Cirrascale携手谷歌，将Gemini模型引入本地化部署

Cirrascale Cloud Services宣布与Google合作，通过Google分布式云平台为企业和政府机构提供本地化部署Gemini模型的服务。该方案支持联网或完全气隙隔离环境，满足数据主权与合规需求。硬件采用戴尔设备搭载英特尔和英伟达处理器，模型存储于内存而非硬盘，具备防窃取的安全保障。目标客户涵盖政府、国防、金融、医疗等行业，预计6月底至7月初正式上线。

Cirrascale Cloud Services近日宣布，将通过谷歌分布式云（Google Distributed Cloud）平台，为企业提供本地化部署的AI模型服务。此举主要面向那些希望在自有防火墙内使用先进AI能力、同时保障数据安全的企业客户。

该公司表示，企业和公共部门机构将能够在本地环境或Cirrascale数据中心中运行Gemini模型，支持联网部署或完全物理隔离的气隙（air-gapped）部署方式，以满足数据主权和合规监管的要求。

Cirrascale指出，这一方案将其推理平台的能力延伸至谷歌分布式云上的Gemini模型，重点面向政府、国防、金融、医疗健康和高等教育等行业。

在硬件层面，Cirrascale采用由戴尔制造、搭载英特尔和英伟达CPU及GPU的服务器设备来运行本地Gemini模型，而非使用谷歌自研的张量处理单元（TPU）。其部署方式是在戴尔硬件上安装Gemini模型和谷歌分布式云软件，并以服务形式交付给客户。

Cirrascale首席执行官Dave Driggers表示，客户获得的性能虽不及TPU，但已完全满足实际使用需求。他说："从完整技术栈的角度来看，英伟达之外真正能提供处理器、网络及软件全栈整合方案的平台，其实屈指可数。"

Cirrascale表示，这一部署模式专为数据驻留规定严格或对低延迟有高要求的客户设计，通过将计算资源部署在数据存储和处理的本地位置，有效降低传输延迟。谷歌分布式云支持在客户自主管控的环境中部署，包括完全断网的离线安装方式，这也是部分政府机构和关键基础设施用户的核心需求。

Driggers强调，模型安全是这一方案的重中之重。"这些模型极具价值，必须在可信、安全的环境中交付。谷歌最看重的就是模型本身的安全，因此必须以机密计算的方式进行部署。"他还介绍，模型不存储在硬盘上，而是驻留在内存中。一旦检测到任何入侵行为，系统会立即自动关机，内存中的模型随即消失，从根本上防止模型被窃取。

在服务内容方面，Cirrascale将作为其推理平台的一部分，为客户提供运行大规模Gemini推理所需的硬件配置、性能调优和持续技术支持。该服务面向希望在不重建现有基础设施的前提下构建生产环境的客户，提供经过优化的Gemini推理系统及持续运营支持。

Driggers表示："模型属于谷歌，我们的核心价值在于作为可信合作伙伴，将模型安全交付给客户。这是我们'推理即服务'产品的重要组成部分。我们在模型之上构建了一层软件，让客户可以灵活定制使用方式，包括设置用户队列和用量限制。"

这一机制还支持Token经济（tokenomics）的精细化管理，例如为普通知识工作者和需要快速完成任务的高级程序员设置不同的Token调用频率。

此外，当客户业务分布于多个区域时，该服务同样支持Gemini的跨区域分发，并由Cirrascale负责为终端用户提供负载均衡。

目前该服务已进入预览阶段，计划于今年6月底至7月初正式面向公众开放。

Q&A

Q1：Cirrascale的本地化Gemini部署服务和直接使用谷歌云有什么区别？

A：Cirrascale的本地化部署方案允许企业将Gemini模型运行在自己的数据中心或完全断网的气隙环境中，数据不必离开企业防火墙，适合对数据主权和合规有严格要求的行业。相比之下，直接使用谷歌云需要将数据传输到谷歌的基础设施，这对政府、国防、金融等敏感行业来说存在一定限制。

Q2：Cirrascale的Gemini本地部署方案如何保障模型安全？

A：Cirrascale采用机密计算方式部署Gemini模型，模型不存储在硬盘上，而是直接驻留在内存中。一旦系统检测到任何入侵或异常行为，设备会立即自动关机，内存中的模型数据随之消失，无法被窃取。这种机制从硬件层面为模型提供了物理级别的安全保障。

Q3：Cirrascale的推理服务支持哪些行业，何时可以正式使用？

A：该服务主要面向政府、国防、金融、医疗健康和高等教育等对数据安全和合规要求较高的行业。目前服务已进入预览阶段，计划于2025年6月底至7月初正式对外开放。服务支持多区域分发和负载均衡，企业无需重建现有基础设施即可接入使用。

来源：Networkworld

0赞

好文章，需要你的鼓励

Cirrascale携手谷歌，将Gemini模型引入本地化部署

来源：Networkworld

2026

04/27

09:53

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

英国政府严重低估AI数据中心对碳排放的影响

AI助力伦敦马拉松，智能导览工具提升赛事体验

三星高管担忧：智能手机业务或将首次出现亏损

蒂姆·库克卸任后，苹果公司将走向何方？

谷歌拟向Anthropic投资最高400亿美元，涵盖现金与算力支持

Snowflake推出智能体平台新功能，助力企业用户与开发者

SpaceX获得收购AI编程工具Cursor的选择权，交易金额达600亿美元

我对GPT-5.5进行了10轮测试：总分93分，仅因过度热情失分

我亲测ChatGPT Images 2.0：功能飞跃，真正能用于实际工作

Google推进"智能体企业"战略，发布全新平台与工作流工具

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: