Docker 最近推出了新工具,应用容器技术原理到人工智能开发领域,解决了 AI 模型执行和 Model Context Protocol ( MCP ) 集成中的关键挑战。该公司的 MCP Catalog、MCP Toolkit 和 Model Runner 旨在通过熟悉的容器工作流标准化开发者部署、保护和管理 AI 组件的方法。这些工具弥合了容器化与 AI 系统之间的技术鸿沟,同时为大规模部署 AI 的企业提供企业级管理控件。
MCP 为 AI 系统带来工具访问
Model Context Protocol 使 AI 应用能够通过标准化接口与外部工具和数据源进行交互。由 Anthropic 开发并得到主要 AI 提供商的支持,MCP 允许语言模型和代理发现可用工具并以合适的参数调用它们。然而,实施 MCP 服务器存在多种挑战,包括环境冲突、安全漏洞以及跨平台的不一致行为。
Forbes
为什么 Anthropic 的 Model Context Protocol 是 AI 代理演进中的重要一步
作者:Janakiram MSV
Docker 通过容器化技术解决了这些问题。基于 Docker Hub 基础设施构建的 Docker MCP Catalog 提供了经过安全性和兼容性验证的容器化 MCP 服务器仓库。开发者可以浏览并部署来自包括 Stripe ( 用于支付处理 )、Elastic ( 用于搜索功能 ) 和 Neo4j ( 用于图数据库 ) 等合作伙伴的超过 100 个 MCP 服务器。
配套的 MCP Toolkit 负责处理身份验证和安全执行。它内置与 Docker Hub 账户集成的凭证管理功能,使开发者只需对 MCP 服务器进行一次身份验证,即可在多个客户端间使用。Docker 并非通过给予 MCP 服务器完全的主机访问权限来启动,而是给每个服务器分配恰当的权限和隔离,显著提高了安全性。
典型的实现可能使用容器化的 MCP 服务器为 AI 系统提供时间服务、数据库连接、Git 仓库和 API 集成的访问。Docker MCP 方法确保这些工具在具备受控权限的隔离环境中运行,从而解决了 MCP 实施过程中出现的安全问题。
Model Runner 简化本地 AI 开发
Docker 的 Model Runner 将容器化原理扩展到 AI 模型的执行上。该工具简化了在 Docker 熟悉的工作流中下载、配置和运行模型的过程,从而解决了 AI 开发环境中的碎片化问题。它通过平台专用 API 利用 GPU 加速,同时保持了 Docker 的隔离特性。
该系统将模型作为 OCI 文物存储在 Docker Hub 中,从而实现与其他注册中心 ( 包括内部企业仓库 ) 的兼容。与传统的模型分发方法相比,这种方式提高了部署速度并减少了存储需求。
该架构允许数据保留在组织自身的基础设施内,从而在处理敏感信息时解决隐私问题。Docker Model Runner 并非在容器中运行,而是使用安装在主机上的推理服务器(当前为 llama.cpp),并通过 Apple 的 Metal API 直接访问硬件加速。此设计在平衡性能需求与安全考虑之间取得了平衡。
产业联盟加强生态系统
Docker 已与关键 AI 生态系统参与者达成合作协议,以支持这两项计划。MCP Catalog 集成了流行的 MCP 客户端,包括 Claude、Cursor、VS Code 和 continue.dev。在 Model Runner 方面,Docker 与 Google、Continue、Dagger、Qualcomm Technologies、HuggingFace、Spring AI 和 VMware Tanzu AI Solutions 建立了合作关系,使开发者能够使用最新的模型和框架。
这些合作使 Docker 成为竞争激烈的 AI 基础设施领域中的中立平台供应商。包括 Cloudflare、Stytch 以及 Okta 子公司 Auth0 在内的多家供应商已为 MCP 推出身份和访问管理支持。Docker 方法的独特之处在于应用了容器化原理来隔离 MCP 服务器,提供了针对研究者所发现的漏洞的安全边界。
企业考量与战略影响
对于技术领导者来说,Docker 的 AI 战略带来了诸多优势。开发团队能够使用熟悉的 Docker 命令在 AI 组件与传统应用程序之间保持一致性。容器化方法简化了从开发工作站到生产基础设施的各个环境中的部署。安全团队则受益于隔离特性,降低了将 AI 系统连接到企业资源时面临的风险。
Docker 将容器工作流扩展到 AI 开发中,解决了企业工具链中的关键缺口。通过将成熟的容器化原理应用于新兴的 AI 技术,该公司为组织提供了一条在传统与 AI 驱动的应用程序中统一实践的路径。随着模型成为生产系统的重要组成部分,这种统一的开发、部署和安全方法在维持运营效率的同时,可能在满足 AI 系统独特需求方面发挥重要作用。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。