Mistral 推出专为编程设计的 Devstral AI 模型

Mistral 与 All Hands AI 合作推出了一款专注编程的 AI 模型 Devstral，通过 Apache 2.0 许可证开放使用，在代码浏览、多文件编辑及自动化测试等任务中表现优异，可在 RTX 4090 或高配 Mac 上运行，定价亲民。

AI 初创企业 Mistral 周三宣布推出一款专注于编程的新型 AI 模型：Devstral。

Mistral 表示，Devstral 是与 AI 公司 All Hands AI 合作开发的，并且该模型在 Apache 2.0 许可下公开发布，这意味着可以无限制地用于商业用途。Mistral 宣称，在衡量编程能力的 SWE-Bench Verified 基准测试中，Devstral 的表现超越了 Google 的 Gemma 3 27B 以及中国 AI 实验室 DeepSeek 的 V3 等其他开源模型。

Mistral 在其提供给 TechCrunch 的博客文章中写道：“Devstral 在利用工具探索代码库、编辑多个文件以及驱动软件工程代理方面表现卓越。[它]运行在代码代理脚手架（例如 OpenHands 或 SWE-Agent）之上，这些脚手架定义了模型与测试用例之间的接口…… Devstral 足够轻量，可以在单个 [Nvidia] RTX 4090 或拥有 32GB 内存的 Mac 上运行，这使得它成为本地部署和设备端使用的理想选择。”

Mistral 内部对 Devstral 进行的基准评估结果显示如下：

图片来源：Mistral

伴随着 AI 编程助手以及驱动这些助手的模型日益受欢迎，Devstral 闪亮登场。就在上个月，JetBrains——这家开发了一系列流行应用开发工具的公司，发布了其首款“开放”编程 AI 模型。近几个月来，包括 Google、Windsurf 以及 OpenAI 在内的 AI 公司也相继推出了既有公开版本也有专有版本的、针对编程任务优化的模型。

尽管 AI 模型在编写高质量软件方面仍然存在困难——代码生成 AI 往往会引入安全漏洞和错误，这主要归咎于它们在理解编程逻辑等方面的不足，但它们提升编程生产力的潜力正驱使各公司和开发者迅速采用相关工具。近期一项调查显示，76% 的开发者去年使用或计划在开发流程中使用 AI 工具。

此前，Mistral 已经进入辅助编程领域，推出了用于代码生成的模型 Codestral。但 Codestral 的许可协议并不允许开发者将该模型用于商业应用，其许可协议明确禁止“任何员工在 [公司] 业务活动背景下的内部使用”。

Mistral 称 Devstral 为“研究预览”版本，该模型可以通过 Hugging Face 等 AI 开发平台下载，也可以通过 Mistral 的 API 调用。其定价为每 100 万输入 Token 收费 0.1 美元，每 100 万输出 Token 收费 0.3 美元，而 Token 指的是 AI 模型处理的原始数据单元。（100 万 Token 大约相当于 750,000 个单词，或比《战争与和平》多出约 163,000 个单词。）

Mistral 表示，“正全力打造一个更大规模的具有代理能力的编程模型，该模型将在未来几周内推出。” Devstral 本身并非一个小模型，其参数量为 240 亿，虽然这在参数数量上偏小，但参数数量通常反映了模型的解决问题能力，参数越多的模型往往表现更为优秀。

成立于 2023 年的 Mistral 是一家前沿模型实验室，致力于构建包括聊天机器人平台 Le Chat 和移动应用在内的一系列 AI 驱动服务。该公司得到了包括 General Catalyst 在内的风险投资支持，迄今已筹集超过 11 亿欧元（约 12.4 亿美元）的资金。Mistral 的客户包括 BNP Paribas、AXA 以及 Mirakl。

Devstral 是 Mistral 本月推出的第三款产品。几周前，Mistral 推出了高效通用模型 Mistral Medium 3。与此同时，该公司还推出了定位企业市场的聊天机器人服务 Le Chat Enterprise，该服务提供 AI “代理”构建工具，并将 Mistral 模型与 Gmail、Google Drive 以及 SharePoint 等第三方服务整合。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Mistral 推出专为编程设计的 Devstral AI 模型

来源：Techcrunch

2025

05/22

17:40

分享

点赞

智算赋能，生态共荣——超智算人工智能产业生态大会在京启幕，共筑AI发展新范式

Littelfuse推出首款具有SPDT和长行程且兼容回流焊接的发光轻触开关

至顶科技助力AI创业者，在HICOOL峰会探索“如何用AI赚到第一桶金”

CoreWeave LOTA技术实现对象数据高速全球传输

谷歌DeepMind与CFS合作开发核聚变等离子体AI控制系统

微软为Windows 11推出全新Copilot自动化功能

苹果研究人员探索AI如何预测Bug、编写测试并修复代码

刚果称全球最大水电站可为AI数据中心供电

HPE Alletra存储业务获得战略重点关注

谷歌DeepMind与核聚变初创公司合作的真实原因

Omdia预测：超大规模云市场销售额2030年将达1630亿美元

Oracle全面押注AI，用户仍在摸索应用路径

Amazon 推出短格式 AI 驱动的音频产品摘要服务针对精选商品

Extreme Networks 推出 Platform One 全面增强网络与 AI 能力

OpenAI 更新其全新 Responses API：快速支持 MCP、原生 GPT-4o 图像生成及更多企业功能

Mistral AI 发布 Devstral——一款能在笔记本上运行的强大新型开源软件工程代理模型

Klarna 使用其 CEO 的 AI 化身发布财报

AI 数据中心增长如何改变建设需求

估算 AI 能耗极为棘手——但这份报告作出了一次尝试

Salesforce 以 AI 代理为金融服务公司带来更多人性化体验

开放系统如何驱动 AI 性能

VAST Data 推出 AI 操作系统

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: