Ai2发布开源AI开发智能体系列可适应任意代码库

Ai2推出开源AI编码代理系列，解决现有代理封闭昂贵难适配问题。首发产品SERA在SWE-Bench基准测试中解决超55%问题，超越同规模开源模型。SERA提供32B和8B两版本，支持一行代码部署。通过专业化训练，小型模型性能可媲美千亿参数模型，成本仅需400美元，比现有方案便宜百倍。

人工智能正在快速发展，改变着开发者编写代码的方式。随着代码越来越快地流入GitHub等代码仓库，机器智能现在与人类开发者并肩工作。

根据艾伦人工智能研究所的观点，编码智能体面临一个根本性问题：大多数都是封闭的，训练成本昂贵，难以研究或适应私有代码库。为了解决这个问题，该公司今日发布了Ai2开放编码智能体系列，让构建和训练定制编码智能体变得简单易用。

SERA智能体的核心能力

该系列的首个发布版本名为SERA（软验证高效仓库智能体），能够解决超过55%的SWE-Bench Verified基准测试问题，这一表现超越了同等规模的先前开源模型。

SERA的每个组件都是开源的，包括模型、代码以及与Anthropic公司Claude Code的集成。它只需一行代码即可启动，用户无需任何大语言模型训练经验。

SERA提供两个版本：SERA-32B和SERA-8B。前者是320亿参数的模型，在SWE-bench Verified基准测试中表现强劲，在标准设置下能解决约55%的问题，超越了大多数开源模型如Qwen3-Coder，以及在相同推理设置下的封闭模型，包括Mistral3的Devstral Small 2。后者是80亿参数的模型，能解决29.4%的SWE-Bench Verified问题，而强化学习基线模型仅为9.4%。

技术突破与成本优势

Ai2使用专门的模型，在每个代码库的8000个合成轨迹上进行训练，始终能够匹配甚至超越作为教师模型的GLM-4.5-Air的性能，后者拥有超过1000亿个参数。

Ai2表示，一个特别有希望的结果是，较小的完全开源模型能够复制甚至超越更强大"教师"编码智能体的性能。通过在320亿参数级别针对特定代码库的有利专业化和微调，SERA能够以三分之一的规模超越一些1000亿参数的通用模型。在部署时，这意味着更小的内存占用和更低的计算需求，从而大大降低成本，而不会牺牲质量。

在商品云硬件上重现Ai2主要实验结果的总成本约为400美元，比目前市场上许多现有方法便宜约100倍。

易用性与未来发展

该公司解释说，此次发布包含开发者和研究人员快速上手所需的一切，以便重现、测试和基于SERA进行构建：基于两行代码的轻量级部署，用于启动、部署和推理。还有设置脚本和推理优化，使SERA能够与Claude Code协同工作。

Ai2表示，打算使用相同的方法来不断改进并扩展到更大的骨干网络，但强调当前的流程已经足够便宜和可行，任何人都可以运行、定制和迭代。

Q&A

Q1：SERA智能体是什么？它有什么特殊能力？

A：SERA（软验证高效仓库智能体）是Ai2发布的开源AI编码智能体，能够解决超过55%的SWE-Bench Verified基准测试问题，超越了同等规模的先前开源模型。它的特殊之处在于完全开源，只需一行代码即可启动，用户无需大语言模型训练经验。

Q2：SERA有哪些版本？性能如何？

A：SERA提供两个版本：SERA-32B（320亿参数）和SERA-8B（80亿参数）。SERA-32B在标准设置下能解决约55%的问题，超越了大多数开源和封闭模型。SERA-8B能解决29.4%的问题，远超强化学习基线模型的9.4%表现。

Q3：使用SERA的成本如何？

A：SERA的成本非常低廉。在商品云硬件上重现主要实验结果的总成本约为400美元，比目前市场上许多现有方法便宜约100倍。由于模型规模优化，部署时内存占用更小，计算需求更低，大大降低了使用成本。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Ai2发布开源AI开发智能体系列 可适应任意代码库

来源：SiliconANGLE

2026

01/28

09:37

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

智利社区用"人工智能"替代AI聊天机器人凸显其巨大水资源消耗问题

英国政府接受Meta百万美元资助引争议

达沃斯科技CEO展现AI全球扩张愿景

Anthropic CEO发布万字长文警告AI风险即将到来

外卖选择困难症？Just Eat推出AI语音助手帮你决定

医疗机构影子AI使用现象广泛，潜藏安全风险

MuleSoft新增智能体扫描器应对企业AI混乱

开发者创建"Ralph"循环脚本，每小时10美元成本克隆商业软件

世界经济论坛专家称人工智能需要纠正发展方向

欧洲科技领导者警告：数字主权不应关闭美国技术供应商

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Ai2发布开源AI开发智能体系列可适应任意代码库