由 Founders Fund 投资支持的旧金山创业公司 Cognition AI (又称 Cognition Labs) 在 2024 年初凭借发布 Devin 一举成名。Devin 是一款 AI 驱动的软件工程师工具,能够与人类开发者协同工作,通过提示窗口或第三方通讯应用 Slack 接收人类开发者的自然语言指令来自主完成任务。
然而,AI 开发领域发展迅速,许多其他公司也推出了类似功能的自主或半自主编码助手,包括 GitHub Copilot、AWS Developer Q、Codeium 的 Windsurf 和 Cursor。
Cognition 自成立以来一直使用其他模型,主要是 OpenAI 的 GPT-4 和 GPT-4 系列,为 Devin 提供支持。
现在,Cognition 推出了更新版本 Devin 2.0,这是一个升级版的原生代理软件开发平台。目前尚不清楚这个版本使用了什么基础模型。
新版本现已全面推出,引入了一系列功能,旨在使开发者与 Devin 自主代理之间的协作更加顺畅高效。
此外,在经济不确定性和新的特朗普关税导致成本上涨的时期,Cognition 还带来了一个令人欣喜的好消息:Devin 2.0 的起步价仅为每月 20 美元 (每个"代理计算单元"2.25 美元,这是 Cognition 衡量运行 Devin 所需计算资源的单位),而此前版本的起步价约为每月 500 美元。
Devin 2.0 还提供了哪些新功能?
并行 Devin 和新的云端 IDE Devin 2.0 在 Cognition Labs 早期简化软件开发的基础上更进一步,允许用户与多个自主代理并行工作。最新版本引入了交互式云端 IDE 环境,使用户能够同时运行多个 Devin,有效处理多项任务。每个 Devin 都可以自主工作,用户可以随时介入查看、编辑或指导进度。
交互式规划和任务范围界定 Devin 2.0 的一个重要新增功能是交互式规划。该功能允许开发者从宽泛或不完整的想法开始,与 Devin 协作制定详细的任务计划。在开始会话后几秒钟内,Devin 就能自动分析代码库,识别相关文件,并提出初步计划,即使没有人类用户的具体指导或指示。用户随后可以检查并调整这个计划,确保在执行前达成一致。
探索企业代码库 Devin 2.0 还引入了 Devin Search 工具,旨在帮助用户更有效地理解和导航他们的代码库。搜索功能使开发者能够针对代码提出具体问题,并获得引用相关代码片段的详细回答。对于需要深入探索的复杂查询,用户可以激活深度模式。
此外,新版本还包括 Devin Wiki 功能,每隔几小时自动索引存储库。Devin Wiki 生成包含架构图、源代码链接和其他相关细节的综合文档,为开发者提供有组织且持续更新的参考资料。
效率提升和开发者控制 除了新功能外,Cognition Labs 报告称 Devin 2.0 带来了效率提升。根据公司内部基准测试,最新版本在每个代理计算单元 (ACU) 完成初级开发任务的效率提高了 83% 以上。测试期间,Beta 用户也观察到类似的性能提升。
用户可以通过类似 VSCode 的界面与 Devin 2.0 交互,可以查看和编辑 Devin 的工作,并直接在平台环境中运行测试。这种灵活性支持动手和免动手两种工作流程,取决于用户偏好。
从 Devin 1.2 升级 2025 年初,公司发布了 Devin 1.2,其中包括针对上下文推理和语音命令集成的增强功能。这些改进使 Devin 能够更好地分析代码库、识别模式并在适当时重用现有代码。用户还可以通过 Slack 发送语音消息来发出指令,简化了与代理的交互方式。
Devin 1.2 还引入了面向企业环境的功能,如机器快照以简化登录工作流程,以及用于管理多个 Devin 工作空间的集中管理控制。除了这些功能升级外,Cognition Labs 转向基于使用量的计费模式,允许客户为超出订阅限制的额外容量付费。
Devin 与其他 AI 编码代理和平台的当前对比 虽然 Devin 的早期版本将平台定位为加速开发工作流程的创新解决方案,但早期用户反馈突显了一些成长痛点。研究人员和测试人员注意到,该代理有时在处理过于复杂的代码时会遇到困难,出现不必要的抽象,且任务表现不稳定。
尽管如此,Devin 仍吸引了寻求将自主编码代理整合到软件开发流程中的企业客户的兴趣。
Devin 2.0 的新功能和能力——以及大幅降低的入门价格——应该会受到开发者的欢迎,可能会进一步提高 Cognition 平台的采用率,甚至吸引用户从其他竞争对手的编码工具转向他们。
但是,随着 GitHub Copilot、Codeium 的 Windsurf 和 Amazon Q Developer 等都提供免费版本的 AI 编码助手,Devin 2.0 在这个竞争激烈的市场中面临着越来越强大的竞争对手。
好文章,需要你的鼓励
Hugging Face推出开源工具Yourbench,允许企业创建自定义基准来评估AI模型在其内部数据上的表现。这一工具通过复制大规模多任务语言理解基准的子集,以极低成本实现了对模型性能的精确评估。Yourbench的出现为企业提供了更贴合实际需求的AI模型评估方法,有望改善模型评估的方式。
Cognition AI 推出 Devin 2.0,这是其 AI 驱动的软件开发平台的更新版本。新版本引入了多项功能,旨在提升开发者与自主代理之间的协作效率。最引人注目的是,Devin 2.0 的起价从每月 500 美元大幅下调至 20 美元,使其更易于普及。新功能包括并行 Devin、交互式规划、代码库搜索等,有望提升开发效率并增强用户控制。
安迪·卡拉布蒂斯是一位杰出的CIO,她的职业生涯横跨多个行业和地区,经历了多次变革时刻。她在福特和通用汽车锻炼了领导力和技术专长,后来在戴尔、拜奥根和国家电网等公司担任高管,推动战略创新。本文总结了她对IT领导者核心技能的见解,包括战略沟通、情商、协作、远见卓识、变革管理和敏捷性等,对当今IT领导者具有重要参考价值。
边缘 AI 计算将使人形机器人、智能设备和自动驾驶等应用从数据中心和云端服务器解放出来,转移到制造车间、手术室和城市中心等场景。它能实现低延迟和自主决策,使 AI 无处不在,推动工业设施全面自动化,彻底改变商业和生活方式。边缘 AI 正在快速发展,各大科技公司纷纷推出相关硬件和软件平台,未来将为各行各业带来巨大变革。