Google 宣布其 AI 编程助手 Gemini Code Assist 正在预览版中获得新的"代理"功能。
在周三举行的 Cloud Next 大会上,Google 表示 Code Assist 现在可以部署新的 AI "代理",能够通过多个步骤完成复杂的编程任务。这些代理可以根据 Google Docs 中的产品规格说明创建应用程序,或者执行从一种编程语言到另一种语言的代码转换。除了其他编程环境外,Code Assist 现在也可在 Android Studio 中使用。
Code Assist 的升级很可能是为了应对来自 GitHub Copilot、Cursor 和病毒式编程工具 Devin 开发商 Cognition Labs 等竞争对手的压力。AI 编程助手市场竞争日益激烈,其中蕴含着巨大的商机。考虑到这项技术能够显著提升生产力,这种现象也不足为奇。
公司称,这些可以通过新的 Gemini Code Assist 看板进行管理的代理能够生成工作计划,并对任务请求提供逐步进度报告。除了生成软件和迁移代码外,这些代理还可以实现新的应用功能、执行代码审查,以及生成单元测试和文档。
然而,Code Assist 在执行这些任务时的实际表现如何还不得而知。研究表明,即使是当今最优秀的代码生成 AI 也往往会引入安全漏洞和程序错误,这主要是由于在理解编程逻辑等方面存在不足。最近对 Devin 的一项评估发现,它在 20 个任务中只成功完成了 3 个。
因此,如果你使用 Code Assist 来创建或重构应用程序,为了安全起见,最好还是亲自检查一下代码。
好文章,需要你的鼓励
谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
微软研究人员发布新的仿真环境来测试AI智能体,研究显示当前智能体模型容易受到操纵。该名为"Magentic Marketplace"的合成平台让客户智能体与商家智能体进行交互实验。测试包括GPT-4o、GPT-5和Gemini-2.5-Flash等模型,发现智能体在面临过多选择时效率下降,且在协作方面表现不佳。研究揭示了AI智能体在无监督环境下的性能问题。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。