Google 周二宣布,通过免费 AI 编程助手 Gemini Code Assistant,该公司正在为学生和业余程序员提供一个重要的编程助力工具。这款工具支持所有公开可用的编程语言。
此前仅面向企业客户开放的 Gemini Code Assistant,现在将为所有用户提供"几乎无限制"的 AI 编程辅助功能。根据公司新闻稿介绍,Gemini Code Assistant 每月允许 180,000 次代码补全,这是市场上其他免费编程助手的 90 倍。
负责开发者体验的 Google 产品高级总监 Ryan J. Salva 表示:"一个每天都在编程的专业开发者可能只会用到这个额度的一半。要达到这个使用限制,你得是一个极其投入的开发者,每天花 14 小时不停地coding。"
Google 表示,Gemini Code Assistant 在聊天中支持高达 128,000 个输入 token,可以使用自然语言来帮助生成、解释或改进代码。例如,你可以要求 Gemini 编写一个每天发送最新天气预报的脚本,它就能生成可用的代码。不过,Code Assistant 目前还不能让新手仅通过提示就开发出一个完整的程序。
Salva 认为 2025 年将是 AI 帮助程序员不仅产出更多代码,而且产出更高质量代码的一年。在软件团队中,开发者通常需要进行代码审查,他们的代码会被主管审查并提供改进建议。Salva 表示 Gemini 中的 AI 代理可以帮助完成这项工作,为开发者节省更多时间。Google 还将提供 Gemini Code Assist for GitHub 的公开预览版。
Salva 说:"我们构建了一个 AI 代理,它可以像团队成员或同事一样审查提交的代码是否有缺陷,检查'你是否遵循了最佳实践?'或者'是否有方法让逻辑更优雅?'"
Google 发布 Gemini Code Assistant 之际,科技巨头们正在迅速争夺 AI 领域的主导地位。目前,ChatGPT 被认为是 AI 对话机器人的默认选择,每周用户量达 4 亿。ChatGPT 的部分成功要归功于其在 2022 年底的病毒式传播。被视为默认技术工具具有巨大的优势。通过免费提供 Code Assistant,Salva 表示这一商业决策旨在推动用户长期采用 Google 的 AI 服务。
撇开商业考虑,Salva 认为 Gemini Code Assistant 是帮助人们开始使用自然语言编程的重要一步,这需要很少的编程知识。
Salva 说:"大语言模型可以帮你完成独立逻辑的编写。这让人类变得更有创造力...因为他们不再受到语言障碍的限制,所以能够提高创造力输出。"
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。