Google 于周三宣布推出一款"AI 科研助手",旨在帮助人类研究者加速科学发现。在早期测试中,该系统成功解决了一个困扰科学家超过十年的科学难题。
这款 AI 科研助手可以生成新的可测试假设、详细的研究概述和实验方案,目标是让科学和生物医学研究变得更快速、更高效。
该工具基于 Google 最新版本的对话式 AI 助手 Gemini 2.0 开发,类似于 OpenAI 的 ChatGPT,可以响应用户的自然语言输入。研究人员可以用自然语言向 AI 科研助手说明研究目标,还可以提出自己的想法和建议,并给出反馈和评论。
"AI 科研助手是一个协作工具,用于帮助专家收集研究资料并完善他们的工作 —— 它并非要自动化整个科研过程,"Google 在宣布新系统的博客文章中表示,似乎是为了缓解人们对 AI 可能取代各领域人类的担忧。
目前,这个系统仅被称为"AI 科研助手"。该工具承诺可以多方面协助人类,比如缩短研究人员在不熟悉领域查阅详细文献所需的时间。它还可以直接提供假设,供科学家进行实验验证。
根据 Google 发言人通过电子邮件确认,AI 科研助手目前仅向参与 Google 新的可信测试计划的研究人员开放,该计划涉及约 20 位首席研究员。感兴趣的人可以在线申请参与该计划。
同样的假设,更短的时间
早期测试者已经看到了该模型的前景。在伦敦大学学院,科学家们花了十年时间研究耐抗生素的超级细菌,证明了某些细菌如何导致耐抗生素感染,这是一个广泛存在的健康挑战。
基于与 Fleming Initiative (致力于控制抗菌素耐药性传播的组织) 的合作关系,Google 邀请伦敦大学学院团队测试 AI 科研助手如何应对同样的问题。
"当 Google 研究团队找到我们测试其 AI 平台时,我们意识到需要让它解决我们已经探索过并用作实验工作基础的相同科学问题,"Imperial 传染病系教授 José Penadés 在一份声明中表示。
"这意味着该算法能够查看现有证据,分析可能性,提出问题,设计实验,并提出与我们经过多年艰苦科学研究得出的完全相同的假设,但只用了很短的时间。"
安全和伦理问题
在关于 AI 科研助手的详细报告中,Google 阐述了系统的局限性,并承认需要技术保障来防止不道德的研究查询和恶意用户意图。就在本月,Google 警告 Gemini 可能被网络犯罪分子滥用,这引发了敏感或机密科学查询可能落入坏人之手的担忧。报告指出,AI 科研助手目前已有一些安全措施,但最终还需要更多保护。
尽管如此,已经试用该系统的科学家们对其潜力表示热情。
来自 Imperial 生命科学系和 Fleming Initiative 的实验工作共同负责人 Tiago Dias da Costa 表示:"我们的发现表明,AI 有潜力综合所有可用证据,并引导我们找到最重要的问题和实验设计。如果系统运行效果如我们所期望的那样好,这可能会是一个改变游戏规则的突破;排除'死胡同',让我们能以非凡的速度取得进展。"
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。