Google今天在伦敦举行的云峰会上发布了Firebase Studio的更新,新增了Gemini命令行界面(CLI)集成、初步的模型上下文协议(MCP)支持以及"智能体模式"。
智能体模式融合了熟悉和全新的功能元素。该模式提供三个不同层次的AI协作方式。"Ask"是用于头脑风暴和规划的对话模式。还有一个人机协作智能体,Gemini会建议代码更改,但开发者必须在应用前进行审批。最后是第二种智能体模式,几乎完全自主运行——敏感操作仍需获得许可——但Gemini可以自主编写代码、修复错误并构建功能。
这些更新在Google伦敦云峰会的第二场主题演讲中展示,相比4月发布的版本有了显著改进。Google声称已有"数百万"应用使用该平台开发,但对于将开发者分为实验用户和生产用户的具体数据则较为保守。
我们进行了试用,虽然能够通过提示语启动应用程序,但提示语的制作需要谨慎。该服务还未达到非工程师用户能够轻松制作精美应用的程度,但正在朝这个方向发展。
至于其他更新,Gemini CLI集成对于偏好命令行工作且不喜欢切换窗口的开发者来说是一个受欢迎的补充,MCP集成也很实用,尽管这可以说是AI驱动工具集应该具备的基本功能。
Firebase完全聚焦于AI智能体——在此情况下,Google对该术语的定义是无需人工批准即可自主构建代码。这对于快速生成原型或概念验证很有用,但距离生产就绪还有一定距离。例如,目前无法为用户应用基于角色的访问控制——管理员可能希望某些用户只有只读权限。
当我们上次关注Firebase时,它展现出了前景,但也充满了炒作(这在AI领域很常见)。最新发布在一定程度上兑现了承诺。虽然所创建的应用和服务仍相对简单,但复杂性有所提升,且创建的内容在Google云上运行。然而,开发速度令人印象深刻。
虽然编程助手工具众多,但Firebase致力于闭环开发的努力暗示了一个可能让开发者夜不能寐的未来——或者,如果AI布道者是对的,将迎来一个新的生产力时代。
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。