谷歌公司近日推出了一款人工智能工具,用户无需编写任何代码即可构建简单的应用程序。
这款名为Opal的工具于周四正式发布。此次发布距离亚马逊网络服务公司推出名为Kiro的集成开发环境(使用AI加速软件项目)仅有数周时间。
Opal开发项目的起点是一个类似ChatGPT的聊天机器人界面。用户只需用自然语言描述其应用程序要执行的任务。他们还可以提供完成任务所需的额外数据,以及连接外部工具。
该服务利用提供的数据自动生成简单的应用程序。一旦软件准备就绪,用户可以通过界面右上角的按钮进行分享。这使得应用程序可以通过类似Google文档的分享链接进行访问。
此外,用户可以在发布前使用可视化编辑器对Opal生成的应用程序进行编辑。该编辑器将应用程序表示为虚拟画布上的卡片集合。一些卡片描述应用程序接收的输入,其他卡片则控制处理输入的方式。
可视化编辑器支持链接多个数据处理步骤。例如,用户可以让应用程序生成产品描述,然后基于该描述创建宣传视频。用户可以通过Opal的可视化编辑器输入自然语言指令来自定义这些任务的执行方式。
谷歌产品经理Elle Zadina在演示视频中解释道:"Opal将您的应用描述转换为包含输入、生成步骤和输出步骤的多步骤工作流程。您可以点击步骤查看提示或指令,并直接进行编辑。"
在底层实现上,Opal依赖多个AI模型来生成应用程序。谷歌并未明确说明使用了哪些算法。一个可能的候选者是该公司最近推出的Gemini 2.5 Pro大语言模型,该模型在应用程序开发任务方面表现卓越。它在衡量大语言模型编程技能的流行LMArena基准测试中创下了记录。
考虑到Opal专门用于创建简单应用程序,它可能不需要Gemini 2.5 Pro提供的高级编程功能。谷歌可能使用能力较弱但更节能的编程模型来驱动该工具。而Opal的视频生成功能则可能基于该公司的Veo视频算法之一。
Opal发布时配备了六个以上的预构建应用程序。一些专注于消费者用例,如设计视频游戏。其余的则帮助用户生成营销材料、研究产品和执行其他业务任务。
发布时,Opal通过公测项目向美国用户开放。该工具可通过Google Labs访问,这是一个托管搜索巨头二十多款实验性AI产品的网页。这些产品可自动化从网络搜索到生成应用程序界面设计等各种任务。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。