谷歌公司近日推出了一款人工智能工具,用户无需编写任何代码即可构建简单的应用程序。
这款名为Opal的工具于周四正式发布。此次发布距离亚马逊网络服务公司推出名为Kiro的集成开发环境(使用AI加速软件项目)仅有数周时间。
Opal开发项目的起点是一个类似ChatGPT的聊天机器人界面。用户只需用自然语言描述其应用程序要执行的任务。他们还可以提供完成任务所需的额外数据,以及连接外部工具。
该服务利用提供的数据自动生成简单的应用程序。一旦软件准备就绪,用户可以通过界面右上角的按钮进行分享。这使得应用程序可以通过类似Google文档的分享链接进行访问。
此外,用户可以在发布前使用可视化编辑器对Opal生成的应用程序进行编辑。该编辑器将应用程序表示为虚拟画布上的卡片集合。一些卡片描述应用程序接收的输入,其他卡片则控制处理输入的方式。
可视化编辑器支持链接多个数据处理步骤。例如,用户可以让应用程序生成产品描述,然后基于该描述创建宣传视频。用户可以通过Opal的可视化编辑器输入自然语言指令来自定义这些任务的执行方式。
谷歌产品经理Elle Zadina在演示视频中解释道:"Opal将您的应用描述转换为包含输入、生成步骤和输出步骤的多步骤工作流程。您可以点击步骤查看提示或指令,并直接进行编辑。"
在底层实现上,Opal依赖多个AI模型来生成应用程序。谷歌并未明确说明使用了哪些算法。一个可能的候选者是该公司最近推出的Gemini 2.5 Pro大语言模型,该模型在应用程序开发任务方面表现卓越。它在衡量大语言模型编程技能的流行LMArena基准测试中创下了记录。
考虑到Opal专门用于创建简单应用程序,它可能不需要Gemini 2.5 Pro提供的高级编程功能。谷歌可能使用能力较弱但更节能的编程模型来驱动该工具。而Opal的视频生成功能则可能基于该公司的Veo视频算法之一。
Opal发布时配备了六个以上的预构建应用程序。一些专注于消费者用例,如设计视频游戏。其余的则帮助用户生成营销材料、研究产品和执行其他业务任务。
发布时,Opal通过公测项目向美国用户开放。该工具可通过Google Labs访问,这是一个托管搜索巨头二十多款实验性AI产品的网页。这些产品可自动化从网络搜索到生成应用程序界面设计等各种任务。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。