谷歌公司近日推出了一款人工智能工具,用户无需编写任何代码即可构建简单的应用程序。
这款名为Opal的工具于周四正式发布。此次发布距离亚马逊网络服务公司推出名为Kiro的集成开发环境(使用AI加速软件项目)仅有数周时间。
Opal开发项目的起点是一个类似ChatGPT的聊天机器人界面。用户只需用自然语言描述其应用程序要执行的任务。他们还可以提供完成任务所需的额外数据,以及连接外部工具。
该服务利用提供的数据自动生成简单的应用程序。一旦软件准备就绪,用户可以通过界面右上角的按钮进行分享。这使得应用程序可以通过类似Google文档的分享链接进行访问。
此外,用户可以在发布前使用可视化编辑器对Opal生成的应用程序进行编辑。该编辑器将应用程序表示为虚拟画布上的卡片集合。一些卡片描述应用程序接收的输入,其他卡片则控制处理输入的方式。
可视化编辑器支持链接多个数据处理步骤。例如,用户可以让应用程序生成产品描述,然后基于该描述创建宣传视频。用户可以通过Opal的可视化编辑器输入自然语言指令来自定义这些任务的执行方式。
谷歌产品经理Elle Zadina在演示视频中解释道:"Opal将您的应用描述转换为包含输入、生成步骤和输出步骤的多步骤工作流程。您可以点击步骤查看提示或指令,并直接进行编辑。"
在底层实现上,Opal依赖多个AI模型来生成应用程序。谷歌并未明确说明使用了哪些算法。一个可能的候选者是该公司最近推出的Gemini 2.5 Pro大语言模型,该模型在应用程序开发任务方面表现卓越。它在衡量大语言模型编程技能的流行LMArena基准测试中创下了记录。
考虑到Opal专门用于创建简单应用程序,它可能不需要Gemini 2.5 Pro提供的高级编程功能。谷歌可能使用能力较弱但更节能的编程模型来驱动该工具。而Opal的视频生成功能则可能基于该公司的Veo视频算法之一。
Opal发布时配备了六个以上的预构建应用程序。一些专注于消费者用例,如设计视频游戏。其余的则帮助用户生成营销材料、研究产品和执行其他业务任务。
发布时,Opal通过公测项目向美国用户开放。该工具可通过Google Labs访问,这是一个托管搜索巨头二十多款实验性AI产品的网页。这些产品可自动化从网络搜索到生成应用程序界面设计等各种任务。
好文章,需要你的鼓励
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
华盛顿大学研究团队发现,大型语言模型在未接受手语训练的情况下,竟然具备理解德语手语的能力。通过系统实验,他们证实了模型能够判断手语语法正确性,并进行手语与文字间的翻译。这种"涌现的多模态能力"源于模型对语言抽象结构的深度理解,为开发手语翻译技术和改善聋哑人群数字交流体验开启了新可能。
剑桥咨询CEO蒙蒂·巴洛在采访中分享了如何识别具有潜力的技术领域。他表示,当听到看似不可能或令人惊讶的技术时会特别关注,如深度学习AI、量子计算等。该公司作为"深度科技强国",专注于生物工程、人工智能、量子计算等领域,拥有740名员工,年均为客户创造5000多项专利。巴洛强调跨学科合作的重要性,预测未来计算机系统的应用需求将大幅增长。
谷歌DeepMind团队提出STAR方法,通过模仿苏格拉底教学法让AI学会类比推理,解决传统AI无法"举一反三"的问题。实验显示该方法显著提升AI处理新问题的能力,在逻辑推理准确率从40%提升至75%以上。这项突破为创造真正智能的AI系统指明方向,未来将在教育、医疗、创意设计等领域产生重要应用价值。