谷歌公司近日推出了一款人工智能工具,用户无需编写任何代码即可构建简单的应用程序。
这款名为Opal的工具于周四正式发布。此次发布距离亚马逊网络服务公司推出名为Kiro的集成开发环境(使用AI加速软件项目)仅有数周时间。
Opal开发项目的起点是一个类似ChatGPT的聊天机器人界面。用户只需用自然语言描述其应用程序要执行的任务。他们还可以提供完成任务所需的额外数据,以及连接外部工具。
该服务利用提供的数据自动生成简单的应用程序。一旦软件准备就绪,用户可以通过界面右上角的按钮进行分享。这使得应用程序可以通过类似Google文档的分享链接进行访问。
此外,用户可以在发布前使用可视化编辑器对Opal生成的应用程序进行编辑。该编辑器将应用程序表示为虚拟画布上的卡片集合。一些卡片描述应用程序接收的输入,其他卡片则控制处理输入的方式。
可视化编辑器支持链接多个数据处理步骤。例如,用户可以让应用程序生成产品描述,然后基于该描述创建宣传视频。用户可以通过Opal的可视化编辑器输入自然语言指令来自定义这些任务的执行方式。
谷歌产品经理Elle Zadina在演示视频中解释道:"Opal将您的应用描述转换为包含输入、生成步骤和输出步骤的多步骤工作流程。您可以点击步骤查看提示或指令,并直接进行编辑。"
在底层实现上,Opal依赖多个AI模型来生成应用程序。谷歌并未明确说明使用了哪些算法。一个可能的候选者是该公司最近推出的Gemini 2.5 Pro大语言模型,该模型在应用程序开发任务方面表现卓越。它在衡量大语言模型编程技能的流行LMArena基准测试中创下了记录。
考虑到Opal专门用于创建简单应用程序,它可能不需要Gemini 2.5 Pro提供的高级编程功能。谷歌可能使用能力较弱但更节能的编程模型来驱动该工具。而Opal的视频生成功能则可能基于该公司的Veo视频算法之一。
Opal发布时配备了六个以上的预构建应用程序。一些专注于消费者用例,如设计视频游戏。其余的则帮助用户生成营销材料、研究产品和执行其他业务任务。
发布时,Opal通过公测项目向美国用户开放。该工具可通过Google Labs访问,这是一个托管搜索巨头二十多款实验性AI产品的网页。这些产品可自动化从网络搜索到生成应用程序界面设计等各种任务。
好文章,需要你的鼓励
斯坦福大学研究团队开发了名为BrainSynth的AI系统,通过生成式AI技术创建解剖学上合理的3D大脑MRI影像。该项目由精神病学和行为科学教授Kilian Pohl博士主导,旨在通过AI生成的合成数据来研究大脑疾病的细微影响。研究显示,超过一半的合成MRI脑区域在解剖学上是合理的,能够准确编码年龄和性别等生物因素的影响,为神经科学研究提供了宝贵的数据资源。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
ETH苏黎世和迪士尼研究院联合开发的HiGS技术,通过巧妙利用AI绘画过程中的历史信息,实现了图像生成速度6-8倍提升的同时保持更高质量。这项即插即用的技术无需重新训练模型,在ImageNet数据集上创造新纪录,为AI图像生成领域带来重要突破,具有广泛的实际应用价值。