谷歌公司近日推出了一款人工智能工具,用户无需编写任何代码即可构建简单的应用程序。
这款名为Opal的工具于周四正式发布。此次发布距离亚马逊网络服务公司推出名为Kiro的集成开发环境(使用AI加速软件项目)仅有数周时间。
Opal开发项目的起点是一个类似ChatGPT的聊天机器人界面。用户只需用自然语言描述其应用程序要执行的任务。他们还可以提供完成任务所需的额外数据,以及连接外部工具。
该服务利用提供的数据自动生成简单的应用程序。一旦软件准备就绪,用户可以通过界面右上角的按钮进行分享。这使得应用程序可以通过类似Google文档的分享链接进行访问。
此外,用户可以在发布前使用可视化编辑器对Opal生成的应用程序进行编辑。该编辑器将应用程序表示为虚拟画布上的卡片集合。一些卡片描述应用程序接收的输入,其他卡片则控制处理输入的方式。
可视化编辑器支持链接多个数据处理步骤。例如,用户可以让应用程序生成产品描述,然后基于该描述创建宣传视频。用户可以通过Opal的可视化编辑器输入自然语言指令来自定义这些任务的执行方式。
谷歌产品经理Elle Zadina在演示视频中解释道:"Opal将您的应用描述转换为包含输入、生成步骤和输出步骤的多步骤工作流程。您可以点击步骤查看提示或指令,并直接进行编辑。"
在底层实现上,Opal依赖多个AI模型来生成应用程序。谷歌并未明确说明使用了哪些算法。一个可能的候选者是该公司最近推出的Gemini 2.5 Pro大语言模型,该模型在应用程序开发任务方面表现卓越。它在衡量大语言模型编程技能的流行LMArena基准测试中创下了记录。
考虑到Opal专门用于创建简单应用程序,它可能不需要Gemini 2.5 Pro提供的高级编程功能。谷歌可能使用能力较弱但更节能的编程模型来驱动该工具。而Opal的视频生成功能则可能基于该公司的Veo视频算法之一。
Opal发布时配备了六个以上的预构建应用程序。一些专注于消费者用例,如设计视频游戏。其余的则帮助用户生成营销材料、研究产品和执行其他业务任务。
发布时,Opal通过公测项目向美国用户开放。该工具可通过Google Labs访问,这是一个托管搜索巨头二十多款实验性AI产品的网页。这些产品可自动化从网络搜索到生成应用程序界面设计等各种任务。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。