谷歌公司今日发布了人工智能工具Stitch的全新版本,该工具可以为网站和移动应用生成用户界面。
图形设计软件制造商Figma公司的股价因此下跌超过4%。该公司的同名平台是UI开发项目的首选工具。
构建界面不仅仅是创建设计那么简单。开发者在设计好应用程序的外观后,还必须将其转换为HTML和CSS代码,这是一个非常耗时的过程。从字体大小到界面元素之间的间距,每个细节都需要在代码中手动定义。
Stitch自动化了这一过程。它使用谷歌旗舰级Gemini系列大语言模型,将界面设计转换为HTML和CSS代码。该工具还支持Tailwind,这是一个包含预打包设计元素的广泛使用的开发框架。
谷歌在去年5月发布了Stitch的初始版本。今天推出的升级版本具有围绕"AI原生无限画布"构建的全新界面。该画布可以并排显示多个视觉资源,让用户完整查看其设计项目。
开发者可以通过上传参考图像或提供文本描述来让Stitch生成界面代码。例如,用户可以指示工具为AI应用生成注册页面。原始版本一次只能生成一个屏幕,而据谷歌介绍,新版Stitch可以同时生成多达五个屏幕。
开发电商网站的开发者可以要求Stitch创建产品目录页面、结算页面和购买确认屏幕。"播放"按钮使模拟购物者在这些屏幕间导航成为可能。
谷歌实验室副总裁乔什·伍德沃德在博客文章中解释:"你可以在几秒钟内将屏幕'拼接'在一起,只需点击'播放'即可快速预览交互式应用流程。Stitch可以基于点击自动生成逻辑上的下一个屏幕,轻松映射用户旅程。"
如果AI生成的界面元素的初始版本需要改进,开发者可以使用自然语言提示对其进行优化。该工具还支持语音命令。开发者可以要求Stitch更改字体大小和其他特定设计细节,或输入"强调结算按钮"等更高级别的指令。
该工具的多项功能由新增的AI智能体驱动。开发者可以选择使用MCP工具将Stitch与外部智能体(如谷歌的Antigravity编码工具)连接。Antigravity可以审查界面设计并自动生成新的变体。
Stitch还可以将界面元素导出到其他外部工具。据谷歌介绍,该工具现在允许用户将界面设计细节保存在名为DESIGN.md的自然语言文件中。它旨在简化在设计工具和项目间保持一致外观的任务。
Stitch通过谷歌实验室免费提供,这是这家搜索巨头用于测试实验性产品的平台。
Q&A
Q1:Stitch是什么工具?它的主要功能是什么?
A:Stitch是谷歌开发的人工智能工具,专门用于为网站和移动应用生成用户界面。它使用谷歌的Gemini系列大语言模型,可以将界面设计自动转换为HTML和CSS代码,大大简化了开发者的工作流程。
Q2:新版Stitch相比旧版本有哪些改进?
A:新版Stitch引入了"AI原生无限画布"界面,可以同时生成多达五个屏幕(旧版本一次只能生成一个),支持语音命令和自然语言提示优化,新增AI智能体功能,还可以与外部工具如Antigravity编码工具连接。
Q3:如何获取和使用Stitch工具?
A:Stitch目前通过谷歌实验室平台免费提供。用户可以上传参考图像或提供文本描述来生成界面代码,支持多屏幕同时生成,并可以使用"播放"按钮预览交互效果。开发者还能通过自然语言或语音命令对生成的界面进行调整。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。