你是否曾想过金门大桥沉入水底会是什么样子?现在,你可以亲眼一见。
在谷歌I/O年度开发者大会上,谷歌宣布为Project Genie推出全新功能。Project Genie是一款实验性生成式AI世界模型网页应用,于今年1月首次发布。此次新功能将谷歌地图收录的2800亿张街景图片(覆盖110个国家)与文字生成视频的模拟能力相结合,让AI生成的虚拟场景得以落地于真实世界。
借助这一功能,你可以在自己熟悉的真实地点基础上,运用生成式AI赋予它全新的奇幻风貌。
模拟真实世界场景
通过将两款产品打通,用户可以把Project Genie的生成式能力与谷歌地图海量街景数据相结合,让AI模型以现实为锚点进行创作。操作方式很简单:点击地图图标选择美国境内的一个地点,再通过AI选择一种风格即可。(该功能目前仅支持美国地区,后续计划向全球扩展。)
举例来说,如果你想看到沉入水底的金门大桥,只需选择"海洋世界"风格,AI便会在这座著名地标的真实画面中加入幻想中的潜水员和成群游鱼。此外,你还可以选择"沙漠风情""石器时代"或"黑白电影"等风格,打造复古质感,随心匹配你想要的氛围。
这一功能基于地图影像锚定技术(Maps Imagery Grounding)实现,与开发者利用街景图像生成AI视觉内容所使用的技术相同。
Project Genie向谷歌AI Ultra用户开放
Project Genie及其街景新功能现已面向全球谷歌AI Ultra订阅用户陆续推出。
Q&A
Q1:Project Genie是什么?它有什么新功能?
A:Project Genie是谷歌推出的一款实验性生成式AI世界模型网页应用,于2025年1月首次发布。此次在谷歌I/O大会上宣布的新功能,将谷歌地图2800亿张街景图片与AI生成能力结合,用户可以选择真实地点并为其叠加奇幻风格,比如让金门大桥变成水下世界,或呈现沙漠、石器时代等视觉效果。
Q2:Project Genie目前支持哪些地区和风格?
A:目前Project Genie的街景功能仅支持美国境内的地点,谷歌计划未来向全球扩展。在风格选择上,用户可以选择"海洋世界""沙漠风情""石器时代""黑白电影"等多种风格,将真实场景转化为各具特色的幻想画面。
Q3:Project Genie用了什么技术来结合真实地图数据?
A:Project Genie使用了谷歌的地图影像锚定技术(Maps Imagery Grounding),这与开发者利用街景图像生成AI视觉内容所采用的技术相同。通过这项技术,AI生成的画面能够以真实的街景图像为基础,在保留地标真实面貌的同时叠加创意风格效果。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。