Genie 是谷歌旗下一款通用世界模型,能够生成多样化的交互式虚拟环境。自发布以来,Genie 已成为研究领域的重要基础工具,不仅帮助智能体在复杂虚拟场景中学习与推理,还协助 Waymo 模拟高度逼真的道路行驶环境。
如今,谷歌迈出了重要一步——将 Genie 的生成能力与谷歌街景的真实世界影像相结合,使模型得以在现实世界中找到坐标锚点。这一能力的扩展,可以为 AI 智能体或机器人提供虚拟环境,让它们在其中导航并应对真实世界的复杂情况。
街景接地功能现已上线:让虚拟世界扎根于现实
谷歌今天正式在实验性原型项目 Project Genie 中推出全新的街景接地功能,同时将 Project Genie 的访问权限向全球更多用户开放。
通过此次升级,用户可以利用真实世界的街景影像,探索自己喜爱的地点,或对其进行创意改造。在 Project Genie 中创建虚拟世界时,用户现在可以选择以真实地点为基础。只需点击地图图钉,选择一处美国境内的地点,再搭配"沙漠沙丘"或"石器时代"等风格,然后描述自己的角色形象——可以是最喜欢的动物、漫画英雄,甚至是黏土怪物——Genie 便会将这些信息融合,创造出一个以街景真实影像为起点的奇幻世界。该功能由"地图影像接地"技术驱动,与开发者用于生成精美 AI 视觉内容的街景技术一脉相承。
举个例子:想看看旧金山金门大桥在海底的模样?选择"海洋世界"风格,即可化身潜水员,与成群的鱼儿在大桥周围遨游。又或者想一探德克萨斯州标志性的沃思堡牲畜围场在 1920 年代的风貌?选择"黑白电影"风格,便能沉浸在一个充满酒馆、老式汽车和贸易站的复古世界中。
目前,Project Genie 的街景功能已覆盖美国境内地点,后续计划逐步扩展至更多地区。
Project Genie 现向谷歌 AI Ultra 订阅用户开放
即日起,Project Genie(含全新街景功能)将向全球符合条件的谷歌 AI Ultra 订阅用户(每月 200 美元,18 岁及以上)逐步开放。
需要说明的是,Project Genie 目前仍是 Google Labs 旗下的实验性研究原型,谷歌团队正持续优化细节,提升画面的精准度与真实感。如需了解更多进展及当前限制,可访问谷歌官方网站获取详细信息。
Q&A
Q1:Project Genie 是什么?有什么用?
A:Project Genie 是谷歌旗下的通用世界模型实验性原型,能够生成多样化的交互式虚拟环境。它不仅是研究领域的基础工具,帮助 AI 智能体在复杂虚拟场景中学习与推理,还能协助 Waymo 模拟逼真的道路环境。最新升级后,它还能结合谷歌街景的真实影像,让用户探索真实地点或对其进行创意改造。
Q2:Project Genie 的街景接地功能怎么使用?
A:用户只需在 Project Genie 中点击地图图钉,选择一处美国境内的真实地点,再选择喜欢的世界风格(如"沙漠沙丘""海洋世界""黑白电影"等),并描述自己的角色形象,Genie 便会以街景真实影像为基础,生成一个充满想象力的虚拟世界。目前该功能覆盖美国境内地点,后续将扩展至更多区域。
Q3:Project Genie 向哪些用户开放?如何获取访问权限?
A:即日起,Project Genie 将逐步向全球符合条件的谷歌 AI Ultra 订阅用户开放,订阅费用为每月 200 美元,用户需年满 18 岁。Project Genie 目前仍是 Google Labs 旗下的实验性研究原型,谷歌团队正持续优化功能细节,提升画面精准度。
好文章,需要你的鼓励
谷歌发布Project Genie新功能,将其世界生成模型与Google街景视图相结合,使AI智能体能够在基于真实地点的虚拟环境中导航与交互。用户可选择美国任意地点,结合"沙漠""石器时代"等风格,生成富有创意的沉浸式世界。该功能目前已向全球符合条件的Google AI Ultra订阅用户(200美元/月)逐步开放,未来计划扩展至更多地区。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
保加利亚国家系统集成商BIS已部署谷歌云Cybershield服务,成为欧洲首批落地该方案的国家之一。项目获欧盟资金支持,旨在整合网络情报与遥测数据,覆盖54个政府及公共部门实体,将威胁检测与响应从被动转为主动。BIS将借助谷歌云安全运营平台及Mandiant威胁情报,构建联邦化跨机构安全运营中心,以AI驱动的防御能力应对日益复杂的网络威胁。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。