Genie 是谷歌旗下一款通用世界模型,能够生成多样化的交互式虚拟环境。自发布以来,Genie 已成为研究领域的重要基础工具,不仅帮助智能体在复杂虚拟场景中学习与推理,还协助 Waymo 模拟高度逼真的道路行驶环境。
如今,谷歌迈出了重要一步——将 Genie 的生成能力与谷歌街景的真实世界影像相结合,使模型得以在现实世界中找到坐标锚点。这一能力的扩展,可以为 AI 智能体或机器人提供虚拟环境,让它们在其中导航并应对真实世界的复杂情况。
街景接地功能现已上线:让虚拟世界扎根于现实
谷歌今天正式在实验性原型项目 Project Genie 中推出全新的街景接地功能,同时将 Project Genie 的访问权限向全球更多用户开放。
通过此次升级,用户可以利用真实世界的街景影像,探索自己喜爱的地点,或对其进行创意改造。在 Project Genie 中创建虚拟世界时,用户现在可以选择以真实地点为基础。只需点击地图图钉,选择一处美国境内的地点,再搭配"沙漠沙丘"或"石器时代"等风格,然后描述自己的角色形象——可以是最喜欢的动物、漫画英雄,甚至是黏土怪物——Genie 便会将这些信息融合,创造出一个以街景真实影像为起点的奇幻世界。该功能由"地图影像接地"技术驱动,与开发者用于生成精美 AI 视觉内容的街景技术一脉相承。
举个例子:想看看旧金山金门大桥在海底的模样?选择"海洋世界"风格,即可化身潜水员,与成群的鱼儿在大桥周围遨游。又或者想一探德克萨斯州标志性的沃思堡牲畜围场在 1920 年代的风貌?选择"黑白电影"风格,便能沉浸在一个充满酒馆、老式汽车和贸易站的复古世界中。
目前,Project Genie 的街景功能已覆盖美国境内地点,后续计划逐步扩展至更多地区。
Project Genie 现向谷歌 AI Ultra 订阅用户开放
即日起,Project Genie(含全新街景功能)将向全球符合条件的谷歌 AI Ultra 订阅用户(每月 200 美元,18 岁及以上)逐步开放。
需要说明的是,Project Genie 目前仍是 Google Labs 旗下的实验性研究原型,谷歌团队正持续优化细节,提升画面的精准度与真实感。如需了解更多进展及当前限制,可访问谷歌官方网站获取详细信息。
Q&A
Q1:Project Genie 是什么?有什么用?
A:Project Genie 是谷歌旗下的通用世界模型实验性原型,能够生成多样化的交互式虚拟环境。它不仅是研究领域的基础工具,帮助 AI 智能体在复杂虚拟场景中学习与推理,还能协助 Waymo 模拟逼真的道路环境。最新升级后,它还能结合谷歌街景的真实影像,让用户探索真实地点或对其进行创意改造。
Q2:Project Genie 的街景接地功能怎么使用?
A:用户只需在 Project Genie 中点击地图图钉,选择一处美国境内的真实地点,再选择喜欢的世界风格(如"沙漠沙丘""海洋世界""黑白电影"等),并描述自己的角色形象,Genie 便会以街景真实影像为基础,生成一个充满想象力的虚拟世界。目前该功能覆盖美国境内地点,后续将扩展至更多区域。
Q3:Project Genie 向哪些用户开放?如何获取访问权限?
A:即日起,Project Genie 将逐步向全球符合条件的谷歌 AI Ultra 订阅用户开放,订阅费用为每月 200 美元,用户需年满 18 岁。Project Genie 目前仍是 Google Labs 旗下的实验性研究原型,谷歌团队正持续优化功能细节,提升画面精准度。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。