你是否曾想过金门大桥沉入水底会是什么样子?现在,你可以亲眼一见。
在谷歌I/O年度开发者大会上,谷歌宣布为Project Genie推出全新功能。Project Genie是一款实验性生成式AI世界模型网页应用,于今年1月首次发布。此次新功能将谷歌地图收录的2800亿张街景图片(覆盖110个国家)与文字生成视频的模拟能力相结合,让AI生成的虚拟场景得以落地于真实世界。
借助这一功能,你可以在自己熟悉的真实地点基础上,运用生成式AI赋予它全新的奇幻风貌。
模拟真实世界场景
通过将两款产品打通,用户可以把Project Genie的生成式能力与谷歌地图海量街景数据相结合,让AI模型以现实为锚点进行创作。操作方式很简单:点击地图图标选择美国境内的一个地点,再通过AI选择一种风格即可。(该功能目前仅支持美国地区,后续计划向全球扩展。)
举例来说,如果你想看到沉入水底的金门大桥,只需选择"海洋世界"风格,AI便会在这座著名地标的真实画面中加入幻想中的潜水员和成群游鱼。此外,你还可以选择"沙漠风情""石器时代"或"黑白电影"等风格,打造复古质感,随心匹配你想要的氛围。
这一功能基于地图影像锚定技术(Maps Imagery Grounding)实现,与开发者利用街景图像生成AI视觉内容所使用的技术相同。
Project Genie向谷歌AI Ultra用户开放
Project Genie及其街景新功能现已面向全球谷歌AI Ultra订阅用户陆续推出。
Q&A
Q1:Project Genie是什么?它有什么新功能?
A:Project Genie是谷歌推出的一款实验性生成式AI世界模型网页应用,于2025年1月首次发布。此次在谷歌I/O大会上宣布的新功能,将谷歌地图2800亿张街景图片与AI生成能力结合,用户可以选择真实地点并为其叠加奇幻风格,比如让金门大桥变成水下世界,或呈现沙漠、石器时代等视觉效果。
Q2:Project Genie目前支持哪些地区和风格?
A:目前Project Genie的街景功能仅支持美国境内的地点,谷歌计划未来向全球扩展。在风格选择上,用户可以选择"海洋世界""沙漠风情""石器时代""黑白电影"等多种风格,将真实场景转化为各具特色的幻想画面。
Q3:Project Genie用了什么技术来结合真实地图数据?
A:Project Genie使用了谷歌的地图影像锚定技术(Maps Imagery Grounding),这与开发者利用街景图像生成AI视觉内容所采用的技术相同。通过这项技术,AI生成的画面能够以真实的街景图像为基础,在保留地标真实面貌的同时叠加创意风格效果。
好文章,需要你的鼓励
Locus Robotics宣布收购加拿大温哥华机器人公司Nexera Robotics,将其专有的NeuraGrasp末端执行器技术整合至Locus Array平台。NeuraGrasp融合AI抓取智能、计算机视觉及专利软膜结构,可动态适应不同形状、材质、重量的商品,显著扩大了可自主拣选的SKU类型范围。此次收购将加速Locus Robotics在移动操控领域的技术路线图,推动仓储全流程自动化履约能力迈上新台阶。
ServiceNow研究团队构建的EVA-Bench框架,通过AI对AI的音频通话测试,量化评估语音客服系统在准确性和对话体验两个维度的真实表现,揭示现有系统普遍存在的可靠性缺口。
人形机器人正从原型验证迈向早期商业部署,汽车制造与物流领域预计成为未来十年核心需求市场。IDTechEx预测,相关市场规模将于2030年代初达到约250亿美元,2036年年出货量接近180万台。硬件成本持续下降,均价有望从2024年的约11.47万美元降至2030年的约3.7万美元。高利用率场景下运营成本有望低于5美元/小时,投资回收期可缩短至约6个月。但大规模商业化的关键,仍在于软件能力、任务泛化与系统集成的持续突破。
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。