谷歌近日宣布,旗下世界探索游戏Project Genie将新增一项功能,允许用户置身于真实地点,甚至包括自己所在的街道。
Project Genie于今年年初正式推出。简而言之,该工具利用Nana Banana Pro模型构建可探索的微型世界,操作方式类似电子游戏,支持第一人称或第三人称视角。项目上线之初仅能生成虚构场景,而最新更新则为其注入了真实世界的元素。
新版Project Genie将接入谷歌街景图像数据,以此为基础创建源自真实地点的虚拟世界。
谷歌对此解释称:
"通过此次升级,用户不仅可以借助真实世界的图像探索自己喜爱的地点,还能发挥创意对其进行重新演绎……在Project Genie中创建想象世界时,现在可以以真实地点为蓝本。只需点击地图定位图标,选择美国境内的某个地点,并可选择为世界设定一种风格,例如'沙漠风情'或'石器时代'。然后描述你的角色——比如你最喜欢的动物、漫画英雄,甚至是一个黏土怪物,Genie便会以街景真实图像为起点,创造出一个充满想象力的虚拟世界。"
在生成真实地点时,用户可从多种环境风格中进行选择,并通过输入文字描述来自定义角色形象。目前来看,可选地点仅限于街景中收录的图像,但这已经带来了近乎无限的可能性。
Project Genie仍将限定在AI Ultra订阅层级的用户使用。该工具对算力要求极高——为了构建一个可以20至24帧每秒流畅探索的场景,系统需要持续生成数百张相互关联的图像。每次游览时长限制为60秒,但这已足够让用户以熟悉的WASD操控方式,在同一地点的原貌或全然不同的风格之间自由切换。
谷歌表示,接入街景功能的Project Genie将首先面向美国用户开放,并计划"逐步"扩展至其他地区。目前该研究工具的画面精度尚有不足,谷歌也计划在未来进一步提升细节表现与真实感。
Q&A
Q1:Project Genie是什么?它有什么新功能?
A:Project Genie是谷歌推出的一款世界探索实验性工具,利用AI模型构建可用游戏方式操控的虚拟世界,支持第一人称和第三人称视角。最新更新新增了接入谷歌街景图像的功能,用户可以选择美国境内的真实地点,并设定世界风格和角色描述,生成基于真实场景的虚拟探索世界。
Q2:Project Genie对普通用户开放吗?有哪些限制?
A:目前Project Genie仅对AI Ultra订阅层级的用户开放,且街景功能暂时只在美国地区上线,未来计划逐步扩展。此外,每次探索时长限制为60秒,画面精度也尚未达到高度还原的水平,谷歌表示后续会持续优化。
Q3:Project Genie生成的真实地点场景准确吗?
A:目前准确度有限,谷歌官方也承认该工具仍是实验性研究原型,画面细节还不够精准。不过谷歌已表示有计划提升场景的细节表现和真实还原度,未来版本将逐步改善这一问题。
好文章,需要你的鼓励
谷歌宣布为旗下互动世界构建工具Project Genie新增Google街景功能,用户可基于真实地点生成可探索的游戏世界。只需选定美国境内的地图位置,描述角色形象,并选择"沙漠"或"石器时代"等风格,系统即可生成与现实街景绑定的沉浸式虚拟场景。每次游玩时长限60秒,支持WASD操控,目前仅向AI Ultra订阅用户开放,后续将逐步扩展覆盖范围。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。