《绿野仙踪》正在被转变为一种前所未有的沉浸式 3D 体验,这要归功于全新的人工智能技术,它不仅提升了影片的分辨率,还生成了额外的场景,以适应巨大的环绕式 LED 显示屏。
Sphere Entertainment Co.(拉斯维加斯 Sphere 球馆的运营商)表示,他们与 Google LLC 和华纳兄弟工作室合作,重新创作了这部 1939 年的经典之作,将其转变为一种"多感官体验",让观众能够以前所未有的方式沉浸在故事中。
这部被称为"Sphere 版绿野仙踪"的作品将于 8 月 28 日向观众开放。制作团队利用了 Google 最先进的 AI 模型来彻底重新构想这部经典电影,这次合作标志着这家科技巨头在娱乐领域更广泛拓展的开始。
为 3D 环境重新创作《绿野仙踪》并非易事。原版电影是使用三条胶片的 Technicolor 35 毫米电影摄影机拍摄的,这在当时是最先进的技术,但在今天已经完全过时。将其适配到 Sphere 的 16 万平方英尺弧形、16K 分辨率显示屏上是一项巨大的挑战,但 Google 的 AI 显然完全胜任这项任务。
拥有 17,600 个座位的 Sphere 是一个巨大的球形结构,外部包裹着一种 LED 显示屏外骨架,使其成为世界上最独特的场馆之一。它此前曾举办过 Eagles 和 U2 等表演者的沉浸式音乐会,并放映了一些专为其沉浸式屏幕创作的电影。但其运营商从未尝试过将现有电影改编以适应其不寻常的特性。
然而,在与华纳兄弟达成授权协议获得改编其电影内容的权利后,Sphere 决定迎接这一挑战。随后,公司转向 Google,请求他们使用 AI 魔法来实现这一壮举。
Google DeepMind 的 AI 基础研究总监 Steven Hickson 在接受《华尔街日报》采访时描述了他的团队面临的巨大挑战。"有些场景中,稻草人的鼻子只有约 10 个像素,"他说,"这是一个很大的技术挑战。"
Google 认为只有其最先进的大型语言模型,如 Gemini、Veo 2 和 Imagen 3,才能胜任将《绿野仙踪》呈现为全沉浸式 3D 体验的任务,但仅靠这些还不够。此外,他们还必须设计新技术,如"表演生成"和"外部绘制",以提高电影的分辨率并扩展场景,包括原片中不存在的图像和角色。
这些工作对于使电影适应 Sphere 的新型屏幕是必要的,该屏幕完全环绕观众,让他们感觉自己就在电影的中心。
Hickson 表示,在一个场景中,电影主角多萝西正在与艾姆婶婶和古尔奇小姐交谈,观众知道亨利叔叔也在房间里。但在原版中,亨利叔叔并没有出现在镜头中。在 Sphere 的版本中,观众将能够转身看到亨利叔叔,以及原始场景中未出现的房子的其他部分。Google 表示,这些元素都是使用 AI 生成的。
在拉斯维加斯 Google Cloud Next 开发者大会前夕的特别预览会上,展示的一些场景效果令人印象深刻,尽管有些画面有时看起来略显人工痕迹。Google 和创作者似乎表示,在 8 月底正式开放前,他们还有很多工作要做。
Google Cloud 生成式 AI 工程全球负责人 Ravi Rajamani 表示,超过 90% 的电影内容都经过了 AI 处理。观众还将体验到其他 AI 生成的感官元素,但 Sphere 尚未透露具体内容。
Google 与洛杉矶的沉浸式工作室公司 Magnopus LLC 合作完成了这个项目,并咨询了包括奥斯卡提名人 Jane Rosenthal 在内的专业好莱坞制作人。
"没有其他公司能做到这一点,"Sphere 首席执行官 Jim Dolan 在 SiliconANGLE 参加的今日预览会上表示,并补充说他最初曾就这个项目接触过六家公司。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。