周二早上通勤途中,我收到一封令我驻足的邮件。这是一个链接,指向由富有远见的电影制作人、AI 艺术家 Kavan Cardoza(艺名 Kavan the Kid)制作的一部星球大战宇宙中的新短片《幽灵的学徒》。转眼间,我就在观看可能是近年来最令人惊叹的星球大战作品——这部作品并非出自卢卡斯影业的工业化制作,而是由一位独立创作者运用尖端 AI 工具打造而成。
Cardoza 在使用 AI 制作爆红影片方面并不陌生。去年 12 月,他用 AI 制作的蝙蝠侠短片以其诡异梦幻的质感震惊了观众——以至于华纳兄弟迅速发出了下架通知。现在,他在星球大战领域故技重施,如果迪士尼还没有起草停止通知函,等你读完这篇文章,他们可能就会这么做了。
但他们不应该这样。他们应该聘用他。
AI 驱动的杰作
Cardoza 的星球大战粉丝短片讲述了一个与该系列一样古老的故事——一个年轻的绝地武士为了安全被母亲遗弃,在叔叔和叔叔的幽灵的指导下独自接受训练。让这部作品与众不同的不仅是其情感深度,更在于其出色的技术执行。值得注意的是,当我在演讲厅的大屏幕上放映这部电影时,效果非常出色。没有人工痕迹,没有视觉偏差。如果不告诉你这些令人惊叹的视觉效果是由 AI 制作的,你根本看不出来。而精彩的故事讲述完全归功于 Cardoza。
在与查普曼大学道奇电影学院我的"AI 与前期制作"课程的一次临时 Zoom 通话中,Cardoza 分享了他如何在短短 14 天内,每天工作 12 小时,使用包括 Google 的 Veo、Midjourney 和 Runway 在内的多种 AI 工具创作这部影片。他将 AI 生成视频推向极限,以至于他过度使用 Google Veo 的容量而被切断了进一步使用权限。
在影片的大部分内容中,Veo 负责文本到视频的生成,完美地将 Cardoza 的愿景变为现实。但当他在最后一个场景失去访问权限时,不得不转向使用 Kling 和 Midjourney 完成最后的镜头。"我实际上通过 Veo 完成了 11 分半钟中的 10 分半钟的视频,"Cardoza 告诉我的学生。"然后我失去了访问权限。这就像在跑马拉松时看到终点线,突然有人打断了你的膝盖。"
"能够不花费数万或数十万美元就完成这样的作品,这真是太棒了,"Cardoza 说。"现在,关键就在于你愿意把技术推进到什么程度。"
电影制作的未来——还是好莱坞的终结?
"这是好莱坞的终结,"我的一个学生在通话中说道。"不,"我说。"这是新好莱坞的黎明。"对有才华和雄心壮志的年轻人来说,这是一个绝佳的机会。
Cardoza 已经在与主要制片厂和品牌洽谈。自从蝙蝠侠短片之后,他的 AI 工作室 Phantom X 收到了大量咨询。好莱坞的把关者可能急于让他停止创作,但这个行业应该向他学习。
星球大战一直是追梦者和反叛者的神话——那些推动体制创造出比自己更伟大事物的人。如果银河系中还有正义,Kavan Cardoza 收到的就不会是停止通知函。
而是一份合同。
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
NVIDIA联合多所大学开发的Omni-RGPT实现了AI视觉理解的重要突破,首次让AI能同时精准理解图像和视频中用户指定的任何区域。通过独创的Token Mark机制,该系统解决了传统方法在视频中容易"跟丢"目标的问题,在视觉问答、区域描述等多项任务上达到最先进水平,为教育、安防、内容创作等领域的AI应用奠定了基础。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。