周二早上通勤途中,我收到一封令我驻足的邮件。这是一个链接,指向由富有远见的电影制作人、AI 艺术家 Kavan Cardoza(艺名 Kavan the Kid)制作的一部星球大战宇宙中的新短片《幽灵的学徒》。转眼间,我就在观看可能是近年来最令人惊叹的星球大战作品——这部作品并非出自卢卡斯影业的工业化制作,而是由一位独立创作者运用尖端 AI 工具打造而成。
Cardoza 在使用 AI 制作爆红影片方面并不陌生。去年 12 月,他用 AI 制作的蝙蝠侠短片以其诡异梦幻的质感震惊了观众——以至于华纳兄弟迅速发出了下架通知。现在,他在星球大战领域故技重施,如果迪士尼还没有起草停止通知函,等你读完这篇文章,他们可能就会这么做了。
但他们不应该这样。他们应该聘用他。
AI 驱动的杰作
Cardoza 的星球大战粉丝短片讲述了一个与该系列一样古老的故事——一个年轻的绝地武士为了安全被母亲遗弃,在叔叔和叔叔的幽灵的指导下独自接受训练。让这部作品与众不同的不仅是其情感深度,更在于其出色的技术执行。值得注意的是,当我在演讲厅的大屏幕上放映这部电影时,效果非常出色。没有人工痕迹,没有视觉偏差。如果不告诉你这些令人惊叹的视觉效果是由 AI 制作的,你根本看不出来。而精彩的故事讲述完全归功于 Cardoza。
在与查普曼大学道奇电影学院我的"AI 与前期制作"课程的一次临时 Zoom 通话中,Cardoza 分享了他如何在短短 14 天内,每天工作 12 小时,使用包括 Google 的 Veo、Midjourney 和 Runway 在内的多种 AI 工具创作这部影片。他将 AI 生成视频推向极限,以至于他过度使用 Google Veo 的容量而被切断了进一步使用权限。
在影片的大部分内容中,Veo 负责文本到视频的生成,完美地将 Cardoza 的愿景变为现实。但当他在最后一个场景失去访问权限时,不得不转向使用 Kling 和 Midjourney 完成最后的镜头。"我实际上通过 Veo 完成了 11 分半钟中的 10 分半钟的视频,"Cardoza 告诉我的学生。"然后我失去了访问权限。这就像在跑马拉松时看到终点线,突然有人打断了你的膝盖。"
"能够不花费数万或数十万美元就完成这样的作品,这真是太棒了,"Cardoza 说。"现在,关键就在于你愿意把技术推进到什么程度。"
电影制作的未来——还是好莱坞的终结?
"这是好莱坞的终结,"我的一个学生在通话中说道。"不,"我说。"这是新好莱坞的黎明。"对有才华和雄心壮志的年轻人来说,这是一个绝佳的机会。
Cardoza 已经在与主要制片厂和品牌洽谈。自从蝙蝠侠短片之后,他的 AI 工作室 Phantom X 收到了大量咨询。好莱坞的把关者可能急于让他停止创作,但这个行业应该向他学习。
星球大战一直是追梦者和反叛者的神话——那些推动体制创造出比自己更伟大事物的人。如果银河系中还有正义,Kavan Cardoza 收到的就不会是停止通知函。
而是一份合同。
好文章,需要你的鼓励
TechCrunch Disrupt 2025 AI舞台将汇聚塑造科技未来的领军人物,顶尖风投将揭示在快速变化的AI领域获得融资的关键。来自Apptronik、ElevenLabs、Hugging Face、Runway等创新企业的领导者将分享前沿洞见,探讨AI如何重塑创意过程、改变物理世界、变革国防安全和重新定义人际关系。10月27-29日,五大主题舞台将在旧金山呈现科技创新的未来图景。
西班牙研究团队提出了一种创新的AI自我纠错方法SSC,让人工智能学会识别和修正规则中的漏洞。当AI发现自己在钻空子获得高分时,它会反思规则的合理性并主动改进。实验显示这种方法将AI的"钻空子"行为从50-70%降低到3%以下,同时提升了回答质量。这项技术有望让AI从被动执行指令转变为能够质疑和改进指令的智能协作伙伴。
英超联赛与微软达成五年战略合作伙伴关系,推出AI驱动的Premier League Companion服务,为全球球迷提供个性化体验。该服务利用Azure OpenAI技术,整合30多个赛季的统计数据、30万篇文章和9000个视频,帮助球迷发现和了解更多内容。未来还将为Fantasy Premier League引入个人助理经理功能,并通过Azure AI优化比赛直播体验和赛后分析。
这篇文章详细解析了Long、Shelhamer和Darrell在2015年CVPR会议上发表的开创性研究"全卷积网络用于语义分割"。文章以通俗易懂的方式,将这项复杂的技术比作艺术家的绘画过程,解释了如何让计算机不仅识别图像中有什么物体,还能精确标出每个物体的位置和边界。研究团队通过将传统分类网络改造为全卷积形式,并巧妙运用上采样和跳跃连接技术,实现了高效准确的像素级图像理解。这一突破为自动驾驶、医学影像和增强现实等领域带来了革命性变化,奠定了现代计算机视觉的重要基础。