OpenAI本周宣布,在推出应用程序仅六个月后,将关闭其Sora应用程序和相关视频模型。
在最新一期TechCrunch的Equity播客节目中,Kirsten Korosec、Sean O'Kane和我就这一决定对OpenAI以及整个行业的意义进行了辩论。在某种程度上,这一举措似乎与我们听到的关于OpenAI的消息一致,即该公司正专注于企业和生产力工具,为可能的IPO做准备。
事实上,Kirsten建议,OpenAI关闭Sora的决定是"一个成熟的标志,很高兴在AI实验室中看到这一点"。
但是Sora的关闭,加上字节跳动据报道推迟在全球推出其Seedance 2.0视频模型,也可能是AI视频工具制造商以及声称这些工具很快将取代好莱坞的倡导者的一个现实检验时刻。
以下是我们对话的预览,经过长度和清晰度编辑。
Anthony:我认为值得强调的是,这不仅仅是应用程序。我的意思是,至少对我来说,这个应用程序特别没有吸引力,我认为对其他人也是如此,因为它是一个没有人的社交网络的想法,除了垃圾内容什么都没有。
但是除了应用程序之外,似乎OpenAI基本上正在结束它在视频方面所做的几乎所有事情。根据《华尔街日报》的报道,这个消息的一部分是,这实际上是关于OpenAI在可能上市之前,真正试图专注于商业产品、企业产品、编程产品的想法。因此,这个消费者社交应用程序,以及更广泛的视频,现在不是优先考虑的事项。
Sean:是的,我从来没有真正使用过这个应用程序。这个想法出于多种不同的原因让我感到厌恶。你知道,这是一个很好的提醒,OpenAI——我这样说并不是要以任何方式贬低他们——但我认为这可能是对他们内部的一个提醒,关于ChatGPT成功中的运气因素。
显然,这里有一些对人们有价值的东西,我不想抹杀这一点,因为如果没有一些正确的东西,你不可能达到我们听到他们报告的使用数字——更不用说它已经保持了多年,并发展成为对人们仍然有意义的东西。
但是当Sora出现时,有一种元素,就像"我们构建了有史以来最成功的消费者产品,现在我们又在做同样的事情。我们将引入迪士尼和所有这些东西。"我认为这是一个非常严酷的提醒,就是并不总是会有一个绝对的捷径通往最伟大的消费者产品的顶端,真的需要有一些人们觉得他们从中获得一些意义的东西,它才能坚持下去。
Kirsten:是的,我实际上想为OpenAI的这个决定点赞,因为我们有时会取笑"快速行动,打破常规"的整个想法,但我认为对于那些可以非常快速地迭代,然后杀死不起作用的产品而不感到失败的公司来说,是有一些价值的。我的意思是,真的有金钱损失。如果你看与迪士尼的交易,那是一个十亿美元的交易,但如果你看——我们对此没有洞察,因为我们没有看到他们的资产负债表——但他们在这上面花了多少钱,公司的长期价值是什么?
我认为,虽然看到他们能创造什么确实很有趣,但他们关闭它的决定,对我来说,显示了一个成熟的标志,很高兴在AI实验室中看到这一点。
Anthony:就这对OpenAI意味着什么而言,它似乎与我们听到的关于他们未来战略的一切都非常一致。就我们如何思考生成式AI的未来而言,这似乎不是一个巨大的打击或类似的东西。
特别是在视频方面,这很有趣,因为它也是在围绕Seedance有报道的时候出现的,Seedance是字节跳动的生成式AI视频模型。有报道称Seedance 2.0已被推迟,因为存在工程和法律问题,基本上是在弄清楚"我们能否在其中建立知识产权保护?"显然他们以前没有认真对待这个问题。
所以,这是一个现实检验时刻。有一些真正夸张的声明,包括来自好莱坞内部人员的声明,就像"我们完蛋了,这就是未来,只是输入提示并制作故事片。"事实证明,出于各种技术和法律原因,这并不那么容易,我们离那种情况的发生还很远很远。
Sean:我认为我们还应该说的最后一件事是,这是在Fidji Simo进来开始运营日常运营后似乎正在发生的许多决定之一。这只是OpenAI内部发生变化的一个巨大动态。我认为我们离她被选中管理这些事情的那一刻越远,特别是这些消费者产品并决定它们的命运,回过头来看这个时刻并思考这对这家公司来说是多么重大的一刻就会变得越容易。
Q&A
Q1:为什么OpenAI要关闭Sora应用程序?
A:OpenAI关闭Sora是为了专注于企业和生产力工具,为可能的IPO做准备。Sora应用程序被认为是一个没有真正用户的社交网络,只充斥着AI生成的内容,缺乏用户真正需要的价值。这个决定反映了公司战略的调整,从消费者产品转向商业应用。
Q2:Sora关闭对AI视频行业有什么影响?
A:Sora的关闭连同字节跳动Seedance 2.0的延期,为AI视频行业敲响了警钟。这表明AI视频技术距离取代传统影视制作还很遥远,面临技术和法律等多重挑战。那些声称AI视频工具将很快取代好莱坞的夸张说法得到了现实检验。
Q3:AI视频工具现在面临哪些挑战?
A:AI视频工具面临工程技术难题和知识产权保护等法律问题。字节跳动的Seedance 2.0就因为需要解决IP保护问题而延期发布。此外,这些工具还需要为用户创造真正的价值,而不仅仅是生成内容,才能在市场上立足。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。