OpenAI推出的AI视频生成应用和社交网络Sora已经获得超过100万次下载,据Sora负责人Bill Peebles透露。该应用在不到5天内就达到了100万下载量,Peebles表示这"甚至比ChatGPT当初的增长还要快"。这一成绩尤其令人瞩目,因为OpenAI目前仅在北美地区提供该应用,且用户需要获得邀请才能实际使用。
Sora的运作模式类似TikTok
与TikTok类似,Sora提供无穷无尽的垂直视频流,不同之处在于Sora的视频全部由AI生成,而非用户上传。用户只需在应用中向OpenAI的Sora 2模型输入提示词,就能轻松创建10秒钟的视频。通过Sora的Cameo功能,用户甚至可以创建包含自己和其他同意分享肖像的人的视频。
内容管控面临挑战
OpenAI对Sora设置的有限防护措施已经导致出现大量以OpenAI首席执行官Sam Altman为主角的视频,以及明显侵犯版权的内容。Sora能够轻易创建皮卡丘等知名角色的视频这一事实,引发了人们对OpenAI模型训练数据来源的质疑,并毫不意外地招致了娱乐行业的强烈反对。
作为回应,OpenAI已经更新了Sora,为用户提供更多控制权,让他们能够决定自己的肖像可以出现在哪些视频中。据Altman介绍,OpenAI计划为版权持有者提供类似的控制功能,让他们"能够指定自己的角色如何被使用(包括完全不允许使用)"。目前尚不清楚为什么这些控制功能在Sora发布时并未提供,但这两项改进看起来都是积极的变化。
商业前景与用户增长
由于Sora采用邀请制系统,很难确定超过100万的下载量是否转化为同等数量的实际用户。用户下载应用但从未使用的情况并不罕见。无论如何,OpenAI在AI生成视频领域的押注似乎可能会取得成功,前提是该公司能够找到一种方法,让为Sora生成视频实际赚到的钱超过成本支出。
Q&A
Q1:Sora应用的下载量表现如何?
A:Sora在不到5天内就达到了100万下载量,这一增长速度甚至超过了ChatGPT当初的表现,尽管目前仅在北美地区提供且需要邀请才能使用。
Q2:Sora如何生成AI视频?
A:Sora的运作模式类似TikTok,提供垂直视频流,但所有视频都由AI生成。用户只需向OpenAI的Sora 2模型输入提示词就能创建10秒视频,还可通过Cameo功能制作包含自己肖像的视频。
Q3:Sora在版权保护方面有什么措施?
A:OpenAI已更新Sora,让用户能控制自己肖像的使用范围,并计划为版权持有者提供类似控制功能,让他们能指定角色的使用方式,包括完全禁止使用。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。