OpenAI推出的AI视频生成应用和社交网络Sora已经获得超过100万次下载,据Sora负责人Bill Peebles透露。该应用在不到5天内就达到了100万下载量,Peebles表示这"甚至比ChatGPT当初的增长还要快"。这一成绩尤其令人瞩目,因为OpenAI目前仅在北美地区提供该应用,且用户需要获得邀请才能实际使用。
Sora的运作模式类似TikTok
与TikTok类似,Sora提供无穷无尽的垂直视频流,不同之处在于Sora的视频全部由AI生成,而非用户上传。用户只需在应用中向OpenAI的Sora 2模型输入提示词,就能轻松创建10秒钟的视频。通过Sora的Cameo功能,用户甚至可以创建包含自己和其他同意分享肖像的人的视频。
内容管控面临挑战
OpenAI对Sora设置的有限防护措施已经导致出现大量以OpenAI首席执行官Sam Altman为主角的视频,以及明显侵犯版权的内容。Sora能够轻易创建皮卡丘等知名角色的视频这一事实,引发了人们对OpenAI模型训练数据来源的质疑,并毫不意外地招致了娱乐行业的强烈反对。
作为回应,OpenAI已经更新了Sora,为用户提供更多控制权,让他们能够决定自己的肖像可以出现在哪些视频中。据Altman介绍,OpenAI计划为版权持有者提供类似的控制功能,让他们"能够指定自己的角色如何被使用(包括完全不允许使用)"。目前尚不清楚为什么这些控制功能在Sora发布时并未提供,但这两项改进看起来都是积极的变化。
商业前景与用户增长
由于Sora采用邀请制系统,很难确定超过100万的下载量是否转化为同等数量的实际用户。用户下载应用但从未使用的情况并不罕见。无论如何,OpenAI在AI生成视频领域的押注似乎可能会取得成功,前提是该公司能够找到一种方法,让为Sora生成视频实际赚到的钱超过成本支出。
Q&A
Q1:Sora应用的下载量表现如何?
A:Sora在不到5天内就达到了100万下载量,这一增长速度甚至超过了ChatGPT当初的表现,尽管目前仅在北美地区提供且需要邀请才能使用。
Q2:Sora如何生成AI视频?
A:Sora的运作模式类似TikTok,提供垂直视频流,但所有视频都由AI生成。用户只需向OpenAI的Sora 2模型输入提示词就能创建10秒视频,还可通过Cameo功能制作包含自己肖像的视频。
Q3:Sora在版权保护方面有什么措施?
A:OpenAI已更新Sora,让用户能控制自己肖像的使用范围,并计划为版权持有者提供类似控制功能,让他们能指定角色的使用方式,包括完全禁止使用。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。