OpenAI推出的AI视频生成应用和社交网络Sora已经获得超过100万次下载,据Sora负责人Bill Peebles透露。该应用在不到5天内就达到了100万下载量,Peebles表示这"甚至比ChatGPT当初的增长还要快"。这一成绩尤其令人瞩目,因为OpenAI目前仅在北美地区提供该应用,且用户需要获得邀请才能实际使用。
Sora的运作模式类似TikTok
与TikTok类似,Sora提供无穷无尽的垂直视频流,不同之处在于Sora的视频全部由AI生成,而非用户上传。用户只需在应用中向OpenAI的Sora 2模型输入提示词,就能轻松创建10秒钟的视频。通过Sora的Cameo功能,用户甚至可以创建包含自己和其他同意分享肖像的人的视频。
内容管控面临挑战
OpenAI对Sora设置的有限防护措施已经导致出现大量以OpenAI首席执行官Sam Altman为主角的视频,以及明显侵犯版权的内容。Sora能够轻易创建皮卡丘等知名角色的视频这一事实,引发了人们对OpenAI模型训练数据来源的质疑,并毫不意外地招致了娱乐行业的强烈反对。
作为回应,OpenAI已经更新了Sora,为用户提供更多控制权,让他们能够决定自己的肖像可以出现在哪些视频中。据Altman介绍,OpenAI计划为版权持有者提供类似的控制功能,让他们"能够指定自己的角色如何被使用(包括完全不允许使用)"。目前尚不清楚为什么这些控制功能在Sora发布时并未提供,但这两项改进看起来都是积极的变化。
商业前景与用户增长
由于Sora采用邀请制系统,很难确定超过100万的下载量是否转化为同等数量的实际用户。用户下载应用但从未使用的情况并不罕见。无论如何,OpenAI在AI生成视频领域的押注似乎可能会取得成功,前提是该公司能够找到一种方法,让为Sora生成视频实际赚到的钱超过成本支出。
Q&A
Q1:Sora应用的下载量表现如何?
A:Sora在不到5天内就达到了100万下载量,这一增长速度甚至超过了ChatGPT当初的表现,尽管目前仅在北美地区提供且需要邀请才能使用。
Q2:Sora如何生成AI视频?
A:Sora的运作模式类似TikTok,提供垂直视频流,但所有视频都由AI生成。用户只需向OpenAI的Sora 2模型输入提示词就能创建10秒视频,还可通过Cameo功能制作包含自己肖像的视频。
Q3:Sora在版权保护方面有什么措施?
A:OpenAI已更新Sora,让用户能控制自己肖像的使用范围,并计划为版权持有者提供类似控制功能,让他们能指定角色的使用方式,包括完全禁止使用。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。