虽然OpenAI可能通过关闭Sora应用程序而削减其在视频生成市场的努力,但字节跳动周四确认,其新的音视频模型Dreamina Seedance 2.0现在正在其编辑平台CapCut中推出。
字节跳动表示,该模型允许创作者通过提示词、图像或参考视频来起草、编辑和同步视频和音频内容。
分阶段推出将首先在巴西、印度尼西亚、马来西亚、墨西哥、菲律宾、泰国和越南的CapCut用户中开始,随着时间的推移将增加更多市场。
在CapCut推出的消息传出之前,最近有报告称该模型的全球推出将暂停,因为需要解决知识产权问题,这些问题因涉嫌版权侵权而受到好莱坞的批评。这很可能解释了该模型目前在CapCut中可用的市场数量有限的原因。
在中国,该模型可供字节跳动剪映应用的用户使用。
字节跳动在其公告中表示,即使创作者只使用几个词来描述他们心中的场景,视频生成模型也可以在没有参考图像的情况下工作。CapCut还擅长在各种视觉角度和视角中渲染逼真的纹理、运动和光线,公司指出这可以用来编辑、增强或修正创作者自己的素材。
另一个用例是允许创作者在拍摄真实视频之前,基于早期概念或草图测试潜在的想法。
此外,公司解释说,Dreamina Seedance 2.0可以用于广泛的内容,包括烹饪食谱、健身教程、商业或产品概述,以及包含运动或动作重点内容的视频,而AI视频模型在历史上在这些领域面临挑战。
在推出时,该模型支持长达15秒的剪辑,跨越六种宽高比。
在CapCut中,该模型将在不同领域推出,包括AI视频等编辑功能和视频工作室等生成工具。它还将应用到字节跳动的生成式AI平台Dreamina和其营销平台Pippit。
鉴于其创建逼真内容的能力,字节跳动表示已添加安全限制,因此该模型将无法从包含真实面孔的图像或视频制作视频。CapCut还将阻止未经授权生成知识产权的使用。(然而,如果限制措施正常工作,该模型现在就可以在美国使用。很可能仍在进行更多调整。)
字节跳动补充说,Dreamina Seedance 2.0生成的内容还将包含不可见水印,这将有助于在内容在平台外分享时识别用该模型制作的内容。这可以帮助处理权利持有者在模型允许版权内容通过时的删除请求等事务。
字节跳动表示,随着模型的推出,将与专家和创意社区合作,迭代和改进模型的能力。
Q&A
Q1:Dreamina Seedance 2.0是什么?它有什么功能?
A:Dreamina Seedance 2.0是字节跳动开发的新音视频生成模型,允许创作者通过提示词、图像或参考视频来起草、编辑和同步视频音频内容,支持长达15秒的视频生成。
Q2:这个模型目前在哪些地区可以使用?
A:目前分阶段推出,首先在巴西、印度尼西亚、马来西亚、墨西哥、菲律宾、泰国和越南的CapCut用户中开始,中国用户可通过剪映应用使用,未来将扩展到更多市场。
Q3:字节跳动如何解决AI生成内容的版权和安全问题?
A:字节跳动添加了安全限制,模型无法从包含真实面孔的图像生成视频,阻止未经授权的知识产权生成,并在生成内容中加入不可见水印用于识别AI制作内容。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。