谷歌宣布推出一项新的YouTube Shorts混剪功能,允许用户借助Gemini Omni对视频片段进行风格重塑,甚至可以将自己插入他人的视频之中。
目前,在观看YouTube短视频时,点击底部的混剪图标,即可看到"重新构想"选项。用户可以通过提示词引导Gemini将视频转换为像素艺术风格、动漫风格,或是模拟恐怖找镜头风格。除此之外,还可以对视频内容进行更多创意改动,例如将人物头部放大、添加背景演员、给人物换上海盗服装,甚至将自己的形象植入视频片段之中。
创作者可以自主选择是否开启"重新构想"功能。例如,若创作者上传了一段包含孩子的视频,出于隐私保护等合理考量,可以关闭他人对该视频的混剪权限。谷歌同时表示,通过Gemini Omni混剪生成的短视频将附带数字水印,并附上指向原始视频的链接,以保障原创内容的溯源性。
Q&A
Q1:YouTube Shorts的AI混剪功能具体能做什么?
A:YouTube Shorts的AI混剪功能由Gemini Omni驱动,用户点击短视频底部的混剪图标后,可选择"重新构想"对视频进行风格转换,例如将视频变成像素艺术、动漫风格或恐怖找镜头风格。此外,还支持放大人物头部、添加背景角色、更换服装,甚至将自己插入他人视频中。
Q2:创作者可以防止自己的视频被AI混剪吗?
A:可以。谷歌为创作者提供了开关选项,允许其自主决定是否开放视频的"重新构想"功能。如果创作者不希望他人对自己的视频进行AI混剪,例如涉及孩子或隐私内容的视频,可以直接关闭该权限,保护原始内容不被随意修改。
Q3:AI混剪生成的视频会标注来源吗?
A:会的。谷歌表示,通过Gemini Omni混剪生成的YouTube Shorts视频将自动附带数字水印,并包含指向原始视频的链接,确保混剪内容可以溯源,保障原创者的权益。
好文章,需要你的鼓励
Paramount正加速推进AI布局,同时面临CTO Phil Wiser五月底计划离职的人事变动。在收购华纳兄弟探索公司接近尾声之际,Paramount CIO Lakshman Nathan在路透社举办的Momentum AI大会上分享了公司AI战略:公司已在隐私、法务及代码开发等领域部署AI,两天内即可完成应用测试交付。Paramount采取开放探索与治理并行的策略,借助智能体AI推动企业级应用整合,同时稳步处理多次并购带来的遗留系统问题。
BEAM是阿里巴巴与北京大学提出的MoE大模型动态路由方法,通过可学习的二值掩码实现每个词自适应选择激活专家数量,在保留98%性能的前提下将推理速度提升最高2.5倍。
量子计算行业正面临两大迫切问题:安全威胁与人才短缺。随着"Q-Day"临近,量子计算机或将破解RSA加密体系,威胁银行、医疗、政府等关键基础设施安全。NIST要求2035年前完成向后量子密码学的迁移。与此同时,行业人才严重匮乏——目前仅有3万名量子专业人员,而2029年需求将达25万人。据麦肯锡预测,量子计算到2035年将创造3万亿美元经济机遇。
CurveBench是由四所高校联合构建的视觉拓扑推理基准,通过让AI识别嵌套闭合曲线的层次包含关系,揭示了顶尖视觉语言模型在空间结构理解上的系统性缺陷。