谷歌宣布推出一项新的YouTube Shorts混剪功能,允许用户借助Gemini Omni对视频片段进行风格重塑,甚至可以将自己插入他人的视频之中。
目前,在观看YouTube短视频时,点击底部的混剪图标,即可看到"重新构想"选项。用户可以通过提示词引导Gemini将视频转换为像素艺术风格、动漫风格,或是模拟恐怖找镜头风格。除此之外,还可以对视频内容进行更多创意改动,例如将人物头部放大、添加背景演员、给人物换上海盗服装,甚至将自己的形象植入视频片段之中。
创作者可以自主选择是否开启"重新构想"功能。例如,若创作者上传了一段包含孩子的视频,出于隐私保护等合理考量,可以关闭他人对该视频的混剪权限。谷歌同时表示,通过Gemini Omni混剪生成的短视频将附带数字水印,并附上指向原始视频的链接,以保障原创内容的溯源性。
Q&A
Q1:YouTube Shorts的AI混剪功能具体能做什么?
A:YouTube Shorts的AI混剪功能由Gemini Omni驱动,用户点击短视频底部的混剪图标后,可选择"重新构想"对视频进行风格转换,例如将视频变成像素艺术、动漫风格或恐怖找镜头风格。此外,还支持放大人物头部、添加背景角色、更换服装,甚至将自己插入他人视频中。
Q2:创作者可以防止自己的视频被AI混剪吗?
A:可以。谷歌为创作者提供了开关选项,允许其自主决定是否开放视频的"重新构想"功能。如果创作者不希望他人对自己的视频进行AI混剪,例如涉及孩子或隐私内容的视频,可以直接关闭该权限,保护原始内容不被随意修改。
Q3:AI混剪生成的视频会标注来源吗?
A:会的。谷歌表示,通过Gemini Omni混剪生成的YouTube Shorts视频将自动附带数字水印,并包含指向原始视频的链接,确保混剪内容可以溯源,保障原创者的权益。
好文章,需要你的鼓励
欧洲量子计算初创公司Alice & Bob正式推出其首款完整量子硬件平台——Helium量子系统,标志着该公司从量子芯片制造商升级为完整系统开发商。该系统基于独特的"猫量子比特"架构,仅需18个猫量子比特即可实现首个逻辑量子比特的编码,并集成了处理器架构、控制电子设备及监控软件Starboard。系统功耗仅40千瓦,支持量子与经典计算资源的协同部署,面向高性能计算场景开放研究合作。
韩国科学技术院团队构建的SoCRATES框架,系统评估AI调解员在八类冲突场景和五种社会认知维度下的表现,发现即使最强模型也仅能弥合约三分之一的分歧。
Intuit首席AI官Ashok Srivastava对外界盛传的"AI颠覆SaaS"论调保持冷静,认为SaaS行业的演变本是持续循环的一部分。他表示,公司通过引入AI智能体,过去一年开发速度提升40%,五年内开发效率提升12倍。QuickBooks Live订阅量因AI加入翻倍增长,QuickBooks Capital平台同比增长73%。Srivastava同时强调,Intuit拒绝"Token最大化"策略,坚持以服务客户为核心,在合规监管环境下稳步推进AI落地。
中山大学与Datawhale研究团队发现,在扩散模型训练中,让AI用自身输出的结构熵自动调节学习权重,可令音乐生成模型产生更清晰的段落结构和音色分化。