谷歌宣布推出一项新的YouTube Shorts混剪功能,允许用户借助Gemini Omni对视频片段进行风格重塑,甚至可以将自己插入他人的视频之中。
目前,在观看YouTube短视频时,点击底部的混剪图标,即可看到"重新构想"选项。用户可以通过提示词引导Gemini将视频转换为像素艺术风格、动漫风格,或是模拟恐怖找镜头风格。除此之外,还可以对视频内容进行更多创意改动,例如将人物头部放大、添加背景演员、给人物换上海盗服装,甚至将自己的形象植入视频片段之中。
创作者可以自主选择是否开启"重新构想"功能。例如,若创作者上传了一段包含孩子的视频,出于隐私保护等合理考量,可以关闭他人对该视频的混剪权限。谷歌同时表示,通过Gemini Omni混剪生成的短视频将附带数字水印,并附上指向原始视频的链接,以保障原创内容的溯源性。
Q&A
Q1:YouTube Shorts的AI混剪功能具体能做什么?
A:YouTube Shorts的AI混剪功能由Gemini Omni驱动,用户点击短视频底部的混剪图标后,可选择"重新构想"对视频进行风格转换,例如将视频变成像素艺术、动漫风格或恐怖找镜头风格。此外,还支持放大人物头部、添加背景角色、更换服装,甚至将自己插入他人视频中。
Q2:创作者可以防止自己的视频被AI混剪吗?
A:可以。谷歌为创作者提供了开关选项,允许其自主决定是否开放视频的"重新构想"功能。如果创作者不希望他人对自己的视频进行AI混剪,例如涉及孩子或隐私内容的视频,可以直接关闭该权限,保护原始内容不被随意修改。
Q3:AI混剪生成的视频会标注来源吗?
A:会的。谷歌表示,通过Gemini Omni混剪生成的YouTube Shorts视频将自动附带数字水印,并包含指向原始视频的链接,确保混剪内容可以溯源,保障原创者的权益。
好文章,需要你的鼓励
仿人机器人与自动驾驶汽车在区域架构、功能安全及雷达传感方面高度相似。多分辨率摄像头组合可更好地模拟人类视野,兼顾广角低保真与局部高精度需求。自然运动需实时计算正逆运动学、距离与深度,同时须兼顾功耗效率。当前视觉与基础操控技术最为成熟,而触觉、全身协调及非结构化环境中的移动能力仍是主要挑战。业界正借鉴自动驾驶经验,加速推进仿人机器人的规模化落地。
这项研究提出Epi2Diff方法,通过将大型推理模型的解题思考过程拆解为认知片段序列,提取过程特征预测考题对人类的难度,在四个真实考试数据集上超越了所有对比基线。
随着AI技术发展,攻击者可融合白市、灰市及黑市数据,构建个人及其环境的数字孪生体,使定向攻击更为便捷。专家指出,AI与网络安全的核心交汇点是数据本身。防御AI数据融合攻击需依赖硬件信任根、强加密、安全密钥存储及严格的数据匿名化措施。芯片架构师需将安全设计嵌入硬件层,确保数据完整性验证、隔离执行及认证数据流,以应对日益复杂的运行时攻击面。
南京大学与阿里巴巴提出MIMFlow,将掩码图像建模与标准化流端到端融合,让生成模型专注语义建模,以更少参数和更少令牌在ImageNet上取得FID 2.50的优异表现。