谷歌正在全面革新其搜索体验,这一变革同样延伸至YouTube。与谷歌旗下其他产品一样,YouTube的搜索栏也迎来了AI功能的全面升级,其中包括"Ask YouTube"——一项旨在为用户提供更智能化搜索体验的全新功能。
"通过'Ask YouTube',用户可以发起更复杂的搜索请求,例如询问如何教孩子学骑自行车,或寻找创作者对适合睡前玩的休闲游戏的评测,"YouTube方面介绍道。"用户还可以通过追问的方式,持续细化搜索内容,从而找到更精准的结果。"
该功能将整合YouTube上的短视频(Shorts)与长视频内容,并在此基础上生成综合回复。目前,美国地区的Premium订阅用户可在桌面端率先体验该功能,作为YouTube Premium新工具测试计划的一部分。
与此同时,YouTube还宣布将谷歌全新AI视频模型Gemini Omni引入YouTube Shorts混剪功能及YouTube Create应用。
"通过Omni进行混剪,为用户提供了一种全新的创作方式,让彼此的创意得以相互激发、持续延伸,"YouTube在新闻稿中写道。"该模型能够更精准地理解用户意图,在后台自动处理复杂的视频与音频调整,从而生成更连贯、更有意义的叙事内容。"
Meta和OpenAI等公司此前在Shorts中推进AI功能时,市场反应不一。OpenAI甚至已关闭其社交应用Sora——该平台原本允许用户发布和分享AI生成的视频内容。相比之下,YouTube此次的推出方式显得更为低调,并未将AI属性过度凸显。
此外,YouTube还将其肖像权检测工具的使用范围扩展至18岁及以上的创作者,旨在防止创作者的形象遭他人在AI生成内容中滥用。若创作者发现自己的肖像在AI视频中被不当使用,可申请删除相关内容。由于该功能目前才开始大范围推广,其实际效果有待进一步验证。
Q&A
Q1:Ask YouTube功能目前向哪些用户开放?
A:目前,Ask YouTube功能面向美国地区的YouTube Premium订阅用户开放,仅支持桌面端使用,作为Premium新工具测试计划的一部分供用户体验。
Q2:Gemini Omni被引入YouTube后能实现哪些功能?
A:Gemini Omni被整合至YouTube Shorts混剪功能及YouTube Create应用中。该模型能够更准确地理解用户创作意图,在后台自动完成复杂的视频与音频处理,帮助用户生成更具连贯性和叙事感的视频内容,同时支持创作者之间相互借鉴创意进行二次创作。
Q3:YouTube的肖像权检测工具如何帮助创作者防止被深度伪造?
A:YouTube将肖像权检测工具扩展至18岁及以上的创作者群体。如果创作者发现自己的形象在他人的AI生成视频中被不当使用,可通过该工具申请删除相关内容,从而保护自身肖像权不受侵犯。不过,该功能目前才开始大范围推广,实际效果仍有待观察。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。