YouTube正在整合谷歌的AI辅助搜索功能,推出全新的轮播功能。根据YouTube的官方博客,这一AI生成的轮播功能目前仅向美国的Premium会员开放。当用户在手机YouTube应用中搜索"与购物、地点或特定位置活动相关的查询"时,可能会出现这一功能(并非每次搜索都会显示)。
该轮播功能会收集一系列相关视频,按从左到右的顺序播放(用户也可以直接点击视频缩略图跳转到特定片段),每个视频都配有独立的标题和解释其被选中原因的段落文本。不出所料,这一实现方式看起来很像在Instagram上浏览好友动态。YouTube表示,轮播中的每个视频都能为用户的查询提供"有用的见解"。
YouTube还宣布,将开始向美国的普通用户推出此前仅限Premium用户和Android系统独享的对话式AI工具。用户可以通过点击视频下方工具栏中分享和下载选项之间的"询问"按钮来激活这一AI助手,并可就视频内容提出相关问题。用户还可以让AI在观看视频前先进行总结,节省五分钟的观看时间,或获得类似内容的推荐。YouTube在首次推出这一功能时表示,其AI工具从YouTube平台内部和更广泛的网络中获取信息。目前尚不清楚有多少用户能够使用这一新功能,或者用户多久能遇到一次。同样不明确的是iPhone用户是否以及何时能够获得这一功能。
谷歌的AI概览工具一直备受争议,主要原因之一是其提供的信息并不总是准确。YouTube创作者是否会遇到类似问题还有待观察。
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
POSTECH研究团队开发出VideoFrom3D框架,能够仅凭粗糙3D模型、摄像机轨迹和参考图片生成高质量场景视频。该方法巧妙结合图像和视频扩散模型优势,通过稀疏锚点生成和几何引导插值两个模块,实现了传统3D制作流程的革命性简化。实验证明该方法在多种复杂场景下表现优异,为3D内容创作提供了更高效的解决方案。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
Meta超级智能实验室开发了ARE平台和Gaia2基准测试,为AI智能体创造了更真实的训练和评估环境。ARE支持异步交互,模拟真实世界的复杂性和不确定性。Gaia2包含1120个场景,评估AI的七项核心能力。实验显示最强模型成功率仅42%,特别在时间管理和处理歧义方面表现较差,揭示了当前AI技术的局限性和改进方向。