初创公司Runway AI Inc.和DeepSeek今日发布了两个新的基础模型,声称其性能超越了科技行业巨头开发的算法。
Runway的新算法Gen-4.5提供文本转视频功能。而中国初创公司DeepSeek则发布了其同名推理模型的更新版本。DeepSeek表示,DeepSeek V3.2在编程和数学相关任务上比前代产品表现更佳。
成立于2018年的Runway获得了来自英伟达公司、软银集团等投资方超过3亿美元的资金支持,在最近一轮融资中估值达到30亿美元。该公司通过应用程序编程接口和基于云的设计工具提供视频生成模型服务。
Runway表示,Gen-4.5在人工智能分析文本转视频基准测试中创下新纪录,该基准用于比较AI视频生成器的性能。该模型的高分部分归功于优化改进,使其在遵循提示方面比前代产品表现更出色。用户可以要求Gen-4.5自定义视频片段的摄像角度、光照以及其他多种参数。
该公司表示,该模型还能生成更逼真的视频片段。与早期的视频生成器相比,Gen-4.5在渲染物理效果(如运动和碰撞)方面更加擅长。不过,该模型也存在一定局限性:它有时会过早生成某些效果,偶尔无法渲染用户指定的特定物体。
Runway计划在本周末前将Gen 4.5推广到其产品中。据该公司介绍,该模型将提供与前一代Gen 4算法相当的速度和定价。Runway在由英伟达公司Blackwell和Hopper芯片驱动的AI集群上运行为其产品提供动力的Gen 4.5部署,该集群也用于训练该模型。
英伟达首席执行官黄仁勋表示:"我们正在携手推进AI的整个生命周期,从预训练到后训练再到推理。"
今日发布的另一个新前沿模型DeepSeek-V3.2针对调试代码等推理任务进行了优化。它在SWE多语言和Terminal Bench 2.0编程语言测试中超越了GPT-5。不过,它未能达到谷歌公司Gemini模型系列创下的记录。
推理模型使用称为注意力机制的模块来处理文本。注意力机制通过查看周围文本来确定单词的含义,识别最相关的短语并将其纳入计算中。这个过程占大语言模型硬件使用量的很大比例。
据DeepSeek介绍,DeepSeek-V3.2包含了需要更少基础设施的注意力机制新实现。该公司称这种实现为DSA。它通过减少DeepSeek V3.2为确定单词含义而必须审查的文本量来降低硬件使用率。
优先考虑输出质量而非硬件效率的公司可以使用DeepSeek V3.2-Speciale,这是与之同时发布的模型性能优化版本。DeepSeek通过让大语言模型回答国际数学奥林匹克竞赛和国际信息学奥林匹克竞赛的题目来衡量其性能。该模型在两项测试中均获得了金奖级别的分数。
Q&A
Q1:Runway的Gen-4.5模型有什么新功能?
A:Gen-4.5是Runway推出的新一代文本转视频模型,在人工智能分析文本转视频基准测试中创下新纪录。它比前代产品更擅长遵循提示,用户可以自定义视频的摄像角度、光照等多种参数,同时在渲染物理效果如运动和碰撞方面表现更出色,能生成更逼真的视频片段。
Q2:DeepSeek V3.2在哪些方面有所改进?
A:DeepSeek V3.2是针对推理任务优化的模型,特别擅长调试代码等任务。它在SWE多语言和Terminal Bench 2.0编程语言测试中超越了GPT-5,并且包含了名为DSA的新注意力机制实现,通过减少文本审查量来降低硬件使用率,提高了效率。
Q3:这两个模型什么时候能使用?
A:Runway计划在本周末前将Gen 4.5推广到其产品中,定价和速度与前一代Gen 4算法相当。DeepSeek V3.2已经发布,同时还提供了性能优化版本DeepSeek V3.2-Speciale供优先考虑输出质量的公司使用。
好文章,需要你的鼓励
谷歌在AI购物战中加码,宣布将Gemini打造成购物平台,并与Shopify、沃尔玛、塔吉特等主要零售商合作推出开源标准。公司发布了通用商务协议(UCP),旨在简化AI代理与零售商系统间的通信。新标准将为搜索和Gemini提供结账功能,用户可直接通过AI工具购买商品。已获得Visa、万事达、PayPal等20多家公司支持。此举使谷歌与微软Copilot和OpenAI的ChatGPT竞争。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
Helios Towers供应链总监Dawn McCarroll在采访中分享了公司的数字化转型经验。作为一家在非洲和中东地区运营近15000个移动通信塔站的公司,Helios正通过SAP S/4Hana系统升级、AI技术应用和精益六西格玛方法论来优化供应链管理。McCarroll特别强调了公司Impact 2030战略中的数字包容性目标,计划在未来五年内培训60%的合作伙伴员工掌握精益六西格玛原则,并利用大数据和AI技术实现端到端的供应链集成。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。