初创公司Runway AI Inc.和DeepSeek今日发布了两个新的基础模型,声称其性能超越了科技行业巨头开发的算法。
Runway的新算法Gen-4.5提供文本转视频功能。而中国初创公司DeepSeek则发布了其同名推理模型的更新版本。DeepSeek表示,DeepSeek V3.2在编程和数学相关任务上比前代产品表现更佳。
成立于2018年的Runway获得了来自英伟达公司、软银集团等投资方超过3亿美元的资金支持,在最近一轮融资中估值达到30亿美元。该公司通过应用程序编程接口和基于云的设计工具提供视频生成模型服务。
Runway表示,Gen-4.5在人工智能分析文本转视频基准测试中创下新纪录,该基准用于比较AI视频生成器的性能。该模型的高分部分归功于优化改进,使其在遵循提示方面比前代产品表现更出色。用户可以要求Gen-4.5自定义视频片段的摄像角度、光照以及其他多种参数。
该公司表示,该模型还能生成更逼真的视频片段。与早期的视频生成器相比,Gen-4.5在渲染物理效果(如运动和碰撞)方面更加擅长。不过,该模型也存在一定局限性:它有时会过早生成某些效果,偶尔无法渲染用户指定的特定物体。
Runway计划在本周末前将Gen 4.5推广到其产品中。据该公司介绍,该模型将提供与前一代Gen 4算法相当的速度和定价。Runway在由英伟达公司Blackwell和Hopper芯片驱动的AI集群上运行为其产品提供动力的Gen 4.5部署,该集群也用于训练该模型。
英伟达首席执行官黄仁勋表示:"我们正在携手推进AI的整个生命周期,从预训练到后训练再到推理。"
今日发布的另一个新前沿模型DeepSeek-V3.2针对调试代码等推理任务进行了优化。它在SWE多语言和Terminal Bench 2.0编程语言测试中超越了GPT-5。不过,它未能达到谷歌公司Gemini模型系列创下的记录。
推理模型使用称为注意力机制的模块来处理文本。注意力机制通过查看周围文本来确定单词的含义,识别最相关的短语并将其纳入计算中。这个过程占大语言模型硬件使用量的很大比例。
据DeepSeek介绍,DeepSeek-V3.2包含了需要更少基础设施的注意力机制新实现。该公司称这种实现为DSA。它通过减少DeepSeek V3.2为确定单词含义而必须审查的文本量来降低硬件使用率。
优先考虑输出质量而非硬件效率的公司可以使用DeepSeek V3.2-Speciale,这是与之同时发布的模型性能优化版本。DeepSeek通过让大语言模型回答国际数学奥林匹克竞赛和国际信息学奥林匹克竞赛的题目来衡量其性能。该模型在两项测试中均获得了金奖级别的分数。
Q&A
Q1:Runway的Gen-4.5模型有什么新功能?
A:Gen-4.5是Runway推出的新一代文本转视频模型,在人工智能分析文本转视频基准测试中创下新纪录。它比前代产品更擅长遵循提示,用户可以自定义视频的摄像角度、光照等多种参数,同时在渲染物理效果如运动和碰撞方面表现更出色,能生成更逼真的视频片段。
Q2:DeepSeek V3.2在哪些方面有所改进?
A:DeepSeek V3.2是针对推理任务优化的模型,特别擅长调试代码等任务。它在SWE多语言和Terminal Bench 2.0编程语言测试中超越了GPT-5,并且包含了名为DSA的新注意力机制实现,通过减少文本审查量来降低硬件使用率,提高了效率。
Q3:这两个模型什么时候能使用?
A:Runway计划在本周末前将Gen 4.5推广到其产品中,定价和速度与前一代Gen 4算法相当。DeepSeek V3.2已经发布,同时还提供了性能优化版本DeepSeek V3.2-Speciale供优先考虑输出质量的公司使用。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。