由前OpenAI首席技术官Mira Murati去年创立的AI初创公司Thinking Machines Lab,于本周一宣布推出一项名为"交互模型"的技术。简单来说,这是一种可以在你说话时打断你的AI。
目前,所有AI模型的工作方式都相同:你说话,它倾听;它回应,你倾听。Thinking Machines正试图打破这一模式,通过构建一个能够同时处理用户输入并生成回应的模型,使交互体验更像打电话,而非发短信。
这项技术在专业领域被称为"全双工"通信。该公司表示,其模型TML-Interaction-Small的响应时间仅为0.40秒,与自然人类对话的速度大致相当,同时明显快于OpenAI和谷歌同类模型的响应速度。
不过,这目前仍是一个研究预览版,尚未向公众开放。该公司表示,未来几个月内将推出"有限研究预览版",更广泛的正式发布则计划于今年晚些时候进行。
如何评价这项技术?目前还难下定论。从基准测试数据来看,成绩相当亮眼;而其背后的核心理念——交互能力应当是模型的原生特性,而非后期附加功能——同样颇具吸引力。然而,实际使用体验是否能达到技术层面所宣称的效果,只有等到用户真正上手之后才能见分晓。
Q&A
Q1:TML-Interaction-Small模型的响应速度有多快?和其他模型比怎么样?
A:TML-Interaction-Small的响应时间为0.40秒,与自然人类对话速度大致相当,明显快于OpenAI和谷歌的同类模型。这种速度得益于"全双工"通信技术,使模型能够同时处理用户输入和生成回应。
Q2:全双工AI交互和普通AI对话有什么区别?
A:普通AI对话采用"半双工"模式,即用户说话时AI倾听,AI回应时用户倾听,交替进行,类似发短信。全双工模式则允许AI在处理用户输入的同时生成回应,更接近真实电话通话体验,交互更自然流畅。
Q3:Thinking Machines Lab的交互模型什么时候可以使用?
A:目前该模型仍处于研究预览阶段,尚未向公众开放。据Thinking Machines Lab透露,有限研究预览版将在未来几个月内推出,更广泛的正式版本预计于2025年晚些时候发布。
好文章,需要你的鼓励
随着AI基础设施快速扩张,水资源正成为继电力之后的另一重大制约因素。高密度GPU集群产生大量热能,需要大规模冷却水支撑,部分数据中心单日用水需求高达数百万加仑。多地水务部门已明确表示现有供水能力无法满足需求。研究预测,到2030年美国数据中心新增日用水需求可能高达14.5亿加仑。水资源短缺、废水处理压力及峰值用水波动,正深刻影响AI数据中心的选址与建设规划。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
CoreWeave发布新平台,支持企业部署可自主学习和优化的AI智能体。该平台通过无服务器强化学习机制,让大语言模型在真实业务环境中持续微调,无需企业自建基础设施。相比传统方式,该方案可降低超40%成本,训练速度提升约1.4倍,且不影响质量。据麦肯锡2025年AI现状报告,约62%的受访企业正在试验AI智能体,生产部署趋势日益明显。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。