腾讯近日更新了其混元AI模型,这也是自招募前OpenAI顶尖AI科学家姚顺宇以来的首次重大发布。目前处于预览阶段的混元Hy3模型,在复杂推理和代码生成等多个方面均有显著提升。
这家中国科技巨头正在加速追赶字节跳动、阿里巴巴和DeepSeek等国内AI企业。中国在开源AI领域持续加大投入,以期为美国主流AI平台提供替代选择。早在2023年,腾讯就曾宣称其当时推出的混元大语言模型在能力和智能水平上超越了彼时的ChatGPT和Llama。
腾讯还相继投资了月之暗面(Moonshot AI)和阶跃星辰(StepFun)等AI初创企业,期望借助这些投资推动其云计算业务的增长。此外,公司对旗下研究团队进行了重组,以提升训练数据质量。腾讯计划在今年将AI投资规模翻倍,总额预计超过50亿美元。
与此同时,DeepSeek也宣布推出V4 Flash和V4 Pro系列,这是其大语言模型的最新迭代版本。DeepSeek在2025年1月凭借R1 AI模型一夜爆红,此后持续推出多款新模型。据官方介绍,V4系列升级版在推理能力和智能体任务执行方面将带来进一步提升,新引入的混合注意力架构(Hybrid Attention Architecture)功能则增强了AI平台在长对话中跨轮次记忆查询内容的能力。
Q&A
Q1:腾讯混元Hy3模型有哪些主要改进?
A:腾讯混元Hy3模型目前处于预览阶段,相较于前代版本,在复杂推理能力和代码生成等核心功能上有明显提升。腾讯为推动此次升级,不仅招募了前OpenAI顶尖研究科学家姚顺宇,还对内部研究团队进行了重组以提升训练数据质量,同时计划将今年AI投资规模翻倍至超过50亿美元。
Q2:DeepSeek V4系列有什么新特性?
A:DeepSeek V4系列分为Flash和Pro两个版本,在推理能力和智能体任务执行方面均有提升。其中最值得关注的新特性是混合注意力架构(Hybrid Attention Architecture),该功能显著增强了AI平台在长对话场景中跨轮次记忆用户查询内容的能力,从而提升连贯对话体验。
Q3:腾讯在中国AI竞争格局中处于什么位置?
A:腾讯目前处于追赶阶段,主要竞争对手包括字节跳动、阿里巴巴和DeepSeek。为增强竞争力,腾讯采取了多项举措:投资月之暗面、阶跃星辰等AI初创企业以支撑云计算业务,重组研究团队提升数据质量,并计划今年将AI投资增至逾50亿美元。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。