腾讯近日更新了其混元AI模型,这也是自腾讯成功招募前OpenAI顶尖AI科学家姚顺宇(Yao Shunyu)以来的首次重大版本发布。目前已进入预览阶段的混元Hy3模型,在复杂推理、代码生成等多个维度上均有显著提升。
作为中国科技巨头之一,腾讯正在加速追赶字节跳动、阿里巴巴和DeepSeek等国内AI竞争对手。当前,中国正大力押注开源AI路线,意图为美国主流大语言模型提供替代选择。早在2023年,腾讯就曾声称当时新推出的混元大语言模型,在能力和智能水平上已超越同期版本的ChatGPT与Llama。
在生态布局方面,腾讯已投资月之暗面(Moonshot AI)、阶跃星辰(StepFun)等AI初创公司,寄望借此带动旗下云计算业务的增长。与此同时,腾讯还对研究团队架构进行了调整,以提升训练数据的质量。据悉,腾讯计划今年将AI投入翻倍,总额超过50亿美元。
另一边,DeepSeek也不甘示弱,正式发布了旗下大语言模型的最新版本——V4 Flash系列与V4 Pro系列。DeepSeek凭借2025年1月推出的R1 AI模型一夜成名,此后持续推进模型迭代。DeepSeek表示,V4系列升级版将在推理能力和智能体任务处理上带来显著进步,同时新引入的混合注意力架构(Hybrid Attention Architecture)功能,将大幅增强AI平台对长对话中历史查询内容的记忆能力。
Q&A
Q1:腾讯混元Hy3模型有哪些主要提升?
A:腾讯混元Hy3模型目前处于预览阶段,相较于此前版本,在复杂推理、代码生成等核心能力上有明显进步。此次更新也是腾讯招募前OpenAI研究科学家姚顺宇后的首次重大发布,标志着腾讯在AI研发投入上进一步提速。
Q2:腾讯在AI领域的投资和布局是怎样的?
A:腾讯已投资月之暗面、阶跃星辰等AI初创公司,希望借此推动云计算业务发展。公司还对研究团队进行了架构调整,以提升训练数据质量,并计划今年将AI投资翻倍,总额超过50亿美元。
Q3:DeepSeek V4系列模型有什么新特性?
A:DeepSeek V4系列分为Flash和Pro两个版本,在推理能力和智能体任务处理上有所提升。其中一项名为混合注意力架构(Hybrid Attention Architecture)的新功能,能够增强AI平台对长对话中历史查询内容的记忆能力,改善用户在长对话场景下的使用体验。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。