腾讯近日更新了其混元AI模型,这也是自腾讯成功招募前OpenAI顶尖AI科学家姚顺宇(Yao Shunyu)以来的首次重大版本发布。目前已进入预览阶段的混元Hy3模型,在复杂推理、代码生成等多个维度上均有显著提升。
作为中国科技巨头之一,腾讯正在加速追赶字节跳动、阿里巴巴和DeepSeek等国内AI竞争对手。当前,中国正大力押注开源AI路线,意图为美国主流大语言模型提供替代选择。早在2023年,腾讯就曾声称当时新推出的混元大语言模型,在能力和智能水平上已超越同期版本的ChatGPT与Llama。
在生态布局方面,腾讯已投资月之暗面(Moonshot AI)、阶跃星辰(StepFun)等AI初创公司,寄望借此带动旗下云计算业务的增长。与此同时,腾讯还对研究团队架构进行了调整,以提升训练数据的质量。据悉,腾讯计划今年将AI投入翻倍,总额超过50亿美元。
另一边,DeepSeek也不甘示弱,正式发布了旗下大语言模型的最新版本——V4 Flash系列与V4 Pro系列。DeepSeek凭借2025年1月推出的R1 AI模型一夜成名,此后持续推进模型迭代。DeepSeek表示,V4系列升级版将在推理能力和智能体任务处理上带来显著进步,同时新引入的混合注意力架构(Hybrid Attention Architecture)功能,将大幅增强AI平台对长对话中历史查询内容的记忆能力。
Q&A
Q1:腾讯混元Hy3模型有哪些主要提升?
A:腾讯混元Hy3模型目前处于预览阶段,相较于此前版本,在复杂推理、代码生成等核心能力上有明显进步。此次更新也是腾讯招募前OpenAI研究科学家姚顺宇后的首次重大发布,标志着腾讯在AI研发投入上进一步提速。
Q2:腾讯在AI领域的投资和布局是怎样的?
A:腾讯已投资月之暗面、阶跃星辰等AI初创公司,希望借此推动云计算业务发展。公司还对研究团队进行了架构调整,以提升训练数据质量,并计划今年将AI投资翻倍,总额超过50亿美元。
Q3:DeepSeek V4系列模型有什么新特性?
A:DeepSeek V4系列分为Flash和Pro两个版本,在推理能力和智能体任务处理上有所提升。其中一项名为混合注意力架构(Hybrid Attention Architecture)的新功能,能够增强AI平台对长对话中历史查询内容的记忆能力,改善用户在长对话场景下的使用体验。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。