中国科技巨头腾讯控股有限公司今日发布了一款名为混元 Turbo S 的新人工智能模型,这是一款被设计为"快思考模型"的产品,旨在与 DeepSeek-R1 等所谓的"慢思考"模型展开竞争。
该公司解释说,通过将输出速度提高一倍并将首字输出延迟减少近 44%,该模型能够在一秒内实现"即时回复"。
与 DeepSeek-R1 和其他"推理模型"不同,该公司表示这些模型往往是"思考一下再回答",而新的 Turbo S 模型能够立即开始回答,它使用一个类似于人类直觉的短思考链。这种机制与提供科学、数学和理性答案的慢思考链相融合。
公司表示,在数学、推理和知识等基准测试中,混元 Turbo S 展现出与市场领先模型(如 DeepSeek-V3、OpenAI 的 GPT-4 和 Anthropic PBC 的 Claude)相当的性能。
近几个月来,中国企业 DeepSeek 的 AI 模型(如 R1 和 V3)取得的显著成功引发了广泛关注,促使众多 AI 模型开发商迅速推出竞争产品。竞争异常激烈,包括中国的阿里巴巴集团推出的 Qwen 2.5-Max 模型,声称性能超过 V3。
为了创建这个模型,腾讯使用了 Hybrid-Mamba-Transformer 融合技术,以降低模型 Transformer 架构的计算复杂度和 KV-Cache。最终的模型是一个混合体,可以使用擅长处理长序列的 Mamba 深度学习架构,同时保持 Transformer 理解数据中复杂思想和陈述背景的能力。
腾讯在公告中表示:"这也是业界首次成功将 Mamba 架构应用于超大规模混合专家模型而不造成性能损失。"
混合专家技术是一种机器学习方法,其中多个 AI 模型根据不同的专业领域被分开,并协同工作以解决问题。
该公司还表示,新架构显著降低了训练和部署成本。随着 DeepSeek 等竞争对手以低价推出具有竞争力的模型,这促使腾讯和其他公司降低服务价格,并研究更高效的 AI 训练和推理方法。
好文章,需要你的鼓励
Zopa银行正式推出可在几分钟内开户的活期账户服务,面向其150万储蓄和贷款客户以外的更广泛用户群体。该账户此前已有6万名现有客户参与测试,正式发布时间比预期提前。作为金融科技先驱,Zopa在2020年获得完整银行牌照后推出首款储蓄产品,目前拥有140万客户,年收入超过3亿英镑,存款规模超过50亿英镑。
清华大学团队通过创新的"模式感知重排序"技术,解决了AI视频生成中注意力机制计算效率低下的问题。该技术将复杂分散的注意力模式重新整理成规整的块状结构,结合专门设计的稀疏化和量化策略,在保持生成质量的同时将计算速度提升1.9-2.7倍,为AI视频生成的普及应用铺平道路。
Mozilla正式推出Firefox 140浏览器,作为扩展支持版本(ESR)发布。新版本增加了标签页卸载功能,可清理内存并在需要时重新加载。垂直标签页用户可调整固定标签区域大小,隐私翻译功能现可跟随滚动位置优先翻译当前查看区域。Android版本支持批量选择标签页,私人标签可通过密码或指纹保护。该版本同时更新ESR 128用户,为下游项目如Waterfox和Thunderbird提供新版本基础。
哥伦比亚大学研究团队开发出新的AI偏见纠正技术,通过"重排序"方法让人工智能在总结政治观点时保持公正。该方法让AI生成多个版本后择优选择,结合偏好调优训练,显著提升了观点覆盖度和内容准确性,为构建更可信赖的AI系统提供了实用解决方案。