中国科技巨头腾讯控股有限公司今日发布了一款名为混元 Turbo S 的新人工智能模型,这是一款被设计为"快思考模型"的产品,旨在与 DeepSeek-R1 等所谓的"慢思考"模型展开竞争。
该公司解释说,通过将输出速度提高一倍并将首字输出延迟减少近 44%,该模型能够在一秒内实现"即时回复"。
与 DeepSeek-R1 和其他"推理模型"不同,该公司表示这些模型往往是"思考一下再回答",而新的 Turbo S 模型能够立即开始回答,它使用一个类似于人类直觉的短思考链。这种机制与提供科学、数学和理性答案的慢思考链相融合。
公司表示,在数学、推理和知识等基准测试中,混元 Turbo S 展现出与市场领先模型(如 DeepSeek-V3、OpenAI 的 GPT-4 和 Anthropic PBC 的 Claude)相当的性能。
近几个月来,中国企业 DeepSeek 的 AI 模型(如 R1 和 V3)取得的显著成功引发了广泛关注,促使众多 AI 模型开发商迅速推出竞争产品。竞争异常激烈,包括中国的阿里巴巴集团推出的 Qwen 2.5-Max 模型,声称性能超过 V3。
为了创建这个模型,腾讯使用了 Hybrid-Mamba-Transformer 融合技术,以降低模型 Transformer 架构的计算复杂度和 KV-Cache。最终的模型是一个混合体,可以使用擅长处理长序列的 Mamba 深度学习架构,同时保持 Transformer 理解数据中复杂思想和陈述背景的能力。
腾讯在公告中表示:"这也是业界首次成功将 Mamba 架构应用于超大规模混合专家模型而不造成性能损失。"
混合专家技术是一种机器学习方法,其中多个 AI 模型根据不同的专业领域被分开,并协同工作以解决问题。
该公司还表示,新架构显著降低了训练和部署成本。随着 DeepSeek 等竞争对手以低价推出具有竞争力的模型,这促使腾讯和其他公司降低服务价格,并研究更高效的 AI 训练和推理方法。
好文章,需要你的鼓励
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
Character AI联合耶鲁大学开发的OVI系统实现了音视频的统一生成,通过"孪生塔"架构让音频和视频从生成之初就完美同步。该系统在5秒高清内容生成上显著超越现有方法,为多模态AI和内容创作领域带来突破性进展。
苹果即将发布Apple TV 4K和HomePod mini 2两款产品更新。更值得期待的是三款全新产品:配备7英寸方形显示屏的HomePod Touch将搭载全新homeOS系统,支持Safari、音乐等应用及小组件功能,预计售价350美元;此外还有智能安全摄像头和视频门铃两款配件。这标志着苹果从依赖第三方HomeKit配件转向自主研发智能家居产品的重要战略转变。
这项由南洋理工大学研究团队开发的DragFlow技术,首次实现了在先进AI模型FLUX上的高质量区域级图像编辑。通过创新的区域监督、硬约束背景保护和适配器增强等技术,将传统点对点编辑升级为更自然的区域编辑模式,在多项基准测试中显著超越现有方法,为图像编辑技术带来革命性突破。