中国搜索引擎巨头百度公司正在通过推出两款迄今为止最强大的模型来加强其在人工智能领域的布局,其中包括一个新的专注于推理的模型,据称其性能可以超越 DeepSeek 的 R1 模型。
百度首先在 2023 年推出了 Ernie 系列模型,随后在次年推出了 Ernie 4.0 Turbo,这是一次"重大升级"。
现在,百度公布了 Ernie X1,据称其性能与 DeepSeek R1 相当,但成本仅为竞争对手的一半。据路透社报道,该模型具有"更强的理解、规划、反思和进化能力",同时也是首个能够自主使用独立工具的"深度思维"模型。
在圣诞节前推出 R1 后,DeepSeek 已成为 AI 模型制造商需要超越的新标准。作为一个推理模型,R1 以匹配美国最佳 AI 模型的能力而脱颖而出,尽管其制造商在训练上的投入仅为竞争对手的一小部分。
至于百度的另一个模型 Ernie 4.5,它是一个更标准化的非推理模型,旨在与 OpenAI 的 GPT-4 竞争,但公司表示它具有"出色的多模态理解能力"和"更先进的语言能力"。其理解人类、生成响应的能力以及记忆能力也得到了提升。
多模态 AI 系统以其处理各种不同类型数据的能力而著称。例如,它们可以处理基于文本的提示、视频、图像或音频文件,并能够在这些格式之间转换内容。
除了多模态之外,据报道 Ernie 4.5 还具有"高情商",百度称这有助于它更好地理解网络梗和讽刺漫画。
DeepSeek 的出现重新激活了 AI 竞赛,尤其是百度对改善其命运充满期待。该公司是首批推出类似 ChatGPT 的 AI 模型的中国公司之一,但即使在国内市场也难以竞争,尽管声称其早期的 Ernie 模型与 OpenAI 的最佳模型不相上下。
这家总部位于北京的公司面临着来自国内科技公司的激烈竞争,包括 TikTok 母公司字节跳动和腾讯公司,这些公司的聊天机器人获得了更多用户。
然而,DeepSeek 的戏剧性登场颠覆了中国所有领先的 AI 公司,R1 的推出掀起了一场风暴,开创了更经济实惠的 AI 模型时代。此后,中国政府和数十家本地公司支持 DeepSeek,将其模型整合到自己的产品和服务中,让竞争对手不得不追赶。就连百度也采用了 DeepSeek R1,将推理模型与其标志性搜索引擎进行结合。
DeepSeek 的竞争对手决心迎头赶上,2 月份腾讯旗下的微信推出了一个新模型,声称其响应查询的速度甚至比 DeepSeek 更快。
同样在上个月,阿里巴巴集团表示将在未来三年内投资 3800 亿元人民币(约 520 亿美元)用于 AI 和云计算研究。
与此同时,百度也跟随 DeepSeek 的脚步,表示计划在今年晚些时候开源其 Ernie 模型的代码库。
好文章,需要你的鼓励
随着谷歌搜索和亚马逊主页在电商领域影响力下降,AI助手如ChatGPT、Claude等成为消费者新的购物入口。品牌必须掌握生成式引擎优化(GEO)技术才能保持可见性。传统SEO策略已失效,AI系统更青睐结构化、问答式的高质量内容。研究显示,来自AI助手的流量转化率比其他渠道高9倍。品牌需要基于真实客户问题创建内容,采用结构化问答格式,并建立信任度,才能在这个新的电商秩序中脱颖而出。
阿姆斯特丹大学与Salesforce合作开发的奖励引导推测解码(RSD)技术,通过让小模型处理简单任务、大模型解决复杂问题的智能分工,在保持推理准确率的同时大幅提升计算效率。该技术在数学推理等任务中表现出色,计算量最多可减少75%,为AI应用的普及和成本降低提供了重要技术支撑。
2025年第一季度网络攻击激增126%,英国新法案要求数据中心强制报告网络安全事件。现代威胁已演变为同时攻击IT和OT系统,而许多数据中心的备用电源系统仍使用90年代的过时技术。电池储能系统(BESS)通过分布式架构、加密通信和自主运行能力提供网络弹性防护。BESS即服务模式将网络安全维护转移给专业提供商,同时通过需求响应和能源套利创造收益。随着全球法规要求将网络安全与能源安全相结合,数据中心需要现代化基础设施来应对日益严峻的威胁环境。
微软研究院开发出LongRoPE2技术,能让大型语言模型的记忆容量扩展64倍至12.8万字,同时保持98.5%的原有性能。该方法通过发现AI位置编码训练不均衡问题,采用智能搜索和混合训练策略,仅用传统方法八十分之一的资源就实现突破。这项技术将使AI能完整处理长文档、进行复杂对话,为文档分析、代码开发、内容创作等领域带来重大改进。