中国搜索引擎巨头百度公司正在通过推出两款迄今为止最强大的模型来加强其在人工智能领域的布局,其中包括一个新的专注于推理的模型,据称其性能可以超越 DeepSeek 的 R1 模型。
百度首先在 2023 年推出了 Ernie 系列模型,随后在次年推出了 Ernie 4.0 Turbo,这是一次"重大升级"。
现在,百度公布了 Ernie X1,据称其性能与 DeepSeek R1 相当,但成本仅为竞争对手的一半。据路透社报道,该模型具有"更强的理解、规划、反思和进化能力",同时也是首个能够自主使用独立工具的"深度思维"模型。
在圣诞节前推出 R1 后,DeepSeek 已成为 AI 模型制造商需要超越的新标准。作为一个推理模型,R1 以匹配美国最佳 AI 模型的能力而脱颖而出,尽管其制造商在训练上的投入仅为竞争对手的一小部分。
至于百度的另一个模型 Ernie 4.5,它是一个更标准化的非推理模型,旨在与 OpenAI 的 GPT-4 竞争,但公司表示它具有"出色的多模态理解能力"和"更先进的语言能力"。其理解人类、生成响应的能力以及记忆能力也得到了提升。
多模态 AI 系统以其处理各种不同类型数据的能力而著称。例如,它们可以处理基于文本的提示、视频、图像或音频文件,并能够在这些格式之间转换内容。
除了多模态之外,据报道 Ernie 4.5 还具有"高情商",百度称这有助于它更好地理解网络梗和讽刺漫画。
DeepSeek 的出现重新激活了 AI 竞赛,尤其是百度对改善其命运充满期待。该公司是首批推出类似 ChatGPT 的 AI 模型的中国公司之一,但即使在国内市场也难以竞争,尽管声称其早期的 Ernie 模型与 OpenAI 的最佳模型不相上下。
这家总部位于北京的公司面临着来自国内科技公司的激烈竞争,包括 TikTok 母公司字节跳动和腾讯公司,这些公司的聊天机器人获得了更多用户。
然而,DeepSeek 的戏剧性登场颠覆了中国所有领先的 AI 公司,R1 的推出掀起了一场风暴,开创了更经济实惠的 AI 模型时代。此后,中国政府和数十家本地公司支持 DeepSeek,将其模型整合到自己的产品和服务中,让竞争对手不得不追赶。就连百度也采用了 DeepSeek R1,将推理模型与其标志性搜索引擎进行结合。
DeepSeek 的竞争对手决心迎头赶上,2 月份腾讯旗下的微信推出了一个新模型,声称其响应查询的速度甚至比 DeepSeek 更快。
同样在上个月,阿里巴巴集团表示将在未来三年内投资 3800 亿元人民币(约 520 亿美元)用于 AI 和云计算研究。
与此同时,百度也跟随 DeepSeek 的脚步,表示计划在今年晚些时候开源其 Ernie 模型的代码库。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。