中国搜索引擎巨头百度公司正在通过推出两款迄今为止最强大的模型来加强其在人工智能领域的布局,其中包括一个新的专注于推理的模型,据称其性能可以超越 DeepSeek 的 R1 模型。
百度首先在 2023 年推出了 Ernie 系列模型,随后在次年推出了 Ernie 4.0 Turbo,这是一次"重大升级"。
现在,百度公布了 Ernie X1,据称其性能与 DeepSeek R1 相当,但成本仅为竞争对手的一半。据路透社报道,该模型具有"更强的理解、规划、反思和进化能力",同时也是首个能够自主使用独立工具的"深度思维"模型。
在圣诞节前推出 R1 后,DeepSeek 已成为 AI 模型制造商需要超越的新标准。作为一个推理模型,R1 以匹配美国最佳 AI 模型的能力而脱颖而出,尽管其制造商在训练上的投入仅为竞争对手的一小部分。
至于百度的另一个模型 Ernie 4.5,它是一个更标准化的非推理模型,旨在与 OpenAI 的 GPT-4 竞争,但公司表示它具有"出色的多模态理解能力"和"更先进的语言能力"。其理解人类、生成响应的能力以及记忆能力也得到了提升。
多模态 AI 系统以其处理各种不同类型数据的能力而著称。例如,它们可以处理基于文本的提示、视频、图像或音频文件,并能够在这些格式之间转换内容。
除了多模态之外,据报道 Ernie 4.5 还具有"高情商",百度称这有助于它更好地理解网络梗和讽刺漫画。
DeepSeek 的出现重新激活了 AI 竞赛,尤其是百度对改善其命运充满期待。该公司是首批推出类似 ChatGPT 的 AI 模型的中国公司之一,但即使在国内市场也难以竞争,尽管声称其早期的 Ernie 模型与 OpenAI 的最佳模型不相上下。
这家总部位于北京的公司面临着来自国内科技公司的激烈竞争,包括 TikTok 母公司字节跳动和腾讯公司,这些公司的聊天机器人获得了更多用户。
然而,DeepSeek 的戏剧性登场颠覆了中国所有领先的 AI 公司,R1 的推出掀起了一场风暴,开创了更经济实惠的 AI 模型时代。此后,中国政府和数十家本地公司支持 DeepSeek,将其模型整合到自己的产品和服务中,让竞争对手不得不追赶。就连百度也采用了 DeepSeek R1,将推理模型与其标志性搜索引擎进行结合。
DeepSeek 的竞争对手决心迎头赶上,2 月份腾讯旗下的微信推出了一个新模型,声称其响应查询的速度甚至比 DeepSeek 更快。
同样在上个月,阿里巴巴集团表示将在未来三年内投资 3800 亿元人民币(约 520 亿美元)用于 AI 和云计算研究。
与此同时,百度也跟随 DeepSeek 的脚步,表示计划在今年晚些时候开源其 Ernie 模型的代码库。
好文章,需要你的鼓励
周一AWS美东数据中心DNS故障导致数百万用户和上千家企业断网,Reddit、Snapchat、银行和游戏平台均受影响。专家认为这凸显了冗余备份的重要性,CIO需要根据业务关键性进行风险评估,优先保护核心系统。单一供应商策略仍可行,但需通过多区域部署分散风险,建立故障转移计划。金融、医疗等高风险行业需更高冗余级别。
上海AI实验室等机构联合提出FrameThinker框架,革命性地改变了AI处理长视频的方式。该系统采用"侦探式"多轮推理,先快速扫描全视频获得概览,再有针对性地深入分析关键片段。通过两阶段训练和认知一致性验证,FrameThinker在多个视频理解基准测试中准确率平均提升10.4%,计算效率提高20倍以上,为AI视频理解领域带来突破性进展。
英国政府发布新的反勒索软件指导文件,旨在解决供应链安全薄弱环节。该指南与新加坡当局联合制定,帮助组织识别供应链问题并采取实际措施检查供应商安全性。英国国家网络安全中心过去一年处理了204起"国家重大"网络安全事件。指南强调选择安全可靠的供应商、加强合同网络安全条款、进行独立审计等措施,以提升供应链韧性和防范网络攻击。
复旦大学团队创建MedQ-Bench基准,首次系统评估AI模型医学影像质量评估能力。研究覆盖五大成像模式,设计感知-推理双层评估体系,意外发现医学专用AI表现不如通用AI。结果显示最佳AI模型准确率仅68.97%,远低于人类专家82.50%,揭示了AI在医学影像质控应用中的现实挑战和改进方向。