AI大模型竞争持续升温,多家顶尖AI公司在同一周内密集推出最新更新。就在Anthropic发布Claude Opus 4.7版本仅仅一周之后,OpenAI随即推出了GPT-5.5,中国的DeepSeek也发布了其V4 AI模型的预览版本。
这些公司一直在通过扩展和优化各自的大语言模型,争夺更广泛的消费者和企业用户,试图在竞争激烈的技术市场中脱颖而出。与此同时,科技行业仍在持续向这些技术投入数十亿美元资金。
DeepSeek的最新进展
DeepSeek此次推出的V4 Flash和V4 Pro两款大语言模型,主要聚焦于推理能力和智能体AI任务,采用了混合注意力架构(Hybrid Attention Architecture)。DeepSeek表示,这一架构使模型在面对连续的长提示序列时,依然能够记住完整的查询历史。V4还支持将更长的文档或代码作为提示词输入,并在架构设计和性能优化方面进行了多项改进。此外,这些模型可以部署在配置较低的硬件上,有望为希望采用该技术的企业降低成本。
去年年初,DeepSeek几乎以"横空出世"之势闯入AI领域,凭借更低廉的成本推出了足以媲美顶级模型的产品,打破了市场原有格局。然而此后,该公司也陷入了针对中国AI企业的争议漩涡之中。
OpenAI的最新动态
本周,OpenAI面向付费用户推出了ChatGPT 5.5,这也是GPT-5.5整体发布计划的一部分。该版本重点强化了编程、计算机操作与研究能力,并在易用性方面有所提升,OpenAI表示新版本在更少人工干预的情况下能够更智能地运行。
"这感觉真的像是在为我们未来的计算机工作方式奠定基础,或者说是在为大规模智能体计算的运作方式奠定基础。"公司总裁Greg Brockman在发布会的媒体简报中表示。
ChatGPT 5.5目前已向ChatGPT付费用户及Codex用户开放,涵盖思考版和专业版,并计划近期通过API提供访问能力。这些模型专为工作场景而生,尤其针对编程、计算机操作和研究任务进行了优化。
Brockman表示,GPT-5.5比以往版本更加智能,能够在更少人工指引的情况下完成更多任务。"它可以面对一个模糊的问题,自行判断下一步需要做什么。"他说道。
Anthropic的稳健路线
相比之下,Anthropic的Opus 4.7定位更为亲民友好。与之形成对比的是该公司另一款名为Mythos的高度先进AI模型——Anthropic认为Mythos在网络安全领域存在潜在风险,目前尚未对外公开发布。
Opus 4.7在输出内容的呈现效果上有所升级,例如在生成幻灯片和文档时更加精致美观(Anthropic用"tasteful"一词来形容这种风格)。Anthropic还表示,新模型将更加忠实地理解提示词的字面含义,而非模糊地进行语义推断,这对于那些需要AI直接输出明确结果的用户——例如氛围编程爱好者——将非常实用。
Q&A
Q1:DeepSeek V4模型有哪些技术亮点?
A:DeepSeek V4包含Flash和Pro两个版本,主要聚焦于推理能力和智能体AI任务。其核心技术亮点是采用了混合注意力架构,使模型在连续长对话中仍能保持对历史查询的记忆。此外,V4支持更长文档或代码作为提示词输入,并在架构和性能优化方面进行了改进。值得一提的是,V4可部署在配置较低的硬件上,有望帮助企业降低使用成本。
Q2:GPT-5.5主要面向哪些使用场景?
A:GPT-5.5主要面向工作场景,重点强化了编程、计算机操作和研究三大能力。OpenAI总裁Greg Brockman表示,新版本更加智能直观,能够在更少人工干预的情况下独立处理模糊问题,判断下一步行动方向。目前GPT-5.5已向ChatGPT付费用户和Codex用户开放,并计划近期通过API提供访问。
Q3:Anthropic的Opus 4.7和Mythos有什么区别?
A:Opus 4.7是Anthropic面向大众推出的友好型AI模型,在输出内容的美观度上有所提升,生成的幻灯片和文档更加精致,同时对提示词的理解更加字面化,适合需要直接明确输出的用户。而Mythos是该公司开发的一款高度先进的AI模型,由于Anthropic认为其在网络安全方面存在潜在危险,目前暂未对外公开发布。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。