Anthropic于周四发布了一款新型AI模型,但这并非外界期待的Claude Mythos预览版。Claude Opus 4.7现已正式上线,主要面向开发者和编程爱好者,帮助他们应对复杂的编程任务。
指令遵循能力全面升级
Opus 4.7在指令遵循方面有了显著提升,就像一只训练有素的工作犬,能够更精准地执行命令。Anthropic在其博客中指出,Opus 4.7会"逐字"执行用户指令,而此前的模型版本往往会跳过或宽泛解读提示词。此外,该模型对基于文件的记忆系统进行了改进,能够更有效地调取历史对话和文档中的信息。在图像处理方面,Opus 4.7也能够处理更大体积的图像文件,并更轻松地从图表中提取和分析数据。
界面生成更具美感
Anthropic表示,该模型在创建界面、文档和幻灯片时,表现得更加"精致且富有创意"。不过,Anthropic并未就"好品味"与"差品味"的具体评判标准给出详细说明。
Claude Mythos Preview的前情回顾
本月早些时候,Anthropic曾因发布Claude Mythos Preview而引发广泛关注。这款下一代模型在识别安全漏洞方面表现出色,以至于公司决定仅向思科、CrowdStrike和亚马逊云服务(AWS)等科技及互联网基础设施企业开放,以便这些企业利用Mythos发现的问题来修复自身系统。
其背后的逻辑在于:如果科技公司能借助AI提升自身系统的安全性,就能更有效地抵御那些同样可以使用公开AI模型的恶意攻击者。
网络安全防护机制初显雏形
尽管Opus 4.7与Mythos并非同一产品,但Anthropic已在Opus 4.7中测试部分新型网络安全防护机制。根据公司博客的描述,这些防护措施能够"自动检测并拦截涉及违禁或高风险网络安全用途的请求",是未来"Mythos级"模型中相应功能的简化版本。但在AI被广泛应用于攻防两端的今天,这些功能的重要性依然不容忽视。
Q&A
Q1:Claude Opus 4.7和Claude Mythos Preview有什么区别?
A:Claude Opus 4.7是Anthropic正式发布的通用模型,面向开发者和编程用户,重点提升了指令遵循、文件记忆和图像处理能力。而Claude Mythos Preview是下一代模型,因其在发现安全漏洞方面能力过强,目前仅向思科、CrowdStrike、AWS等基础设施企业开放,尚未公开发布。两者定位和开放范围均不相同。
Q2:Claude Opus 4.7在网络安全方面有哪些新功能?
A:Claude Opus 4.7内置了部分新型网络安全防护机制,能够自动检测并拦截涉及违禁或高风险网络安全用途的请求。这些防护措施是未来"Mythos级"模型中完整网络安全功能的简化版,主要目的是防止AI被用于恶意攻击行为,在AI日益渗透攻防两端的背景下具有重要意义。
Q3:Claude Opus 4.7对文件记忆系统做了哪些改进?
A:Claude Opus 4.7对基于文件的记忆系统进行了优化升级,使模型能够更有效地从历史对话记录和上传文档中调取相关信息。这意味着用户在多轮对话或处理长文档时,模型能够保持更好的上下文连贯性,减少重复输入同类信息的需要,从而提升整体使用效率。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。