Anthropic公司最强大的Claude模型正在迎来新的升级,该公司在周四的博客文章中表示,Claude Opus 4.6将在编程和项目创建方面表现得更加出色,一次性完成的成功率更高。
Claude Opus 4.5已经是一个强大的编程模型,其11月发布后引发了Claude Code在假期期间的病毒式传播热潮。Claude经过验证的编程实力和新的Cowork功能让华尔街感到焦虑,近几周许多科技股下跌,人们担心未来可能不再需要软件产品。
Anthropic表示,新模型更专注于解决最大的挑战,比如复杂应用程序的内部运作机制,同时也能更快地处理简单的步骤。
作为推理模型,Opus 4.6的工作原理是分解执行任务所需的步骤,制定计划后再开始执行。它还会回过头检查这些步骤的工作,有时会在不需要你要求的情况下进行多次尝试。
有时模型可能会在任务上花费过多精力,Anthropic表示可以通过将努力级别从默认的"高"设置降低来解决这个问题。
Claude Opus模型适用于Pro、Max、Team和Enterprise计划的付费Claude用户。其中最便宜的Pro计划每月费用为20美元(如果按年付费则每月17美元)。Pro计划对Opus的使用有限制,用户在几个小时的编程后可能会达到限制,然后需要等待几个小时才能重置。
除了Opus,Anthropic还有规模更小、功能稍弱的Sonnet 4.5和Haiku 4.5模型。
Claude Opus 4.6初体验
为了测试新模型,我让它创建一个通过语音操作的问答应用。这个过程经过了大约一小时的多次迭代,但Claude每次都能很快完成输出。这绝不是完全自主的——我识别故障并提供解决方案的想法,尽管我的一些建议在完全在HTML文件内构建的限制下产生了反效果。
这次体验与我之前用Opus 4.5进行类似测试时没有太大不同,尽管这次似乎稍微快一些。模型从一开始就理解了我想要做什么,这在AI项目中并不总是如此。当我告诉它要制作有挑战性的问题时,它想出的问答题制作得相当精良。大部分问题都很准确,尽管其中一道(众多)艺术史问题要求我说出艺术家的名字(爱德华·蒙克),但却告诉我正确答案是画作的标题(《呐喊》)。
速度提升的缺点是我在大约90分钟内就用完了Pro计划的使用限额——正当我让应用程序几乎无缝运行时——无法发出最后一个请求:要求一个包含100多个问题的数据库。这只能再等几个小时了。
Q&A
Q1:Claude Opus 4.6相比前一版本有哪些改进?
A:Claude Opus 4.6在编程和项目创建方面表现更出色,一次性完成的成功率更高。它更专注于解决复杂应用程序内部运作等重大挑战,同时也能更快处理简单步骤。作为推理模型,它会分解任务步骤并制定执行计划,还会主动检查和多次尝试优化结果。
Q2:Claude Opus模型的收费标准是什么?
A:Claude Opus模型适用于Pro、Max、Team和Enterprise等付费计划用户。最便宜的Pro计划每月20美元(年付17美元/月)。需要注意的是Pro计划对Opus使用有限制,用户可能在几小时编程后达到限制,需等待几小时重置。
Q3:Claude Opus 4.6的编程能力表现如何?
A:实际测试中,Claude Opus 4.6能够创建语音操作的问答应用,理解能力强,从一开始就能把握用户需求。生成的问答题质量较高,大部分准确,处理速度也比前版本有所提升,但可能因为处理速度快而更快消耗使用限额。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。