又一周过去,又一个新的 AI 模型面向公众发布。这次是 Anthropic 推出的 Claude 3.7 Sonnet。该公司将其最新发布的产品描述为市场上首个"混合推理模型",这意味着新版 Claude 既可以几乎瞬间回答问题,也可以花时间逐步思考解决问题。作为用户,你可以通过下拉菜单选择想要 Claude 采用的"思考模式"来决定其处理方式。
Anthropic 表示:"我们开发 Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。正如人类使用同一个大脑既能快速响应又能深度思考,我们认为推理能力应该是前沿模型的一项集成功能,而不是一个完全独立的模型。这种统一的方法也为用户创造了更流畅的使用体验。"
虽然 Anthropic 没有明确点名 OpenAI,但显然是在暗指这个竞争对手。在 GPT-4、o1、o1-mini 和现在的 o3-mini 之间,OpenAI 提供了多个不同的模型,但除非你密切关注该公司,否则这么多系统会让人感到困惑。事实上,Sam Altman 最近也承认了这一点。他本月早些时候在 X 平台上发帖说:"我们和你一样讨厌模型选择器,希望能回归到统一的智能系统。"
Anthropic 表示,他们在开发 Claude 的推理能力时也采取了不同的方法。"我们在数学和计算机科学竞赛问题上的优化相对较少,转而更关注企业实际使用大语言模型的真实场景任务,"该公司写道。就此而言,当前的 Claude 用户可以期待"在编程和前端网页开发方面有特别显著的改进。"
Claude 3.7 Sonnet 从今天开始在所有 Claude 计划中可用,包括 Anthropic 的免费版本。同时,开发者可以通过该公司的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问新模型。
说到开发者,Anthropic 还推出了 Claude Code,这是一个新的"代理式"工具,允许你直接从终端界面将编码任务委托给 Claude。目前作为有限的研究预览版提供,Anthropic 表示 Claude Code 可以读取代码、编辑文件、编写和运行测试,甚至可以向 GitHub 推送提交。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。