又一周过去,又一个新的 AI 模型面向公众发布。这次是 Anthropic 推出的 Claude 3.7 Sonnet。该公司将其最新发布的产品描述为市场上首个"混合推理模型",这意味着新版 Claude 既可以几乎瞬间回答问题,也可以花时间逐步思考解决问题。作为用户,你可以通过下拉菜单选择想要 Claude 采用的"思考模式"来决定其处理方式。
Anthropic 表示:"我们开发 Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。正如人类使用同一个大脑既能快速响应又能深度思考,我们认为推理能力应该是前沿模型的一项集成功能,而不是一个完全独立的模型。这种统一的方法也为用户创造了更流畅的使用体验。"
虽然 Anthropic 没有明确点名 OpenAI,但显然是在暗指这个竞争对手。在 GPT-4、o1、o1-mini 和现在的 o3-mini 之间,OpenAI 提供了多个不同的模型,但除非你密切关注该公司,否则这么多系统会让人感到困惑。事实上,Sam Altman 最近也承认了这一点。他本月早些时候在 X 平台上发帖说:"我们和你一样讨厌模型选择器,希望能回归到统一的智能系统。"
Anthropic 表示,他们在开发 Claude 的推理能力时也采取了不同的方法。"我们在数学和计算机科学竞赛问题上的优化相对较少,转而更关注企业实际使用大语言模型的真实场景任务,"该公司写道。就此而言,当前的 Claude 用户可以期待"在编程和前端网页开发方面有特别显著的改进。"
Claude 3.7 Sonnet 从今天开始在所有 Claude 计划中可用,包括 Anthropic 的免费版本。同时,开发者可以通过该公司的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问新模型。
说到开发者,Anthropic 还推出了 Claude Code,这是一个新的"代理式"工具,允许你直接从终端界面将编码任务委托给 Claude。目前作为有限的研究预览版提供,Anthropic 表示 Claude Code 可以读取代码、编辑文件、编写和运行测试,甚至可以向 GitHub 推送提交。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。