又一周过去,又一个新的 AI 模型面向公众发布。这次是 Anthropic 推出的 Claude 3.7 Sonnet。该公司将其最新发布的产品描述为市场上首个"混合推理模型",这意味着新版 Claude 既可以几乎瞬间回答问题,也可以花时间逐步思考解决问题。作为用户,你可以通过下拉菜单选择想要 Claude 采用的"思考模式"来决定其处理方式。
Anthropic 表示:"我们开发 Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。正如人类使用同一个大脑既能快速响应又能深度思考,我们认为推理能力应该是前沿模型的一项集成功能,而不是一个完全独立的模型。这种统一的方法也为用户创造了更流畅的使用体验。"
虽然 Anthropic 没有明确点名 OpenAI,但显然是在暗指这个竞争对手。在 GPT-4、o1、o1-mini 和现在的 o3-mini 之间,OpenAI 提供了多个不同的模型,但除非你密切关注该公司,否则这么多系统会让人感到困惑。事实上,Sam Altman 最近也承认了这一点。他本月早些时候在 X 平台上发帖说:"我们和你一样讨厌模型选择器,希望能回归到统一的智能系统。"
Anthropic 表示,他们在开发 Claude 的推理能力时也采取了不同的方法。"我们在数学和计算机科学竞赛问题上的优化相对较少,转而更关注企业实际使用大语言模型的真实场景任务,"该公司写道。就此而言,当前的 Claude 用户可以期待"在编程和前端网页开发方面有特别显著的改进。"
Claude 3.7 Sonnet 从今天开始在所有 Claude 计划中可用,包括 Anthropic 的免费版本。同时,开发者可以通过该公司的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问新模型。
说到开发者,Anthropic 还推出了 Claude Code,这是一个新的"代理式"工具,允许你直接从终端界面将编码任务委托给 Claude。目前作为有限的研究预览版提供,Anthropic 表示 Claude Code 可以读取代码、编辑文件、编写和运行测试,甚至可以向 GitHub 推送提交。
好文章,需要你的鼓励
谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
浙江大学和吉利汽车研究院联合团队提出的FreeTimeGS是一种创新的动态3D场景重建方法。不同于传统方法,它允许高斯基元在任意时空位置自由出现,并赋予每个基元运动功能,使其能够随时间移动到相邻区域。研究通过4D正则化策略解决了高不透明度基元阻碍优化的问题。在多个数据集测试中,该方法在渲染质量和速度上均大幅超越现有技术,特别是在处理复杂动态场景时,使用单个RTX 4090 GPU能以467 FPS的速度实现1080p实时渲染,为电影制作、游戏和虚拟现实等应用提供了新可能。
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
这篇研究介绍了"对角线批处理"技术,该技术解决了循环记忆Transformer模型在处理长文本时的并行计算瓶颈。通过重新编排计算顺序,研究团队实现了在不破坏依赖关系的情况下进行并行计算,使LLaMA-1B模型处理长文本的速度提升3.3倍,同时内存使用减少167.1倍。这种纯运行时优化不需要重新训练模型,为实际应用中的长文本处理提供了高效解决方案。