Claude现在可以在聊天中直接创建交互式图表、图解和可视化内容,这是Anthropic公司周四宣布的新功能。这项目前处于测试阶段的工具(可能存在漏洞)并不是AI图像生成器,也不是某个竞品的对手,而是完全不同的东西。实际上,您需要亲自体验这个功能才能理解它的有趣和巧妙之处。
我通过要求Claude展示如何换轮胎来测试这个新功能,它生成了一个全面的交互式分步可视化演示,让我相信自己能够处理这项任务。这不仅仅是一个炫酷的技巧(尽管确实很酷);相比于AI聊天机器人通常给出的大段文字,这是一种更好的展示过程的方式。
这些新的可视化功能有一个明确的目标:让用户更好地理解他们与Claude讨论的主题。在某些情况下,大段文字可以用视觉内容更清晰地替代,这正是Claude的制造商Anthropic想要实现的。系统会判断在对话中何时视觉呈现可能是最合适的回应方式,以便信息能够更容易被理解。
在Anthropic分享的更有趣的例子中,包括制作"酷炫"纸飞机的分步教程,以及可以点击单个元素获取更多信息的交互式元素周期表。
当Claude判断视觉呈现是最合适的回应时,或者当用户明确要求时,它会即时生成交互式HTML和SVG文件,完全从零开始构建。Anthropic将这个功能比作给Claude提供了一个按需白板。
这个功能是Anthropic更广泛推动的一部分,旨在使Claude成为更动态的AI工具,能够选择传递答案的最佳媒介。即使没有传统的图像生成器,这种能力可能更有影响力,在最有用的时候提供可视化内容。
该功能将默认开启,无需在设置中点击启用。此外,它适用于所有计划类型,意味着您不会因为付费墙而无法使用它。目前仅适用于网页和桌面版本,未来可能会推出移动版本。
Claude教我如何换轮胎
为了了解这个功能的工作原理,我要求Claude以视觉方式展示如何换轮胎。几秒钟内,它就生成了一个交互式的七步流程图解,包含了所需工具和关键步骤的说明。虽然图解不是非常详细,但清楚地传达了要点。
出于好奇,我还要求Claude为我正在阅读的书中描述的房屋正面创建交互式视觉呈现。它不仅准确地完成了这项任务,而且几乎所有内容都是可点击的,选择窗户或门时会显示小段信息。这个功能确实有"令人惊叹"的效果,您可以下载它生成的图解,或将它们保存为工件以便稍后在Claude中使用。
Q&A
Q1:Claude的新可视化功能具体能做什么?
A:Claude可以在聊天中直接创建交互式图表、图解和可视化内容。它能即时生成HTML和SVG文件,制作分步教程、交互式图表等,比如换轮胎教程、元素周期表等,用视觉方式替代大段文字说明。
Q2:这个功能需要付费使用吗?
A:不需要。这个功能将默认开启,适用于所有计划类型,用户不会因为付费墙而无法使用。目前仅适用于网页和桌面版本,未来可能推出移动版本。
Q3:Claude如何决定何时使用可视化回应?
A:系统会自动判断在对话中何时视觉呈现可能是最合适的回应方式,以便信息能够更容易被理解。当Claude判断视觉呈现最合适时,或者用户明确要求时,它就会生成可视化内容。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。