Kimi 发布视觉思考模型 k1

k1 模型基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。

根据Kimi官方介绍：

k1 模型基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。

其中，在数理化方面取得了很不错的成绩，完全超越其他SOTA级别模型 - OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。

关于「Kimi 视觉思考版」这一强化学习下的新势力选手：可以完整呈现推理思维链CoT，让用户不只看到答题结果，也能完整看到模型思索答案的全过程。

再概括下 k1 视觉思考模型的训练过程

1、训练阶段划分：本质上还是预训练及基于预训练模型后的强化学习后训练，这两个阶段

2、基础模型特点

- 重点优化字符识别能力

- 在多个基准测试集上取得卓越成绩：如OCRBench：903分（SOTA）；

3、强化学习后训练 - 划重点：强化学习后训练在数据质量和学习效率方面做了进一步优化

4、科学测试集创新

- 自主构建 Science Vista 测试集：覆盖不同难度的数理化图片题目；其分布与用户需求匹配

以下是Kimi官方的解数学题的demo：

Kimi 发布视觉思考模型 k1

除了数学能力，Kimi还展示了 k1 视觉思考模型解答经典物理电路题的例子：

Kimi 发布视觉思考模型 k1

看到这里，还留下了一个问题：

你认为Kimi的「视觉思考模型」，对哪个大模型对手产生的威胁最大呢？

来源：为AI发电

0赞

好文章，需要你的鼓励

人工智能

移动计算

用户体验优化

2025-08-20

Google力推手机AI功能引发关注

继苹果和其他厂商之后，Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注，希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利，并将这些技术优势转化为市场竞争力。

人工智能

注意力机制

推理能力

2025-08-20

麻省理工学院发现LLM“幻觉“新根源：注意力机制竟然会自相矛盾

麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源：注意力机制存在固有缺陷。研究通过理论分析和实验证明，即使在理想条件下，注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点，为未来AI架构发展指明新方向，提醒用户在复杂推理任务中谨慎使用AI工具。

人工智能

机器翻译

多语言支持

2025-08-20

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

Meta为Facebook和Instagram推出全新AI翻译工具，可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布，旨在打破语言壁垒，让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译，后续将增加更多语言。创作者还可使用AI唇形同步功能，创造无缝的口型匹配效果，并可通过创作者控制面板随时关闭该功能。