尽管 Humane AI Pin 已经陷入困境,但 Rabbit 仍在继续前进。该公司今天发布了一篇博文和视频,展示了一个"通用 Android 代理",它能够缓慢地控制平板电脑上的应用程序,这与一年多前 Rabbit 声称其 R1 设备所具备的功能类似 (实际上当时做不到,现在也做不到)。这项工作是在 Rabbit 去年推出的"通用网页代理" LAM Playground 的基础上发展而来。
在演示过程中,工程师们完全没有使用 Rabbit R1 设备。相反,他们在笔记本电脑上的提示框中输入请求,系统会将这些请求转换为 Android 平板电脑上的操作。他们让系统执行各种任务,比如查找 YouTube 视频,或在鸡尾酒应用中找到威士忌鸡尾酒的配方,收集所需原料,然后将它们添加到 Google Keep 购物清单中。在某个环节,他们要求系统下载益智游戏 2048 并学会如何玩,虽然动作缓慢,但系统确实做到了。
这个模型基本上能够完成他们要求的任务,有时表现出色,有时则会出现一些怪异行为,比如通过 WhatsApp 发送诗歌时,是一条消息一行而不是整体发送。其中一位工程师猜测他们或许应该在提示中要求使用换行符,但他们没有重新尝试。
Rabbit 的 AI 代理显然仍在开发中,自从 2024 年 1 月创始人兼 CEO Jesse Lyu 展示的功能几乎都未能在 R1 发布时实现。Rabbit 一直在稳步推出更新,比如训练其 AI 代理完成特定任务或重新设计界面的能力。根据 Rabbit 的博文,今天展示的例子"仅仅是 Android 代理完成的核心动作循环"。公司承诺在未来几周内会分享更多关于其"即将推出的跨平台多代理系统"的信息。
好文章,需要你的鼓励
迪士尼与OpenAI达成三年合作协议,授权200多个迪士尼、皮克斯、漫威和星球大战角色用于Sora视频和ChatGPT图像生成。迪士尼将向OpenAI投资10亿美元股权,成为其主要客户。协议明确不包含真人演员肖像和声音授权,仅限动画版本角色。同时迪士尼向谷歌发出停止侵权通知,要求停止基于其IP生成内容。这标志着娱乐巨头积极拥抱AI技术变革。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
OpenAI推出GPT-5.2模型,专为专业工作场景优化。新模型在创建电子表格、制作演示文稿、编写代码等方面表现更佳。GPT-5.2 Thinking版本在多项基准测试中超越前代产品,数学问题获得满分,事实性回答错误率降低30%。该发布被视为OpenAI对谷歌Gemini 3 Pro的"红色警报"回应,旨在重新夺回AI领域领先地位。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。