尽管 Humane AI Pin 已经陷入困境,但 Rabbit 仍在继续前进。该公司今天发布了一篇博文和视频,展示了一个"通用 Android 代理",它能够缓慢地控制平板电脑上的应用程序,这与一年多前 Rabbit 声称其 R1 设备所具备的功能类似 (实际上当时做不到,现在也做不到)。这项工作是在 Rabbit 去年推出的"通用网页代理" LAM Playground 的基础上发展而来。
在演示过程中,工程师们完全没有使用 Rabbit R1 设备。相反,他们在笔记本电脑上的提示框中输入请求,系统会将这些请求转换为 Android 平板电脑上的操作。他们让系统执行各种任务,比如查找 YouTube 视频,或在鸡尾酒应用中找到威士忌鸡尾酒的配方,收集所需原料,然后将它们添加到 Google Keep 购物清单中。在某个环节,他们要求系统下载益智游戏 2048 并学会如何玩,虽然动作缓慢,但系统确实做到了。
这个模型基本上能够完成他们要求的任务,有时表现出色,有时则会出现一些怪异行为,比如通过 WhatsApp 发送诗歌时,是一条消息一行而不是整体发送。其中一位工程师猜测他们或许应该在提示中要求使用换行符,但他们没有重新尝试。
Rabbit 的 AI 代理显然仍在开发中,自从 2024 年 1 月创始人兼 CEO Jesse Lyu 展示的功能几乎都未能在 R1 发布时实现。Rabbit 一直在稳步推出更新,比如训练其 AI 代理完成特定任务或重新设计界面的能力。根据 Rabbit 的博文,今天展示的例子"仅仅是 Android 代理完成的核心动作循环"。公司承诺在未来几周内会分享更多关于其"即将推出的跨平台多代理系统"的信息。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。