尽管 Humane AI Pin 已经陷入困境,但 Rabbit 仍在继续前进。该公司今天发布了一篇博文和视频,展示了一个"通用 Android 代理",它能够缓慢地控制平板电脑上的应用程序,这与一年多前 Rabbit 声称其 R1 设备所具备的功能类似 (实际上当时做不到,现在也做不到)。这项工作是在 Rabbit 去年推出的"通用网页代理" LAM Playground 的基础上发展而来。
在演示过程中,工程师们完全没有使用 Rabbit R1 设备。相反,他们在笔记本电脑上的提示框中输入请求,系统会将这些请求转换为 Android 平板电脑上的操作。他们让系统执行各种任务,比如查找 YouTube 视频,或在鸡尾酒应用中找到威士忌鸡尾酒的配方,收集所需原料,然后将它们添加到 Google Keep 购物清单中。在某个环节,他们要求系统下载益智游戏 2048 并学会如何玩,虽然动作缓慢,但系统确实做到了。
这个模型基本上能够完成他们要求的任务,有时表现出色,有时则会出现一些怪异行为,比如通过 WhatsApp 发送诗歌时,是一条消息一行而不是整体发送。其中一位工程师猜测他们或许应该在提示中要求使用换行符,但他们没有重新尝试。
Rabbit 的 AI 代理显然仍在开发中,自从 2024 年 1 月创始人兼 CEO Jesse Lyu 展示的功能几乎都未能在 R1 发布时实现。Rabbit 一直在稳步推出更新,比如训练其 AI 代理完成特定任务或重新设计界面的能力。根据 Rabbit 的博文,今天展示的例子"仅仅是 Android 代理完成的核心动作循环"。公司承诺在未来几周内会分享更多关于其"即将推出的跨平台多代理系统"的信息。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。