亚马逊公司旗下以保密著称的 Lab126 研发部门今日宣布成立了一个专注于人工智能 agent 的新团队。
Lab126 是亚马逊内部的一个研发机构,以高度保密闻名。此前它曾协助开发了 Amazon Kindle 电子书阅读器和 Echo 智能音箱等设备,并以在产品发布前对许多创新技术保密而著称。
这一新团队的成立正值越来越多的科技公司在探索人工智能 agent 潜能之时。它们希望利用人工智能的最新进展,超越简单的文本和图像生成器,打造能够代表用户执行复杂多步任务和操作的数字助手。
Lab126 的新团队主要将研究如何利用人工智能 agent 来提升公司机器人的性能。亚马逊在其物流运营中已经大量使用仓库机器人,现正寻求提升这些机器人的智能化水平,以便它们能执行多种任务。这将是一次重大改进,因为目前的机器人通常只设计完成单一任务。
为此,亚马逊的新团队将尝试开发用于所谓“物理 AI”应用的 agentic AI 框架。
亚马逊在周三的一次发布会上表示,通过将 agentic AI 能力嵌入机器人,这些机器将能够卸载拖车,然后取回任何需要维修的零件。公司解释称,这种 agentic AI 软件将使机器人能够 “hear, understand and act on natural language commands” ,从而将其转变为一支具备多种技能、灵活多变的自动化工人军队。
亚马逊机器人部门高级应用科学经理 Yesh Dattatreya 告诉路透社,对于亚马逊的客户来说,最大的好处将是更快的配送速度。他认为,这些机器人在需求高峰期(例如节假日)尤为有用,能够加快订单处理速度,并通过在狭小空间中搬运重物来优化仓库运营。他还表示,这将有助于最大限度减少浪费并降低碳排放。
不过,Dattatreya 强调,亚马逊的 agentic AI 机器人仍处于非常早期的阶段,公司尚未决定它们的具体形态,以及具体的部署时间和数量。
亚马逊在 AI agent 方面已有一定经验。今年早些时候,公司旗下的 AI 实验室推出了一款名为 Nova Act 的网页浏览器 agent,能够在线执行任务。此外,它还推出了一款先进版本的数字语音助手 Alexa+,具备一定的 agentic 能力。
融合 AI 的地图
在同一活动的另一项公告中,亚马逊表示正致力于开发更先进的地图技术,以提高配送员的工作效率。该技术将提供诸如建筑形状等更为细致的信息,以及配送员在投递包裹途中可能遇到的任何障碍物。
亚马逊在活动中表示:“这一创新使得亚马逊的配送员更容易找到正确的交付位置,尤其是在诸如大型办公园区等复杂环境中。”
亚马逊暗示,这些先进地图可能会与其为配送员开发的专用眼镜集成在一起。据报道,去年该公司就开始研发一款内嵌显示屏的眼镜,该眼镜能够显示实时地图,并提供实时、逐向导航。其理念是让配送员始终双手稳握方向盘,而无需停车操作 GPS 设备——更不用说在未停车的情况下操作。
亚马逊地图与地理空间业务副总裁兼总经理 Viraj Chatterjee 确认,公司正在研发这种设备,这是首次有公司高管公开证实此事。他对路透社表示,这项新地图技术可能会与这种设备配合使用,但他补充道,相关硬件仍在开发中。他指出,早期测试显示该软件在大型住宅区尤为有效,因为这些区域中许多建筑外观相同。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。