亚马逊公司旗下以保密著称的 Lab126 研发部门今日宣布成立了一个专注于人工智能 agent 的新团队。
Lab126 是亚马逊内部的一个研发机构,以高度保密闻名。此前它曾协助开发了 Amazon Kindle 电子书阅读器和 Echo 智能音箱等设备,并以在产品发布前对许多创新技术保密而著称。
这一新团队的成立正值越来越多的科技公司在探索人工智能 agent 潜能之时。它们希望利用人工智能的最新进展,超越简单的文本和图像生成器,打造能够代表用户执行复杂多步任务和操作的数字助手。
Lab126 的新团队主要将研究如何利用人工智能 agent 来提升公司机器人的性能。亚马逊在其物流运营中已经大量使用仓库机器人,现正寻求提升这些机器人的智能化水平,以便它们能执行多种任务。这将是一次重大改进,因为目前的机器人通常只设计完成单一任务。
为此,亚马逊的新团队将尝试开发用于所谓“物理 AI”应用的 agentic AI 框架。
亚马逊在周三的一次发布会上表示,通过将 agentic AI 能力嵌入机器人,这些机器将能够卸载拖车,然后取回任何需要维修的零件。公司解释称,这种 agentic AI 软件将使机器人能够 “hear, understand and act on natural language commands” ,从而将其转变为一支具备多种技能、灵活多变的自动化工人军队。
亚马逊机器人部门高级应用科学经理 Yesh Dattatreya 告诉路透社,对于亚马逊的客户来说,最大的好处将是更快的配送速度。他认为,这些机器人在需求高峰期(例如节假日)尤为有用,能够加快订单处理速度,并通过在狭小空间中搬运重物来优化仓库运营。他还表示,这将有助于最大限度减少浪费并降低碳排放。
不过,Dattatreya 强调,亚马逊的 agentic AI 机器人仍处于非常早期的阶段,公司尚未决定它们的具体形态,以及具体的部署时间和数量。
亚马逊在 AI agent 方面已有一定经验。今年早些时候,公司旗下的 AI 实验室推出了一款名为 Nova Act 的网页浏览器 agent,能够在线执行任务。此外,它还推出了一款先进版本的数字语音助手 Alexa+,具备一定的 agentic 能力。
融合 AI 的地图
在同一活动的另一项公告中,亚马逊表示正致力于开发更先进的地图技术,以提高配送员的工作效率。该技术将提供诸如建筑形状等更为细致的信息,以及配送员在投递包裹途中可能遇到的任何障碍物。
亚马逊在活动中表示:“这一创新使得亚马逊的配送员更容易找到正确的交付位置,尤其是在诸如大型办公园区等复杂环境中。”
亚马逊暗示,这些先进地图可能会与其为配送员开发的专用眼镜集成在一起。据报道,去年该公司就开始研发一款内嵌显示屏的眼镜,该眼镜能够显示实时地图,并提供实时、逐向导航。其理念是让配送员始终双手稳握方向盘,而无需停车操作 GPS 设备——更不用说在未停车的情况下操作。
亚马逊地图与地理空间业务副总裁兼总经理 Viraj Chatterjee 确认,公司正在研发这种设备,这是首次有公司高管公开证实此事。他对路透社表示,这项新地图技术可能会与这种设备配合使用,但他补充道,相关硬件仍在开发中。他指出,早期测试显示该软件在大型住宅区尤为有效,因为这些区域中许多建筑外观相同。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。