想象一下这样的场景:你正在为节日聚会制作饼干,厨房里一片忙乱。你打开烤箱门,戴上隔热手套,拿出一盘热乎乎的肉桂饼干。当你转身准备把烤盘放在台面上时……糟糕,你忘了准备垫子。就在你犹豫不决时,你注意到一些隔热垫开始从台面储物处自动移出来,它们自己在滚动,正好滚到需要的位置。
这看起来像魔法,像是《美女与野兽》中的情景,但根据卡内基梅隆大学研究人员的设想,这可能就是你未来厨房的景象。借助摄像头、各种AI模型和一些小轮子,普通物品可以自动找到你希望它们到达的确切位置,无需你去寻找。
很容易想象到像《杰森一家》中罗西那样的机器人管家,但这并不是机器人技术和人工智能在理论上为你在家中或办公室提供便利的唯一方式。同样的技术可以应用到更小的规模上,应用到你日常交互的物品上——你的咖啡杯、订书机、厨房用具等等。
"与其在我们现有的环境中引入额外的机器人,不如让我们家中已经存在的、我们已经熟悉的物品既智能又具有机器人功能,如何?"卡内基梅隆大学博士生、该研究论文的主要作者韩紫薇在采访中说道。
大型、强大的人形机器人给我们带来了很多担忧:它们既重又强壮,一旦出现故障就可能造成损害。它们接近令人不安的恐怖谷效应,当某样东西看起来几乎像人类时。而且要让它们可靠工作非常困难。人类的灵巧性是进化的非凡成就,我们构建的世界基于这样的假设:在其中移动的人能够做诸如握门把手这样的事情。这对机器人来说是一个困难的技能。即使这些机器人确实变得普遍,它们也不会是唯一自动化的东西。
"我很难设想你有这些机器人管家,但与此同时,其他一切都保持原来那样静态,"卡内基梅隆大学人机交互研究所助理教授、交互式结构实验室负责人亚历山德拉·伊恩说道。
为我们使用的物品添加AI和移动性解决了许多这些问题。它让自动化感觉更加自然——你仍然使用同样类型的订书机,即使它有小轮子并且似乎有自己的思维。但也有新的问题,比如隐私和安全,这些问题需要在你的咖啡杯每次你打哈欠时都开始追着你跑之前得到解决。
运动中的物品
如果你要让智能隔热垫知道在你拿着热烤盘时滚向你,你需要能够移动的隔热垫。在这些实验中,研究人员建造了有轮平台——比如为杯子设计的圆形平台,配有几个轮子、电机和电池。每个平台都由蓝牙控制的微控制器操作。韩紫薇和伊恩说,这些物品的未来消费者版本可以定制构建得更加无缝,但这只是为了证明技术的可行性。
物品本身并没有配备人工智能。虽然AI模型可以在小型硬件上运行,比如手机和手表,但这实际上是一个AI系统控制整个厨房。
它配备了一个摄像头,将图像帧流式传输到AI模型,这些模型可以处理和识别特定时刻正在发生的事情。它们确定一个人在做什么,并发现可能涉及该活动的物品。具有推理技能的大语言模型预测接下来可能发生什么。编码到系统中的知识库确保它知道人们如何与物品互动的一些基本知识。
"比如,如果一个杯子向我移动,如果把手朝向我会更方便,"韩紫薇举例说。
虽然物品在危机中前来拯救你的想法很戏剧化(即使危机本身相当微小),但该系统还可以通过其他方式提供帮助。如果你准备走出房子而没有带钥匙,钥匙托盘可以摇动你的钥匙。如果你在寻找订书机但它被桌子上的某样东西挡住了,AI可以将它移动到你能看到的地方。你甚至可以使用语音激活功能让你的智能房屋给你拿订书机。
什么时候你可以在家里期待这项技术?技术本身"并不遥远",伊恩说,但人们是否真的想要使其成为可能的设备是另一回事。"如果你能接受头顶的摄像头,那部署会快得多,"她说,"但就我个人而言,我不会接受这样。"
一个隐私解决方案更多的是政治性而非技术性的。更好的法规和政策将让消费者相信他们的隐私会得到保护,伊恩说。拥有可以完全在本地硬件上运行的模型,即不连接到互联网的计算机,也会有所帮助。
你想要什么样的机器人?
关于人形机器人,伊恩说有一种关于机器人管家的乌托邦观点,也有"机器人管家可能因某种原因变邪恶的反乌托邦版本"。即使机器人不是人形的,仍然存在担忧。在这种情况下,你应该在刀具上安装AI控制的轮子吗?研究人员有一把移动的刀,但设计它时确保刀刃始终背对着人移动。
"我认为这是一个有趣的紧张关系和需要讨论的问题,"伊恩说。"我们是否根本不想让这些类型的物品被驱动?"
目标是确保当机器人在我们家中做事情时,它们的行为方式能促进安全并真正帮助我们做我们想做的事。
"机器人在诸如叠衣服方面变得越来越有能力,但……它们应该按照我们想要的方式叠衣服,"韩紫薇说。"每件衣服可能都不同。对于机器人来说,不仅要有能力,还要理解用户想要什么以及如何最好地协助用户,这很重要。"
这可能是什么样子?你的咖啡杯识别出你准备再喝一口,并开始寻找通往你的路径。
Q&A
Q1:卡内基梅隆大学的智能物品技术是如何工作的?
A:该技术通过摄像头、AI模型和小轮子让普通物品变得智能。系统使用摄像头流式传输图像到AI模型,识别人的行为和相关物品,大语言模型预测接下来可能发生什么,然后通过蓝牙控制器让物品自动移动到需要的位置。
Q2:这种智能物品技术什么时候能在家庭中普及?
A:研究人员表示技术本身"并不遥远",但普及还面临隐私和接受度问题。如果用户能接受头顶摄像头,部署会更快,但很多人不愿意。需要更好的法规保护隐私,以及能在本地硬件运行的AI模型。
Q3:智能物品会不会存在安全隐患?
A:确实存在安全考虑,比如是否应该给刀具添加AI控制轮子。研究人员在设计移动刀具时确保刀刃始终背对人移动。关键是确保机器人行为促进安全,理解用户需求,以用户期望的方式提供帮助。
好文章,需要你的鼓励
传统AI依赖云端处理存在延迟和隐私问题。越来越多开发者将AI处理从数据中心转移到手机、笔记本等个人设备上。设备端AI具有三大优势:速度更快,无需等待云端响应;隐私更安全,数据不离开设备;成本更低,无需支付云服务费用。目前iPhone已运行30亿参数的设备端AI模型,谷歌Pixel手机也搭载Gemini Nano模型。未来五年内,随着硬件升级和算法优化,设备端AI将实现物体识别、导航翻译等更复杂功能。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
卡内基梅隆大学研究人员开发了一项革命性技术,通过摄像头、AI模型和微型轮子,让咖啡杯、订书机等日常物品能够自主移动到需要的位置。这种"智能物品"技术避免了传统人形机器人的复杂性和安全隐患,通过蓝牙微控制器和AI视觉系统,物品能够识别用户行为并预测需求。虽然技术已相对成熟,但隐私保护和安全性仍是推广前需要解决的关键问题。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。