Sunday是一家由斯坦福大学博士机器人专家创立的人工智能机器人初创公司,今日正式推出家用机器人Memo,这款机器人能够完成日常家务。
新机器人专为家庭环境设计,将安全性和稳定性作为首要考虑因素。
创始人兼首席执行官Tony Zhao和创始人兼首席技术官Cheng Chi在车库中创立了Sunday公司,他们夜以继日地使用3D打印机开发和制造机器人的硬件和外观。
"我们开发Memo是为了让人们有更多时间做重要的事情,同时考虑到每个家庭的安全需求,"Zhao说道。"这是家用机器人技术的转折点。"
Memo与当前热门的仿人形机器人设计理念不同,它没有腿部结构,这消除了仿人形机器人面临的最大问题之一:在上半身运动的同时保持平衡建模。它有一个从厚重滚动平台(类似于大型扫地机器人)延伸出来的"躯干"。整体而言,这款机器人外观略显厚重,配有光滑的白色肢体和关节、卡通化的面部和塑料"棒球帽"。
尽管外观和动作相对缓慢,但Memo出人意料地灵活,能够完成基本的家务任务。它可以在厨房和客厅执行各种活动,如清洁盘子和玻璃杯、将它们装入洗碗机、收拾衣物、制作浓缩咖啡,甚至协助准备简单菜肴。
人类凭借大脑的天然构造,能够直觉地学习和理解如何与环境互动。随着他们对环境越来越熟悉,灵活性也会提高。
另一方面,AI机器人依赖视觉行动模型,这些模型缺乏这种基础认知,必须经过训练才能完成甚至是拾取物品、关闭橱柜门以及绕过桌椅等障碍物等基本任务。
为了克服这一挑战,Sunday开发了他们称为"技能捕获手套"的可穿戴设备,能够捕获人们在家中移动、清洁和整理的方式。使用一副这样的手套,公司研究人员构建了一个包含约1000万个真实家庭例程的数据集,这些数据在超过500个家庭中采集,代表了大量的数据多样性。
根据Sunday的说法,这个数据集的综合家庭训练使Memo能够适应家庭环境的不可预测性,包括厨房、客厅和洗衣区域。
"Tony的ALOHA和Cheng的UMI研究告诉我们,有了足够的数据,使用相当低成本的硬件实际上就可以实现精细操作任务,"Sunday产品负责人Camilla Guo表示。
ALOHA,即低成本开源硬件系统,由斯坦福大学与谷歌DeepMind AI部门合作开发,旨在使用模仿学习构建低成本机器人平台,训练它们执行复杂任务。UMI,即通用操作界面,提供了一个数据收集和策略学习框架,用于教授机器人如何使用人类演示处理任务,为公司的技能捕获手套铺平了道路。
Sunday获得了来自Benchmark和Conviction的3500万美元融资。
"AI机器人技术的前景不在于后空翻或舞蹈表演,而是能够在混乱的真实世界环境中工作的机器人,"Benchmark普通合伙人Eric Vishria表示。"要实现这一目标,我们需要真实世界的训练数据。我们目前拥有的数据仅为所需数据的百万分之一。"
Sunday表示,公司的"创始家庭测试"计划申请已于11月19日开放,该计划将把机器人投放到家庭中使用。从申请者中,公司将选择50个家庭在2026年底成为Memo的早期用户。
"有很多公司基于我们的工作推进他们的研究,"Zhao说道,"但我们在这里构建的是更宏大的目标:让机器人走进每个家庭。"
Q&A
Q1:Memo机器人能做什么家务?
A:Memo机器人可以在厨房和客厅执行多种家务活动,包括清洁盘子和玻璃杯、将餐具装入洗碗机、收拾衣物、制作浓缩咖啡,甚至可以协助准备简单的菜肴。它专门为家庭环境设计,能够适应厨房、客厅和洗衣区域等不同场所的需求。
Q2:Sunday公司是如何训练Memo机器人的?
A:Sunday开发了"技能捕获手套"这一可穿戴设备,能够捕获人们在家中移动、清洁和整理的真实动作。公司研究人员使用这些手套在超过500个家庭中收集了约1000万个真实家庭例程的数据集,通过这种大规模真实数据训练,使Memo能够适应家庭环境的复杂性和不可预测性。
Q3:普通家庭什么时候可以使用Memo机器人?
A:Sunday公司已于11月19日开放"创始家庭测试"计划申请,将从申请者中选择50个家庭在2026年底成为Memo的早期用户。这意味着普通消费者最早可能在2026年底开始体验这款家用机器人,但大规模商用时间表尚未公布。
好文章,需要你的鼓励
迪士尼与OpenAI达成三年合作协议,授权200多个迪士尼、皮克斯、漫威和星球大战角色用于Sora视频和ChatGPT图像生成。迪士尼将向OpenAI投资10亿美元股权,成为其主要客户。协议明确不包含真人演员肖像和声音授权,仅限动画版本角色。同时迪士尼向谷歌发出停止侵权通知,要求停止基于其IP生成内容。这标志着娱乐巨头积极拥抱AI技术变革。
香港大学团队开发的VideoSSM突破了AI视频生成的时长瓶颈,通过创新的双重记忆架构,能生成一小时长度且保持完美一致性的视频。该系统模仿人脑记忆机制,结合局部和全局记忆模块,在长视频生成测试中取得领先成绩,为视频创作普及化奠定了技术基础。
OpenAI推出GPT-5.2模型,专为专业工作场景优化。新模型在创建电子表格、制作演示文稿、编写代码等方面表现更佳。GPT-5.2 Thinking版本在多项基准测试中超越前代产品,数学问题获得满分,事实性回答错误率降低30%。该发布被视为OpenAI对谷歌Gemini 3 Pro的"红色警报"回应,旨在重新夺回AI领域领先地位。
伊朗谢里夫理工大学研究团队开发了一种新的语音合成技术,通过服务导向架构解决了机器发音准确性和实时性难以兼得的问题。该技术将复杂的语言处理模块独立运行,避免拖累核心引擎速度,在波斯语测试中发音准确率显著提升,为语音助手和屏幕阅读器等应用带来更自然的语音体验。