8月21日,2024世界机器人大会在北京经济技术开发区北人亦创国际会展中心开幕。
据悉,今年共有27家人形机器人整机企业、30余家人形机器人产业链上下游的企业亮相,是人形机器人参展企业数量最多的一届。来自深圳的星尘智能新一代AI机器人助理Astribot S1也在这次展会上正式亮相。
Astribot S1是星尘智能于两日前正式发布的新一代AI机器人助理,在数小时内复刻了专家的扬琴、书法、糖画技艺,为现场观众表演并互动,这种学习操作能力可复刻到多类任务、多种场景,展现了业界领先泛场景通用操作能力,刷新了行业标准。
为你而生,为你而智
星尘智能公司Slogan为“科技创造美好”(High tech, High life),致力于为数十亿人打造有温度的AI机器人助理。
S1是具备全能操作的具身人形机器人,在今年四月首次技术展示中,执行了熨叠衣物、分拣物品、颠锅炒菜、吸尘清洁、竞技叠杯等多项复杂任务,引发行业广泛关注。此次S1以整机形态亮相,继续践行“为你而生,为你而智”(Naturally Yours)的产品理念,在一系列高难度、长序列、可泛化任务上,展现了“最强AI机器人助理”潜质。
在1倍速(业界常见为3到10倍速)的视频展示中,S1可谓智能又全能,在食物制作、泡功夫茶、乐器演奏等长序列任务展现了智能规划与最强操作,在模仿咏春拳、定点投篮等特技上展现了媲美专家的敏捷、灵巧与丝滑度,极大拓宽了应用想象力。
Design for AI
S1产品依托了星尘智能自主研发的面向AI(Design for AI)的软硬件一体化系统架构,将“AI智能”与“最强操作”强耦合,让机器人高度仿人,能像人一样学习、思考和劳动,与人流畅智能地交互,使用人的工具和设备、帮人完成枯燥、困难或危险的任务,奠定了具身智能技术基础与核心技术优势。
AI智能方面,S1拥有“最强大脑”,具备在复杂环境中的感知、认知、实时决策能力,及智能理解和多模态交互执行能力,实现物体、任务和环境级别通用操作泛化。值得注意的是,星尘智能在具身智能数据获取上取得关键性突破,S1能低成本利用现有的真实世界视频数据和人体动作捕捉数据,并通过第一人称视角收集触觉、力觉、视觉、听觉等多维度的高质量数据。综合这些数据进行更高效的规模化训练,降低了机器人高质量数据采集的成本、数据量级和新任务的训练难度,提升了泛化能力的潜力。
机器人硬件方面,S1能以低成本实现同规格机器人中的“最强操作”。其独特的刚柔耦合传动机构设计,通过传感器实时监测力的传输,不再依赖轨迹估算,而是像人一样,通过感知力的大小来精准控制控制力的输出,显著提升操作精度。
S1能像人一样去理解和决策、与人流畅交互,更能通过与真实世界交互持续学习进化,不断提升智能化和多任务泛化能力,未来有望逐步实现通用人工智能(AGI)。
2024年完成商业化
S1具备“高价值的上半身,可落地的下半身”,可用于科研、商业和家庭等广泛场景。其关键零部件自研,具备明显的成本优势。
通过刚柔耦合硬件设计和创新力规划算法,让S1具备极高安全性,能在交互中精确控制力度,在运动中不伤人、不伤物、不伤自己,为场景落地奠定基础。
星尘智能追求软硬件一体化技术的极致突破,不断拓展应用场景的边界,预计于2024年完成商业化。
星尘智能 CEO 来杰表示:“我们的愿景是让数十亿人拥有 AI 机器人助理。无论是照顾家庭还是到工厂工作,机器人在学习、决策和执行上越像人,越能帮人做得更多和更好,因此欢迎大家给S1提需求,让它的能力能从55%、85%成长到99.99%,无限接近人类水平。也希望未来五年到十年,AI机器人就能走进千家万户。”
好文章,需要你的鼓励
存储扩展专家Lucidity将其AutoScaler平台扩展至Kubernetes容器编排平台,帮助企业控制存储支出。该公司表示,Kubernetes中的持久卷常常成为隐形浪费源,虽然Kubernetes可自动扩展实例数量,但底层存储通常未被充分利用。新服务可为亚马逊EKS提供持久卷的自动扩缩容,声称可为客户节省高达70%的云块存储费用。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
超过1.8万Spotify用户加入名为"Unwrapped"的集体组织,通过去中心化数据平台Vana将个人听歌数据打包出售给AI开发者。该组织已将1万用户的艺术家偏好数据以5.5万美元价格售出,用于构建新型流媒体数据分析工具。Spotify对此发出警告,称该行为违反开发者政策和商标权,禁止将平台数据用于机器学习模型构建。但Unwrapped团队坚持用户拥有控制和变现个人数据的权利,双方就数据所有权展开争议。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。