谷歌DeepMind于周二发布了一款名为Gemini Robotics On-Device的新型语言模型,该模型可在机器人上本地执行任务,无需互联网连接。
基于该公司今年3月发布的Gemini Robotics模型,Gemini Robotics On-Device能够控制机器人的运动。开发者可以使用自然语言提示来控制和微调模型,以满足各种需求。
在基准测试中,谷歌声称该模型的性能接近基于云端的Gemini Robotics模型。公司表示,在通用基准测试中,它优于其他设备端模型,尽管没有具体说明这些模型的名称。
在演示中,该公司展示了运行这一本地模型的机器人执行解拉链包和折叠衣物等任务。谷歌表示,虽然该模型最初是为ALOHA机器人训练的,但后来适配到双臂Franka FR3机器人和Apptronik公司的Apollo人形机器人上。
谷歌声称双臂Franka FR3成功应对了之前从未"见过"的场景和物体,比如在工业传送带上进行装配作业。
谷歌DeepMind还发布了Gemini Robotics SDK。公司表示,开发者可以向机器人展示50到100次任务演示,在MuJoCo物理模拟器上使用这些模型训练机器人执行新任务。
其他AI模型开发者也在涉足机器人领域。英伟达正在构建一个为人形机器人创建基础模型的平台;Hugging Face不仅在开发开源机器人模型和数据集,还在研发机器人;韩国创业公司RLWRLD获得未来资产投资,正致力于创建机器人基础模型。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。