从上个月开始,拉斯维加斯的游客见证了一个即使在这座城市也算不寻常的景象:看起来像烤面包机的方形双向车辆,底部装有超大的滑轮装置。
这些车辆名为Zoox,如果亚马逊公司的计划顺利,它们将在几年内遍布各大城市的街道。这家零售巨头五年前收购了初创公司Zoox Inc.,但这些车辆直到上个月才开始载客。拉斯维加斯的游客可以免费乘坐Zoox前往拉斯维加斯大道的指定目的地。Zoox还在旧金山、西雅图、奥斯汀、迈阿密、洛杉矶、华盛顿特区和亚特兰大开展试点项目。
亚马逊云服务在为Zoox未来主义出租车提供动力方面发挥着核心作用。这家亚马逊子公司依靠云服务提供商的基础设施来训练、测试和优化处理导航和安全的机器学习模型。但对于这家云计算巨头来说,Zoox只是另一个客户,尽管是优先客户。"我们的作用是为Zoox提供工具和基础设施,帮助他们做到最好,"亚马逊云服务战略客户技术总监保罗·罗伯茨说。
智能终端
自动驾驶车辆本质上是复杂分布式网络中的终端。由于在时速60英里时不允许延迟,每辆车本质上都是一个移动数据中心,使用车载基础设施进行导航,同时收集大量关于交通模式、天气条件和行人行为等现实世界信息。这些数据被传输到亚马逊云服务,在那里进行大规模模拟,预测所有Zoox车辆应如何应对动态情况,比如有人走进人行横道或鲁莽司机在交通中穿行。
经过亚马逊云服务训练和验证后,更新的模型会部署到Zoox的车辆上。每辆车都能独立运行,但基于云的学习和基于边缘的执行实现了持续改进,同时不牺牲安全性或延迟。
"他们的目标方向与我们如何最好地支持他们之间有着紧密的联系,"罗伯茨说,"但安全是第一要务。"
与谷歌母公司Alphabet Inc.旗下的机器人出租车服务Waymo不同,Zoox车辆不是改装的乘用车。从零开始为自动驾驶设计,它们可以前进、后退,甚至无需转向就能横向移动。
车内没有驾驶座、踏板或其他传统控制装置。乘客座椅面对面放置,允许乘客在行驶过程中交谈甚至玩牌。乘客通过手机应用程序叫车,就像使用Uber或Lyft一样。
庞大后端
尽管这些车辆体积较小(目前长11.8英尺,高6.2英尺),但它们需要大量的云计算能力。后端基于亚马逊的弹性Kubernetes服务,可以扩展到数千个计算实例进行模型训练。"他们不必担心设置自己的集群;一切都是托管的,"罗伯茨说。
数据中心互连采用亚马逊云服务的弹性网络适配器。"它允许我们使用所有可用的网络路径,有些可达每秒3.2太比特的吞吐量,"罗伯茨说。"如果你试图在传统数据中心做这件事,将需要很长时间。"
亚马逊的FSx for Lustre托管分布式文件系统将训练数据从S3存储传输到计算集群,提供"跨数千个实例每秒数百吉字节",罗伯茨说。
这种组合使Zoox机器学习模型能够分析数PB的传感器数据,并在几小时而不是几周内完成重新训练。对于更高级的工作负载,Zoox利用亚马逊云服务EC2容量块,允许它在单个集群中预留多达2000个图形处理单元,用于提前八周安排的模拟。
即插即用
将数据从街道传输到云端需要一些创造性的工程设计。单个车辆每小时可产生多达4太字节的原始数据。蜂窝数据网络无法处理如此大的数据量,因此每辆Zoox会偶尔停靠并在安全的物理位置插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
亚马逊以及全球其他六家建造机器人出租车的公司将自动驾驶出租车视为解决个人车辆拥有巨大低效率的一种方式。罗伯茨指出,在任何给定时间,只有约4%的人工驾驶车辆在使用中,而仅在美国,司机每年就要花费950亿小时在方向盘后。
"当人们开始乘坐Zoox时,他们说一开始没有方向盘感觉很奇怪,但随着时间的推移,他们会习惯的,"罗伯茨说。"就像Uber或Airbnb一样,感觉正常只是时间问题。"
Q&A
Q1:Zoox自动驾驶车辆与传统出租车有什么不同?
A:Zoox车辆从零开始为自动驾驶设计,可以前进、后退甚至横向移动无需转向。车内没有驾驶座、踏板或传统控制装置,乘客座椅面对面放置,允许乘客交谈或玩牌。
Q2:Zoox车辆如何处理数据传输?
A:单个车辆每小时可产生多达4太字节的原始数据。由于蜂窝网络无法处理如此大的数据量,每辆Zoox会偶尔停靠在安全的物理位置,插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
Q3:亚马逊云服务如何支持Zoox的机器学习训练?
A:亚马逊云服务提供弹性Kubernetes服务,可扩展到数千个计算实例进行模型训练。通过FSx for Lustre分布式文件系统和弹性网络适配器,实现跨数千个实例每秒数百吉字节的数据传输,使模型能在几小时内分析数PB传感器数据并完成重新训练。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。