从上个月开始,拉斯维加斯的游客见证了一个即使在这座城市也算不寻常的景象:看起来像烤面包机的方形双向车辆,底部装有超大的滑轮装置。
这些车辆名为Zoox,如果亚马逊公司的计划顺利,它们将在几年内遍布各大城市的街道。这家零售巨头五年前收购了初创公司Zoox Inc.,但这些车辆直到上个月才开始载客。拉斯维加斯的游客可以免费乘坐Zoox前往拉斯维加斯大道的指定目的地。Zoox还在旧金山、西雅图、奥斯汀、迈阿密、洛杉矶、华盛顿特区和亚特兰大开展试点项目。
亚马逊云服务在为Zoox未来主义出租车提供动力方面发挥着核心作用。这家亚马逊子公司依靠云服务提供商的基础设施来训练、测试和优化处理导航和安全的机器学习模型。但对于这家云计算巨头来说,Zoox只是另一个客户,尽管是优先客户。"我们的作用是为Zoox提供工具和基础设施,帮助他们做到最好,"亚马逊云服务战略客户技术总监保罗·罗伯茨说。
智能终端
自动驾驶车辆本质上是复杂分布式网络中的终端。由于在时速60英里时不允许延迟,每辆车本质上都是一个移动数据中心,使用车载基础设施进行导航,同时收集大量关于交通模式、天气条件和行人行为等现实世界信息。这些数据被传输到亚马逊云服务,在那里进行大规模模拟,预测所有Zoox车辆应如何应对动态情况,比如有人走进人行横道或鲁莽司机在交通中穿行。
经过亚马逊云服务训练和验证后,更新的模型会部署到Zoox的车辆上。每辆车都能独立运行,但基于云的学习和基于边缘的执行实现了持续改进,同时不牺牲安全性或延迟。
"他们的目标方向与我们如何最好地支持他们之间有着紧密的联系,"罗伯茨说,"但安全是第一要务。"
与谷歌母公司Alphabet Inc.旗下的机器人出租车服务Waymo不同,Zoox车辆不是改装的乘用车。从零开始为自动驾驶设计,它们可以前进、后退,甚至无需转向就能横向移动。
车内没有驾驶座、踏板或其他传统控制装置。乘客座椅面对面放置,允许乘客在行驶过程中交谈甚至玩牌。乘客通过手机应用程序叫车,就像使用Uber或Lyft一样。
庞大后端
尽管这些车辆体积较小(目前长11.8英尺,高6.2英尺),但它们需要大量的云计算能力。后端基于亚马逊的弹性Kubernetes服务,可以扩展到数千个计算实例进行模型训练。"他们不必担心设置自己的集群;一切都是托管的,"罗伯茨说。
数据中心互连采用亚马逊云服务的弹性网络适配器。"它允许我们使用所有可用的网络路径,有些可达每秒3.2太比特的吞吐量,"罗伯茨说。"如果你试图在传统数据中心做这件事,将需要很长时间。"
亚马逊的FSx for Lustre托管分布式文件系统将训练数据从S3存储传输到计算集群,提供"跨数千个实例每秒数百吉字节",罗伯茨说。
这种组合使Zoox机器学习模型能够分析数PB的传感器数据,并在几小时而不是几周内完成重新训练。对于更高级的工作负载,Zoox利用亚马逊云服务EC2容量块,允许它在单个集群中预留多达2000个图形处理单元,用于提前八周安排的模拟。
即插即用
将数据从街道传输到云端需要一些创造性的工程设计。单个车辆每小时可产生多达4太字节的原始数据。蜂窝数据网络无法处理如此大的数据量,因此每辆Zoox会偶尔停靠并在安全的物理位置插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
亚马逊以及全球其他六家建造机器人出租车的公司将自动驾驶出租车视为解决个人车辆拥有巨大低效率的一种方式。罗伯茨指出,在任何给定时间,只有约4%的人工驾驶车辆在使用中,而仅在美国,司机每年就要花费950亿小时在方向盘后。
"当人们开始乘坐Zoox时,他们说一开始没有方向盘感觉很奇怪,但随着时间的推移,他们会习惯的,"罗伯茨说。"就像Uber或Airbnb一样,感觉正常只是时间问题。"
Q&A
Q1:Zoox自动驾驶车辆与传统出租车有什么不同?
A:Zoox车辆从零开始为自动驾驶设计,可以前进、后退甚至横向移动无需转向。车内没有驾驶座、踏板或传统控制装置,乘客座椅面对面放置,允许乘客交谈或玩牌。
Q2:Zoox车辆如何处理数据传输?
A:单个车辆每小时可产生多达4太字节的原始数据。由于蜂窝网络无法处理如此大的数据量,每辆Zoox会偶尔停靠在安全的物理位置,插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
Q3:亚马逊云服务如何支持Zoox的机器学习训练?
A:亚马逊云服务提供弹性Kubernetes服务,可扩展到数千个计算实例进行模型训练。通过FSx for Lustre分布式文件系统和弹性网络适配器,实现跨数千个实例每秒数百吉字节的数据传输,使模型能在几小时内分析数PB传感器数据并完成重新训练。
好文章,需要你的鼓励
PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
Ironclad OS项目正在开发一个新的类Unix操作系统内核,面向小型嵌入式系统,计划支持实时功能。该项目的独特之处在于采用Ada编程语言及其可形式化验证的SPARK子集进行开发,而非常见的C、C++或Rust语言。项目还包含运行在Ironclad内核上的完整操作系统Gloire,使用GNU工具构建以提供传统Unix兼容性。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。