从上个月开始,拉斯维加斯的游客见证了一个即使在这座城市也算不寻常的景象:看起来像烤面包机的方形双向车辆,底部装有超大的滑轮装置。
这些车辆名为Zoox,如果亚马逊公司的计划顺利,它们将在几年内遍布各大城市的街道。这家零售巨头五年前收购了初创公司Zoox Inc.,但这些车辆直到上个月才开始载客。拉斯维加斯的游客可以免费乘坐Zoox前往拉斯维加斯大道的指定目的地。Zoox还在旧金山、西雅图、奥斯汀、迈阿密、洛杉矶、华盛顿特区和亚特兰大开展试点项目。
亚马逊云服务在为Zoox未来主义出租车提供动力方面发挥着核心作用。这家亚马逊子公司依靠云服务提供商的基础设施来训练、测试和优化处理导航和安全的机器学习模型。但对于这家云计算巨头来说,Zoox只是另一个客户,尽管是优先客户。"我们的作用是为Zoox提供工具和基础设施,帮助他们做到最好,"亚马逊云服务战略客户技术总监保罗·罗伯茨说。
智能终端
自动驾驶车辆本质上是复杂分布式网络中的终端。由于在时速60英里时不允许延迟,每辆车本质上都是一个移动数据中心,使用车载基础设施进行导航,同时收集大量关于交通模式、天气条件和行人行为等现实世界信息。这些数据被传输到亚马逊云服务,在那里进行大规模模拟,预测所有Zoox车辆应如何应对动态情况,比如有人走进人行横道或鲁莽司机在交通中穿行。
经过亚马逊云服务训练和验证后,更新的模型会部署到Zoox的车辆上。每辆车都能独立运行,但基于云的学习和基于边缘的执行实现了持续改进,同时不牺牲安全性或延迟。
"他们的目标方向与我们如何最好地支持他们之间有着紧密的联系,"罗伯茨说,"但安全是第一要务。"
与谷歌母公司Alphabet Inc.旗下的机器人出租车服务Waymo不同,Zoox车辆不是改装的乘用车。从零开始为自动驾驶设计,它们可以前进、后退,甚至无需转向就能横向移动。
车内没有驾驶座、踏板或其他传统控制装置。乘客座椅面对面放置,允许乘客在行驶过程中交谈甚至玩牌。乘客通过手机应用程序叫车,就像使用Uber或Lyft一样。
庞大后端
尽管这些车辆体积较小(目前长11.8英尺,高6.2英尺),但它们需要大量的云计算能力。后端基于亚马逊的弹性Kubernetes服务,可以扩展到数千个计算实例进行模型训练。"他们不必担心设置自己的集群;一切都是托管的,"罗伯茨说。
数据中心互连采用亚马逊云服务的弹性网络适配器。"它允许我们使用所有可用的网络路径,有些可达每秒3.2太比特的吞吐量,"罗伯茨说。"如果你试图在传统数据中心做这件事,将需要很长时间。"
亚马逊的FSx for Lustre托管分布式文件系统将训练数据从S3存储传输到计算集群,提供"跨数千个实例每秒数百吉字节",罗伯茨说。
这种组合使Zoox机器学习模型能够分析数PB的传感器数据,并在几小时而不是几周内完成重新训练。对于更高级的工作负载,Zoox利用亚马逊云服务EC2容量块,允许它在单个集群中预留多达2000个图形处理单元,用于提前八周安排的模拟。
即插即用
将数据从街道传输到云端需要一些创造性的工程设计。单个车辆每小时可产生多达4太字节的原始数据。蜂窝数据网络无法处理如此大的数据量,因此每辆Zoox会偶尔停靠并在安全的物理位置插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
亚马逊以及全球其他六家建造机器人出租车的公司将自动驾驶出租车视为解决个人车辆拥有巨大低效率的一种方式。罗伯茨指出,在任何给定时间,只有约4%的人工驾驶车辆在使用中,而仅在美国,司机每年就要花费950亿小时在方向盘后。
"当人们开始乘坐Zoox时,他们说一开始没有方向盘感觉很奇怪,但随着时间的推移,他们会习惯的,"罗伯茨说。"就像Uber或Airbnb一样,感觉正常只是时间问题。"
Q&A
Q1:Zoox自动驾驶车辆与传统出租车有什么不同?
A:Zoox车辆从零开始为自动驾驶设计,可以前进、后退甚至横向移动无需转向。车内没有驾驶座、踏板或传统控制装置,乘客座椅面对面放置,允许乘客交谈或玩牌。
Q2:Zoox车辆如何处理数据传输?
A:单个车辆每小时可产生多达4太字节的原始数据。由于蜂窝网络无法处理如此大的数据量,每辆Zoox会偶尔停靠在安全的物理位置,插入亚马逊云服务数据传输终端,以高达每秒400吉比特的速度直接上传数据集。
Q3:亚马逊云服务如何支持Zoox的机器学习训练?
A:亚马逊云服务提供弹性Kubernetes服务,可扩展到数千个计算实例进行模型训练。通过FSx for Lustre分布式文件系统和弹性网络适配器,实现跨数千个实例每秒数百吉字节的数据传输,使模型能在几小时内分析数PB传感器数据并完成重新训练。
好文章,需要你的鼓励
OpenAI推出全新Sora应用,打造完全由AI生成视频的社交媒体平台。美国、加拿大、日本和韩国用户现可直接下载使用,无需邀请码,但该开放政策仅限时提供。其他地区用户仍需等待更广泛的开放或通过Discord等渠道获取邀请码。用户可使用ChatGPT账户登录,立即开始观看、分享和创建AI视频内容。
泰国SCBX公司研究团队首次针对泰语开发了语义对话结束检测技术,通过分析文字内容而非声音停顿来判断对话是否结束。研究比较了多种AI模型方案,发现微调的小型变压器模型能在110毫秒内做出准确判断,显著优于传统静音检测方法。该技术能识别泰语特有的句尾助词等语言特征,为银行客服、智能家居、教育等场景的语音交互系统提供了更自然流畅的解决方案。
AI搜索初创公司Perplexity与Getty Images达成多年授权协议,获得在其AI搜索工具中展示Getty图片的权限。这一合作标志着该公司战略转变,此前Perplexity因内容抓取和抄袭指控备受争议。协议要求在搜索结果中显示图片时必须包含署名和原始来源链接,强调归属和准确性的重要性。
浙江大学研究团队提出Graph2Eval框架,这是首个基于知识图谱的AI代理自动化评测系统。该框架通过知识图谱持续生成新测试任务,解决传统固定数据集评估的局限性。框架支持文档理解和网页交互两类任务,构建了包含1319个任务的测试集。实验验证显示该方法能有效区分不同AI系统能力,为AI代理评估开辟新路径。