在与大众汽车达成 50 亿美元合作协议的部分支持下,Rivian 正在开发下一代电动车平台,全面整合 AI 技术,以期与特斯拉展开竞争。
在上周四于旧金山举行的新闻发布会上,Rivian 首席执行官 RJ Scaringe 和 Rivian-大众技术合资公司联合首席执行官兼首席软件官 Wassym Bensaid 分享了该电动汽车制造商的 AI 发展规划。
Scaringe 宣布,公司计划在 2025 年实现免手动驾驶,并在 2026 年实现 L3 级自动驾驶下的免视线驾驶。他解释道,L2 级要求驾驶员手握方向盘、目视前方,同时配备驾驶辅助功能,如现有 Rivian 自动驾驶平台所具备的变道、泊车辅助、巡航控制和碰撞警告等功能。L3 级允许驾驶员在驾驶座位上解放双手、发短信或阅读,但需随时准备接管车辆控制权。L4 级则是完全无人驾驶模式,无需驾驶员在车内。
他表示:"我们认为,首先是 L2 级,但更重要的是在特定领域实现 L3 级自动驾驶,这对客户来说具有巨大价值。想象一下,当你离开家,坐在车里上了高速公路后,就能完全掌控自己的时间。你可以使用手机、写邮件,不用关注道路,也不用握着方向盘表示'我还在这里'。车辆能够完成这些任务,这就是我们的发展路线图,我们正在全力以赴实现这个目标。"
能与你对话的 Rivian
Bensaid 解释道:"AI 将渗透到整个车辆中,无论是采用端到端训练方法的自动驾驶功能,还是车内体验,都将解锁大量新功能。"
关于驾驶员何时能够询问 Rivian 仪表盘上闪烁的红灯含义(这项功能 Amazon 在一年多前就已经整合到 AWS Bedrock 中,目前正在推广到搭载 ChatGPT 的大众汽车中),Bensaid 回应说,Rivian 很快就能告诉驾驶员发生了什么,并且在预见问题时预约维修服务。
"想象一下你现在通过触摸界面完成的所有操作。未来,你都可以通过语音来完成。从安全角度考虑,在驾驶时使用语音交互实际上要安全得多。"
更实惠的 Rivian
Scaringe 表示,软件定义汽车可以实现许多新颖功能,关键在于资源分配。他解释说,AI 控制的按摩座椅和续航能力提升并不是首要任务。
"如果我们对所有好想法都说'是',那么就会造出一辆售价 30 万美元的汽车。产品开发过程的奥妙就在于要做出数以千计的权衡。"
他解释说,即使将电池成本降至每千瓦时 60 美元(根据 BloombergNEF 的数据,去年行业平均水平为每千瓦时 115 美元),增加电动汽车续航里程的成本仍然很高。在 Rivian 提供的三种电池组选择中,最受欢迎的是续航里程超过 300 英里的中型电池组。Scaringe 说:"客户更希望看到价格下降。"
尽管公司销量仅略超过 51,000 辆,但 Rivian 的目标是实现数百万辆的销量,推出更实惠、更紧凑的车型可能有助于实现这一目标。
为此,Rivian 正在规划扩张,最近与美国能源部敲定了最高 66 亿美元的贷款,用于建设其佐治亚州工厂。该公司还在加快在美国各地开设展厅和服务中心的步伐。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。