Qualcomm 和诺基亚贝尔实验室展示了多供应商 AI 模型如何在无线网络中实现互操作性协同工作。
诺基亚贝尔实验室研究员 Carl Nuzman 和 Qualcomm 首席工程师 Rachel Wang 在一篇博客文章中表示,他们展示了序列学习的灵活性,这种方法可以促进网络解码器优先或设备编码器优先的训练。
他们表示,Qualcomm 和诺基亚贝尔实验室正在继续合作,以展示互操作的多供应商 AI 在无线网络中的价值。在 2024 年世界移动通信大会上,他们首次展示了 AI 增强型信道状态反馈编码器和解码器模型的空中互操作性。
这些模型分别在搭载 Qualcomm 5G 调制解调器-射频系统的参考移动设备和诺基亚原型基站上运行。这些互操作模型是两家公司使用一种称为序列学习的新技术开发的。现在他们在 2025 年世界移动通信大会上带来了更多内容。
信道状态反馈帮助网络找出向设备发送数据的最佳方式。随着无线条件的变化,从网络到设备的最佳传输方向也会随之改变。Qualcomm 和诺基亚通过 AI 生成精确的波束,使网络变得更智能和高效。
通过序列学习,多家公司可以共同设计互操作的 AI 模型,而无需共享其实现的专有细节。相反,一家公司会与另一家公司共享模型输入/输出对的训练数据集。
在这个概念验证的基础上,两家公司一直在继续合作,以展示信道状态反馈互操作 AI 的价值、灵活性和可扩展性。
不同物理环境下的无线 AI 鲁棒性
AI 可以向您的设备发送正确的无线波束。
随着 AI 技术在实际网络中的部署,确保模型在不同环境中稳健运行变得越来越重要。训练数据集应足够多样化,以便 AI 模型能够有效学习;但是,要覆盖所有可能的场景是不现实的。
因此,AI 模型必须能够将其训练泛化以应对新情况。在合作中,两家公司研究了三个非常不同的小区站点:一个户外郊区位置和两个不同的室内环境。
在第一个场景中,他们比较了使用多样化数据集训练的通用 AI 模型与在特定位置训练的超本地模型的性能。他们发现通用 AI 模型可以在不同环境中工作,性能与超本地模型相当。
后来,两家公司将通用模型改进以包含室内站点 2 的数据(改进的通用模型)。然后他们在室内站点 2 的四个不同位置测量了用户数据吞吐量。在所有情况下,通用模型的性能与改进的通用模型相差不到 1%,显示了通用模型对新场景的鲁棒性。
AI 增强的信道状态反馈允许网络以更精确的波束模式传输,提高接收信号强度,减少干扰,最终提供更高的数据吞吐量。我们通过记录移动用户在小区内不同位置移动时使用 AI 反馈和基于波束网格的反馈 (3GPP Type I) 所经历的数据吞吐量来测量这种改进。
使用 AI 反馈产生了更高的吞吐量,各位置的吞吐量增益范围从 15% 到 95%。在商用系统中使用 AI 增强的信道状态反馈所观察到的吞吐量增益将取决于多个因素。然而,这个概念验证的结果,加上众多仿真研究表明,使用 AI 增强后的吞吐量将始终高于传统方法。
序列学习可以通过两种方式进行,要么是设备编码器优先,要么是网络解码器优先,这对部署和标准化有不同的影响。为了支持 3GPP 对解码器优先方法的日益关注,今年我们用解码器优先模型训练替代了原来的编码器优先演示。
在 2024 年世界移动通信大会展示的编码器优先方法中,Qualcomm 设计了一个编码器模型,生成了输入/输出对的训练数据集,然后与诺基亚共享数据集,后者随后设计了一个互操作解码器。
今年,采用解码器优先方法,诺基亚设计了一个解码器模型,并生成和共享了解码器输入/输出对的训练数据集,供 Qualcomm 用于设计互操作编码器。我们发现两种模式设计的模型性能相差不大,仅有几个百分点的差异。
AI 模型可以提升无线网络的性能。
Qualcomm 和诺基亚贝尔实验室共同展示的原型代表了将 AI 增强通信从概念转变为现实的关键一步。结果表明,通过多种学习模式,用户体验可以得到显著改善,且具有鲁棒性。随着我们学会设计互操作的多供应商 AI 系统,我们可以开始实现增强的容量、改进的可靠性和降低的能耗。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。