距离欧洲核子研究中心(Cern)成为开放量子研究所(OQI)三年试点阶段的基地已经过去一年多了。Cern是大型强子对撞机(LHC)的所在地,而OQI是一个多方利益相关者参与的全球性、科学外交驱动的倡议,其主要目标包括为所有人提供量子计算访问权限并加速相关应用的发展。
在六月份于伦敦巴特西发电站举办的首届量子数据中心联盟论坛上,欧洲核子研究中心国际组织关系高级顾问兼首席科学家Archana Sharma接受了Computer Weekly的采访。她将OQI描述为"对量子计算、量子网络、量子计算机现状的评估","让我们能够了解欧洲核子研究中心正在发生的事情"。
"欧洲核子研究中心的使命是粒子物理学,"她说。"我们不能停止粒子物理学研究而转向量子计算机。"
但Sharma相信,量子技术的发展与欧洲核子研究中心的研究之间可能存在协同效应。她表示,粒子加速器中的加速过程是由各种力产生的,"加速过程中发生的所有过程都与量子力学密切相关"。
此外,量子力学是使粒子加速器的各种探测器能够收集科学家实验结果的关键技术。
这些实验产生了大量数据。事实上,为支持欧洲核子研究中心粒子物理实验而开发的技术——白兔(White Rabbit)——正被应用于量子计算的错误纠正。白兔是一个开源精确定时系统,具有亚纳秒级精度,通过以太网分布。
英国量子网络技术公司Nu Quantum最近加入了欧洲核子研究中心的白兔合作项目。来自欧洲核子研究中心的技术为Nu Quantum提供了一种在必要级别上实现同步的方法,以扩展量子计算网络。
**为粒子物理学而进行的计算**
万维网源于Tim Berners-Lee在欧洲核子研究中心时的想法,如今LHC的所在地维护着多个GitHub存储库,并为推进粒子物理学研究开发了多个开源平台。
计算是欧洲核子研究中心的三大支柱之一。"第一个支柱是研究,"Sharma说。"第二个是基础设施,即加速器、实验和探测器。然后是计算。"
Sharma表示,欧洲核子研究中心一直在发展其计算中心能力,以满足实验所需基础设施的要求。
"我们需要确保看到和记录的都是好数据,"她说,这意味着欧洲核子研究中心必须将每秒4000万次碰撞的数据首先筛选到大约1000次,然后再降到100次。
这种处理需要极其快速地进行,在粒子加速器中检测到下一次碰撞之前完成。她说处理时间约为2.5毫秒。
用欧洲核子研究中心的术语来说,传感器被称为"通道",每个实验有100,000个这样的通道需要处理。欧洲核子研究中心依靠模式识别和机器学习来帮助处理实验期间产生的庞大数据集并创建仿真模型,正如Sharma解释的:"这是我们拥有的最大工具。我们运行了大量仿真来产生模型,告诉我们每次碰撞将如何被读出。"
"我们需要确保看到和记录的都是好数据"
Archana Sharma,欧洲核子研究中心
实际上,模型和仿真使欧洲核子研究中心能够简化触发数据或碰撞的收集过程,这些数据被识别为来自实验期间需要处理的100,000个通道传感器的微小电信号。
触发数据用于重建,其中来自传感器的能量测量被汇总。重建实际上是使用观察数据对实验进行仿真。在企业IT中,这样的设置可能被视为数字孪生的示例。然而,Sharma表示欧洲核子研究中心的仿真很接近,但不能完全归类为数字孪生。
"我们不完全是数字孪生,因为物理学的软件是概率性的。我们试图尽可能接近,"她说。
**好的、坏的和明显错误的**
在数据处理领域,手头的任务是预测分析,因为它建立在使用预测理论的科学基础上。"我们站在预测的肩膀上——我们测量并验证我们被告知的与理论预测的对比,"Sharma说。
要么基于实验收集数据的观察结果支持理论,要么出现了错误。Sharma表示,错误的结果可能意味着理论不正确需要调整,或者可能意味着LHC本身存在校准错误。
LHC即将进入"技术停机"阶段,这是一个三年的停机期,期间将进行升级以支持新科学。根据Sharma的说法,改进的一个领域是亮度提高10倍,她说这将使其能够收集10倍的数据。
除了欧洲核子研究中心在基础设施和探测器方面需要进行的工作外,Sharma表示欧洲核子研究中心的计算中心也在为需要处理的大量数据增长做准备。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。