在人工智能、工业互联网等国家战略领域的呼唤之下,算力成为拉动数字经济持续健康发展的新引擎。而算力服务作为东数西算及算力经济的核心支撑,成为业内关注的热点,大量参与者纷纷涌入。
纵览国家及行业相关指导意见可以发现,想要做好算力服务,参与者需同时具备“优化数据中心供给结构”、“规划资源协同调度机制”、“打造高水平云服务平台”的一体化算力服务能力,才能深度解决“算力断点”、“供给矛盾”等各种问题,实现真正的算力服务化。

基于此,中科曙光布局算力服务赛道的子公司-曙光智算,凝练自身能力储备、业务思考和运营经验等,率先构建了“三位一体”算力服务原型。作为首个跑通一体化算力服务的企业,曙光期待为算力服务市场的标准化发展提供新参考。
“三位一体”领衔算力服务新赛道
“三位一体”算力服务原型围绕 “算力神经元-算力神经中枢-算力神经网络”进行设计。

算力神经元,即丰富、高效、安全、绿色的算力资源,如同大脑构造中,负责存储电信号的百亿神经元。基于曙光20余年的计算领域技术深耕,加以持续管理运营算力资源的经验沉淀,为实现一体化算力服务建立基础。
算力神经中枢,即一体化资源协同调度系统,负责打通算力资源与计算需求。基于Access(通路)、Acceleration(加速)、Automatic Collaboration(协同)三大特征,算力神经中枢能够智慧化、定制化地匹配用户需求,为用户提供最优化的算力资源投资组合,让每一个用户需求“适得其算”。
算力神经网络,即链接幅员辽阔、千行百业算力网络。构建算力神经网络,不仅是各个神经元物理意义上的网络互联,更重要是通过算力网络为用户提供算力服务和算力能力的输出。如通过“智算+”API服务及企业商城服务,面向广大软件厂商、SAAS服务商以及第三方服务商,提供应用集成、算力外接甚至门户定制等服务,实现真正的算力服务成网,共拓算力生态。
曙光作为算力服务市场的先行者,意在通过“三位一体”算力服务原型,为市场其他参与者走出一条“原型之路”,促进算力服务高效高质发展。同时,期待与更多算力服务市场上下游参与者共同携手,不断打磨“三位一体”算力服务原型,助力市场发展正循环,赋能东数西算和算力生态。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。