今年以来,AI领域风起云涌。从春节期间DeepSeek点燃新一轮热潮,到Manus甫一亮相便被开源破解,技术迭代的速度令人咋舌。仿佛还没消化完上一波浪潮,新一波已扑面而来。而在这片繁荣图景的背后,支撑其运转的“神经系统”——智算网络,正面临着前所未有的压力测试。
DeepSeek的“核爆”效应
生成式AI的爆发,尤其是DeepSeek的横空出世,正以惊人的速度重塑智算格局。新华三集团先进技术研究部总经理朱仕银将其带来的影响归纳为三个层面:
第一,DeepSeek的出现是中国AI产业的一针“强心剂”。
它不仅提振了国内AI从业者的士气,更在技术赛道上另辟蹊径,以“算法优化、效率优先”的策略,试图在算力军备竞赛中实现“弯道超车”。这不仅给资金和算力受限的国内AI创业公司打开了新的窗口,更为中国AI在全球舞台上的竞争力注入了新的动能。
第二,DeepSeek直接引爆了市场对算力需求的“饥渴”。
据统计,全球智能算力需求正以78%的复合年增长率迅猛攀升,其中超三分之一的增量源自DeepSeek类模型的场景渗透。朱仕银指出,DeepSeek通过提升算力利用率,显著降低了模型训练和推理的门槛,让更多中小企业也能“上车”,不仅算力需求大幅增长,也极大加速了AI的普惠化和算力平权的进程。未来随着算力效率的持续提升,也将进一步催生智算中心的广泛落地。
第三,DeepSeek的崛起为国产算力生态带来了利好。
算力门槛的降低,使得高性价比的推理场景迅速爆发,国产算力迎来了发展窗口。第三方报告显示,2023年训练与推理服务器的工作负载比例为:训练60%,推理40%。DeepSeek的广泛应用正加速推理需求的增长。报告预测,两到三年内推理服务器占比将升至70%,训练则降至30%。这种趋势不仅优化了算力结构,更为国产算力的崛起奠定了基础。
可以说,DeepSeek的出现将大模型应用推向了一个全新的阶段:从技术探索的“实验室”走向了端到端需求的“爆发点”。而这背后,智算网络的压力也随之而来。
智算网络如何应对“数据洪流”的挑战?
智算网络,连接着算力与应用的每一寸末梢。面对DeepSeek所掀起的这股洪流,智算网络该如何“接招”?
简而言之,智算网络需要敏锐地捕捉到AI大模型带来的新需求,例如算力的高效协同、跨域的无缝扩展以及坚固的安全保障。
朱仕银指出,在新型智算中心运营实践中,训推算力的协同利用已成为常态。依托智能化调度系统,白天优先将AI大模型训练算力动态调配至在线推理服务,支撑业务高峰期的实时推理需求;晚上则通过负载转移释放推理算力,反哺大规模模型训练任务,从而实现算力资源的最大化利用。
同时,随着DeepSeek等大模型应用的深入,算力需求不再仅仅局限于单一的智算中心,而是呈现出跨数据中心、甚至跨地域的趋势。就像一个庞大的“大脑”,其不同区域的“神经元”需要高效地协同工作,才能完成复杂的任务。
这对智算网络提出了更高的要求:不仅要支撑大规模的数据流动,还要能够应对突发流量、实现灵活的算力调度,以及跨地域的资源整合。
在这种情况下,确定性网络(Deterministic Network)的价值便凸显出来。该技术以低时延、高可靠和稳定的特性,为关键业务提供了可预期的网络性能,如同为数据传输量身定制的“高速公路”。
以国家“东数西算”工程为例,算力资源的集中化趋势,使得智算网络需要在广阔的地域范围内提供确定性的传输能力。而DeepSeek等大模型的广泛应用,进一步放大了这一需求。
面对这些挑战,新华三通过高通量传输技术从端侧、网侧和端网协同三方面进行优化,基于拥塞控制和传输协议的改进,显著提升了网络效率和带宽利用率。同时,持续推进确定性网络和IP+光融合技术的落地,实现400G长距离无损传输。这种端到端的优化方案,不仅满足了“东数西算”工程对广域网络的高吞吐需求,也为智算网络的跨域扩展奠定了基础。
此外,智算网络的安全也不容忽视。朱仕银强调,虽在硬件基础设施层面,智算与传统计算的网络安全无本质区别,但在应用和数据层面,差异显著。例如,在“存算分离”的场景下,数据从用户端流向训练系统,再到训练后的销毁,需要重新设计端到端的安全机制。此外,推理场景下的数据隐私保护和模型安全也值得关注。
生成式AI推动网络速率跃迁
不难发现,生成式AI的崛起加速了网络速率的演进。
从2019到2025年的六年间,网络速率经历了从100G到400G再到800G的快速跃迁。目前400G在市场上已呈现出大规模出货的态势,这正是AI需求推动网络基础设施的直接体现。新华三预期,在未来三年内,随着技术成熟和成本的逐步下降,800G技术也将逐步放量。
朱仕银还强调了技术成熟度、成本以及产业生态的重要性。技术在不断进步,但只有当成本可控、产业生态完善时,新的技术才能真正实现大规模落地。就像800G与1.6T之间的技术差异,以及国内外芯片和产业生态的差异,都将影响到未来高速端口的迭代速度和市场普及程度。
生成式AI时代已经呼啸而来,而支撑这个时代的,不仅是强大的计算能力,更离不开坚韧、高效的智算网络。它为AI这匹“千里马”打造了更宽广的“赛道”,使其能够更好地驰骋在数字世界的“星辰大海”中。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。