AI交换机:未来四大变革
AI 训练集群带来 GPU 互联需求,新增后端网络组网需求。AI 服务器比传统服务器新增 GPU 模组,GPU 模组通过对应的网卡与其他服务器或交换机互联,实现各节点之间的通信。因此相比传统网络架构,AI 服务器组网增加后端网络组网(Back End),增加了每台服务器的网络端口数量,拉动对高速交换机、网卡、光模块、光纤光缆等组件需求。
本文来自“AI时代交换机迎来四大产业变革机遇”,以太网交换机是重要的通信网络设备,随着全球 AI 的高速发展,AI 集群规模持续增长,AI 集群网络对组网架构、网络带宽、网络时延等方面提出更高要求,带动交换机朝着高速率、多端口、白盒化、光交换机等方向持续迭代升级,我们认为AI 时代交换机有望迎来四大产业变革新机遇。
交换机变革 1:AI 集群新增后端组网需求,集群规模持续增长,以太网占比有望逐步提升,有望带来大量高速以太网交换机需求
(1)AI 训练集群带来 GPU 互联需求,新增后端网络组网需求。AI 服务器比传统服务器新增 GPU 模组,GPU 模组通过对应的网卡与其他服务器或交换机互联,实现各节点之间的通信。因此相比传统网络架构,AI 服务器组网增加后端网络组网(Back End),增加了每台服务器的网络端口数量,拉动对高速交换机、网卡、光模块、光纤光缆等组件需求。
(2)AI 集群加速 Scale out,万卡、十万、百万卡集群组网带来大量高速交换机需求。随着 AI 模型参数持续增长,带动集群规模从百卡、千卡拓展至万卡、十万卡,Scale out 推动组网架构从 2 层向 3 层、4 层架构拓展,带来大量高速交换机需求。
(3)以太网网络根基深厚,生态厂商众多,AI 网络中以太网网络占比有望持续提升。IB 网络凭借低延迟、堵塞控制以及自适应路由等机制,仍然主导 AI 后端网络,但随着以太网网络部署的不断优化,超以太网联盟加速发展,我们认为未来以太网方案占比有望持续提升,带动以太网交换机需求增长。
交换机变革 2:AI 网络带来低时延、大带宽等网络需求,400G/800G 交换机持续放量,1.6T 交换机加速落地
AI 大模型参数量持续增长倒逼集群规模提升,叠加 AI 芯片带宽提升,促使交换机端口速率及交换容量同步升级。交换机端口速率从 200G 向 400G、800G、1.6T提升,交换芯片带宽容量提升至 25.6T、51.2T,下一代 102.4T 交换芯片有望于 2025年下半年推出,盒式交换机端口数量得以持续增长以支持组网规模提升,高速数据中心交换机市场规模有望快速增长。
交换机变革 3:交换机白盒化趋势显著,带来新成长机遇
白盒交换机是一种硬件与软件解耦的网络交换机,其硬件由开放化的硬件组件组成,而软件可由用户或第三方自由选择和定制,具备灵活性、可扩展性较高、采购和维护成本较低等优势,广泛应用于互联网厂商和运营商网络,交换机白盒化趋势显著,目前产业生态较为完善,商用交换机芯片厂商、JDM/ODM/OEM 交换机设备商有望迎来发展新机遇。
交换机变化 4:光交换机商用逐渐成熟,光电融合组网落地大模型训练
光电路交换机(OCS)主要通过配置光交换矩阵,从而在任意输入/输出端口间建立光学路径以实现信号的交换,相比电交换机,光交换机具有成本低、时延低、功耗低、可靠性高等特点,在 AI 大模型预训练应用场景中表现较好。当前光电融合方案中 OCS 方案商用化程度较高,基于 3D-MEMS 系统的 OCS 方案综合应用较好。
按应用场景和传输介质来看,交换机种类较多。交换机是重要的通信网络设备,最常见的网络交换设备以以太网交换机为主,其次还包括语音交换机、光纤交换机等,适应不同网络环境与应用场景。
按照应用场景划分:(1)园区用以太网交换设备:可分为金融类、政企类、校园类;(2)运营商用以太网交换设备:可分为城域网用、运营商承建用以及运营商内部管理网用;(3)数据中心用以太网交换设备:可分为公有云用、私有云用、自建数据中心用;(4)工业用以太网交换设备:可分为电力用、轨道交通用、市政交通用、能源用、工厂自动化用等。
早期以集线器为代表的以太网设备主要在物理层工作,无法隔绝冲突扩散,网络性能难以提升,而以太网交换机能够隔绝冲突,持续提升以太网性能。世界上第一台以太网交机最早于 1989 年问世,经过三十余年的的发展,以太网交换机在转发性能和功能上持续提升。转发性能方面,以太网交换设备的端口速率从 10M 发展到 800G,单台设备的交换容量从 Mbps 量级提升至 Tbps 量级。功能方面,以太网交换设备发展至今,可分为二层交换机、三层交换机和叠加型多业务交换设备。二层交换机和三层交换机之间的最大区别在于路由功能,叠加型多业务交换设备(四层或更高层)除了实现二层和三层的业务外,还可具备如防火墙、网关等其他功能。
二层交换机工作在数据链路层,三层交换机工作在网络层。二层交换机在接受来自光纤传输的光信号后,通过光模块进行光电转换,最终将光信号转换为设备可理解的数字信号后,数据包从网络端口进入。PHY 层负责跨物理连接传输和接收比特流,包括编码、多路复用、同步、时钟恢复和线路上数据的序列化等,一旦在 PHY上接收到有效的比特流,则数据将发送到 MAC 控制器, MAC 层负责将比特流转换为帧/数据包。经过以太网收发器芯片(PHY 芯片)、MAC 控制器后,进入以太网交换芯片,基于 MAC 地址进行数据交换;三层交换机/路由器工作在网络层,能够基于 IP 地址进行转发与路由选择。
光猫:工作在物理层,通常安装在网络入口处即光纤接入点处,用于光电信号转换,主要应用在家庭网络接入场景;
路由器:工作在网络层,连接不同网络,基于 IP 地址进行转发与路由选择;
网关:通常用于连接使用不同协议的网络,能够在多个层次上进行必要的翻译和协议转换。二层交换机主要工作在数据链路层,具有网桥和集线器的功能,用于同一网络内基于MAC 地址进行帧/数据包转发与过滤。
以太网交换机主要由芯片、PCB、光器件、插接件、阻容器件、壳体、电源、风扇等组成,芯片包含以太网交换芯片、CPU、PHY、CPLD/FPGA 等,其中以太网交换芯片和 CPU 是最核心部件。
以太网交换芯片专为优化网络应用设计,是负责交换处理大量数据和转发报文的专用芯片,芯片内部的逻辑通路由数百个特性集合组成,以确保芯片在协同工作的同时保持较强的数据处理能力,架构实现较为复杂;CPU 是用于管理登录、协议交互的控制的通用芯片;PHY 负责处理物理层数据。
典型以太网交换芯片主要由接口模块、内容处理模块、进出口数据包修改模块、MMU 模块、L2 处理器(查阅 MAC 表)、L3 处理器(查阅路由表)、安全模块等模块组成,部分以太网交换机芯片内部会集成 CPU、MAC 控制器和 PHY 芯片。
从交换机物理形态上,可以分为框式交换机和盒式交换机。框式交换机通常由一个机框和多个插槽组成,可以插入不同类型和数量的模块,如接口模块、主控模块、交换模块等,具有较高的灵活性和扩展性;而盒式交换机一般是一体化设计,接口数量和类型相对固定,部分盒式交换机接口采用模块化设计。框式交换机与盒式交换机的主要差异更多体现在内部构造与应用场景(OSI 使用层级)上。
细分背板架构来看,常见的包括 Full-Mesh 交换架构、Crossbar 矩阵交换架构和 CLOS 交换架构等。
(1)在 Full mesh 架构中,所有业务线卡通过背板走线连接到其它线卡,任意两个节点间都直接连接,所以随着节点数量增加连接总数也持续上升,因此可扩展性较差;
(2)Crossbar 架构则是一种两级架构,每个 CrossPoint 都是一个开关,交换机通过控制开关来完成输入到特定输出的转发,随着端口数量的增加,交叉点开关的数量呈几何级数增长,端口数量仍然有限;
(3)CLOS 架构是一种多级架构,每个入口级开关连接至中间级开关再连接到出口级开关,每块业务线卡和所有交换网板相连,交换芯片集成在交换网板上,实现了交换网板和主控引擎硬件分离。CLOS 架构又可细分为非正交背板、正价背板和正交零背板设计。
0赞 好文章,需要你的鼓励
推荐文章
根据Capital One工程副总裁Terren Peterson的说法,IT领域的一切最终都会商品化。Peterson在该银行工作了超过24年,对于商品化如何影响IT业务有着第一手的经验。
澳大利亚新南威尔士州交通局首席创新和技术官Kurt Brissett最近和我们分享了如何为交通用户提供世界首创的技术,以及如何将很高的员工参与度转化为客户满意度。
成立于2021年的SnapAttack公司旗下平台将成为思科Splunk业务的一部分,此举将进一步加快思科的有机威胁检测路线图,并帮助加强企业的安全运营,进而实现更明智的威胁防御。
算力网和算力网络,是经常被大家提及的话题。有人认为,两者是一回事,就是同一件事情的不同叫法。有的人认为,两者是两回事,算