Marvell Technology近日宣布推出Teralynx T100,该公司称其为业界首款专为AI场景设计的102.4 Tbps交换芯片。
Teralynx T100在架构层面完全面向AI需求而生,在该带宽级别下实现了低功耗与低延迟的兼顾,旨在解决当今大规模AI集群中存在的关键瓶颈问题。
数据传输已成为现代AI数据中心的核心关注点之一。过去,少量服务器组成的集群便能支撑后台应用与数据库的运行需求。但随着AI模型规模的急剧扩大,数据中心各个环节都需要以极高的速度完成数据的发送与接收。
这对功耗的要求也远超以往。当前基于GPU和XPU的系统,每机架功耗已接近120千瓦,而交换与网络组件的功耗约占机架总功耗的15%至25%,这使得低功耗交换芯片成为一项战略性需求。
Teralynx T100在更高数据速率下,相比竞争产品可降低高达25%的功耗。这意味着AI基础设施可以在现有供电条件下部署更多加速器,无需对电力基础设施进行额外扩建。
Marvell数据中心交换业务部门副总裁兼总经理Rishi Chugh在声明中表示:"随着AI工作负载的快速演进与指数级增长,超大规模数据中心运营商需要能够同时优化延迟、功耗与可扩展性的网络架构。Teralynx T100是专为AI而生的产品,其设计从零开始,摒弃了那些导致功耗虚高的历史包袱,工程目标是提供确定性的性能与效率,以支撑下一代数据中心基础设施的规模化扩展。"
在横向扩展(Scale-Out)部署场景下,T100最多支持512端口的Radix配置,使运营商能够合并网络层级、简化架构,并降低拥有数万台加速器的大型AI训练集群中的整体延迟。
在纵向扩展(Scale-Up)部署场景下,该产品灵活可编程的流水线架构支持多种互联标准及新兴的纵向扩展互联协议,包括以太网纵向扩展网络协议(ESUN)、超以太网联盟(UEC)的最新规范要求,以及持续演进中的AI以太网网络架构。
Marvell Teralynx T100交换芯片将于本季度开始向客户提供样品。
Q&A
Q1:Teralynx T100的功耗表现如何?
A:Teralynx T100在更高数据速率下,相比同类竞争产品可降低高达25%的功耗。当前基于GPU和XPU的AI系统每机架功耗接近120千瓦,交换与网络组件约占总功耗的15%至25%。T100的低功耗特性使AI基础设施在不扩建电力设施的前提下,能够在现有供电条件下部署更多加速器。
Q2:Teralynx T100支持哪些网络扩展部署方式?
A:Teralynx T100同时支持横向扩展和纵向扩展两种部署模式。横向扩展方面,最多支持512端口Radix配置,可简化大型AI训练集群的网络架构并降低延迟;纵向扩展方面,其可编程流水线架构支持ESUN协议、超以太网联盟最新规范以及新兴AI以太网网络架构等多种互联标准。
Q3:Teralynx T100何时可以开始供货?
A:根据Marvell官方公告,Teralynx T100交换芯片将于发布当季度开始向客户提供工程样品,具体量产时间表暂未披露。
好文章,需要你的鼓励
仿人机器人与自动驾驶汽车在区域架构、功能安全及雷达传感方面高度相似。多分辨率摄像头组合可更好地模拟人类视野,兼顾广角低保真与局部高精度需求。自然运动需实时计算正逆运动学、距离与深度,同时须兼顾功耗效率。当前视觉与基础操控技术最为成熟,而触觉、全身协调及非结构化环境中的移动能力仍是主要挑战。业界正借鉴自动驾驶经验,加速推进仿人机器人的规模化落地。
这项研究提出Epi2Diff方法,通过将大型推理模型的解题思考过程拆解为认知片段序列,提取过程特征预测考题对人类的难度,在四个真实考试数据集上超越了所有对比基线。
随着AI技术发展,攻击者可融合白市、灰市及黑市数据,构建个人及其环境的数字孪生体,使定向攻击更为便捷。专家指出,AI与网络安全的核心交汇点是数据本身。防御AI数据融合攻击需依赖硬件信任根、强加密、安全密钥存储及严格的数据匿名化措施。芯片架构师需将安全设计嵌入硬件层,确保数据完整性验证、隔离执行及认证数据流,以应对日益复杂的运行时攻击面。
南京大学与阿里巴巴提出MIMFlow,将掩码图像建模与标准化流端到端融合,让生成模型专注语义建模,以更少参数和更少令牌在ImageNet上取得FID 2.50的优异表现。