/

AI服务器核心部件产业链剖析（2024）

Al芯片是AI服务器算力的核心，专门用于处理人工智能应用中的大量计算任务，Al芯片按架构可分为GPU、FPGA、ASIC和NPU等。HBM作为内存产品的一种，已经成为高端GPU标配，可以理解为与CPU或SoC对应的内存层级，将原本在PCB板上的DDR和GPU芯片同时集成到SiP封装中，使内存更加靠近GPU,使用HBM可以将DRAM和处理器(CPU,GPU以及其他ASIC)之间的通信带宽大大提升，从而缓解这些处理器的内存墙问题。

AI服务器产业链包括芯片CPU、GPU,内存DRAM和内存接口及HBM,本地存储SSD,NIC、PCle插槽、散热和等。服务器CPU架构包括X86、ARM、MIPS和RISC-V等。

Al芯片是AI服务器算力的核心，专门用于处理人工智能应用中的大量计算任务，Al芯片按架构可分为GPU、FPGA、ASIC和NPU等。HBM作为内存产品的一种，已经成为高端GPU标配，可以理解为与CPU或SoC对应的内存层级，将原本在PCB板上的DDR和GPU芯片同时集成到SiP封装中，使内存更加靠近GPU,使用HBM可以将DRAM和处理器(CPU,GPU以及其他ASIC)之间的通信带宽大大提升，从而缓解这些处理器的内存墙问题。

服务器本地存储的选择方案则包括HDD和SSD，SSD的主要硬件组件包括NAND Flash、主控芯片和DRAM,核心软件为企业级SSD的固件，数据中心级SSD已不再是一个硬盘，而是一个具备处理、缓存、计算、安全保护的小型系统，SSD渗透率有望逐渐提升。

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

AI服务器核心部件产业链剖析（2024）

来源：架构师技术联盟

0赞

好文章，需要你的鼓励

推荐文章

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

人工智能

大语言模型

市场泡沫

2025-08-19

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

OpenAI首席执行官Sam Altman表示，鉴于投资者的AI炒作和大量资本支出，我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋，但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户，是全球第五大网站。由于服务器容量不足，OpenAI无法发布已开发的更好模型，计划在不久的将来投资万亿美元建设数据中心。

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

人工智能

音频驱动动画

多目标优化

2025-08-19

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

阿里巴巴团队提出FantasyTalking2，通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集，训练三个专业模块分别优化不同维度，再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术，用户评价提升超12%。

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

人工智能

自然语言处理

混合架构优化

2025-08-19

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

英伟达推出新的小型语言模型Nemotron-Nano-9B-v2，拥有90亿参数，在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构，支持多语言处理和代码生成，可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程，并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练，采用企业友好的开源许可协议，支持商业化使用。

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

人工智能

内存优化

算法创新

2025-08-19

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

UC Berkeley团队提出XQUANT技术，通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7，升级版XQUANT-CL更可实现12.5倍节省，同时几乎不影响模型性能。研究针对现代AI模型特点进行优化，为在有限硬件资源下运行更强大AI模型提供了新思路。

2024

11/06

21:04

分享

点赞

架构师技术联盟

分享项目实践，洞察前沿架构，聚焦云计算、微服务、大数据、超融合、软件定义、数据保护、人工智能、行业实践和解决方案。

最近文章 :

阅读更多内容，猛戳这里

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证