智算中心的发展基于最新人工智能理论和领先的人工智能计算架构,当前算法模型的发展趋势以Al大模型为代表,算力技术与算法模型是其中的核心关键,算力技术以Al芯片、Al服务器、Al集群为载体。
GPU主宰算力芯片,Al信创驱动国产算力发展:得益于硬件支持与软件编程、设计方面的优势,CPU+GPU成为了目前应用最广泛的平台。Al分布式计算的市场主要由算力芯片(55-75%)、内存(10-20%)和互联设备(10-20%)三部分组成。
由于ChatGPT的爆火,GPU需求明显,英伟达也加大对三星和SK海力士HBM3的订单。2023年10月,SK海力士表示,已经在2023年出售了明年HBM3和HBM3E的所有产量。据Omdia预测,到2025年,HBM市场的总收入将达到25亿美元。
集成算力与存力,先进封装产能紧缺:CoWoS封装技术是目前集成HBM与CPU/GPU处理器的主流方案。台积电主导全球CoWoS封装市场。据IDC预测,全球CoWoS供需缺口约20%,2024年台积电的CoWos封装产能将较2023年提升一倍,2.5D/3D先进封装市场规模在2023-2028年将以22%的CAGR高速增长。
Al算力对高效电源提出新需求,背面供电技术蓄势待发:越来越高度化的集成会造成针对加速芯片的电源解决方案越来越复杂,方案需要不同电压、不同路的多路输入,这种情况下电压轨会越来越多。
台积电、三星、英特尔等芯片大厂都在积极布局背面供电网络技术,为日益复杂的芯片提供高效供电方案,其中英特尔较为领先。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。