近日,中国移动浙江公司(以下简称浙江移动)算力网络与杭州人工智能计算中心成功对接,实现了AI算力并网,并成功完成杭州智团信息技术有限公司(以下简称智团公司)的宫颈细胞学病理AI模型训练任务的调度。
据了解,智团公司细胞学病理Al模型是业界首个病理AI辅助诊断二类证,旨在通过机器学习算法,辅助人工进行宫颈液基细胞学诊断,提高科室诊断水平和工作效率。由于病理AI模型的训练和推理都是基于高分辨率的图像数据,数据量庞大,需要搭建大量的AI服务器资源,模型的训练成本与训练周期均无法满足智团公司的要求。医疗科室在进行AI辅助诊断时,单个病例的AI辅助诊断报告需要2到3分钟才能输出,严重影响科室诊断效率。另外,发展自主创新的AI技术对于中国人工智能产业持续发展来说至关重要。
因此,昇腾AI与产业界一起构建了从规划、开发到产业化的AI模型全流程使能体系,简化AI模型从开发到部署的全流程,有效突破了人工智能在规模化应用方面面临的成本高、周期长、迭代慢等挑战。昇腾AI采用了AI深度学习专用架构“达芬奇架构”,针对AI计算特点,架构中含有Cube、Vector、Scalar三种计算单元,相比兼顾图像渲染与AI计算的传统GPU架构,在深度学习所需的矩阵乘Cube单元规模上,最大有16倍的提升,能够大大提高AI模型训练与推理的效率。
为了充分满足智团公司细胞学病理AI模型的算力需求,解决训练成本高、周期长以及推理速度慢等问题,浙江移动将杭州人工智能计算中心的昇腾AI算力并网到算力网络中。同时,浙江移动算力服务团队为智团公司量身打造系统迁移适配方案,将其细胞学病理AI模型迁移到昇腾AI基础软硬件平台。迁移成功后,模型训练时间从之前的168小时,降低到目前的120小时;推理时间从之前的2分钟降低到目前的1.2秒。整体使用成本下降47.1%。
社会算力并网作为浙江移动和华为联合成立的“算力网络联合创新中心”的创新课题之一,通过社会算力并网试点,将超算中心和智算中心这类第三方算力引入,通过FullMesh的云专网打通各个算力节点,实现算力快速接入,提升社会资源利用率,可为各行各业提供超算、智算算力服务。当前除智团公司之外,杭州联汇科技股份有限公司、杭州它人机器人技术有限公司等企业也正通过浙江移动社会算力并网创新方案接入使用杭州人工智能计算中心的AI服务,目前正在进行流程的对接及模型的调试优化。
面向未来,浙江移动与华为将继续基于 “算力网络联合创新中心”,充分发挥各自优势领域,开展更多算力网络联合创新,共同建设好高效、安全、绿色的算网基础设施,打造更丰富的算网融合产品与场景化方案,为用户提供优质的算力网络服务。
好文章,需要你的鼓励
国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。