近日,中国移动浙江公司(以下简称浙江移动)算力网络与杭州人工智能计算中心成功对接,实现了AI算力并网,并成功完成杭州智团信息技术有限公司(以下简称智团公司)的宫颈细胞学病理AI模型训练任务的调度。
据了解,智团公司细胞学病理Al模型是业界首个病理AI辅助诊断二类证,旨在通过机器学习算法,辅助人工进行宫颈液基细胞学诊断,提高科室诊断水平和工作效率。由于病理AI模型的训练和推理都是基于高分辨率的图像数据,数据量庞大,需要搭建大量的AI服务器资源,模型的训练成本与训练周期均无法满足智团公司的要求。医疗科室在进行AI辅助诊断时,单个病例的AI辅助诊断报告需要2到3分钟才能输出,严重影响科室诊断效率。另外,发展自主创新的AI技术对于中国人工智能产业持续发展来说至关重要。
因此,昇腾AI与产业界一起构建了从规划、开发到产业化的AI模型全流程使能体系,简化AI模型从开发到部署的全流程,有效突破了人工智能在规模化应用方面面临的成本高、周期长、迭代慢等挑战。昇腾AI采用了AI深度学习专用架构“达芬奇架构”,针对AI计算特点,架构中含有Cube、Vector、Scalar三种计算单元,相比兼顾图像渲染与AI计算的传统GPU架构,在深度学习所需的矩阵乘Cube单元规模上,最大有16倍的提升,能够大大提高AI模型训练与推理的效率。
为了充分满足智团公司细胞学病理AI模型的算力需求,解决训练成本高、周期长以及推理速度慢等问题,浙江移动将杭州人工智能计算中心的昇腾AI算力并网到算力网络中。同时,浙江移动算力服务团队为智团公司量身打造系统迁移适配方案,将其细胞学病理AI模型迁移到昇腾AI基础软硬件平台。迁移成功后,模型训练时间从之前的168小时,降低到目前的120小时;推理时间从之前的2分钟降低到目前的1.2秒。整体使用成本下降47.1%。
社会算力并网作为浙江移动和华为联合成立的“算力网络联合创新中心”的创新课题之一,通过社会算力并网试点,将超算中心和智算中心这类第三方算力引入,通过FullMesh的云专网打通各个算力节点,实现算力快速接入,提升社会资源利用率,可为各行各业提供超算、智算算力服务。当前除智团公司之外,杭州联汇科技股份有限公司、杭州它人机器人技术有限公司等企业也正通过浙江移动社会算力并网创新方案接入使用杭州人工智能计算中心的AI服务,目前正在进行流程的对接及模型的调试优化。
面向未来,浙江移动与华为将继续基于 “算力网络联合创新中心”,充分发挥各自优势领域,开展更多算力网络联合创新,共同建设好高效、安全、绿色的算网基础设施,打造更丰富的算网融合产品与场景化方案,为用户提供优质的算力网络服务。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。