企业在大规模人工智能 (AI) 项目上的投入,正不断引领它们跨入超级计算的领域 —— 无论企业是否将此称为超级计算 —— 据惠普企业(HPE)高性能计算 (HPC) 与 AI 基础设施解决方案高级副总裁兼总经理 Trish Damkroger 指出。
Damkroger 在近期接受 Computer Weekly 采访时指出,构成现代 AI 基础设施的基本原则 —— 海量计算能力、高密度配置以及扩展架构 —— 与传统超级计算有着直接对应的关系。
“无论你是否称之为超级计算,其实都是在谈论超级计算,”她说道。“这本质上是密集式计算和扩展架构,”她补充,并指出不断增长的算力需求是一个明显信号,同时她提到与客户讨论建设一吉瓦数据中心的情况,这已逐渐成为常态。
虽然“超级计算”一词可能会让人联想到科研机构,但 Damkroger 表示,一些行业也在利用 HPC 来运行 AI 应用。她举例说明,一个量化交易基金正考虑利用超级计算机,因为这种机器对于需要直接液冷支持的高密度 AI 工作负载来说,更具成本效益。
此外,韩国的 SK Telecom 也在利用超级计算来训练基于 OpenAI 的 GPT-3 的大型韩语语言模型。这些模型为该电信公司移动网络中的 AI 服务及应用提供动力。HPE 则提供了一套集成的高性能架构,以支持大规模训练与部署。
在日本,东洋轮胎采用了搭载 HPE Cray XD 系统的 HPE GreenLake,加速了用于轮胎设计模拟的运算。通过性能提升三倍的优势,该公司如今能够在一半的时间内完成复杂的大规模模拟,从而利用 HPC 与 AI 加速产品开发。
事实上,AI 的不断普及推动了亚太 (APAC) 地区对 HPC 系统的兴趣。“去年,我们在亚太地区的 AI 销售额仅次于北美,而这在以往并不常见,”Damkroger 说道。“该地区的 AI 领域正迎来巨大发展。”
为了满足各类企业需求,HPE 提供了一套灵活的软件策略。其中包括 AI 工厂,允许客户在 HPE 的集群管理软件之上选择开源框架,并通过 Morpheus 混合云管理平台进行编排。对于寻求更即插即用功能的用户,Damkroger 表示 HPE 的 Private Cloud AI 是一项精心策划的产品,它可以让 AI 与 IT 团队进行实验并扩展 AI 项目。“这就像一键启用 AI 的简单按钮,”她补充道。
尽管 AI 技术的进步与广泛采用已经取得显著发展,但找到真正利用 HPC 实现变革性企业 AI 应用的案例仍然是一项持续的探索。“如果具体看企业中的 AI 应用,确实有一些优秀的案例,但我认为我们还没有发现那些最惊人的应用,”Damkroger 坦言。
尽管内部效率提升(如利用大语言模型编写服务文档)极具价值,但她表示,“我不确定我们是否找到了那款足以抵消高昂成本的杀手级应用,”她指出,目前企业在广泛采用 HPC 辅助 AI 时所面临的主要挑战包括初期基础设施投资、功耗需求以及持续的人才短缺。
针对大多数企业首先选择利用公共云来运行 HPC 和 AI 工作负载的现状,Damkroger 表示,对于长期且密集的使用场景,将 HPC 部署在本地会更具成本效益。
“我们发现,在 HPC 领域,如果你的使用率超过 70%,本地部署会更加经济实惠,”Damkroger 说道。然而,她也承认公共云在探索性研究和低需求场景中的作用,并补充说,数据安全问题同样是促使敏感 HPC 工作负载倾向于本地部署的关键因素。
回顾 HPE 在 HPC 领域的深厚积淀 —— 包含即将迎来首台超级计算机 50 周年的 Cray 传承 —— Damkroger 表示:“现阶段液体冷却技术如此突出,实在让人感到兴奋。我们终于看到过去 50 年所做所有工作的成果,并将其优势尽情发挥出来。”
好文章,需要你的鼓励
中国搜索引擎巨头百度今日宣布开源其生成式AI聊天机器人文心一言,专家认为此举将推动行业从性能竞争转向价格战。百度此前一直支持专有封闭系统,如今政策大转弯,希望通过开源代码实现更广泛采用并构建开发者生态系统。今年百度加速转向开源技术,2月免费提供文心服务,3月大幅降价80%。分析师称这是对OpenAI等西方竞争对手的重大挑战。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
都柏林标志性的英杰华体育场宣布完成分布式天线系统5G升级改造。该体育场与独立无线基础设施运营商Shared Access合作,为爱尔兰三大移动网络运营商Three Ireland、沃达丰和eir提供5G连接服务,显著提升了球迷和访客的移动网络性能、覆盖范围和容量。升级还集成了VoltServer数字电力解决方案以提高能效。这使英杰华体育场成为爱尔兰首个5G连接的体育场馆。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。