英特尔助火山引擎“优化”AI云技术内核 原创

“在中国公有云上,每产生两个tokens,就有一个是由火山引擎生产。”

英特尔助火山引擎“优化”AI云技术内核

作者 | 金旺

出品 | 科技行者

据IDC统计数据显示,2025年,火山引擎公有云大模型服务调用量位居国内第一,市场份额达到了49.2%。

这正是火山引擎总裁谭待在近日的原动力大会上豪言称“在中国公有云上,每产生两个tokens,就有一个是由火山引擎生产”的原因。

在这次大会上,火山引擎对外公布了一系列2025年最新业务数据:

火山引擎已经服务100万+企业和个人、覆盖100+行业,有100+家企业累计token使用量已经超过1万亿……

毫无疑问,火山引擎已经成长为国内又一朵无法忽视的AI云,谭待在这次大会上也一再强调,火山引擎的基础产品已经完成了从传统云基础设施到AI云原生基础设施的一次系统性升级。

在这样的技术升级过程中,火山引擎与产业生态开展了广泛合作。

值得一提的是,针对AI云基础设施,谭待在大会上从计算、存储、网络、数据库四个层面解读了火山引擎今年在基础设施层面的升级,我们在英特尔展台上看到了双方在相关领域的技术合作成果。

英特尔助火山引擎“优化”AI云技术内核

作为AI云基础设施的基础,火山引擎在计算层面发布了第四代本地SSD型实例、高性价比的Flex算力型实例,以及面向大模型训练、推理设计的大内存实例,这其中当然也包括基于英特尔至强6性能核处理器的火山引擎第四代通用计算型实例。

我们在大会现场的英特尔展台上,看到了基于英特尔至强6+火山引擎g4i的AI视频处理解决方案。

以视频高效解码抽帧这一应用场景为例,针对1500帧的1080p视频以100帧间隔进行抽帧时,英特尔技术专家特别提到了两项技术:

一项是,iVTAL视频解码加速软件库,基于这一软件可以将视频解码抽帧效率提升2.14倍;

另一项是,英特尔AMX加速技术,基于这一技术又可以将视频解码抽帧效率提升4.11倍。

英特尔助火山引擎“优化”AI云技术内核

正是在英特尔快速抽帧算法和AMX加速下,可以将这一示例中的视频OCR推理整体时间从33秒压缩到8秒左右,实现了4倍的端到端效率提升。

除了计算加速,AI计算的安全防护同样很重要。

谭待在大会上就特别发布了一项全新的服务——MaaS on AICC。

火山引擎的AICC机密计算技术是通过差分计算、同态加密、可信执行环境等方案,实现了用户数据的端到端加密,而通过MaaS on AICC,火山方舟上所有模型都可以直接运行在AICC加密计算环境中。

这其中,火山引擎Jeddak AICC机密计算平台就深入融合了英特尔TDX技术,基于开源Trusted MCP方案,利用AICC产品提供的端云互信能力,解决了原生MCP协议中服务身份不可信、数据篡改、流量劫持、隐私泄露等安全威胁,从而保证智能体之间的通信安全。

英特尔助火山引擎“优化”AI云技术内核

存储层面,火山引擎则是面向向量化数据升级了AI Native存储系统,包括弹性极速缓存EIC(新版本推理性能提升了87.5%、推理GPU算力消耗降低了20%)、AI Native文件系统、向量知识库存储、数据智能检索。

英特尔面向存储过程中的压缩、加密等任务有两项重要技术,数据保护与压缩加速技术QAT和数据流加速器DSA,这两项技术在开源软件中也得到了广泛应用,但火山引擎在经过调研后发现,市面上集成QAT、DSA的开源软件无法满足自身存储业务需求,于是,火山引擎与英特尔联合开发了veSAL这款开源软件。

英特尔助火山引擎“优化”AI云技术内核

据悉,veSAL基于英特尔至强6处理器内置的QAT及DSA,对存储系统中压缩/解压缩、加解密等高频高负载操作进行加速,已集成至高性能存储业务,并实现了性能提升与CPU资源节省双重目标。

这些技术能力的升级,加强了火山引擎面向AI的服务能力。

2025年被视为企业Agent元年,然而,据火山引擎的调研结果显示,能够做好Agent开发的企业并不多,能将Agent运营好并能大规模使用的,更是少之又少。

正因如此,我们看到,火山引擎面向Agent开发推出了一系列工具和产品,这其中就包括企业级一站式智能体工作站HiAgent。

据谭待在大会上透露,今年HiAgent已经服务了数百家企业。

在推动Agent普及应用过程中,火山引擎、英特尔、华胜天成、联想四方合作,共同面向产业推出了社区全能数字员工“华格格”一体化解决方案。

社区服务往往存在大量综合问题,一个Agent通常无法精准回答所有问题,在回答这样综合性问题时,就涉及到切换多个Agent来协同工作,如果直接进行硬切换,往往会导致上下文丢失,影响Agent工作效果,HiAgent提供的就是这样一个统一调度平台。

在“华格格”一体化解决方案中,通过HiAgent实现多智能体的跨域调度与画布式交互,显著提升了人机协同效率,与此同时,基于英特尔锐炫B60构建的一体机算力方案,不仅有效降低了部署成本,更以开箱即用的软硬一体模式,满足了快速交付与多场景灵活部署的需求。

英特尔助火山引擎“优化”AI云技术内核

也正是基于这样灵活的Agent解决方案,在过去一年里,企业Agent在使用广度和使用深度上得到了进一步跨越——企业平均投产的Agent数量从2024年50+个增长到了200+个,这些智能体也从轻量化试点场景扩展到了B端严肃生产场景。

而这样的技术迭代和应用爆发,仍在继续。

来源:至顶网人工智能频道

0赞

好文章,需要你的鼓励

2025

12/19

17:45

分享

点赞

邮件订阅