SK Telecom发布自主研发的韩语大语言模型

韩国SK电信发布了A.X 3.1 Lite，这是一个70亿参数的韩语大语言模型，完全从零开始自主开发。该模型在1.65万亿多语言标记上训练，重点关注韩语内容，可在智能手机上运行且无需云端支持。模型在韩语多任务推理基准测试中表现优异，响应时使用的标记数比同类GPT模型少三分之一。已开源并应用于SK电信的A.dot语音助手，支持实时通话摘要等功能。

上周，韩国SK电信在全球AI竞赛中发布了一款新产品：A.X 3.1 Lite，这是一个拥有70亿参数的大语言模型，完全从零开始为韩语应用场景训练。它足够小，可以在智能手机上运行，但仍能处理广泛的任务，无需云服务。

在韩国本土从零构建

大多数区域性语言模型都是在海外大型架构基础上进行微调的版本。但这款不是。SK电信的团队完全自主开发了A.X 3.1 Lite，使用1.65万亿个多语言Token进行训练，重点关注韩语内容。该项目在SK电信的TITAN超级计算机上运行，公司控制了从Token化器到推理的每一层。

回报是什么？一个将数据保留在国内并避免依赖外国技术的系统。

"基于我们稳步建立的韩语大语言模型开发能力，我们将努力增强AI生态系统的独立性，并为提升国家AI竞争力做出贡献，"SK电信基础模型经理Kim Tae-yoon说道。

模型背后的技术

按照2025年的标准，70亿参数听起来可能不算庞大，但这正是关键所在。较小的模型加载更快、耗电更少、微调成本更低，这些优势对于移动应用、小型企业和研究实验室来说至关重要。

为了达到这个最佳平衡点，SK电信的工程师构建了一个32层Transformer，配备32个注意力头、4096维隐藏层大小和32768个Token的上下文长度。简而言之：它紧凑、快速，并且在性能上表现出色。

数据支持了这一点。在韩语多任务推理基准KMMLU上，A.X 3.1 Lite得分61.7，约为SK电信更大的A.X 4.0 Lite模型的96%。在CLIcK文化智能测试中，它超越了更大的同类产品：71.22对69.97。在更广泛的韩语问答基准KoBALT-700上，它得分27.43，与几倍于其规模的模型竞争力相当。

对于韩语提示，它产生的响应使用的Token数量比同类GPT模型少约三分之一。这意味着更低的延迟和更长的手机电池寿命。

该模型是开源的，可在GitHub和Hugging Face上获得，采用Apache 2.0许可证。

已投入实际应用

SK电信不仅仅是在实验室测试A.X 3.1 Lite。它已经为公司的A.dot语音助手提供动力，可以实时总结通话。开发者可以将同样的技术集成到翻译应用、客户支持工具或离线聊天界面中，全部无需数据中心或外部API。

对于大规模部署，SK电信还提供API和基于Docker的容器选项，可在本地运行。这对于需要将敏感数据保留在国内的银行、医院和公共机构来说意义重大。

分层策略：轻量级和大型

SK电信的路线图采用双轨模式。A.X 3系列，如3.1 Lite，完全从零开始构建，专注于主权、紧凑性和速度。相比之下，4系列要大得多，通过持续预训练针对性能进行优化。

这为韩国组织提供了选择：使用快速、高效的Lite模型处理日常任务，或使用更强大的A.X 4系列进行扩展，全程无需更换供应商。

A.X 3.1 Lite也不是终点。SK电信计划在2025年8月底发布一个340亿参数的版本，同样从零开发。该模型旨在改善创意写作和代码生成，同时保持韩语效率。

韩国在AI独立性上的重大押注

SK电信的努力是更广泛国家战略的一部分。韩国政府已承诺投入数十亿韩元来构建自己的基础AI模型。相关合同正在制定中，预计SK电信将与竞争对手Naver和Kakao争夺这一合同。

目标是什么？通过构建真正理解韩国语言的工具，减少对外国API和模型的依赖，无论是从字面意义还是政治意义上。

这一趋势不仅限于韩国。法国的Mistral AI正在使用18000GPU超级计算机在本土训练模型。阿联酋的技术创新研究所发布了Falcon 180B和更轻量的Falcon 3系列，都是完全开源的。在印度，在Google Cloud帮助下构建的BharatGPT支持十多种地方语言。沙特阿拉伯正在资助HUMAIN，这是一个由该国主权财富基金支持的阿拉伯语模型。

信息很明确：主权AI不再只是一个流行词。

对于SK电信来说，A.X 3.1 Lite不仅仅是另一个产品。它是一个标志，证明韩国可以自主构建有能力、有竞争力的语言模型，并在人们随身携带的设备上运行。

来源：Forbes

0赞

好文章，需要你的鼓励

SK Telecom发布自主研发的韩语大语言模型

来源：Forbes

2025

07/17

07:51

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

希捷发布28TB和30TB HAMR硬盘 专为边缘AI和NAS打造

Krisp推出VIVA开发工具包提升语音智能体精准度

谷歌研究：大语言模型在压力下会放弃正确答案

OnePlus 13将获得专属AI"心智空间"功能

大型企业AI岗位成IT从业者高薪就业首选

Mistral发布首个开源AI音频模型Voxtral

Google Discover新增AI摘要功能，出版商流量或进一步下滑

Anthropic推出专为金融服务设计的Claude专业版

AI编程工具正向终端转移：生成式AI的新趋势

研究领导者呼吁科技行业监控AI的"思维"过程

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

希捷发布28TB和30TB HAMR硬盘专为边缘AI和NAS打造