上周,韩国SK电信在全球AI竞赛中发布了一款新产品:A.X 3.1 Lite,这是一个拥有70亿参数的大语言模型,完全从零开始为韩语应用场景训练。它足够小,可以在智能手机上运行,但仍能处理广泛的任务,无需云服务。
在韩国本土从零构建
大多数区域性语言模型都是在海外大型架构基础上进行微调的版本。但这款不是。SK电信的团队完全自主开发了A.X 3.1 Lite,使用1.65万亿个多语言Token进行训练,重点关注韩语内容。该项目在SK电信的TITAN超级计算机上运行,公司控制了从Token化器到推理的每一层。
回报是什么?一个将数据保留在国内并避免依赖外国技术的系统。
"基于我们稳步建立的韩语大语言模型开发能力,我们将努力增强AI生态系统的独立性,并为提升国家AI竞争力做出贡献,"SK电信基础模型经理Kim Tae-yoon说道。
模型背后的技术
按照2025年的标准,70亿参数听起来可能不算庞大,但这正是关键所在。较小的模型加载更快、耗电更少、微调成本更低,这些优势对于移动应用、小型企业和研究实验室来说至关重要。
为了达到这个最佳平衡点,SK电信的工程师构建了一个32层Transformer,配备32个注意力头、4096维隐藏层大小和32768个Token的上下文长度。简而言之:它紧凑、快速,并且在性能上表现出色。
数据支持了这一点。在韩语多任务推理基准KMMLU上,A.X 3.1 Lite得分61.7,约为SK电信更大的A.X 4.0 Lite模型的96%。在CLIcK文化智能测试中,它超越了更大的同类产品:71.22对69.97。在更广泛的韩语问答基准KoBALT-700上,它得分27.43,与几倍于其规模的模型竞争力相当。
对于韩语提示,它产生的响应使用的Token数量比同类GPT模型少约三分之一。这意味着更低的延迟和更长的手机电池寿命。
该模型是开源的,可在GitHub和Hugging Face上获得,采用Apache 2.0许可证。
已投入实际应用
SK电信不仅仅是在实验室测试A.X 3.1 Lite。它已经为公司的A.dot语音助手提供动力,可以实时总结通话。开发者可以将同样的技术集成到翻译应用、客户支持工具或离线聊天界面中,全部无需数据中心或外部API。
对于大规模部署,SK电信还提供API和基于Docker的容器选项,可在本地运行。这对于需要将敏感数据保留在国内的银行、医院和公共机构来说意义重大。
分层策略:轻量级和大型
SK电信的路线图采用双轨模式。A.X 3系列,如3.1 Lite,完全从零开始构建,专注于主权、紧凑性和速度。相比之下,4系列要大得多,通过持续预训练针对性能进行优化。
这为韩国组织提供了选择:使用快速、高效的Lite模型处理日常任务,或使用更强大的A.X 4系列进行扩展,全程无需更换供应商。
A.X 3.1 Lite也不是终点。SK电信计划在2025年8月底发布一个340亿参数的版本,同样从零开发。该模型旨在改善创意写作和代码生成,同时保持韩语效率。
韩国在AI独立性上的重大押注
SK电信的努力是更广泛国家战略的一部分。韩国政府已承诺投入数十亿韩元来构建自己的基础AI模型。相关合同正在制定中,预计SK电信将与竞争对手Naver和Kakao争夺这一合同。
目标是什么?通过构建真正理解韩国语言的工具,减少对外国API和模型的依赖,无论是从字面意义还是政治意义上。
这一趋势不仅限于韩国。法国的Mistral AI正在使用18000GPU超级计算机在本土训练模型。阿联酋的技术创新研究所发布了Falcon 180B和更轻量的Falcon 3系列,都是完全开源的。在印度,在Google Cloud帮助下构建的BharatGPT支持十多种地方语言。沙特阿拉伯正在资助HUMAIN,这是一个由该国主权财富基金支持的阿拉伯语模型。
信息很明确:主权AI不再只是一个流行词。
对于SK电信来说,A.X 3.1 Lite不仅仅是另一个产品。它是一个标志,证明韩国可以自主构建有能力、有竞争力的语言模型,并在人们随身携带的设备上运行。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。