一次AI开发1200万美元？华为盘古大模型说NO 原创

作者：任新勃

当前大模型效果如何，还是让子弹飞一会，时间会检验的。

理论到实际应用是需要过程的。

比如5G从理论论文到应用有十年之长。任正非多次谈到，华为5G技术来自十多年前的土耳其教授的一篇论文。2008年，土耳其Erdal Arikan教授提出极化码(Polar code)理论之后，一个月后，华为从期刊上了解并评估了阿勒坎的论文，意识到这篇论文的重要性，之后十年，基于该理论，华为5G编码技术实现突破并开始全球应用。

同样目前火热的AI大模型也不是横空出世，在ChatGPT 火热之后，我们看到的ChatGPT 是2018基于OpenAI实验室研发的GPT模型（Generative Pre-trained Transformer）开发的。但其原理也是Google公司在2017年开源的Transformer神经网络架构而来的。

ChatGPT的火热，也让国内AI企业积极推出自己的AI大模型，有代表性的是百度、阿里各自推出自己的对话大模型，一个是一言，一个是千问，还有一个受到大家关注的是华为盘古大模型。

前两天，我们看到在中国人工智能学会主办的人工智能大模型技术高峰论坛上，华为云AI领域首席科学家、国际欧亚科学院院士田奇出席现场，对华为盘古系列大模型的研发与应用落地情况进行了分享。

一次AI开发1200万美元？华为盘古大模型说NO

我们从田奇的分享可以看到，华为盘古大模型的当下的服务方式还是更实际一些，AI好不好用，包括算力、算法和数据三部分。这三个部分面临的挑战，田琦奇给点了出来，那就是AI大模型有两个高门槛：

一个是资金门槛高，开发和训练一次花费约1200万美元，一个是技术门槛高，需要对AI框架深度优化和超强的并行计算能力。

那么这两个门槛就让绝大部分的企业和用户挡在在AI大模型研发之外，华为的思路是就是解决传统AI开发面临作坊式开发、样本标注代价大、模型维护困难、模型泛化不足、行业人短缺等难题。这也是盘古大模型的价值和意义。

比如华为开放了盘古大模型开发的全流程大模型使能套件，包括TransFormers大模型套件MindSpore TransFormers、以文生图大模型套件MindSpore Diffusion、人类反馈强化学习套件MindSpore RLHF、大模型低参微调套件MindSpore PET，支撑大模型从预训练、微调、压缩、推理及服务化部署。

当然在“大模型时代”，到底如何实现价值，我们看到华为盘古大模型的思路是首先在强化大模型能力，实现在各垂直领域落地，通过参数微调，适配多个场景。所以华为盘古大模型所提供的服务更广，不仅提供像chatGPT一样的NLP大模型底座，还可以提供CV大模型、科学计算大模型等基础大模型。

同时华为盘古大模型还有一个特点是更灵活，据田奇介绍，在CV大模型和科学计算大模型的多个应用场景。矿山大模型、铁路巡检方案等，面向科学领域的盘古气象大模型、药物分子大模型、海浪预测大模型等。

当然个人建议，包括chatGPT在内的预训练大数据模型的原理是通过预测说话过程中的每个词和每个词的结合概率来生成语句。比如“我喜欢喝啤”，那下一个字的概率是什么，相信大家都知道。当然实际上现在模型已经实现了更复杂的的语音预测。包括词和词的概率，每一个句子的意思和下一个句子的意思，段落和段落的逻辑等。这么看来，有一些场景，预训练模型并不合适，包括气象、股市、经济等混沌事件就不适合预训练模型，因为这些场景，数据越多，越不确定，预测难度就越大。形成了一个死循环。

总之，当前大模型效果如何，还是让子弹飞一会，时间会检验的。同时我期待各个大模型企业可以形成直接的技术壁垒，技术护城河，但是不用形成技术傲慢，也就是你提供的AI产品应该是越来越简单，而不是越来越复杂，让人们望而生畏，那就不是AI护城河了，那就是AI霸权了。

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

一次AI开发1200万美元？华为盘古大模型说NO 原创

来源：至顶网人工智能频道

2023

04/10

11:19

分享

点赞

《2025 中国企业级 AI 实践调研分析年度报告》：深度剖析与价值洞察

Gartner：在中国构建AI软件工程技能的三大举措

阿联酋MBZUAI发布PAN世界模型，AI仿真技术迎来突破

Nvidia和Google支持的AI代码编辑器Cursor获23亿美元融资

Anthropic披露首例Claude模型参与的AI网络间谍活动

Cadence首款系统芯粒架构成功流片，助力物理AI发展加速

百度发布定制AI加速器响应国产芯片需求

VasEdge试用火热招募，降本增效机遇来袭

Infinidat InfiniBox G4系列升级重塑高端企业存储格局

Avalonia为微软MAUI跨平台应用方案带来Linux和浏览器支持

谷歌DeepMind发布SIMA 2智能体：游戏世界中学习迈向AGI之路

Infinidat G4系列升级重新定义高端企业存储格局

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

当超1/4美国高中生用ChatGPT学习：一场静默的教育革命正在发生

专访DeepMind CEO：我们距离实现AGI只需5-10年

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: