2022年6月15日,在华为伙伴暨开发者大会2022上,华为发布人工智能大模型全流程使能体系,该体系包含从规划、开发到产业化全流程,使能大模型发展,与业界共筑中国大模型生态,开创大模型产业化新模式。
华为发布人工智能大模型全流程使能体系
当前人工智能技术趋势正朝着通用大模型方向发展,大模型具备更强泛化能力、可覆盖多业务场景,发展大模型也成为产学研各界共识。为了更好的推动大模型的发展,华为推出人工智能大模型全流程使能体系,包括:
• 规划昇腾大模型沙盘,与产业界共筑中国大模型创新高地。过去的一年,产业界基于昇腾AI先后推出鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列有影响力的大模型。今年,为进一步鼓励大模型的研究与创新,华为推出昇腾科研创新使能计划,通过资金、算力和技术的扶持,鼓励高校及科研院所,基于昇腾大模型沙盘,开展大模型的研究和创新,在前沿领域和热点行业打造出世界级领先的大模型。
昇腾大模型沙盘
• 打造大模型开发使能平台,让大模型易开发、易适配、易部署。针对基础模型开发,华为推出基于昇思MindSpore和ModelArts结合的大模型开发套件,通过算法开发、并行计算、存储优化、断点续训,实现大模型的高效开发;为快速适配行业应用,推出基于MindX的大模型微调组件,实现一键式微调和低参数调优功能;在模型推理部署方面,推出基于MindStudio大模型部署套件,实现分布式推理服务化、模型轻量化和动态加密部署功能。
大模型开发使能平台
• 从科研创新到行业落地,开创产业聚集新模式。去年,基于全球首个智能遥感框架及数据集武汉.LuoJia和全球首个三模态大模型紫东.太初,成立智能遥感开源生态联盟和多模态人工智能产业联盟,60余家伙伴已陆续孵化出多个行业解决方案。今年,华为将与伙伴一起,共同成立AI流体力学、AI生物医药、以及智慧育种等产业联盟,助力相关领域的大模型创新和产业化发展。
人工智能产业聚集新模式
好文章,需要你的鼓励
Snap 推出 Lens Studio 的 iOS 应用和网页工具,让所有技能层次的用户都能通过文字提示和简单编辑,轻松创建 AR 镜头,包括生成 AI 效果和集成 Bitmoji,从而普及 AR 创作,并持续为专业应用提供支持。
SEALQA是维吉尼亚理工大学研究团队开发的新型基准测试,旨在评估搜索增强型语言模型在面对矛盾、嘈杂或无用搜索结果时的推理能力。它包含三种测试:SEAL-0(极具挑战性的核心问题集)、SEAL-HARD(更广泛的困难问题集)和LONGSEAL(测试长上下文多文档推理)。研究发现,即使是前沿模型在这些测试中表现也很差,增加测试时计算资源往往不能带来可靠的性能提升,高级推理模型对嘈杂搜索结果特别敏感,模型在识别大量干扰文档中的相关信息时仍然困难重重。
这篇论文提出了"计划与预算"框架,解决大型语言模型在推理任务中的效率问题。研究者发现模型存在"推理失调"现象——简单问题上过度思考,复杂问题上思考不足。他们开发了贝叶斯预算分配模型(BBAM)作为理论基础,将推理分解为子问题并根据不确定性分配计算资源。实验表明,该方法在不同任务上显著提高推理效率,令牌使用减少39%,E?指标提升187.5%,且能使小型模型达到大型模型的效率水平。