行业研究机构Omdia(Informa tech集团旗下)发布《中国人工智能框架市场调研报告》,指出中国AI框架市场竞争格局与创新趋势。Omdia调研发现,PyTorch、TensorFlow与MindSpore在知名度与市场份额上处于第一梯队。
人工智能随着技术的发展逐渐出现在大众眼前,作为新兴产业,市场规模不断扩大,应用场景也随着人工智能技术的成熟而扩展。从科研创新到产业应用落地,预训练大模型、AI for Science、负责任的AI等已成为全球学术界、产业界的焦点。AI框架是模型算法开发的核心,是支撑人工产业繁荣发展的基础,因此Omdia深入研究了AI框架的发展与产业趋势。
时下,以ChatGPT为代表的大模型获得的瞩目已经超越学术界、产业界,成为所有人的关注的创新成果,而大模型需要有强大的AI框架技术支撑。报告指出预训练大模型的三大趋势:第一,大模型参数量继续呈指数增长态势,“大模型”正走向“超大模型”;第二, 大模型正从单模态走向多模态、多任务融合; 第三,人工智能框架对大模型的训练有关键性的技术支撑作用。
在支持超大规模模型训练开发方面,全球领先的人工智能框架TensorFlow和PyTorch仍然占据领导地位;同时,开发者认为在中国本土人工智能框架中昇思MindSpore已占据优势地位,原生支持大模型,并孵化出了一系列创新大模型。
Omdia通过与专家深度访谈,发现TensorFlow由于有了JAX这一新生框架的融入,给业界带来更多期待;PyTorch则是依托第三方并行算法库补充了大模型支持能力;在中国本土市场上, 百度飞桨和昇思MindSpore由于有独特的中国本土语言和数据优势,更能在支持本土预训练大模型方面取得成功。
在以ChatGPT为代表的AIGC火爆的背后, 也出现了“造假”等AI伦理道德问题,人工智能开发者和机构越来越关注“负责任的人工智能”。 Omdia在对开发者的调研中发现,在所有主流人工智能框架中,TensorFlow 与MindSpore 对“负责任的人工智能”提供的支持能力最好,分别是第一与第二名。
同时,《中国人工智能框架市场调研报告》指出,“负责任的人工智能”既是一套道德准则, 又是一套技术体系。“负责任的人工智能”是以安全、可靠和合乎道德的方式开发、评估、部署和规模化人工智能系统的方法。人工智能框架引入众多的技术手段和可信AI功能模块,帮助开发者打造可信AI,帮助开发者和机构解决人工智能的安全隐私等合规性问题, 实现人工智能的可持续发展。
在科研创新领域,“AI for Science”也是人工智能行业的前沿热点,人工智能与科学的深度融合正在推动科研范式的创新,给科研领域带来了新的发展机遇。Omdia的分析师认为,与大模型类似,“AI for Science”是AI创新发展的新的重要方向,而人工智能框架对“AI for Science”的发展起着关键的技术支撑作用。“AI for Science”的发展对人工智能框架提出了更高的要求,调研发现,中国的人工智能开发者认为昇思MindSpore是最适合做 “AI for Science”项目的国产人工智能框架, 其对“AI for Science”的支持能力甚至超过了PyTorch,并有赶超TensorFlow的趋势。
人工智能框架作为AI创新的重要基础,将助力行业加速智能化转型升级。更多人工智能框架调研发现,请查看《中国人工智能框架市场调研报告》。Omdia报告链接:
https://omdia.tech.informa.com/commissioned-research/articles/china-ai-frameworks-market-report-2023
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。