2023年2月6日,行业研究机构Omdia(Informa tech集团旗下)发布了《中国人工智能框架市场调研报告》,深入分析了中国人工智能框架市场的竞争格局,产业现状与创新趋势。Omdia通过调研发现,PyTorch、TensorFlow、MindSpore等人工智能框架在知名度与市场份额上处于第一梯队。
随着众多人工智能项目从科研创新到产业落地,人工智能应用场景逐渐扩展,人工智能市场规模正在不断扩大。预训练大模型、“AI for Science”、“负责任的人工智能”等已成为全球学术界和产业界关注的焦点。而人工智能框架是模型算法开发的核心,是支撑人工智能技术发展和产业繁荣发展的基础。
以ChatGPT为代表的大模型已经超越学术界和产业界,开始成为大众关注的热点,而大模型需要有强大的人工智能框架技术支撑。报告指出预训练大模型的三大趋势:第一,大模型参数量继续呈指数增长态势,“大模型”正走向“超大模型“;第二, 大模型正从单模态走向多模态、多任务融合; 第三,人工智能框架对大模型的训练有关键性的技术支撑作用。
TensorFlow, PyTorch, MindSpore和PaddlePaddle在支持超大规模模型训练方面处于领先
在支持超大规模模型训练开发方面,全球领先的人工智能框架TensorFlow和PyTorch仍然占据领导地位;中国人工智能开发者认为,昇思MindSpore原生支持预训练大模型开发,已在中国市场上占据优势地位,并已经孵化出了一系列创新大模型。
Omdia通过与专家深度访谈,发现TensorFlow由于JAX这一新生框架的融入,给业界带来更多期待;PyTorch依托第三方并行算法库,补充了大模型支持能力;在中国本土市场上, 百度飞桨和昇思MindSpore由于有独特的中国本土语言和数据优势,更能在支持本土预训练大模型方面取得成功。
在以ChatGPT为代表的AIGC火爆的的背后, 也出现了“造假”等AI伦理道德问题,人工智能开发者和机构越来越关注“负责任的人工智能”。 Omdia在对人工智能开发者的调研中发现,在所有主流人工智能框架中,TensorFlow 与MindSpore 对“负责任的人工智能”提供的支持能力最好,分别位居第一与第二名。
TensorFlow和MindSpore对“负责任的人工智能”提供的支持能力最好
《中国人工智能框架市场调研报告》指出,“负责任的人工智能”既是一套道德准则, 又是一套技术体系。“负责任的人工智能”是以安全、可靠和合乎道德的方式开发、评估、部署和规模化人工智能系统的方法。人工智能框架引入众多的技术手段和可信AI功能模块,帮助开发者打造可信AI,帮助开发者和机构解决人工智能的安全隐私等合规性问题, 实现人工智能的可持续发展。
在科研创新领域,“AI for Science”也是人工智能行业的前沿热点,人工智能与科学的深度融合正在推动科研范式的创新,给科研领域带来了新的发展机遇。Omdia的分析师认为,与大模型类似,“AI for Science”是人工智能创新发展的重要方向,人工智能框架对“AI for Science”的发展起着关键的技术支撑作用。“AI for Science”的发展也对人工智能框架提出了更高的要求,调研发现,中国的人工智能开发者认为昇思MindSpore是最适合做 “AI for Science”项目的国产人工智能框架, 其对“AI for Science”的支持能力甚至超过了PyTorch,并有赶超TensorFlow的趋势。
人工智能框架作为人工智能创新的重要基础设施,正促进人工智能技术加速进步,助力众多行业智能化转型升级。想了解更多关于本次中国人工智能框架市场调研的发现,请查看《中国人工智能框架市场调研报告》。https://omdia.tech.informa.com/commissioned-research/articles/china-ai-frameworks-market-report-2023.
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。