7月29-31日,首届中国算力大会在济南举行。大会现场,基于昇腾AI基础软硬件平台、由中国科学院自动化研究所联合华为打造的“紫东太初”人工智能基础大模型荣获“DC Tech创新先锋”优秀成果。

“紫东太初”人工智能基础大模型荣获“算力平台”先锋案例
2022中国算力大会是我国算力领域首个全国性会议,作为大会发布的重要奖项,“创新先锋”优秀成果评选旨在从设备技术、软硬件系统、成果应用、能效水平、赋能情况、流程优化等多个方面优中选优,充分发挥典型标杆的示范引领作用。
“紫东太初”是全球首个三模态大模型,开拓性实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”,理解和生成能力更接近人类,向通用人工智能迈出了重要一步。紫东太初作为多模态大模型代表作,正在全力助推AI研发规则和产业应用模式变革,加速各行业智能化转型实践。
当下,多模态大模型受产学研用多方关注,原因在于人工智能产业高速发展带来全新研究、应用需求。目前,网络数据90%以上为图像与视频,音频数据也保持高增长,但当下用于预训练的模型大多是以文本、图像为主的单模态或双模态,只能涵盖互联网一小部分数据,不仅与人类多模态交互能力差别很大,也无法充分发挥数据的生产要素作用,限制了下一阶段人工智能应用创新。
因此,推动预训练模型从单模态向多模态方向发展,打通图像、文字、语音壁垒,进而使AI应用更贴合人类行为习惯与现实需求,成为当前人工智能行业攻坚点之一。
中科院自动化所以昇腾AI平台为基础,基于武汉人工智能计算中心算力,研发面向超大规模的高效分布式训练框架,在图、文、音三个基础模型上加入跨模态编码和解码网络,基于昇思MindSpore AI框架,打造了全球首个千亿参数三模态大模型“紫东.太初”,性能领跑业界,可以灵活支撑图、文、音全场景AI应用,更加接近人类真正的感情和思考,灵活性更高,通用性更强。基于紫东太初打造的虚拟人“小初”,具备视频生成、视频描述、图像生成、智能问答、语音识别等多个功能,甚至能在纺织生产线上通过声音就能“听”出纱线断头的质检缺陷。
去年底,国内首个多模态人工智能产业联盟成立,吸引了新华社技术局、长安汽车、中国移动、千博手语等30余个成员单位加盟,通过开源的多模态大模型快速进行自身业务AI融合创新,基于“紫东太初” 陆续孵化出新媒体内容检索平台、智能座舱、南宋御街数字人、手语教考一体机等场景化行业应用,充分展现了人工智能大模型的产业价值。
从“紫东太初”大模型的研发,到产业联盟的组建,AI研发规则和产业应用模式迎来深刻变革,昇腾AI正在加速推动AI产业化和产业AI化,助力中国人工智能抢占智能时代新高地。
好文章,需要你的鼓励
AI正在革命性地改变心脏疾病治疗领域。从设计微创心脏瓣膜手术到预防原理定位,机器学习和神经网络的洞察力推动了巨大进步,甚至可以构建新型移植解剖结构。数字孪生技术为个性化心血管护理提供持续预测管理。哈佛干细胞研究所的研究人员利用纳米材料和类似棉花糖机的设备,能在10分钟内制造心脏瓣膜,相比传统3周制造时间大幅缩短。这些突破性技术为每年4万名先天性心脏畸形儿童带来新希望。
Fractal AI Research实验室开发了Fathom-DeepResearch智能搜索系统,该系统由两个4B参数模型组成,能够进行20多轮深度网络搜索并生成结构化报告。研究团队创新了DUETQA数据集、RAPO训练方法和认知行为奖励机制,解决了AI搜索中的浅层化、重复性和缺乏综合能力等问题,在多项基准测试中显著超越现有开源系统,为AI助手向专业研究工具转变奠定了基础。
谷歌正在为搭载其内置信息娱乐系统的汽车推出谷歌地图实时车道引导功能,首先从极星4开始。该系统利用车辆前置摄像头和AI技术,分析车道标线和路标,为驾驶者提供更精确的车道指引和视听提示。该功能将在未来几个月内在美国和瑞典的极星4车型上推出,目前仅支持高速公路使用。
快手科技与清华大学合作发现当前AI语言模型训练中存在严重的权重分配不平衡问题,提出了非对称重要性采样策略优化(ASPO)方法。该方法通过翻转正面样本的重要性权重,让模型把更多注意力放在需要改进的部分而非已经表现良好的部分,显著提升了数学推理和编程任务的性能,并改善了训练稳定性。