7月29-31日,首届中国算力大会在济南举行。大会现场,基于昇腾AI基础软硬件平台、由中国科学院自动化研究所联合华为打造的“紫东太初”人工智能基础大模型荣获“DC Tech创新先锋”优秀成果。

“紫东太初”人工智能基础大模型荣获“算力平台”先锋案例
2022中国算力大会是我国算力领域首个全国性会议,作为大会发布的重要奖项,“创新先锋”优秀成果评选旨在从设备技术、软硬件系统、成果应用、能效水平、赋能情况、流程优化等多个方面优中选优,充分发挥典型标杆的示范引领作用。
“紫东太初”是全球首个三模态大模型,开拓性实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”,理解和生成能力更接近人类,向通用人工智能迈出了重要一步。紫东太初作为多模态大模型代表作,正在全力助推AI研发规则和产业应用模式变革,加速各行业智能化转型实践。
当下,多模态大模型受产学研用多方关注,原因在于人工智能产业高速发展带来全新研究、应用需求。目前,网络数据90%以上为图像与视频,音频数据也保持高增长,但当下用于预训练的模型大多是以文本、图像为主的单模态或双模态,只能涵盖互联网一小部分数据,不仅与人类多模态交互能力差别很大,也无法充分发挥数据的生产要素作用,限制了下一阶段人工智能应用创新。
因此,推动预训练模型从单模态向多模态方向发展,打通图像、文字、语音壁垒,进而使AI应用更贴合人类行为习惯与现实需求,成为当前人工智能行业攻坚点之一。
中科院自动化所以昇腾AI平台为基础,基于武汉人工智能计算中心算力,研发面向超大规模的高效分布式训练框架,在图、文、音三个基础模型上加入跨模态编码和解码网络,基于昇思MindSpore AI框架,打造了全球首个千亿参数三模态大模型“紫东.太初”,性能领跑业界,可以灵活支撑图、文、音全场景AI应用,更加接近人类真正的感情和思考,灵活性更高,通用性更强。基于紫东太初打造的虚拟人“小初”,具备视频生成、视频描述、图像生成、智能问答、语音识别等多个功能,甚至能在纺织生产线上通过声音就能“听”出纱线断头的质检缺陷。
去年底,国内首个多模态人工智能产业联盟成立,吸引了新华社技术局、长安汽车、中国移动、千博手语等30余个成员单位加盟,通过开源的多模态大模型快速进行自身业务AI融合创新,基于“紫东太初” 陆续孵化出新媒体内容检索平台、智能座舱、南宋御街数字人、手语教考一体机等场景化行业应用,充分展现了人工智能大模型的产业价值。
从“紫东太初”大模型的研发,到产业联盟的组建,AI研发规则和产业应用模式迎来深刻变革,昇腾AI正在加速推动AI产业化和产业AI化,助力中国人工智能抢占智能时代新高地。
好文章,需要你的鼓励
Paramount正加速推进AI布局,同时面临CTO Phil Wiser五月底计划离职的人事变动。在收购华纳兄弟探索公司接近尾声之际,Paramount CIO Lakshman Nathan在路透社举办的Momentum AI大会上分享了公司AI战略:公司已在隐私、法务及代码开发等领域部署AI,两天内即可完成应用测试交付。Paramount采取开放探索与治理并行的策略,借助智能体AI推动企业级应用整合,同时稳步处理多次并购带来的遗留系统问题。
字节跳动团队提出ATESD,通过让AI"老师"自适应控制向"学生"暴露多少参考推理过程,突破了自蒸馏训练中全量暴露的默认设定,在竞赛数学推理上显著提升小模型性能。
量子计算行业正面临两大迫切问题:安全威胁与人才短缺。随着"Q-Day"临近,量子计算机或将破解RSA加密体系,威胁银行、医疗、政府等关键基础设施安全。NIST要求2035年前完成向后量子密码学的迁移。与此同时,行业人才严重匮乏——目前仅有3万名量子专业人员,而2029年需求将达25万人。据麦肯锡预测,量子计算到2035年将创造3万亿美元经济机遇。
StepFun团队发现主流全感官AI评测存在"视觉作弊"漏洞,发布OmniClean清洁评测集,并提出三阶段OmniBoost训练方案,让30亿参数小模型媲美300亿参数大模型。