近日,基于全场景AI框架昇思MindSpore 开发的蛋白质结构预测模型在全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)上连续三周霸榜,并包揽月榜前二,显示出昇腾AI基础软硬件平台在AI for Science领域的强大能力。
4月21日最新月榜竞赛结果
由瑞士生物信息研究所和巴塞尔大学联合举办的 CAMEO(Continous Automated Model EvaluatiOn)——全球持续蛋白质结构预测竞赛,被认为是蛋白质结构预测领域最重要的比赛之一。
CAMEO 竞赛的规则是,每位参赛者需每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,其分数和名次每周都会进行在线更新。
因此,该竞赛吸引来不少世界范围内生物计算领域的前沿模型“选手”。基于昇思MindSpore AI框架训练的蛋白质结构预测模型,一经亮相,便领跑全球。在最近的三周CAMEO竞赛中持续排名第一,意味着昇腾AI基础软硬件平台在AI for Science领域的强大能力。
昇思MindSpore蛋白质结构预测模型研发进展
2021年11月,昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具,并在2022年2月实现训练的全流程打通,效率同比提升2-3倍。
采用昇腾AI基础软硬件平台后,在混合精度下,单步迭代时间由20秒缩短到12秒,性能提升超过60%。依托昇思MindSpore内存复用能力, 训练序列长度由384提升至512。
在训练精度接近AlphaFold2的基础上,昇思MindSpore在算法、规模和软硬件支持等方向上持续改进,本次发布的蛋白质结构预测模型成绩持续刷新业界记录、拿下CAMEO竞赛第一,毫无疑问是昇思MindSpore在蛋白质结构预测领域的又一里程碑,在填补AI根技术在蛋白质结构预测领域成绩空白的同时,更加证明了其价值与优越性。
未来,针对蛋白质结构预测问题,昇思MindSpore将携手学术科研界更多合作伙伴,在蛋白质结构预测领域共同探索、持续突破,助力国内相关基础研究,尤其是生命各分支学科的进步,推动创新制药行业的发展。
蛋白质折叠代码仓路径https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。