近日,基于全场景AI框架昇思MindSpore 开发的蛋白质结构预测模型在全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)上连续三周霸榜,并包揽月榜前二,显示出昇腾AI基础软硬件平台在AI for Science领域的强大能力。
4月21日最新月榜竞赛结果
由瑞士生物信息研究所和巴塞尔大学联合举办的 CAMEO(Continous Automated Model EvaluatiOn)——全球持续蛋白质结构预测竞赛,被认为是蛋白质结构预测领域最重要的比赛之一。
CAMEO 竞赛的规则是,每位参赛者需每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,其分数和名次每周都会进行在线更新。
因此,该竞赛吸引来不少世界范围内生物计算领域的前沿模型“选手”。基于昇思MindSpore AI框架训练的蛋白质结构预测模型,一经亮相,便领跑全球。在最近的三周CAMEO竞赛中持续排名第一,意味着昇腾AI基础软硬件平台在AI for Science领域的强大能力。
昇思MindSpore蛋白质结构预测模型研发进展
2021年11月,昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具,并在2022年2月实现训练的全流程打通,效率同比提升2-3倍。
采用昇腾AI基础软硬件平台后,在混合精度下,单步迭代时间由20秒缩短到12秒,性能提升超过60%。依托昇思MindSpore内存复用能力, 训练序列长度由384提升至512。
在训练精度接近AlphaFold2的基础上,昇思MindSpore在算法、规模和软硬件支持等方向上持续改进,本次发布的蛋白质结构预测模型成绩持续刷新业界记录、拿下CAMEO竞赛第一,毫无疑问是昇思MindSpore在蛋白质结构预测领域的又一里程碑,在填补AI根技术在蛋白质结构预测领域成绩空白的同时,更加证明了其价值与优越性。
未来,针对蛋白质结构预测问题,昇思MindSpore将携手学术科研界更多合作伙伴,在蛋白质结构预测领域共同探索、持续突破,助力国内相关基础研究,尤其是生命各分支学科的进步,推动创新制药行业的发展。
蛋白质折叠代码仓路径https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold。
好文章,需要你的鼓励
尽管市场上频繁出现所谓的自主代理 AI,但目前尚无统一定义,多数产品不过是 LLM 的简单包装,这让 CIO 在采购时面临风险与困惑。
最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。
本文讨论了 IT 自动化过程中容易忽视的流程问题、数据质量、整合难题、成本误区以及 AI 融入后带来的监管与创新挑战。
构建云边端协同的多元化算力体系已成为企业实现大模型规模化落地的关键路径,Arm正助力从云到端的大模型部署与高效运行,满足企业对更高性能、更高能效以及更强本地处理能力的迫切需求。