近日,基于全场景AI框架昇思MindSpore 开发的蛋白质结构预测模型在全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)上连续三周霸榜,并包揽月榜前二,显示出昇腾AI基础软硬件平台在AI for Science领域的强大能力。
4月21日最新月榜竞赛结果
由瑞士生物信息研究所和巴塞尔大学联合举办的 CAMEO(Continous Automated Model EvaluatiOn)——全球持续蛋白质结构预测竞赛,被认为是蛋白质结构预测领域最重要的比赛之一。
CAMEO 竞赛的规则是,每位参赛者需每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,其分数和名次每周都会进行在线更新。
因此,该竞赛吸引来不少世界范围内生物计算领域的前沿模型“选手”。基于昇思MindSpore AI框架训练的蛋白质结构预测模型,一经亮相,便领跑全球。在最近的三周CAMEO竞赛中持续排名第一,意味着昇腾AI基础软硬件平台在AI for Science领域的强大能力。
昇思MindSpore蛋白质结构预测模型研发进展
2021年11月,昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具,并在2022年2月实现训练的全流程打通,效率同比提升2-3倍。
采用昇腾AI基础软硬件平台后,在混合精度下,单步迭代时间由20秒缩短到12秒,性能提升超过60%。依托昇思MindSpore内存复用能力, 训练序列长度由384提升至512。
在训练精度接近AlphaFold2的基础上,昇思MindSpore在算法、规模和软硬件支持等方向上持续改进,本次发布的蛋白质结构预测模型成绩持续刷新业界记录、拿下CAMEO竞赛第一,毫无疑问是昇思MindSpore在蛋白质结构预测领域的又一里程碑,在填补AI根技术在蛋白质结构预测领域成绩空白的同时,更加证明了其价值与优越性。
未来,针对蛋白质结构预测问题,昇思MindSpore将携手学术科研界更多合作伙伴,在蛋白质结构预测领域共同探索、持续突破,助力国内相关基础研究,尤其是生命各分支学科的进步,推动创新制药行业的发展。
蛋白质折叠代码仓路径https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold。
好文章,需要你的鼓励
还在为渲染一个3D模型等上几小时吗?还在纠结移动办公就得牺牲性能吗?当AI遇上专业工作站,传统设计流程的游戏规则正在被改写。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。