近日,基于全场景AI框架昇思MindSpore 开发的蛋白质结构预测模型在全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)上连续三周霸榜,并包揽月榜前二,显示出昇腾AI基础软硬件平台在AI for Science领域的强大能力。
4月21日最新月榜竞赛结果
由瑞士生物信息研究所和巴塞尔大学联合举办的 CAMEO(Continous Automated Model EvaluatiOn)——全球持续蛋白质结构预测竞赛,被认为是蛋白质结构预测领域最重要的比赛之一。
CAMEO 竞赛的规则是,每位参赛者需每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,其分数和名次每周都会进行在线更新。
因此,该竞赛吸引来不少世界范围内生物计算领域的前沿模型“选手”。基于昇思MindSpore AI框架训练的蛋白质结构预测模型,一经亮相,便领跑全球。在最近的三周CAMEO竞赛中持续排名第一,意味着昇腾AI基础软硬件平台在AI for Science领域的强大能力。
昇思MindSpore蛋白质结构预测模型研发进展
2021年11月,昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具,并在2022年2月实现训练的全流程打通,效率同比提升2-3倍。
采用昇腾AI基础软硬件平台后,在混合精度下,单步迭代时间由20秒缩短到12秒,性能提升超过60%。依托昇思MindSpore内存复用能力, 训练序列长度由384提升至512。
在训练精度接近AlphaFold2的基础上,昇思MindSpore在算法、规模和软硬件支持等方向上持续改进,本次发布的蛋白质结构预测模型成绩持续刷新业界记录、拿下CAMEO竞赛第一,毫无疑问是昇思MindSpore在蛋白质结构预测领域的又一里程碑,在填补AI根技术在蛋白质结构预测领域成绩空白的同时,更加证明了其价值与优越性。
未来,针对蛋白质结构预测问题,昇思MindSpore将携手学术科研界更多合作伙伴,在蛋白质结构预测领域共同探索、持续突破,助力国内相关基础研究,尤其是生命各分支学科的进步,推动创新制药行业的发展。
蛋白质折叠代码仓路径https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。