用人工智能技术精准预测蛋白折叠是近年来科学家热衷的研究领域,蛋白质的折叠、结构的预测在生物医药上将会有很大的应用前景,是人类健康面临的真正前沿技术。
7月15日,由谷歌投资的英国AI研究实验室DeepMind公司在《自然》杂志上发表论文,公开了进一步优化的Alpha Fold 2人工智能系统的源代码。
同日,华盛顿大学蛋白设计研究所大卫·贝克(David Baker)教授课题组在《科学》杂志上发表论文,公布了其开源人工智能系统RoseTTA Fold的研究结果。
两个团队将预测蛋白结构的机器学习系统开源,将有助于更多研究团队免费获得人工智能系统预测蛋白结构的框架和训练方法,以促进整个生命科学领域的进步。
对此,《自然》发表评论指出:“这些论文和人工智能系统资源的发布,能让AI系统预测蛋白质结构的技术能够为广大科学家和研究人员使用,从而进一步激发这一领域的技术进展,攻克目前人工智能系统尚且无法确定构象的蛋白,并可使用这些软件设计全新的蛋白。”
诺贝尔化学奖获得者、斯坦福大学计算生物学家、复旦大学复杂体系多尺度研究院荣誉院长迈克尔·莱维特(Michael Levitt)教授对第一财经记者表示:“从DeepMind和华盛顿大学两个团队先后在《自然》和《科学》杂志上发表的文章可以看出,在AI预测蛋白结构领域的竞争正在加剧,谷歌团队也不得不将其技术进行开源。”
在过去的50年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或X射线晶体学等实验手段在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,耗时耗力,可能需要花上好几年时间。
去年,DeepMind公司公布AI预测蛋白折叠的最新进展。其开发的Alpha Fold 2人工智能系统基于氨基酸序列,对蛋白质三维结构的预测准确性,能够与使用冷冻电子显微镜(CryoEM)、核磁共振或X射线晶体学等实验技术解析的三维结构准确性相媲美。这一突破被视为能够“为解决人类50年来的巨大挑战铺平道路”。
最新发布的更新版Alpha Fold 2在去年的系统基础上又进行了优化,系统的处理速度快了大约16倍。根据蛋白的大小,它可以在几分钟到几小时内生成准确的蛋白结构。
受到DeepMind的Alpha Fold 2系统的启发,华盛顿大学蛋白设计研究所贝克教授团队构建了名为RoseTTA Fold的软件系统,它的神经网络能够同时考虑蛋白序列的模式,蛋白中不同氨基酸之间的相互作用,以及蛋白质可能出现的三维结构。
莱维特教授认为,目前在AI预测蛋白结构的竞争中,DeepMind仍然领先全球,但其他团队正在积极追赶。研究人员表示,RoseTTA Fold系统在解析蛋白质三维结构方面的表现,与Alpha Fold 2的水平几乎相当,在有些蛋白上甚至优于Alpha Fold 2。
目前贝克教授已经将RoseTTA Fold软件工具上传到GitHub网站上。本月迄今,已被世界上超过140个不同研究团队下载,科学界正在利用RoseTTA Fold服务器来解决重要的生物学问题。