DeepMind 科学家因预测每种蛋白质结构的人工智能赢得 300 万美元的“突破奖”

“蛋白质折叠问题”是生物学中长期存在的障碍。

核糖体(浅紫色图片)从称为氨基酸的构件中组装出新的蛋白质。 (图片来源:CHRISTOPH BERGSTEDT/SCIENCE PHOTO LIBRARY via Getty Images)
核糖体(浅紫色图片)从称为氨基酸的构件中组装出新的蛋白质。 (图片来源:CHRISTOPH BERGSTEDT/SCIENCE PHOTO LIBRARY via Getty Images)

谷歌 DeepMind 的科学家因开发人工智能 (AI) 系统而获得了 300 万美元的奖金,该系统预测了几乎所有已知蛋白质如何折叠成其 3D 形状。

今年的生命科学突破奖之一授予了 DeepMind 的联合创始人兼首席执行官 Demis Hassabis,该公司创建了称为 AlphaFold 的蛋白质预测程序,以及突破奖基金会 DeepMind 的高级研究科学家 John Jumper周四(9 月 22 日)宣布

据此前报道,开源程序根据蛋白质的氨基酸序列或构成蛋白质的分子单元进行预测。这些单独的单元连接成一条长链,然后“折叠”成 3D 形状。蛋白质的 3D 结构决定了该蛋白质可以做什么,无论是切割 DNA 还是标记危险的病原体以进行破坏,因此能够从其氨基酸序列推断蛋白质的形状是非常强大的。

突破奖旨在表彰基础物理学、生命科学和数学领域的领先研究人员。 每个奖项都有 300 万美元的奖金,由创始赞助商谢尔盖·布林提供; 普莉希拉·陈和马克·扎克伯格; 尤里和朱莉娅米尔纳; 和安妮·沃西基。

“蛋白质是运行细胞的纳米机器,从氨基酸序列预测它们的 3D 结构对于理解生命的运作至关重要,”该基金会的声明中写道。 “与他们在 DeepMind 的团队一起,Hassabis 和 Jumper 构思并构建了一个深度学习系统,可以准确、快速地模拟蛋白质的结构。”

DeepMind 团队使用 AlphaFold 编制了一个包含大约 2 亿个蛋白质结构的数据库,包括由植物、细菌、真菌和动物制造的蛋白质,此前曾报道过。该数据库包括几乎所有科学已知的编目蛋白质。

人工智能系统通过研究现有数据库中编译的已知蛋白质结构“学会”组装这些形状。这些蛋白质结构已通过一种称为 X 射线晶体学的技术进行了艰苦的可视化,该技术涉及用 X 射线扫描晶体蛋白质结构,然后测量这些射线如何衍射。

在这些现有数据库中,AlphaFold 确定了蛋白质氨基酸序列与其最终 3D 形状之间的模式。然后,使用神经网络——一种受大脑中神经元如何处理信息的松散启发的算法——人工智能使用这些信息迭代地提高其预测已知和未知蛋白质结构的能力。

哈萨比斯在一篇文章中写道:“看到研究界采用 AlphaFold 的无数方式,从了解疾病、保护蜜蜂、破译生物谜题,到更深入地研究生命本身的起源,这真是令人鼓舞。” 7 月发布的声明

“作为‘数字生物学’这一新兴领域的先驱,我们很高兴看到人工智能的巨大潜力开始成为人类推动科学发现和理解生命基本机制的最有用的工具之一,”他写道.

发表回复