世界不思議

人工智慧解決了蛋白質摺疊的問題


AlphaFold神經網絡有史以來第一次能夠根據其胺基酸序列準確預測複雜蛋白質的空間形狀。

人工智慧解決了一個問題,該問題在半個世紀以來一直是生物學最緊迫的問題之一:從原發性蛋白質預測三級結構。現在,知道了一個大蛋白質分子的胺基酸序列,就有可能計算出其三維空間構型。英國創業公司DeepMind在一份新聞稿中宣布了這一成就。

事實是,蛋白質的特性和功能是由蛋白質的三維結構決定的,而關於蛋白質如何發揮作用的許多重要發現正是基於這種結構。幾十年來,為此使用了諸如X射線晶體學,核磁共振或低溫電子顯微鏡的方法,這些方法耗時,複雜且費力。然而,即使他們並不總是能應付。結果,今天已經建立了科學已知的約2億個蛋白質中約17萬個蛋白質的3D結構。

同時,在自然界中,蛋白質的三級結構是由一級分子(形成這些分子鏈的胺基酸序列)決定的:它們自身自然摺疊。此過程稱為蛋白質摺疊。毫不奇怪,多年來科學家一直在努力對其進行數學建模。任務變得如此複雜,以至於即使使用超級計算機也無濟於事:需要為包含數百個胺基酸的分子計算出的變異數是天文數字。

AD:韓國幸福持久口溶片 isentrips.com

為了激勵朝這個方向開展工作,自1994年以來,每兩年進行一次CASP(蛋白質結構預測的關鍵評估)試驗。來自世界各地的此類項目和算法的創建者獲得了約一百種蛋白質的胺基酸序列,其結構仍是未知的,並正在嘗試使用其模型進行計算。同時,科學家正在實驗室中使用「經典」的結構生物學方法進行研究。然後比較結果結構,計算匹配值-GDT。

GDT值從90到100被認為是結構的準確預測,而對於由幾十個胺基酸組成的短肽來說,這是在1990年代實現的。然而,對於包含數百個胺基酸的蛋白質,多年來氣體放電管保持在一個「可恥」的水平-僅在幾年前大約20,使用複雜的算法,這個數字被帶到40,這仍然是不夠的。

AD:韓國幸福持久口溶片 isentrips.com

自2018年以來,由英國公司DeepMind開發的AlphaFold項目也一直參與CASP競賽-之前創建AI就是為了擊敗圍棋遊戲的專業人士。即使這樣,AlphaFold在評級中的佼佼者,展示GDT在高達60即使是最複雜結構的水平。在2020年的競賽中,對AI進行了改進,並針對170,000種已知蛋白質結構進行了培訓。在測試中,他能夠預測最複雜分子的平均GDT超過92和87的摺疊。

專家們已經將這一事件稱為近年來最重要的突破之一。也許,神經網絡將很快使根據需要動態計算蛋白質的三維結構成為可能。以前如此艱巨的任務使得其中一些作品的作者獲得了諾貝爾獎,這將成為日常工作。

Related Articles

Back to top button