【2024諾貝爾化學獎深度解析-2】蛋白質設計與結構預測

發表者 SPEC科學推展中心

34 觀看次數

中央研究院生物化學研究所吳昆峯副研究員授權轉載 │ 原文連結


圖片來源: https://www.nobelprize.org/prizes/chemistry/2024/summary/

2024年諾貝爾化學獎於台灣時間10月9日下午5:45公告,獲獎者有三位。分別是華盛頓大學的David Baker以及DeepMind的Demis Hassabis與John M. Jumper。 其中David Baker獲得了一半的獎金,Demis Hassabis與John Jumper則共享了另外一半的獎金。 這三位學者的學術貢獻在於David Baker是使用電腦軟體設計蛋白質的先驅,而Demis Hassabis與John Jumper是成功引入人工智慧(AI, Artificial Intelligence)技術,開發出AlphaFold 以預測蛋白質的三維結構。

諾貝爾奬官方簡介 / 新聞記者會 / 新聞稿 / 科普知識 / 進階內容(背景故事)

DNA 轉錄成RNA,RNA的資訊轉譯成蛋白質 (Protein)是生命科學的中心觀念 (central dogma),有多位學者因這部分的研究與調控的機制獲得諾貝爾獎,包含

 

  • James Watson 與 Francis Crick (1962年醫學獎)
  • Andrew Z. Fire 與 Craig C. Mello (2006年生理與醫學獎)
  • Venkatraman Ramakrishnan, Thomas A. Steitz 與 Ada E. Yonath (2009年化學獎)
  • Frances H. Arnold (1/2) (2018年化學獎)
  • Katalin Karikó 與 Drew Weissman (2023年生理與醫學獎)
  • Victor Ambros 與 Gary Ruvkun (2024年生理與醫學獎)

 

相較於DNA的雙股螺旋三維結構,RNA的單股纏繞構型,蛋白質的結構非常複雜。蛋白質的結構可分拆為一級序列,二級結構單元,三級構型以及四級組合。其中一級序列是從RNA轉錄過來的資訊,有20種必須胺基酸組合出蛋白質一級序列,這些序列在經過核糖體(ribosome)合成出蛋白質序列後,會產生alpha-螺旋,或是beta-折板的二級結構單元,整個蛋白質的序列可包含多個alpha-螺旋與beta-折板,這一系列的二級結構單元會根據其特性而排列、折疊、最終組合出蛋白質的三維結構。從一級別到三維結構這個過程顯示出蛋白質的折疊的複雜度。有些時候,蛋白質會聚集成複合體,如血紅蛋白(Hemoglobin)是兩對珠蛋白單體的聚合,這是第四級組合。

圖片來源: https://www.news-medical.net/life-sciences/Protein-Folding.aspx
 

但是蛋白質如何折疊呢?能否使用物理跟化學的法則作出預測呢?如何知道預測的結果是正確的呢? 這些問題在學界是個長達50年的懸而未決的問題。因為蛋白質的序列可長可短,短的約是50-80顆胺基酸,長的時候可以超過2000顆胺基酸。實驗學家一直希望從序列的變化之間,找出一個規則,用來推測蛋白質的折疊流程,進而解出蛋白質的三維結構。

 

而物種之間的蛋白質數目也有明顯差異,人類基因組計劃完成後,發現人類基因編碼著2-3萬種不同的蛋白質,低等的細菌則只有2000-3000種蛋白質來執行細胞的生理功能。在西元2000年之後,世界各國爭相投入經費與資源,使用結構生物學的技術,嘗試解構各式各樣不同物種之間的蛋白質,希望增加蛋白質資料庫(Protein Data Bank, PDB)內的蛋白質結構與序列的差異度,因為資料庫深度足夠後,可協助預測結構的準度。而這些實驗的技術,包含X光繞射,核磁共振,電子顯微鏡,以及電腦模擬計算,都是過去百年來的諾貝爾獎獲獎技術。在技術已臻開發完善,科學家才有機會實作,解析出大量不同蛋白質的結構後,才能有完善的經驗法則,成功預測未知的蛋白質的三維結構。

 

開發這些技術與應用技術而獲得諾貝爾獎的學者包含:

 

  • X-光 晶體繞射與生物分子結構
  • Max von Laue (1914年物理獎)
  • William Henry Bragg 與 William Lawrence Bragg (1915年物理獎)
  • Max Ferdinand Perutz 與 Cowdery Kendrew (1962年化學獎)
  • James Watson 與 Francis Crick (1962年醫學獎)
  • Dorothy Crowfoot Hodgkin (1964年化學獎)
  • Herbert A. Hauptman 與 Jerome Karle (1985年化學獎)
  • Johann Deisenhofer, Robert Huber 與 Hartmut Michel (1988年化學獎)
  • Venkatraman Ramakrishnan, Thomas A. Steitz 與 Ada E. Yonath (2009化學獎)
  • Robert J. Lefkowitz 與 Brian K. Kobilka (2012年化學獎)
  • 電子顯微鏡
  • Ernst Ruska, Gerd Binnig 與 Heinrich Rohrer (1986年物理獎)
  • Jacques Dubochet, Joachim Frank 與 Richard Henderson (2017年化學獎)
  • 核磁共振
  • Isidor Isaac Rabi (1944年物理獎)
  • Felix Bloch 與 Edward Mills Purcell (1952年物理獎)
  • Richard R. Ernst (1991年化學獎)
  • Kurt Wüthrich (1/2) (2002年化學獎)
  • Paul C. Lauterbur 與 Sir Peter Mansfield (2003年生理與醫學獎)
  • 電腦模擬
  • Martin Karplus, Michael Levitt 與 Arieh Warshel (2013年化學獎)


David Baker在1993年開始他在華盛頓大學的研究,逐漸把重心從純化蛋白質與分析折疊,轉向到使用電腦軟體設計與預測蛋白質的結構。這是一個很前驅的舉動。在1998年開始,他與研究人員開發名為Rosetta的軟體,這個軟體套用了蛋白質內的種種物理與化學法則,經過了數年的努力,他們於2003年的Science期刊發表了一篇劃時代的研究。David Baker跟他的學生 Brian Kuhlman成功設計一個代號為Top7的蛋白質,這個Top7有93顆胺基酸,但是蛋白質序列是人工設計,不存在於自然界的任何一個物種之間。他們使用Rosetta預測了Top7的三維結構,用核磁共振學驗證了Top7的折疊,接著用X光晶體繞射法,成功解析出Top7的三維結構。下圖是Top7的Rosetta預測 (藍色)與X光繞射晶體結構(紅色),預測與實作的內容相差慎小,可見Rosetta能精準的設計蛋白質的結構。這個研究成果在當年是一個重大的指標。Baker樹立一個嶄新的研究方向,蛋白質的結構可以先用Rosetta軟體設計出序列與預測三維結構,如果準確度夠高,不需要實驗驗證,可直接使用作為藥物設計或眾多應用。

圖片來源: https://www.science.org/doi/10.1126/science.1089427 圖4C

 

經過七年,David Baker再度震撼了世界。他與實驗室成員使用Rosetta軟體成功設計出世界第一個人造蛋白質酶。他們設計了代號DA_20的一個人造酵素,可以成功執行Diels-Alder reaction (狄耳士–阿爾德反應),這個反應執行了環化反應,把下圖的化合物 1 (左) ,經由DA_20的輔助,加上化合物 2,產生鍵結跟環化,而做出反應物 4。這個研究的指標性意義是蛋白質不只可以用Rosetta設計跟預測正確的三維結構,還可以執行預期的化學反應。

圖片來源 https://www.science.org/doi/10.1126/science.1190239 圖1

在近年來導入人工智慧技術後,David Baker與他的研究人員把Rosetta改造成RoseTTAFold這套使用深度學習訓練過的新軟體,在結構預測上準確度更高,因使用GPU計算,花費的時間也更短。他們也加強了RoseTTAFold的功能,衍生出RoseTTAFold-Diffusion,可執行生成式人工智慧,設計出一個不存在的蛋白質,且折疊正確,功能確認。甚至套用定向演化 (Directed Evolution)的概念與深度學習,設計一套軟體名為ProteinMPNN。ProteinMPNN使用蛋白質的結構為範本,大幅度的修改胺基酸序列,創造出一個自然界不存在的序列版本,卻仍維持與範本相同的蛋白質序列長度與三維結構。這些巨大的貢獻加速了蛋白質設計,不僅提高準度,拉高深度,更擴充廣度。讓科學家從空想,變成下指令,虛擬篩選後,精準設計出有效的蛋白質。這些技術,近年來已被應用到抗體的篩選,細胞內酵素的功能調節,以及阻隔新冠病毒的進入宿主細胞,大大地降低病毒感染風險。

 

蛋白質的結構預測在過去20年來一直是重大的研究主題。科學家自發性的組織一個稱為CASP (Critical Assessment of Structure Prediction)的結構預測競賽。這個競賽每2年舉辦一次,由結構生物學家使用上述多種不同的技術解出蛋白質的三維結構,並提供蛋白質序列給參賽者進行預測。在2018年之前,David Baker實驗室的Rosetta一直是預測結果的大贏家,成功率約略5成上下。在2018年,AlphaFold橫空出世,直接把成功率拉到近6成,兩年後,AlphaFold2這個版本把成功率推進到8成以上。

 

AlphaFold是由DeepMind 這間公司開發,CEO是Demis Hassabis,執行計畫的科學家是John Jumper。在DeepMind投入蛋白質結構預測之前,他們在2013-2016年設計了圍棋的對弈軟體AlphaGo,並於2016年9月以這軟體成功地擊敗世界棋王韓國的Lee Sedol (李世乭),在五場對戰之中,AlphaGo贏了四局,李世乭僅贏了第四局,卻也是目前唯一有贏過AlphaGo的人類。

 

在圍棋對弈軟體的成功後,DeepMind認知到若要套用人工智慧技術,挑戰更困難的問題,要轉向生物系統。他們決定使用人工智慧的深度學習方法,破解蛋白質折疊的秘密。Demis Hassabis與John Jumper借用自然界蛋白質的序列與已解出的蛋白質結構為訓練材料,設計出AlphaFold,讓AlphaFold 只需要取得蛋白質的胺基酸序列後,分析這段序列與自然界基因組資訊,在使用深度學習訓練的模型,把序列上各個區段的二級結構單元套入並組合成3度空間的互動。這種折疊的預測在2018年當時是一個顛覆時代的的科學實驗方法。在這之前,蛋白質結構的預測都是採用歸納過的物理力學以及胺基酸內各個原子的化學特性,進行組合。

圖片來源: https://www.nobelprize.org/prizes/chemistry/2024/popular-information/

因為AlphaFold2 的巨大成功,在2020年後,學界已認可AlphaFold2預測結構的準度,並大幅度使用為日常研究用的資訊,或學術研究的文章數據之一。DeepMind公司也與歐洲生物資訊中心(EBI)合作,把已知的48個物種的共2億個蛋白質的序列全部預測一番,並把這些資訊無償釋出給學界跟普羅大眾。此預測的2億個蛋白質結構收錄於AlphaFold Protein Structure Database。

 

成功預測蛋白質結構並沒有讓Demis Hassabis與John Jumper就此打住,因為蛋白質往往會與不同的分子互動,包含小分子、設計的藥物、蛋白質與核酸(DNA, RNA)。DeepMind在AlphaFold2中,已有能力分析蛋白質-蛋白質之間的互動,並成功把兩個/多個蛋白質之間的四級結構預測。此套件稱為AlphaFold-Multimer。這個技術的成功,可預測人類基因組內或是任何一個物種基因組內的蛋白質互動網路,未來將可模擬各種細胞內蛋白質與疾病的關係。

 

DeepMind在2024年把AlphaFold進化到第三版(AlphaFold3),這個版本的功能更廣泛了,除了原本AlphaFold2的功能有優化,更可分析後轉譯修飾(Post-translational modification, PTM)的蛋白質的結構,比方說磷酸化、甲基化或更多化學修飾過的蛋白質。這把原本2-3萬個人類基因組內的蛋白質結構擴展了十倍、百倍的深度。生物學家未來可使用這些資訊,分析後轉譯修飾對細胞內的種種PTM調控的蛋白質的功能。

 

結論:


蛋白質的結構極其複雜,要使用實驗的方式分析並計算出三維空間的結構費時費力,可能要一個研究生花費2-5年的時間才能解析完成。了解蛋白質的結構才能對蛋白質的功能進行精準調控。過去20年來,結構生物學家花費太多時間在解析三維結構,而無更多精力分析結構後面的深度意義。這三位獲獎者站在過去50年來結構生物學技術蓬勃發展的基石之上,開展了全新的預測、分析與設計的方法,讓蛋白質折疊與結構不再是深不可測的秘密,創造無限大的應用性。

 

除了AlphaFold,2020-2024 四年來眾多以人工智慧為基底的結構預測軟體如雨後春筍般的公開。未來數年,人工智慧的技術將會大幅度地應用在蛋白質的相關實驗,生物學家過去無法用實驗解決的問題,有可能被突破。這如同過去30年來基因定序從花費1-2年與巨大金額才能完成的基因組定序,到現在可以客製化、專一性的系統化研究個人基因圖譜。

 

再者,蛋白質相關的藥物開發,永續環保的固碳、塑膠分解,工業應用的酵素都可以使用這三位學者的先驅貢獻,加速研發,減低成本,提高效能。可預期在不久的將來,眾多新穎的人工智慧媒介的蛋白質藥物將會進入臨床測試,也可能有進入醫療市場,對抗疾病。


延伸閱讀

本文版權所有,請勿隨意節錄部分內文。
如有刊登需求,請洽kpwulab@gmail.com索取版權使用同意。