撰稿 / 朱舢樺 (科學推展中心特約編輯)
蛋白質是構成生命的基石,幾乎參與了所有生物體內的重要活動。透過設計蛋白質,可以實現如新藥開發等多樣化應用。中央研究院生物化學研究所吳昆峯副研究員團隊致力於解析蛋白質的構型與穩定度以及蛋白質設計,本文將介紹研究團隊針對設計泛素變異體所採用的兩種不同方法:循理性設計與人工智慧設計。
生物體內調控蛋白質的幫手—泛素
泛素(Ubiquitin, UB)是長度為76個胺基酸的小蛋白質,和蛋白質的轉譯後修飾有關,影響細胞內的蛋白質平衡。泛素就像是一個標記一般,蛋白質被加上不同的泛素標記後,會根據標記的類型及位置,觸發不同的細胞反應與功能調控,例如當蛋白質被加上K48鍵結的泛素鏈後,被會送進蛋白酶體中降解而細胞內的泛素共有8種基本標記(鏈結),並可能相互連接,增加調控蛋白質恆定的變化。
負責在蛋白質上加上泛素修飾的有三個酵素群組,分別是E1啟動酶、E2結合酶、E3連接酶,細胞內約有共800款E1, E2, 與E3泛素酶負責執行蛋白質的泛素化反應。而去泛素酶(deubiquitinases, DUBs)則會將泛素標記移除。這四種酶在細胞內有固定的相互調控機制,因此,增加酶的活性或是抑制酶的作用能夠達到影響細胞生理的效果。
循理性設計蛋白質—潛力抗病毒藥物UbV5
中東嚴重呼吸症冠狀病毒MERS的去泛素酶PLpro可以干擾宿主的防禦系統,並在病毒複製過程中起著關鍵作用。抑制PLpro不僅可以中斷病毒的複製,還能防止PLpro損害宿主的先天免疫反應,具有一石二鳥的效果。研究團隊與與加州大學河濱分校化學系的張嘉恩教授組成一跨國團隊,藉由設計出數個和PLpro的結合能力遠高於泛素的泛素變異體,降低病毒的去泛素酶PLpro和泛素的結合機會,達到抑制PLpro的效果,此研究於2023年12月刊登於國際期刊《Journal of Molecular Biology》。
在此循理性設計方法中,了解蛋白質間交互作用(protein–protein interactions, PPIs)並精確選擇要突變蛋白質位點十分重要,因為減少突變的位點可以降低製造出的蛋白質不穩定的風險。不同於傳統觀念已增加互動網絡熱點的方式,研究團隊認為優化原有熱點即可強化結合,改善親和力。故團隊先建立PLpro和泛素之間的互動網絡,標定出高度互動的位點進行優化式修改,如此,只需改變泛素蛋白質的少數幾個胺基酸側鏈,就能提高與PLpro的結合能力。
研究團隊僅突變一個胺基酸位點64,從Glutamic acid轉換成Tyrosine,便使親和力增加185倍。後續增加兩個突變位點 A46F及K48E稱為UbV3,其親和力增強到14,700倍,抑制能力已從單一點E64Y的180倍到三點突變的3,500倍,最後,研究團隊發表一個五位點突變版本稱為 UbV5,便能使泛素變異體與PLpro的親和力較泛素高了27,500倍,抑制PLpro活性的效果也強化了5000倍以上!
本跨國團隊研究結合電腦計算和實驗驗證,設計出的泛素變異體UbV5有望作為抗MERS病毒的先驅藥物,也可套用到新冠病毒以及其他病毒的關鍵酵素的蛋白質型抑制劑的藥物開發。
圖1. 循理性設計蛋白質流程
運用人工智慧設計蛋白質—增加E3連接酶活性
在另一研究中,研究團隊結合了深度學習工具ProteinMPNN及AlphaFold2,設計出了能增加E3連接酶Rsp5活性的泛素變異體R4,此研究於2023年8月刊登於國際期刊《ACS Synthetic Biology》。
ProteinMPNN是由2024年諾貝爾化學獎得主David Baker的實驗室所研發的深度學習軟體。和循理性設計的策略不同,前者的策略是精準突變,而ProteinMPNN大幅度的更改蛋白質的序列。大量的突變通常會導致蛋白質結構不穩定,進而破壞二級和三級結構。但若給予ProteinMPNN一個蛋白質範本,能在不改變蛋白質二級和三級結構的情況下設計出此蛋白質的變異體。若給予ProteinMPNN的範本是蛋白質複合體,諸如「E3連接酶與泛素」,則可在改變蛋白質序列的同時,優化兩蛋白質間的互動網路。不同於前段採用的循理性精準式篩選,人工智慧軟體可跳脫既有思考窠臼,採用深度學習的經驗法則,提供截然不同的變異體,可擴大蛋白質設計的廣度與深度。
研究團隊率先運用軟體ProteinMPNN來設計泛素蛋白質序列後,再套用結構預測軟體AlphaFold2預測「E3連接酶—泛素變異體」複合體的三維結構,以驗證設計出的泛素變異體與E3連接酶Rsp5的結合是否維持與範本相同,若是相同,則這些變異體有可能呈現更好的結合能力。
接著,研究團隊從6,000組序列數據中篩選出20個泛素變異體來進行實驗驗證,指出20個泛素變異體中,便有5個變異體能有效的增加Rsp5的活性,成功率達25%,效率極佳。而泛素變異體R4的親和力較泛素高25倍,並能使Rsp5的活性增加6倍。縱使R4的胺基酸序列與泛素差異了32個突變點,但兩者的晶體結構幾乎一致,顯示ProteinMPNN優化蛋白質序列的方式的強大能力,令人十分驚豔。此外,此方法在預測新的蛋白質序列上極度快速,十分鐘即可產生上千種候選序列,佐以結構預測軟體篩選優質序列,能大幅降低人力和時間成本。此次研究在短短三個月內便能完成所有實驗流程。研究成果也是開發者David Baker實驗室外,學界首篇套用ProteinMPNN軟體,自動化設計蛋白質序列,並呈現出高差異度序列,成功率高與具有活化能力。
圖2. 運用人工智慧設計蛋白質流程
此兩篇研究分別使用了不同策略,提出了兼具效率及成效的設計流程,為未來的蛋白質研究提供了重要參考方向,尤其是抗體開發,工業用蛋白質與蛋白質藥物的設計,可望降低研究成本,提高精準度,並縮短研究時程。