人工智能賦能科研 中國科大團隊推出最高效蛋白質口袋生成算法之一

小分子和蛋白質之間的結合相互作用是人體中最重要和廣泛的分子間相互作用。在藥物發現和生物醫療領域,設計與小分子結合的功能蛋白質具有重要意義。記者11月18日從中國科大獲悉,中國科學技術大學認知智能全國重點實驗室劉淇指導博士生張載熙和哈佛大學醫學院Marinka Zitnik 課題組合作,設計了深度生成算法PocketGen,用於生成與小分子結合的蛋白質口袋序列和空間結構。相關研究成果於2024年11月15日發表於《自然·機器智能》(Nature Machine Intelligence)期刊。

近年來,在人工智能的幫助下,科學家們創造出了一個又一個全新的蛋白質,幫助研發出新的靶向藥物、更小的生物傳感器。美國華盛頓大學David Baker教授因其在蛋白質設計領域的開創性貢獻獲得2024年諾貝爾化學獎。PocketGen承擔的任務與David Baker實驗室的生成模型RFDiffusion和RFDiffusionAA類似,但在蛋白質的生成效率和成功率方面取得了進一步突破。

PocketGen主要用於生成與小分子結合的蛋白質口袋序列和空間結構。蛋白質口袋是蛋白質上適合與特定分子結合的空腔,每個蛋白質口袋都是一個特定的結合點位。當小分子與之緊密結合後,會引起蛋白質的構象變化,進而激活或者調節蛋白質功能。

要想設計蛋白質口袋,傳統方法是通過能量優化和模板匹配,但是計算效率慢、成功率低。現有的基於深度學習的模型又並非專爲研究蛋白質-小分子相互作用而設計,可能無法充分描述蛋白質與小分子結合口袋區域之間的特徵。PocketGen的成功開發爲該問題的解決提供了新的方案。

該算法由雙層圖Transformer編碼器和蛋白質預訓練語言模型兩部分組成。兩者分別對應蛋白質的結構信息和序列信息。通過兩個部分同時進行信息處理和不斷迭代,最終生成所需要的蛋白質口袋。

PocketGen在計算效率和蛋白質口袋設計的成功率方面表現亮眼,是目前全球最高效、最高成功率的蛋白質口袋設計算法之一。在實驗中,PocketGen模型不僅在親和力和結構合理性等指標上超過傳統方法,在計算效率方面也有大幅提高(相比傳統方法提高10倍以上)。審稿人也對該工作給予高度評價,認爲“與最先進的方法相比,該方法顯著提高了結合親和力和有效性,表現出更快的性能和更高的成功率。”

PocketGen推進了深度生成模型用於功能蛋白質設計,爲進一步理解蛋白質設計規律並開展生物實驗驗證奠定了基礎,未來在藥物開發、生物傳感器、酶催化等領域具有廣泛的應用前景。

“人工智能方法在解決藥物研發和生物工程領域重要科學問題上的優勢已經展現,接下來,我們計劃設計一款將人工智能和傳統方法結合起來的模型,更好地發揮不同的方法的長處。”張載熙博士說。(通訊員 聶詩琦 記者 汪喬)