剛剛,AlphaFold 3 登上 Nature:所有生命分子的結構和相互作用,都被 AI 預測了

就在剛剛,新一代 AlphaFold——由 Google DeepMind 和 Isomorphic Labs 研究團隊推出的革命性人工智能(AI)模型 AlphaFold 3——登上了權威科學期刊 Nature。

據介紹,AlphaFold 3以前所未有的精確度成功預測了所有生命分子(蛋白質、DNA、RNA、配體等)的結構和相互作用。

與現有的預測方法相比,AlphaFold 3 發現蛋白質與其他分子類型的相互作用至少提高了 50%,對於一些重要的相互作用類別,預測準確率甚至提高了一倍。

研究團隊認爲,AlphaFold 3 將有助於改變我們對生物世界和藥物發現的理解,進而開啓人工智能細胞生物學的新時代。

爲了利用 AlphaFold 3 在藥物設計方面的潛力,Isomorphic Labs 已經與製藥公司合作,將其應用於現實世界的挑戰,並最終爲一些對人類造成最具破壞性影響的疾病開發出新的療法。

相關研究論文以“Accurate structure prediction of biomolecular interactions with AlphaFold 3”爲題,已發表在 Nature 上。

此外,Google DeepMind 也基於 AlphaFold 3 推出了一個免費平臺——AlphaFold Server,供全世界的科學家利用它進行非商業性研究,預測蛋白質如何與細胞中的其他分子相互作用。

只需點擊幾下,生物學家就可以利用 AlphaFold 3 爲由蛋白質、DNA、RNA 以及選擇的配體、離子和化學修飾組成的結構進行建模。

對此,Francis Crick 研究所 Uhlmann 實驗室的研究科學家 Céline Bouchoux 評價道:

“AlphaFold 3 一經發布,有可能像 AlphaFold 一樣具有開創性。有了 AlphaFold Server,其不再僅僅是預測結構,而是慷慨地提供訪問權限: 允許研究人員提出大膽的問題,並加速發現 。”

AlphaFold 3 是如何煉成的?

每個植物、動物和人類細胞內都有數十億臺“分子機器”。它們由蛋白質、DNA 和其他分子組成,但沒有任何單獨的部分可以獨立工作。只有看到它們如何在數百萬種組合中相互作用,人類才能開始真正瞭解生命的進程。

近年來,基於人工智能技術的 AlphaFold 系列模型在這方面取得的成就,給人類帶來了足夠的震撼和新的認知。

AlphaFold 首次於 2020 年問世,其和迭代版 AlphaFold 2 能夠根據蛋白質的氨基酸(蛋白質的基本成分)序列預測其 3D 結構,如今全球已有數百萬研究人員將 AlphaFold 2 應用在瘧疾疫苗、癌症治療和酶設計等領域,有了不少新的發現;之後的 AlphaFold-Multimer 則推動了對蛋白質-蛋白質複合物的預測。

然而,由於不同類型的特異性相互作用差異太大,擴大單一深度學習模型可以預測的複合物範圍一直是一個未解決的難題。

在這項工作中,研究團隊認爲,AlphaFold 3 可以將我們從蛋白質帶入廣泛的生物分子領域。這一飛躍有望開啓更具變革性的科學——從開發生物可再生材料和更具抗逆性的作物,到加速藥物設計和基因組學研究。

據論文描述,只需給定一個分子輸入列表,AlphaFold 3 就能生成它們的聯合 3D 結構,揭示它們是如何組合在一起的。

AlphaFold 3 可以對蛋白質、DNA 和 RNA 等大型生物分子進行建模,當然也包括小分子,比如配體,許多藥物的作用機制是通過作爲配體與特定蛋白質或其他生物分子結合來實現的。

圖| 在土生真 菌中發現的酶( 來 源 : Google DeepMind )

此外,AlphaFold 3 還可以模擬這些分子的化學修飾(控制着細胞的健康功能),這些細胞一旦受到破壞就會導致疾病。

AlphaFold 3 的強大能力,來自於其新一代的架構和訓練(已經涵蓋了所有生命分子)。其核心是改進版本的 Evoformer 模塊,這是一種深度學習架構,是 AlphaFold 2 取得成功的基礎。在處理輸入後,AlphaFold 3 使用擴散網絡(類似於人工智能圖像生成器中的擴散網絡)進行預測。擴散過程從原子雲開始,經過多個步驟,最終形成最精確的分子結構。

研究團隊表示,AlphaFold 3 對分子相互作用的預測準確性超過了所有現有系統。作爲一個以整體方式計算整個分子複合物的單一模型,它具有統一科學見解的獨特能力。

引領藥物發現

AlphaFold 3 具備了藥物設計的能力,可以預測藥物中常用的分子(如配體和抗體),這些分子可與蛋白質結合,改變蛋白質在人類健康和疾病中的相互作用方式。

AlphaFold 3 在預測類似藥物相互作用(包括蛋白質與配體的結合以及抗體與靶蛋白的結合)方面達到了前所未有的準確性。

在無需輸入任何結構信息的情況下,AlphaFold 3 在 PoseBusters 基準測試中的準確率,比最好的傳統方法高出 50%,是首個超越基於物理的生物分子結構預測工具的人工智能系統。

預測抗體與蛋白質結合的能力,對於瞭解人體免疫反應的各個方面以及設計新的抗體至關重要,這是一種不斷增長的治療方法。

據瞭解,Isomorphic Labs 將 AlphaFold 3 與一套補充的內部人工智能模型結合,正在爲內部項目以及製藥合作伙伴進行藥物設計;他們正在利用 AlphaFold 3 加快並提高藥物設計的成功率——通過確定新的疾病靶點,並開發新的方法來觸及以前無法實現的現有靶點。

不足與展望

AlphaFold 3 的問世,使生物世界變得更加清晰。

它讓科學家能夠看到細胞系統的所有複雜性,包括結構、相互作用和修飾等。這個觀察生命分子的新窗口揭示了它們之間的聯繫,有助於瞭解這些聯繫如何影響生物功能,如藥物的作用、激素的分泌和 DNA 修復的健康保護過程等。

研究團隊表示,AlphaFold 3 的潛力已經顯現,他們迫不及待地想知道未來會發生什麼。

然而,正如他們在論文中寫道的,AlphaFold 3 模型依然存在一些侷限性,需要進一步的研究和改進。例如:

立體化學限制:模型輸出的立體化學有時會違反手性規則,儘管輸入是正確手性的參考結構。另外,模型偶爾會產生重疊的原子。

幻覺影響:從非生成性的 AlphaFold2 模型轉換到基於擴散的 AlphaFold3 模型,引入了在無序區域中產生虛假結構秩序(幻覺)的挑戰。雖然幻覺區域通常被標記爲低置信度,但它們可能缺乏 AlphaFold2 在無序區域中產生的典型絲帶狀外觀。

預測準確性問題:對於某些目標,準確預測仍然具有挑戰性。爲獲得最高精度,可能需要生成大量預測並對其進行排名,這增加了計算成本。特別是對於抗體-抗原複合物,預測質量隨着模型種子的數量增加而顯著提高。

結構構象限制:模型預測的結構構象可能不正確或不夠全面,這取決於指定的配體和其他輸入。例如,E3 泛素連接酶在無配體時呈現開放構象,但模型預測的構象只有閉合狀態。

缺乏動態信息:模型主要預測生物分子系統的靜態結構,而不是在溶液中的動態行爲。

特定目標預測限制:對於某些特定類型的生物分子複合物,模型的預測可能存在侷限性。

儘管在所有相互作用類型中實現高度準確的預測,仍然存在一些實質性挑戰,但 AlphaFold 3 證明,可以構建一個深度學習系統,對所有這些相互作用顯示出強大的覆蓋和泛化能力。

未來,實驗結構測定方法的進步,如冷凍電鏡和斷層掃描技術的顯著改進,將提供大量新訓練數據,進一步改善這類模型的泛化能力。

而且,隨着深度學習技術的不斷髮展,以及實驗結構測定方法論的不斷革新,結構建模將繼續進步,推動我們進入一個結構信息驅動的生物理解和治療開發的時代。

https://www.nature.com/articles/s41586-024-07487-w

|點擊關注我 記得標星|