世間幾乎所有已知蛋白質結構,都被DeepMind開源了

科學界已知的幾乎所有蛋白質結構,都在這裡了。

蛋白質是生命的基礎構件,它們由氨基酸鏈組成,摺疊成不同的複雜形狀。蛋白質的功能通常由其 3D 結構決定。如果我們了解蛋白質的摺疊方式,就可以開始探索它們是如何工作的,並嘗試改變它們的功能。儘管 DNA 提供了製造氨基酸鏈的指令,但預測它們如何相互作用以形成蛋白質的 3D 結構是一個巨大的挑戰。

一年前,DeepMind 發佈了 AlphaFold2,以原子水平的準確度預測了 2/3 的蛋白質結構,並與 EMBL-EBI 共同發佈了開放可搜尋的蛋白質結構資料庫 AlphaFold DB,與世界共同分享這一技術。

7 月 28 日,DeepMind 宣佈AlphaFold DB已從 100 萬個結構擴展到超過 2 億個結構,擴大超過 200 倍,這一進展將極大地提升人們對於生物學的理解。

幾乎涵蓋所有已知蛋白質

「你可以認為它基本涵蓋了所有蛋白質結構。包括植物、細菌、動物和許多其他生物的預測結構,這為 AlphaFold 開闢了巨大的新機會,可以對環保、糧食安全和被忽視疾病等重要問題產生影響,」DeepMind 創始人、執行長傑米斯 · 哈薩比斯在介紹 AlphaFold DB 這次擴展時說道。

這一更新包括植物、細菌、動物和其他生物的蛋白質預測結構。

這一更新意味著蛋白質資料庫 UniProt 都將帶有蛋白質預測結構(UniProt 是一個全面的,高質量的,免費使用的蛋白質序列與功能資訊資料庫,它還包含了大量來自研究文獻的關於蛋白的生物學功能資訊)。研究者可以通過 Google Cloud Public Datasets 批量下載,讓世界各地的科學家更容易訪問 AlphaFold。

斯克裡普斯轉化研究所創始人 Eric Topol 表示:「AlphaFold 是生命科學領域獨一無二的重大進步,展示了 AI 的力量。過去確定蛋白質的 3D 結構需要數月或數年,現在只需幾秒鐘。AlphaFold 已經加速並實現了大規模發現,包括破解核孔複合體的結構。新的蛋白質結構不斷增加,幾乎照亮了整個蛋白質宇宙,我們可以期待每天都有更多的生物謎團被解開。」

AlphaFold 的影響

自發布至今,AlphaFold 已產生令人難以置信的影響。它是 DeepMind 構建的最複雜的人工智慧系統,需要多項關鍵創新,並已應用到多種下游任務中。

AlphaFold2 可以在原子精度上準確地預測蛋白質的結構,它不僅為生物學中 50 年來的重大挑戰提供了解決方案,也證明了:人工智慧可以極大地加速科學發現,進而推動人類進步,這一點意義重大。

DeepMind 已經開源了 AlphaFold 的程式碼,並在《自然》雜誌上發表了兩篇深度論文,引用量已超過 4000。此外,DeepMind 還與 EMBL-EBI 合作設計了一種幫助生物學家使用 AlphaFold 的工具,並共同發佈了 AlphaFold DB。

在發佈 AlphaFold 之前,DeepMind 徵求了 30 多名生物學研究專家的意見,使得他們以最大化潛在利益和最小化潛在風險的方式與世界分享 AlphaFold 。

迄今為止,來自 190 個國家 / 地區的超過 500000 名研究人員訪問了 AlphaFold DB,查看了超過 200 萬個結構。一些免費提供的蛋白質結構也已集成到其他公共資料集中,例如 Ensembl、UniProt 和 OpenTargets,被數百萬使用者訪問。

在與其他機構合作時,DeepMind 優先考慮那些最具積極社會效益的應用,重點關注那些資金不足或被忽視的計劃。

拼湊核孔複合體

在最新一期《科學》雜誌特刊上,幾個研究團隊描述了 AlphaFold 幫助拼湊核孔複合體——生物學中最具挑戰性的難題之一。這個巨大的結構由數百個蛋白質部分組成,控制著進出細胞核的一切。

人們通過使用現有的實驗方法揭示它的輪廓,結合 AlphaFold 預測完成和解釋其中不清楚的區域,最終揭示了它的微妙結構。《科學》將其稱為實驗結構生物學的勝利,這種新研究方式現在正成為實驗室的常規做法,開啟了新的科學研究道路。

結構搜尋工具

Foldseek、Dali 等結構搜尋工具允許使用者非常快速地搜尋與給定蛋白質相似的結構。這將是為實際有用的蛋白質(例如分解塑膠的蛋白質)挖掘大型序列資料集的第一步,它可以提供有關蛋白質功能的線索。

對人類健康的影響

AlphaFold 已經對人類健康產生了重大而直接的影響。與歐洲人類遺傳學會的合作證明 AlphaFold 對於解開罕見遺傳疾病的原因至關重要。此外,AlphaFold 還通過更好地了解新發現的可能成為藥物靶點的蛋白質,幫助科學家更快地找到與其結合的潛在藥物來加速藥物發現。

參考內容:

https://www.science.org/doi/10.1126/science.add2210

https://www.theverge.com/2022/7/28/23280743/deepmind-alphafold-protein-database-alphabet

https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe

https://www.nature.com/articles/d41586-022-02083-2

相關文章