內容一覽:從光鮮亮麗的明星,到素裝淡裹的普通人,大家都會無可避免地老去,經歷形容的變化與身體機能的退化。正因為此,人們也在努力尋找延緩衰老的秘方。然而,現有的抗衰老藥物總伴有一些副作用。近期,在深度學習的幫助下,《Nature Aging》上發表的一篇研究成果篩選出了高效安全的抗衰老藥物,或許能讓我們距離「長生不老」更進一步。
關鍵詞:計算模型 機器學習 衰老
作者|雪菜
編輯|三羊
喬納森·斯威夫特曾說「每個人都希望能夠長壽,但沒有人喜歡自己變老」。然而,《Nature Medicine》上的一項研究顯示,在 34 歲、60 歲和 78 歲 3 個時間節點,人體內衰老相關疾病的基因表達會上調,導致人體「斷崖式衰老」。這也就意味著,人體的衰老也許比我們認為的來得更早更快。如何永葆青春,又一次成為了焦點話題。
近年來,有實驗表明,通過抗衰老藥物清除生物體內的衰老細胞 (Snc),可以改善由細胞衰老導致的病理生理性結果,甚至延長小鼠的壽命。然而,這些藥物又存在一系列副作用,包括減緩傷口癒合,導致肺部和血管周圍細胞纖維化等,其功效與安全性難以兩全。
為此,來自麻省理工學院 (MIT) 的 Felix Wong 等人,通過深度學習的方式,利用圖神經網路,從數十萬種化合物中篩選出了安全高效的抗衰老成分,並在小鼠身上驗證了其藥效與安全性。其研究成果於 2023 年 5 月發表在《Nature Aging》上,標題為「Discovering small-molecule senolytics with deep neural networks」。

研究成果已發表於《Nature Aging》期刊
論文地址:
https://www.nature.com/articles/s43587-023-00415-z
實驗概述
研究者們首先從現有的部分藥物中篩選出了具有抗衰老功效的藥物,作為深度學習的訓練資料,並提出了衡量其藥效和安全性的指標。隨後,基於 Chemprop 模型(一種訊息傳播圖神經網路模型),他們篩選出了高效安全的抗衰老藥物。進一步篩選後,得到 3 種化合物,並圍繞抗衰老特性和生物安全性,與傳統的抗衰老藥物進行了對比驗證。
資料集
本研究資料集包括兩部分:Broad 研究所藥物再利用中心收錄的 5,819 種藥物,及 Broad 研究所收錄的 799,140 種化合物。
實驗過程
本實驗主要包括 3 個步驟:
1、從美國 FDA 審批通過及正在進行臨床試驗的 2,352 種藥物中,篩選出有抗衰老功效的藥物,作為模型的訓練集;
2、通過 Chemprop 模型,篩選抗衰老藥物;
3、將篩選出的 3 種代表化合物,與傳統的抗衰老藥物 ABT-737 進行對比,驗證其抗衰老特性及生物安全性。
篩選過程
抗衰老藥物需要滿足以下 3 個指標:
1、藥物處理後正常細胞的相對活性>0.7
2、衰老細胞的相對活性<0.5
3、衰老細胞與正常細胞的活性之比<0.7
基於這 3 個標準,研究者首先從 FDA 審批通過及正在進行臨床試驗的藥物中,篩選出了 45 種具有抗衰老特性的藥物,作為 Chemprop 模型訓練集。
Chemprop 模型展現出了極高的藥物選擇性,其精確率-召回率曲線 (PR 曲線) 下的面積 (AUC) 為 0.24,較隨機模型 (0.019) 有了顯著提高,較隨機森林模型 (0.15) 也有提高。

圖 1:Chemprop 模型訓練中的 PR 曲線
藍線為 Chemprop 模型的結果,黑線為人工篩選的結果
95% 置信度區間:0.138-0.339
鑑於 Chemprop 模型出色的表現,科研人員利用 Chemprop 對資料集中的化合物進行了篩選。其中,Broad 研究所的藥物再利用中心收錄的藥物中,有 284 種預測值高於 0.1。Broad 研究所收錄的化合物中,有 2,537 種化合物預測值 (PS) 高於 0.4,還有 3,838 種藥物預測值極低,為無抗衰老特性的藥物。

圖 2:Chemprop 的抗衰老化合物篩選結果
綠色:Broad 藥物再利用中心中,可能具有抗衰老特性的藥物 (PS>0.1);
黑色:Broad 研究所收錄的,可能具有抗衰老特性的化合物 (PS>0.4);
黃色:後期驗證確有抗衰老特性的化合物;
紫色:預測沒有抗衰老特性的化合物;
紅色:訓練資料中有抗衰老特性的化合物;
藍色:訓練資料中沒有抗衰老特性的化合物。
基於化學結構和藥代動力學特性,研究團隊對這些化合物進行進一步的篩選。首先,泛篩選干擾化合物 (PAINS) 和不利於藥代動力的化學物被去除。隨後,他們挑選了 216 種穀本系數 (Tanimoto similarity) 小於 0.5 的化合物,與已知的抗衰老藥物進行結構上的區分。同時,他們還選出了 50 種沒有抗衰老特性的藥物,作為負對照。最後,研究者通過化學手段,驗證了這 266 種化合物的抗衰老特性。
216 種得分較高的化合物中,有 25 種在實驗中展現出了抗衰老特性。Chemprop 模型的正預測率為 11.6%,高於人工篩選的 1.9%。而 50 個負對照化合物均沒有抗衰老特性,說明 Chemprop 模型在負預測中表現優異。

圖 3:Chemprop 的預測正確率
對比驗證
在得到目標化合物後,研究者們將其與現有的抗衰老藥物進行了對比。首先用依託泊苷 (Etoposide) 處理過的人肺成纖維細胞 (IMR-90) 構建了衰老細胞模型,隨後用篩選出的 BRD-K20733377、BRD-K56819078 及 BRD-K44839765 分別對細胞進行處理,並與傳統的 ABT-737 藥物進行對比。
結果中我們可以看到,圖神經網路篩選出的化合物對衰老細胞有著良好的清除效果,同時沒有影響到正常細胞的生長,有著較強的選擇性。相反,ABT-737 在清除衰老細胞的同時,也殺死了一部分正常細胞,副作用較強。

圖 4:篩選出的化合物與傳統藥物的藥效對比
灰色:對照組的正常細胞;
藍色:依託泊苷處理後得到的衰老細胞。
隨後,研究者用傳代初期和傳代晚期的 IMR-90 細胞進行了複製性衰老實驗,得到了相似的結果。進一步的,他們進行了溶血實驗,以測試這些藥物的生物毒性。結果顯示,即使藥物劑量達到正常用量的 10 倍 (100 μM),血液中也幾乎沒有檢測出因紅細胞死亡釋放出的血紅蛋白,證明了其生物安全性。

圖 5:篩選出的化合物與傳統藥物的溶血實驗
細胞破膜劑 Triton X-100 作為對照組
基於上述結果,研究者用細胞選擇性最強的 BRD-K56819078 在 C57BL/6J 小鼠身上進行了活體實驗。藥物注射 14 天后,取小鼠的腎臟細胞,觀察其衰老相關的 β-半乳糖苷酶 (SA-β-gal) 的含量及相關 mRNA 的表達。

圖 6:小鼠腎臟細胞的衰老指標
灰色為對照組,紅色為實驗組
a:SA-β-gal 含量;
b:衰老相關 mRNA 的表達量
結果顯示,SA-β-gal 的含量和 mRNA 的表達量都有下調,說明 BRD-K56819078 有效地清除了小鼠體內的衰老細胞。在經歷層層篩選後,Chemprop 模型最終得到了高效安全的抗衰老藥物。
Chemprop 模型:藥物開發好幫手
Chemprop 模型是一種基於圖神經網路 (GNN) 的深度學習模型。它具有 5 層、1,600 個隱藏維度,較普通 GNN 模型更為複雜。
基於下列特徵,每個原子和化學鍵在 Chemprop 中生成了特徵向量:
1、原子數、每個原子的鍵合數、形式電荷、手性、與氫原子鍵合數、雜化、芳香性及原子質量等原子特徵;
2、鍵型(單鍵、雙鍵、三鍵或是芳香環等)、共軛性、是否成環及三維特性等化學鍵特徵。

圖 7:Chemprop 的主要框架
Chemprop 模型利用訊息傳播卷積神經網路對化合物的特徵進行分析。通過將相鄰鍵的訊息進行累加,隨後將其與總鍵和進行對比,最後利用具有非線性激活函數的單個神經網路層對其進行處理,我們就可以得到一個化學鍵的訊息。在進行固定數量的訊息傳遞後,整個分子的訊息被累加,得到代表這個分子的訊息值。將這一值輸入到前饋神經網路後,Chemprop 模型將輸出一個與化合物活性相關的預測值。
目前,Chemprop 模型已被廣泛運用於預測化合物的藥物活性及篩選和開發新藥。
2020 年,MIT 通過 Chemprop 從超過 1.07 億個分子中篩選出了 8 種與現有抗生素結構不同的抗菌藥物,並找到了在小鼠體內展現出廣譜抗菌活性的藥物分子 Halicin。2022 年,首都醫科大學的研究團隊利用 Chemprop 篩選出了一種可能的組織蛋白酶 L 抑制劑,為殺死新冠病毒提供了新靶點。
參考連結:
[1]https://doi.org/10.26434/chemrxiv-2023-3zcfl
[2]https://www.cell.com/cell/fulltext/S0092-8674(20)30102-1
[3]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9110316/