內容一覽:研究表明細胞衰老與癌症、2 型糖尿病、骨關節炎和病毒感染等疾病密切相關。儘管清除衰老細胞的藥物已逐漸成為研發熱點。但由於缺乏充分表徵的分子靶點,已發現的抗衰老化合物 (Senolytics) 很少。近期,國際期刊《Nature Communications》上發佈了一篇研究成果,研究人員新發現了 3 種 Senolytics。
關鍵詞:Senolytics 機器學習 XGBoost
作者|daserney
編輯|緩緩、三羊
自古以來,人們一直追求長生不老。令人驚喜的是,近年來抗衰、長壽等話題,正在從神秘、虛無縹緲的保健品界,走向大眾認可的醫療健康界。一般認知裡,衰老就是身體機能緩慢弱化的過程,進程不可逆,所以人類只能順其自然,聽天由命。然而很多人不了解的是,早在 2018 年,世衛組織 (the World Health Organization) 就在《國際疾病法典》宣佈,衰老是一種可以治療的疾病。
在衰老的廣泛定義裡,細胞衰老是近來科學家們研究的熱門方向之一。所謂細胞衰老 (Cellular senescence) 是一種以細胞分裂停止為特徵的現象。通常情況下,人體免疫系統能夠有效清除衰老細胞 (Senescent cells),但隨著年齡的增長,這種清除功能會逐漸減弱,除了會導致視力惡化、活動能力受限等,還極易引發癌症、阿茲海默病等多種疾病。
2015 年,梅奧診所的 James L. Kirkland 博士等人發現了第一種能夠清除衰老細胞的抗衰藥 (Senolytics) ,Senolytics 指選擇性誘導衰老細胞死亡的小分子化合物,其名稱源自 Senescence (衰老) 和 Lytic (破壞)。最新研究中,愛丁堡大學聯合坎塔布里亞大學利用機器學習發現了三種 Senolytics—— Ginkgetin, Periplocin 及 Oleandrin,並驗證了其在人類細胞系中的抗衰作用。目前該研究已發佈在《Nature Communications 》期刊上,標題為「Discovery of Senolytics using machine learning」。

圖 1:該研究成果已發表在 Nature Communications
論文地址:
https://www.nature.com/articles/s41467-023-39120-1#Sec2
實驗過程
資料集
本實驗資料集來自多個渠道,包括學術出版物和商業專利。首先,研究人員挖掘了 58 種已知的 Senolytics,而後又從 LOPAC-1280 及 Prestwick FDA-approved-1280 兩個已有的化學庫中挖掘了多種非 Senolytics。資料集將二者進行了整合,共包含 2,523 種化合物,其中 Senolytics 佔 2.3%。

圖 2:用於訓練機器學習模型的化合物
a:訓練資料來自多個渠道。
b:用於訓練的 58 種 Senolytics 來源,包括每個來源的化合物數量和細胞系 (cell lines)。
模型訓練
研究人員使用上述資料集訓練模型,來識別具有 Senolytics(陽性)特徵的化合物。首先,研究人員對資料集進行了特徵選擇,在此過程中,他們利用隨機森林 (RF) 模型計算了每個特徵的平均基尼指數減少量,選擇了 165 個最重要的特徵,從而減少了特徵數量,降低模型複雜度。
基尼指數衡量了一個節點中樣本的混雜程度,值越低表示節點中的樣本越純淨。
其次,研究人員利用 165 個最重要特徵以及完整資料集中的各種樣本資料,開發了多個 Senolytics 二分類模型(識別 Senolytics 或非 Senolytics)。為了比較各個模型,並充分利用有限數量的 Senolytics 樣本,研究人員在資料集上進行了 5 倍交叉驗證,使用 3 個性能指標對模型進行評分:精確度、召回率和 F1 得分。
起初,研究人員主要關注支持向量機 (SVM) 和 RF 模型,但經過實驗發現它們的性能均不理想。同時他們還評估了其他複雜度不同的模型,包括邏輯迴歸器 (Logistic regressors)、樸素貝葉斯分類器 (Naïve Bayes classifier) 和用於不平衡分類資料增強法 (SMOTE),但結果顯示這些模型的性能還不如 SVM 和 RF 模型。
因此,研究人員以 RF 性能為基準,又開發了 XGBoost 模型,通過迭代地訓練決策樹模型提高預測能力。如圖 3b 所示,XGBoost 模型在精確度、召回率和 F1 得分方面均有所提升,在所有考慮的模型中表現最佳。

圖 3:訓練機器學習模型
a:模型訓練、化合物篩選和結果驗證流程,使用多個性能指標,篩選合適的模型。
b:3 個機器學習模型性能,條形圖顯示在 5 倍交叉驗證中計算的平均性能指標,誤差條表示一個標準差。
本實驗資料集地址,稍後會同步到 HyperAI超神經官網:
https://doi.org/10.5281/zenodo.7870357
實驗結果
首先,研究人員從 4,340 多個化合物中篩選出了 21 種可能具有抗衰老活性的化合物。隨後,他們又對這 21 種化合物進行測試,如圖 4 顯示,其中 3 種具有衰老細胞清除作用:Periplocin 及 Oleandrin(兩種強心苷類物質,尚未被確定能夠清除衰老細胞)以及 Ginkgetin(一種天然無毒的雙黃酮類化合物)。

圖 4:Periplocin,Oleandrin 及 Ginkgetin
具有衰老細胞清除作用
c:實驗驗證。21 個化合物中有三個顯示出抗衰老活性:Ginkgetin、Oleandrin 和 Periplocin;熱力圖顯示了 n = 3 個重複實驗的均值。圖中 Ouabain 為已知 Senolytics。
d:3 種新發現的抗衰化合物的劑量-反應曲線。SI 為抗衰指數。
此外,上述實驗過程中,研究人員還發現與 Ouabain 相比,新發現的 Oleandrin 的抗衰性更強,尤其是在低濃度情況下。因此,研究人員比較了 Periplocin、Oleandrin 及 Ouabain 在 10 nM 低濃度下的抗衰老活性。

圖 5:Periplocin、Oleandrin 及 Periplocin
在低濃度下抗衰性能比較
a:圖中顯示了 IMR90 ER:RAS (衰老細胞) 和 IMR90 ER:STOP (對照組) 在 100 nM 4OHT 培養條件下的組織培養皿。在接下來的 72 小時內,用 10 nM Oleandrin、Ouabain 和 Periplocin 以及 DMSO (對照) 進行處理。
b:通過定量分析評估細胞存活率。
如圖 5b 所示,低濃度的 Ouabain 和 Periplocin 在 IMR90-ER:STOP 以及 IMR90-ER:RAS 中均未表現出明顯的細胞毒性,而使用 Oleandrin 進行處理後,IMR90-ER:RAS 中的衰老細胞存活率顯著下降,表明 Oleandrin 在較低的藥物濃度下具有較強的抗衰活性。
綜合以上實驗結果,機器學習能成功尋找到抗衰化合物,並且還找到了比現有抗衰化合物抗衰性更強的 Oleandrin。
AI 驅動藥物發現
AI 在新藥研發的各個階段都發揮了重要作用。目前,研究重點集中在藥物發現和臨床前開發階段。這項研究展示了 AI 在藥物研發中的潛力,特別是在應對生物結構複雜或已知分子靶點較少的疾病時。作者 Diego Oyarzún 指出:「AI 在幫助我們發現新的候選藥物方面非常有效,尤其是在藥物發現的早期階段。」
該研究的一作 Vanessa Smer-Barreto 則強調了資料科學家、化學家和生物學家之間密切合作的重要性。她表示:「這項工作是通過資料科學家、化學家和生物學家之間的緊密合作而產生的。我們利用這種跨學科合作的優勢,構建了穩健的模型,並通過僅使用已發表的資料進行模型訓練來節省篩選成本。」這種合作模式為加速 AI 應用提供了新的機會,並有望推動藥物研發的創新和發展。
目前,儘管 AI 在新藥研發中取得了突破,但仍然面臨一些挑戰,例如資料質量及可靠性、演算法可解釋性以及模型的泛化能力等。隨著技術的不斷進步和資料資源的增加,AI 在藥物研發中的應用前景仍然非常廣闊。通過加強資料共享和跨學科合作,可以更好地利用 AI 的優勢,加速新藥的發現和開發,為人類健康帶來福祉。
參考文章:
[1]http://zixun.69jk.cn/shwx/79532.html
[2]https://en.wikipedia.org/wiki/Cellular_senescence#Characteristics_of_senescent_cells
[3]https://newatlas.com/medical/machine-learning-algorithm-identifies-natural-anti-aging-chemicals/
[4]https://www.sohu.com/a/673349496_121124375
[5]https://www.ed.ac.uk/institute-genetics-cancer/news-and-events/news-2023/ai-algorithms-find-drugs-that-could-combat-ageing
[6]http://www.stcn.com/article/detail/904319.html