一個資料越少,科學家越高興的資料庫

未知的基因組
未知的基因組

未知的基因組

當談到前沿、未被完全探索的領域時,你會想到什麼?是地球上的海底深處,還是遙遠的太空?其實,在我們人體中,就存在許多仍有待發現的未知奧秘。

最近,來自英國劍橋大學和牛津大學的研究人員創建了一個新穎、開放的基因資料庫。有別於多數其他常見的資料庫,研究人員期待,隨著時間的推移,這個資料庫中的資料只會越來越少,而不是越來越多。

他們將這個資料庫命名為「unknome」,這是一個由「unknown(未知)」和「genome(基因組)」構成的合成詞,表示未被充分研究但具有潛在重要性的蛋白質及其相應的蛋白質編碼基因

8月8日,研究人員在期刊《公共科學圖書館·生物學》上一篇論文中對這個新的資料庫進行了描述,並表示「unknome」資料庫的存在,凸顯了我們目前對人類基因和蛋白質的諸多不了解

顯而易見的忽視

人類基因組編碼了大約2萬種蛋白質。然而,在這其中,有數以千計的蛋白質,是由已知存在卻功能未知的基因所編碼的。‍‍‍‍

造成這部分蛋白質沒有得到充分研究的原因有很多,比如本就稀缺的研究資金和同行評審系統,都偏向於研究那些已知的、具有功能性或臨床重要性的蛋白質;再比如由於缺乏抗體或小分子抑制劑等特異性試劑作為工具,大多數科研項目都更傾向於關注豐富且廣泛表達的蛋白質。

在新的研究中,研究人員認為,無論造成這種局面的原因是什麼,這種顯而易見且正在加劇的忽視會帶來問題,因為可能有一部分甚至是大量這樣的蛋白質,都在關鍵的細胞過程中發揮了重要作用,並且有可能為治療干預提供見解和目標。

為了解決這個問題,研究人員決定開發這樣一個對所有人開放、可修改的資料庫。

「認知」分數

具有共同進化祖先的蛋白質,通常可被歸為一個蛋白質簇。在Unknome所包含的所有蛋白質簇中,都至少有一種蛋白質是來自人類或11種常見的模式生物。

在unknome所包含的超過13000個蛋白質簇、近200萬種蛋白質中,unknome會根據對與每簇蛋白質的相應基因的了解程度,對每個蛋白質打出一個「認知」分數。資料表明,有3000個蛋白質簇的「認知」得分為零,其中805簇中至少含有一種人類蛋白質,這意味著人類基因組中還有很多東西需要了解 。

在新發表的研究中,研究人員從資料庫中選擇了260個果蠅和人類共有的「認知」分數很低的基因(1分及以下)。通過在果蠅中降低這些蛋白質的編碼基因的活性後,研究人員發現,大約有60個基因對生命至關重要,其他的一些則與繁殖、生長、運動和抗壓力能力息息相關

這表明,即使是在像果蠅這種已經被研究得非常充分的生物中,也有許多新的事物有待發現。

基於這個系統,研究人員發現有成千上萬種蛋白質的「認知」得分幾乎為零,其中包括許多模式生物和人類基因組的蛋白質。

關注未知

研究人員尚不清楚這些基因是否對人類也有著類似的影響。但是,unknome資料庫可以幫助研究人員更快速地篩選出更容易研究的生物體(如果蠅)中的相似蛋白質,進而梳理出重要的人類蛋白質,這對未來的疾病治療和藥物發現等研究都將起到重要作用。 接下來,研究人員希望能夠對這些神秘的蛋白質進行大規模的系統研究。

#創作團隊:

撰文:糖獸

排版:雯雯

#參考來源:

https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3002222

https://www.sciencenews.org/article/unknome-catalog-genome-protein-mysterious

https://www.eurekalert.org/news-releases/997386

#圖片來源:

封面圖&首圖:geralt / Pixabay

相關文章

這是什麼草?鑑定地球熱門草原類型

這是什麼草?鑑定地球熱門草原類型

提到小草,你會想到什麼?「沒有花香,沒有樹高」的平凡,「燕草如碧絲」的柔美,亦或是「野火燒不盡,春風吹又生」的生命力?放下人類賦予它的種種含...

性的故事

性的故事

昂貴的性 當我們談到性時,你會想到什麼?美好與愛情?還是風險和威脅?無論情感將你帶往何方,我們都能認同的一個直截了當的簡單事實是——性是我們...

一種全新的顯微鏡,靈感來自大海和太空

一種全新的顯微鏡,靈感來自大海和太空

提起扇貝,你會想到什麼?蒜蓉和粉絲?這是很多人都喜歡的美妙搭配,但你可能不知道的是,這些美味居然是有眼睛的,而且多達200多隻!‍‍ 扇貝長...