研究人員挖掘了一個數(shù)據(jù)庫,其中包含幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)——使用Google DeepMind 革命性的 AlphaFold 神經(jīng)網(wǎng)絡(luò)預(yù)測了超過 2 億條條目。這項(xiàng)工作揭示了全新的形狀、生命機(jī)器中令人驚訝的聯(lián)系,以及幾年前無法想象的其他見解。
首爾國立大學(xué)的計算生物學(xué)家 Martin Steinegger 表示,科學(xué)家們立即發(fā)現(xiàn)該資源很方便,但他們中的許多人只關(guān)注單個結(jié)構(gòu)或相關(guān)結(jié)構(gòu)家族,他對繪制整個數(shù)據(jù)庫的關(guān)系感興趣。“我認(rèn)為看看我們的結(jié)構(gòu)宇宙到底有多大會很有趣。”
為此,由 Steinegger 和瑞士蘇黎世聯(lián)邦理工學(xué)院計算生物學(xué)家 Pedro Beltrao 共同領(lǐng)導(dǎo)的團(tuán)隊(duì)開發(fā)了一種工具,可以根據(jù)形狀的相似性快速比較數(shù)據(jù)庫中的每個結(jié)構(gòu)。這在 AlphaFold 數(shù)據(jù)庫1中識別出了超過 200 萬個形狀相似的蛋白質(zhì)“簇” 。
研究人員通常使用基因編碼的蛋白質(zhì)序列進(jìn)行此類比較。但與它們的結(jié)構(gòu)相比,蛋白質(zhì)序列在進(jìn)化過程中往往變化得更快,限制了尋找關(guān)系極遠(yuǎn)的蛋白質(zhì)的能力。Steinegger 估計,通過比較蛋白質(zhì)結(jié)構(gòu),他們識別出的相關(guān)蛋白質(zhì)簇的數(shù)量是僅使用序列時的 10 倍。
研究人員才剛剛開始探索蛋白質(zhì)宇宙中這些新發(fā)現(xiàn)的“星系”,但他們已經(jīng)發(fā)現(xiàn)了一些令人驚訝的聯(lián)系。例如,他們發(fā)現(xiàn)人類和其他復(fù)雜生物體用來檢測病毒 DNA 并引發(fā)快速免疫攻擊的一種蛋白質(zhì)與來自單細(xì)胞細(xì)菌和古細(xì)菌的蛋白質(zhì)處于一個簇中——這種聯(lián)系以前并不為人所知,斯坦尼格說。
對于超過三分之一的蛋白質(zhì)簇幾乎一無所知。“我真的希望生物學(xué)家能夠?yàn)檫@個黑暗帶來一些曙光,”斯坦格說。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!