卡內(nèi)基梅隆大學(xué)計(jì)算生物學(xué)系和俄羅斯圣彼得堡州立大學(xué)的研究人員設(shè)計(jì)的一種算法可以幫助科學(xué)家識(shí)別未知分子。該算法名為 MolDiscovery,它使用來(lái)自分子的質(zhì)譜數(shù)據(jù)來(lái)預(yù)測(cè)未知物質(zhì)的身份,在研究早期告訴科學(xué)家他們是偶然發(fā)現(xiàn)了新事物,還是僅僅重新發(fā)現(xiàn)了已知事物。
這一發(fā)展可以節(jié)省尋找可用于醫(yī)學(xué)的新天然產(chǎn)品的時(shí)間和金錢。
“科學(xué)家們浪費(fèi)了大量時(shí)間來(lái)分離已知的分子,基本上是重新發(fā)現(xiàn)青霉素,”助理教授、研究團(tuán)隊(duì)成員 Hosein Mohimani 說(shuō)。“早期檢測(cè)分子是否已知可以節(jié)省時(shí)間和數(shù)百萬(wàn)美元,并有望使制藥公司和研究人員更好地尋找可能導(dǎo)致新藥開發(fā)的新型天然產(chǎn)品。”
該團(tuán)隊(duì)的工作“MolDiscovery:學(xué)習(xí)小分子的質(zhì)譜碎片化”最近發(fā)表在《自然通訊》上。研究團(tuán)隊(duì)包括 Mohimani;CMU博士學(xué)生劉曹和穆斯塔法·古勒;CMU研究助理李奕元;以及圣彼得堡州立大學(xué)算法生物技術(shù)中心的研究人員 Azat Tagirdzhanov 和 Alexey Gurevich。
Mohimani 在代謝組學(xué)和宏基因組學(xué)實(shí)驗(yàn)室的研究重點(diǎn)是尋找新的天然藥物,例如,在一位科學(xué)家檢測(cè)到一種有望作為海洋或土壤樣本中潛在藥物的分子后,可能需要一年時(shí)間或更長(zhǎng)的時(shí)間來(lái)識(shí)別分子,但不能保證該物質(zhì)是新的。MolDiscovery 使用質(zhì)譜測(cè)量和預(yù)測(cè)性機(jī)器學(xué)習(xí)模型來(lái)快速準(zhǔn)確地識(shí)別分子。
質(zhì)譜測(cè)量是分子的指紋,但與指紋不同的是,沒(méi)有龐大的數(shù)據(jù)庫(kù)來(lái)匹配它們。盡管已經(jīng)發(fā)現(xiàn)了數(shù)十萬(wàn)種天然分子,但科學(xué)家們無(wú)法獲得他們的質(zhì)譜數(shù)據(jù)。MolDiscovery 從質(zhì)譜數(shù)據(jù)中預(yù)測(cè)分子的身份,而無(wú)需依賴質(zhì)譜數(shù)據(jù)庫(kù)進(jìn)行匹配。
該團(tuán)隊(duì)希望 MolDiscovery 將成為實(shí)驗(yàn)室發(fā)現(xiàn)新型天然產(chǎn)物的有用工具。MolDiscovery 可以與 Mohimani 實(shí)驗(yàn)室開發(fā)的機(jī)器學(xué)習(xí)平臺(tái) NRPminer 協(xié)同工作,幫助科學(xué)家分離天然產(chǎn)物。與 NRPminer 相關(guān)的研究最近也發(fā)表在Nature Communications 上。
標(biāo)簽: 分子
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!