盡管每個人類細胞都包含大量基因,但這些所謂的“編碼”DNA序列僅占我們整個基因組的 1%。剩下的 99% 由“非編碼”DNA 組成——與編碼 DNA 不同,它不攜帶構建蛋白質(zhì)的指令。
這種非編碼 DNA(也稱為“調(diào)節(jié)性”DNA)的一個重要功能是幫助打開和關閉基因,控制蛋白質(zhì)的制造量(如果有的話)。隨著時間的推移,隨著細胞復制它們的 DNA 以生長和分裂,這些非編碼區(qū)域經(jīng)常會出現(xiàn)突變——有時會調(diào)整它們的功能并改變它們控制基因表達的方式。許多這些突變是微不足道的,有些甚至是有益的。但有時,它們可能與常見疾病(如 2 型糖尿病)或更危及生命的疾病(包括癌癥)的風險增加有關。
為了更好地了解這些突變的影響,研究人員一直在努力研究數(shù)學圖譜,使他們能夠查看生物體的基因組,預測哪些基因將被表達,并確定該表達將如何影響生物體的可觀察特征。這些被稱為適應度景觀的地圖大約在一個世紀前被概念化,以了解基因構成如何影響一種常見的有機體適應度,特別是:繁殖成功率。早期的適應環(huán)境非常簡單,通常只關注有限數(shù)量的突變。現(xiàn)在可以獲得更豐富的數(shù)據(jù)集,但研究人員仍然需要額外的工具來表征和可視化這些復雜的數(shù)據(jù)。這種能力不僅有助于更好地理解個體基因如何隨著時間的推移而進化,
在3 月 9 日發(fā)表在《自然》雜志上的一項新研究中,一組科學家開發(fā)了一個框架,用于研究調(diào)控 DNA 的適應性景觀。他們創(chuàng)建了一個神經(jīng)網(wǎng)絡模型,當對數(shù)億次實驗測量進行訓練時,該模型能夠預測酵母中這些非編碼序列的變化如何影響基因表達。他們還設計了一種以二維方式表示景觀的獨特方式,使其易于理解過去并預測酵母以外的生物中非編碼序列的未來演變——甚至為基因治療和工業(yè)應用設計定制的基因表達模式。
“我們現(xiàn)在有一個‘神諭’,可以詢問:如果我們嘗試了這個序列的所有可能突變怎么辦?或者,我們應該設計什么樣的新序列來給我們想要的表達?” 麻省理工學院生物學教授(休假)、哈佛大學布羅德研究所和麻省理工學院的核心成員(休假)、基因泰克研究和早期發(fā)展負責人、該研究的資深作者Aviv Regev說。“科學家們現(xiàn)在可以使用該模型解決他們自己的進化問題或場景,以及其他問題,例如制作以所需方式控制基因表達的序列。我也對對可解釋性感興趣的機器學習研究人員的可能性感到興奮。他們可以反過來問他們的問題,以更好地了解潛在的生物學。”
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!