德克薩斯大學MD安德森癌癥中心的研究人員已經開發(fā)出了首創(chuàng)的基于人工智能(AI)的工具,該工具可以從單細胞數據集中準確地識別出罕見的重要生物學重要細胞群,這些細胞通常包含基因或蛋白質表達來自數千個細胞的數據。該研究今天發(fā)表在《自然計算科學》上。
該計算工具稱為SCMER(單細胞流形保留特征選擇),可以幫助研究人員對復雜數據集的噪聲進行分類,以研究否則可能無法識別的細胞。
高級作者,生物信息學與計算生物學副教授Ken Chen博士解釋說,SCMER可能廣泛應用于腫瘤學及其他領域,包括對最小殘留疾病,耐藥性和免疫細胞群的研究。
Chen說:“現代技術可以產生大量數據,但要確定哪些基因或蛋白質在那些情況下實際上很重要變得越來越困難。”“例如,小細胞群可能具有可能在耐藥性中起作用的重要特征,但是這些特征可能不足以將它們與更常見的細胞區(qū)分開。在分析單細胞數據集以使其能夠檢測這些稀有細胞及其獨特的分子特征。”
在癌癥研究中開發(fā)有效研究小型或稀有細胞種群的方法,是對國家癌癥研究所(NCI)在2020年提出的挑釁性問題之一的直接回應,該問題被指定為一個重要且尚未開發(fā)的研究領域。SCMER旨在解決此問題,并使研究人員能夠從日益復雜的數據集中獲得最大收益。
與基于數據集中包含的所有數據將細胞分類為簇的傳統(tǒng)方法不同,SCMER采取無偏見的方式來檢測定義唯一細胞組的最有意義的區(qū)別特征。這使研究人員不僅可以檢測稀有細胞群,還可以生成一組緊湊的基因或蛋白質,可用于檢測許多其他細胞。為了突出SCMER的實用性,研究團隊將其應用到分析了多個已發(fā)布的單細胞數據集,發(fā)現它與當前可用的計算方法相比具有優(yōu)勢。
在對超過4,500個黑色素瘤細胞的重新分析中,SCMER能夠僅使用75個基因的表達來區(qū)分存在的細胞類型。結果還指出了許多與腫瘤發(fā)展和耐藥有關的基因,在原始研究中沒有被認為是有意義的。
在包含近40,000個胃腸道免疫細胞的復雜數據集中,SCMER僅使用250個不同的特征來分離細胞。該分析確定了在原始研究中檢測到的所有原始細胞類型,但在許多情況下,進一步定義了以前未鑒定的稀有細胞亞組。
最后,研究小組應用SCMER研究了藥物治療后各個時間點采集的1,400多種肺癌細胞。該工具僅使用80個基因,即可根據治療反應準確區(qū)分細胞,并指出了治療耐藥性的新驅動力。
標簽: AI
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!