通過將無監(jiān)督和自動化機器學習技術應用于數(shù)百萬癌細胞的分析,Rebecca Ihrie 和 Jonathan Irish 都是細胞和發(fā)育生物學副教授,他們在腦腫瘤中發(fā)現(xiàn)了新的癌細胞類型。機器學習是一系列計算機算法,可以識別大量數(shù)據(jù)中的模式,并通過更多經(jīng)驗變得“更聰明”。這一發(fā)現(xiàn)有望使研究人員能夠更好地理解和靶向這些細胞類型,用于膠質(zhì)母細胞瘤(一種高死亡率的侵襲性腦腫瘤)的研究和治療,以及機器學習在癌癥研究中的更廣泛適用性。
Ihrie 和 Irish 與其合作者一起開發(fā)了風險評估群體識別 (RAPID),這是一種開源機器學習算法,可揭示與生存結(jié)果相關的蛋白質(zhì)表達和修飾的協(xié)調(diào)模式。
文章“Unsupervised machine learning reveals risk stratifying glioblastoma tumor cells”于 6 月 23 日在線發(fā)表在eLife雜志上。RAPID 代碼和示例可在 cytolab Github 頁面上找到。
在過去的十年中,研究界一直致力于利用機器學習的能力來吸收和分析比人類思維單獨處理的更多的癌細胞研究數(shù)據(jù)。“在沒有任何人為監(jiān)督的情況下,RAPID 梳理了 200 萬個腫瘤細胞——每個患者至少有 4,710 個膠質(zhì)母細胞瘤細胞——來自 28 個膠質(zhì)母細胞瘤,標記出最不尋常的細胞和模式供我們研究,”Ihrie 說。“我們能夠在大海撈針中找到針頭,而無需搜索整個大海撈針。這項技術讓我們能夠?qū)W⒂诟玫亓私庾钗kU的癌細胞,并更接近于最終治愈腦癌。”
將控制神經(jīng)干細胞和其他腦細胞的身份和功能的細胞蛋白質(zhì)數(shù)據(jù)輸入 RAPID。使用的數(shù)據(jù)類型稱為單細胞質(zhì)譜流式細胞術,這是一種通常應用于血癌的測量技術。一旦 RAPID 的統(tǒng)計分析完成并找到了“大海撈針”,就只會研究那些細胞。“我們研究中最令人興奮的結(jié)果之一是,無監(jiān)督機器學習發(fā)現(xiàn)了最嚴重的罪犯細胞,而不需要研究人員為其提供臨床或生物學知識作為背景,”Irish 說,他也是范德比爾特大學癌癥與免疫學核心的科學主任。“這項研究的結(jié)果目前代表了我在范德比爾特實驗室的最大生物學進展。”
研究人員的機器學習分析使他們的團隊能夠研究腦腫瘤細胞中蛋白質(zhì)的多種特征與其他特征的關系,從而提供新的和意想不到的模式。“我們兩個實驗室之間的合作,我們從范德比爾特大學和范德比爾特-英格拉姆癌癥中心 (VICC) 獲得的這項高風險工作的支持,以及與神經(jīng)外科醫(yī)生和病理學家的卓有成效的合作,他們?yōu)檠芯咳祟惣毎峁┝霜毺氐臋C會Ihrie 和 Irish 在一份聯(lián)合聲明中說:“直接從大腦中取出讓我們實現(xiàn)了這一里程碑。” 該論文的共同第一作者是前范德比爾特大學研究生 Nalin Leelatian,目前是耶魯大學(愛爾蘭實驗室)的神經(jīng)病理學住院醫(yī)師,以及Justine Sinnaeve(Ihrie 實驗室)。通過她在該主題上的研究和工作,Leelatian 于 2017 年 4 月獲得了美國癌癥研究協(xié)會 (AACR) 的美國腦腫瘤協(xié)會 (ABTA) 培訓學者獎。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!