這種被研究團隊稱為“轉(zhuǎn)化機器學習”(TML)的新方法在解決科學問題(包括藥物設(shè)計)的三個領(lǐng)域比傳統(tǒng)機器學習做出了更好的預測。
“在藥物設(shè)計中,我們發(fā)現(xiàn) TML 提供了對藥物靶標特異性、藥物之間的關(guān)系以及靶蛋白之間關(guān)系的洞察,”作者寫道,由約翰摩爾斯大學計算機科學與數(shù)學學院的 Ivan Olier 領(lǐng)導。英國
傳統(tǒng)機器學習與 TML
傳統(tǒng)的監(jiān)督 ML 算法在標記示例(例如,不同動物的標記照片)上進行訓練,從中學習識別內(nèi)在特征(例如,“毛茸茸”和“小”)。相反,TML 依賴于來自在其他相關(guān)任務(wù)上訓練的 ML 模型的預測的外在特征。
例如,要訓練一個 TML 模型來識別所有已知的動物物種,并且預計會添加新的動物物種,首先要對已知物種(例如貓、兔子和驢)應(yīng)用現(xiàn)有的預測模型。這些模型的輸出將生成新的外在特征,例如“貓性”、“兔子性”和“驢性”,然后將用于訓練元級 ML 模型以使用此級別的表示進行預測。該方法使 TML 模型能夠捕獲最初未編碼的動物的屬性,例如可愛(貓和兔子共有)和頭部側(cè)面有眼睛(兔子和驢共有)。
“典型的 ML 系統(tǒng)在學習識別一種新型動物時必須從頭開始——比如小貓——TML 可以利用與現(xiàn)有動物的相似性:小貓像兔子一樣可愛,但沒有像兔子那樣長的耳朵兔子和驢,”領(lǐng)導這項研究的劍橋化學工程和生物技術(shù)系教授羅斯金在一份聲明中說。“這使得 TML 成為一種更強大的機器學習方法。”
藥物發(fā)現(xiàn)的承諾
研究人員表示,TML 在藥物發(fā)現(xiàn)領(lǐng)域顯示出特別的前景。典型的 ML 方法將根據(jù)分子形狀和結(jié)構(gòu)等內(nèi)在特征來搜索藥物分子,而 TML 通過檢查其他 ML 模型傳達的有關(guān)特定分子的信息來加快該過程。
該論文包括一個使用 TML 預測定量結(jié)構(gòu)活性關(guān)系 (QSAR) 的案例研究,這是早期藥物發(fā)現(xiàn)的一個常見步驟。給定一個目標(通常是一個蛋白質(zhì))和一組具有相關(guān)活動(例如,抑制目標蛋白質(zhì))的化合物(小分子),QSAR 任務(wù)是學習從分子表示到活動的預測映射。在 TML 方法中,基于內(nèi)在描述符的標準 ML 方法首先應(yīng)用于現(xiàn)有的 QSAR 預測任務(wù),然后將其輸出用作可應(yīng)用于新 QSAR 任務(wù)的新 TML 模型的外在特征。
為了評估 QSAR 學習中的 TML 方法,研究人員使用 1,024 位分子指紋表示作為內(nèi)在特征,針對 2,219 個 QSAR 問題訓練了各種 ML 方法。然后,他們使用之前學習的 ML 模型預測的復合活動作為 TML QSAR 模型的外在屬性。
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!