最近,研究者借助 AI 技術發現了近 6000 種前所未聞的新病毒,這一工作已在 3 月 15 號由美國能源部(DOE)組織的一場會議中展示,成為了一種探索發現數量巨大、種類繁多的病毒的新工具。
盡管從人類健康到垃圾降解,病毒的影響力無處不在,卻很難被研究??茖W家無法在實驗室培植絕大多數病毒,確定其基因序列的嘗試也多遭失敗,因為它們的基因組極小,且進化迅速。
近年來,通過將取自不同環境的樣本中的 DNA 進行排序,研究者已經獲得了一些未知的病毒。為了確定目前存在的微生物,研究者搜集了已知病毒和細菌的基因特征,就如同文字處理器的「查找」功能會突出顯示文檔中包含特定字母的單詞。但這一方法經常失敗,因為病毒學家無法搜集他們不知道的東西。機器學習解決了這一問題,因為它可以發現海量數據中的潛在模式。機器學習算法解析數據,從中學習,接著自動分類信息。
南加州大學洛杉磯分校的計算生物學家 Jie Ren 說:「從前沒有研究病毒的好方法,但現在就不同了,我們有了新工具。」
上周日,美國能源部聯合基因組研究所(JGI)的計算生物學家 Simon Roux 訓練計算機識別不常見的 Inoviridae 病毒家族的基因序列。這些病毒生存在細菌中并改變宿主的行為:比如,它們會使引起霍亂的細菌即霍亂弧菌的毒性變得更強。Roux 在 JGI 組織的會議上(加州,舊金山)展示了其研究,稱在他的研究開始前已識別到的基因組種類不到 100 種。
Roux 展示了一個機器學習算法,該算法使用兩個數據集:一個包含 805 個來自已知 Inoviridae 的基因序列,另一個包含 2000 個來自細菌和其他病毒的基因序列。算法可以找到一種方式來區分二者。
然后,Roux 向模型饋送大量宏基因組學數據集。計算機恢復了一萬多種 Inoviridae 基因組,并將其分成不同種類的集群。這些集群之間的基因變異非常大,意味著 Inoviridae 可能有很多家族。
病毒學習
在另一項獨立研究中,巴西圣保羅大學的生物信息學家 Deyvid Amgarten 應用機器學習來在城市動物園的天然肥料堆中尋找病毒。他將算法設計為可以搜索病毒基因組的幾個可分辨特征,例如給定長度的 DNA 雙鏈的基因密度。經過訓練之后,計算機復原了幾種可能是新型的基因組,Amgarten 說。他將這個結果在 JGI 會議上進行了展示。最后一步是學習這些病毒生成的蛋白質種類,然后檢查哪些蛋白質將加速有機物的破壞。「我們希望改善肥料的質量。」他說。
Amgarten 是從去年報告的一項機器學習工具即 Ren 的團隊開發的 VirFinder 中得到靈感的。VirFinder 被設計用于尋找 DNA 堿基組合,例如 DNA 雙鏈中的 AT 或 GC。Ren 將算法應用到從健康人和肝硬化患者(由肝炎或慢性酒精中毒導致的疾病)的臉部取樣的宏基因組。機器將取樣的病毒完成了分組之后,該團隊注意到樣本中某些特定類型的基因組在健康人群中相對更少或更多,這意味著這些基因組相關的病毒可能導致了疾病。Ren 的成果是一項很誘人的發現:生物醫學研究者長期以來一直很困惑,到底是哪些病毒導致了那些疑難雜癥,例如慢性疲勞綜合癥(也稱為肌痛性腦脊髓炎),以及炎癥性腸病。
康涅狄格州法明頓市的基因組醫學杰克遜實驗室的免疫學家 Derya Unutmaz 推測,病毒可能觸發了一些毀滅性的反應,或者改變了人體微生物群系的細菌行為,從而使新陳代謝和免疫系統變得不穩定。Unutmaz 說,通過應用機器學習,研究者可以發現患者體內仍被隱藏的病毒。此外,由于 AI 可以在大規模數據集中發現模式,該方法也許可以將病毒數據和細菌關聯起來,然后和癥狀相關的蛋白質變化關聯起來?!笝C器學習可以揭示出我們甚至從沒思考過的問題?!筓nutmaz 說。
-
醫療
+關注
關注
8文章
1801瀏覽量
58660 -
機器學習
+關注
關注
66文章
8378瀏覽量
132415 -
數據分析
+關注
關注
2文章
1429瀏覽量
34017
原文標題:前沿 | 機器學習助力醫療,通過數據分析發現近6000種新病毒
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論