科學家和醫療研究人員曾受濕式實驗室中的研究樣本數量以及在觀察細胞時被顯微鏡質量所限制。現在,他們正在使用強大的計算工具從不斷擴展的生物數據庫中獲取洞見。
支持這場數字生物學革命的正是高性能計算系統與特定領域軟件框架這對組合。
在近期公布的TOP500全球性能最強大的系統榜單上,我們看到了兩臺超級計算機的身影:專注于醫療行業的NVIDIA Cambridge-1和生物技術公司Recursion的BioHive-1。這兩臺超級計算機均基于NVIDIA DGX SuperPOD參考架構。
全球各醫學研究機構、制藥公司和生物技術初創企業都在使用NVIDIA Clara Parabricks(一套基因組學庫和參考應用)來推動新一代測序工作。
位于上海的明碼生物技術公司成為中國第一家啟用Clara Parabricks Pipelines支持精準醫療工作的研究實驗室。這是繼今年在泰國和日本啟動的大型基因組學舉措之后的又一項舉措。而基因治療初創企業Greffex最近使用Parabricks Pipelines來加速其通用流感疫苗項目的開發。
能夠用于人口研究的基因組學洞見
Parabricks Pipelines在NVIDIA GPU上將DNA和RNA類項目的速度提高了50倍,這使科學家能夠從每天生成的數百兆字節儀器數據中提取盡可能多的有用信息。開展人口研究的公共衛生機構和研究實驗室由于需要分析數以萬計的基因組,因此尤其需要這種加速。
明碼生物技術公司采用Parabricks Pipelines和NVIDIA T4 Tensor Core GPU來加速其測序和多組學數據分析工作。該公司為醫療機構、制藥公司和研究人員提供用于疾病研究和藥物開發的基因組洞見。
泰國國家生物庫中的NVIDIA DGX A100 系統正在驅動泰國基因組學研究。這項舉措旨在將基因組醫學作為該國的一項常規醫療服務。該研究機構正在使用Parabricks Pipelines分析5萬名泰國志愿者全基因組測序數據中的基因變異。
通過組合DGX系統與Parabricks Pipelines,該項目的全基因組數據處理時間縮短了四個月。這項工作的成果將幫助研究人員更好地分析泰國人口特有的基因變異。
而日本東京大學人類基因組中心最近啟用了目前日本生命科學領域最快的超級計算機——SHIROKANE。這臺由DGX A100驅動的超級計算機正在運行Parabricks Pipelines對92000名患者的全基因組進行測序,創建了一個為癌癥和難治性疾病的精準醫療奠定基礎的數據庫。
推動臨床測序和新藥研發
Parabricks Pipelines 遺傳工具套件可通過配置來滿足每個實驗室的具體需求。研究人員可在各種NVIDIA GPU系統上運行Parabricks Pipelines工作負載,包括臺式工作站、GPU加速云和一些全球最快的超級計算機。
位于休斯頓的Greffex開始使用NVIDIA RTX數據科學工作站,現在該公司正在使用Parabricks Pipelines和NVIDIA Clara Discovery來推進其通用流感疫苗的開發工作。
這家初創企業結合基因組測序、分子動力學工具和濕式實驗室研究,對流感菌株如何隨時間演變以及這些變異如何影響疫苗的效力開展了研究。
為了監測流感變化,Greffex收集了來自世界各地的數萬個流感基因組并使用NVIDIA RTX 8000 GPU運行大規模的序列比對,確定了病毒遺傳密碼的變化之處。通過使用GPU運行基因組工作負載,該公司在每個樣本上節省了多達13小時的時間,同時也使其團隊能夠以不同的參數重新運行樣本,從而對排列結果進行微調。
Greffex科學家對流感病毒表面的蛋白質——血凝素進行了計算密集型分子動力學模擬,以了解它在自然環境中的表現。
一旦確定基因變異,Greffex科學家就會使用分子動力學來觀察這些基因變化如何改變流感病毒的物理形狀。他們現在正在密切觀察流感病毒的多態變異,這種變異可能使流感病毒變形成一種無法與疫苗抗體有效結合的形狀。
Greffex生物信息學科學家Daniel Preston表示:“如果一種疫苗不僅需要能夠與當前的流感病毒株結合,還要能夠與多種其他病毒株結合,那么其蛋白質結構的優化將是一個非常漫長且昂貴的過程。現在,我們可以通過計算方法在實際的實驗室測試之前了解什么可能會起到作用,這與過去的方法有著天壤之別。”
關于NVIDIA Clara Parabricks
NVIDIA Clara Parabricks為博德研究所的行業標準基因組分析工具包以及谷歌的DeepVariant基因調用器等流行工具帶來了GPU加速。Parabricks在NVIDIA A100 Tensor Core GPU上運行時,能夠將整個人類基因組的二次分析時間縮短到23分鐘,從而實現DNA生殖系變異識別。而如果在CPU系統上運行,則需要20多個小時。
除了DNA測序解讀之外,Clara Parabricks Pipelines還能夠對生殖系和體細胞變異檢測進行對齊、分類、篩選和變異識別,并且支持RNA類應用。生殖系變異是通過個體祖先遺傳的變異,而體細胞變異會在人的一生中發生并且可能引發癌癥。
Parabricks Pipelines 3.6版本將提供更多用于體細胞變異識別和新生殖系變異識別的工具,前者將為研究人員提供適用于精準腫瘤學的洞見,而后者將為自閉癥等復雜疾病的研究提供信息。
新生殖系變異識別管道(de novo germline variant calling pipeline)是與華盛頓大學醫學院研究人員合作開發的一項技術。該技術將基因組數據的解析時間縮短至一小時以下并能夠識別家族史或父母-子女三人組中的新變異。
可在NGC 或 AWS Marketplace 上獲得用于加速基因組分析的NVIDIA Clara Parabricks Pipelines。
責任編輯:haq
-
NVIDIA
+關注
關注
14文章
4940瀏覽量
102815 -
計算機
+關注
關注
19文章
7421瀏覽量
87718 -
AI
+關注
關注
87文章
30146瀏覽量
268417
原文標題:從基因組到蛋白質再到細胞,數字生物學革命在HPC和AI的推動下不斷前進
文章出處:【微信號:murata-eetrend,微信公眾號:murata-eetrend】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論