“精準醫療”是醫學全新領域的分支,是根據個體基因差異、個人生活方式以及環境因素,在精準數據的指導下對疾病開展預防和治療的新方法;從狹義的角度講,是利用已知的基因信息,為目前腫瘤、傳染性疾病和遺傳病提供針對個體化的更為有效的治療手段之一。
近年,國家將"精準醫療"列入"十三五"健康發展問題進行研究,《健康中國“2030”規劃綱要》更提出了加強精準醫學等關鍵技術的突破?!熬珳梳t療”需要不斷響應最新的信息技術和醫療進展,是典型的交叉學科。當前先進計算技術已經被應用到蛋白質結構研究,計算機輔助藥物設計,生物信息學等。
海量數據分析,對先進計算需求升級
作為生物信息學的一個重要分支,基因數據處理一般需要進行4步處理,分別是對測序獲取的短序列進行比對拼接、進行全基因組基因注釋、對預測的基因進行功能注釋、比較基因組和分子進化分析。
在這個過程中,面臨眾多技術挑戰。
一方面是軟件應用問題:對應某一功能的軟件數以百計,隨著儀器的更新換代,同一款軟件的算法也不斷升級,造成軟件選擇難;另外分析效率不高,多為領域專家依賴腳本語言和庫寫成的軟件,未考慮與硬件資源使用的匹配。
同時,分析流程中多軟件銜接難:多數的高通量測序數據分析需幾個軟件配合完成,各軟件通過腳本和大數據的重復讀寫來協調。例如,比對之后做SNP檢測,那么比對結果將作為SNP分析的輸入。各軟件資源使用特征差異大:如拼接軟件需要大量的內存消耗,比對則是典型的數據密集計算。
二方面是數據存儲問題。由于基因測序過程不允許被中斷,對支撐測序應用的存儲系統穩定性和可靠性的要求則極為苛刻。基因測序中,25微秒采集一幅高清晰圖像,對性能要求也超過了現有閃存固態盤的最高帶寬,必須采用更快的固態盤。
另外,海量小數據將產生全新的存儲需求。海量小文件的文件尺寸小,物理位置跨度大,而文件系統的每次文件訪問都會伴隨一定的元數據操作。文件數量越多,元數據訪問壓力越大;此外,海量小文件讀寫并發隨機訪問,對存儲系統的隨機讀寫性能有極高的要求。
由此可見,基因數據分析在對先進計算的計算能力和存儲的容量、吞吐能力、存儲架構都提出了不同于其他應用的全新要求。
曙光先進計算與“精準醫療”共成長
曙光有著豐富的精準醫療合作經驗。非典時期,曙光4000無償協助完成了SARS全基因組測序。今年,新冠肺炎疫情蔓延,5月,學術界頂級周刊《自然》雜志發表針對新型冠狀病毒的研究成果。此項研究得到了正在建設中的“轉化醫學國家重大科技基礎設施”有力支撐。該成果的基因數據分析等研究工作使用了2019年中科曙光部署完成的先進計算系統。
精準醫療以健康大數據為基礎、以移動通信為手段,將使人類健康管理真正做到個性化、精確化。面對“精準醫療”這一項復雜的工程,曙光針對第三代基因測序、組學分析等技術的大批量、小規模,一次提交成百上千應用數據處理需求特點,以及多種基因檢測及特征分析軟件并存、更新迭代快且無統一標準的局面,曙光先進計算將全面升級,具備PB(十億億字節)級儲存架構下,解決數據復雜流程分析能力,并適應軟件的多樣與多變。
據悉,曙光已為“北京大學醫學部”、“四川省人民醫院”等超12所三甲級醫院,以及“重慶市巴南醫院”、“江蘇泰州市人民醫院”等超50家普通醫院、縣級醫院、醫療機構等提供計算服務。此外,曙光還與華大基因等“基因組學研發機構”合作,推動基因測序行業發展。曙光先進計算將不斷突破技術發展的極限,為精準醫療大發展、大爆發提供有力技術支撐。
責任編輯:xj
原文標題:"精準醫療"新需求,"先進計算"新應對
文章出處:【微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
-
計算
+關注
關注
2文章
446瀏覽量
38738 -
精準醫療
+關注
關注
0文章
14瀏覽量
2335
原文標題:"精準醫療"新需求,"先進計算"新應對
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論