2017年,黃巖誼課題組將通信理論中的糾錯碼引入到測序技術中,通過三條正交的簡并序列來檢測并校正測序錯誤。這項“糾錯碼測序技術”兼具較長的讀長和極高的準確度。近日,該課題組又在《國家科學評論》(National Science Review, NSR)發表文章,通過計算機模擬構建的“虛擬測序儀”,揭示了糾錯碼測序技術中“失相”問題的模式、特征,并在此基礎上建立了一個失相校正算法,為更加高效、準確的測序技術提供了一種實用解決方案。
高通量測序中的“失相”問題
近二十年來,新一代高通量測序技術快速發展,極大地改變了生命科學和醫學研究,并迅速進入醫學診斷等領域,服務于健康產業。
當前主流的高通量測序技術大多采用“邊合成邊測序”的方式,且會將每一條待測DNA分子擴增成多條DNA組成的簇,從而放大可檢測信號。理想情況下,一簇DNA中的每個分子在測序過程中都是同步的,所以周期性反應所獲得的測序信號就直接反映出待測DNA的序列信息。 然而,在真實的測序體系中,各個分子間從來都不是完美同步的。由于反應不完全或者反應體系中雜質引起的副反應,一簇DNA中的各個分子會逐漸失去同步性,反映到測序過程中,就會使測序信號變得紊亂,而無法直接反映DNA的序列信息。這一現象稱為“失相”,即分子間信號“相位”的失諧。失相問題極大地限制了高通量測序的讀長和準確性。
每一種基于類似原理的測序方法,都存在這樣的現象。而在使用不同化學反應的不同測序方法中,失相現象的特征也不盡相同。如要創建新的測序技術,對其失相現象的充分理解是一個必須解決的主要問題。
“糾錯碼測序”中的失相模式
為了提高測序技術的準確性,北京大學黃巖誼課題組于2017年將通信理論中的糾錯碼引入到測序技術中,通過三條正交的簡并序列來檢測并校正測序錯誤。這一項糾錯碼測序技術兼具較長的讀長和極高準確度的潛力。糾錯碼測序中也有失相問題。近期,黃巖誼課題組通過計算機模擬,構造了一個“虛擬測序儀”,來研究糾錯碼測序方法中失相問題的模式、規律,并探索解決方案。研究者發現,“單堿基滑動”是糾錯碼測序獨有的失相模式。在糾錯碼測序中,雜質引起的副反應會使DNA分子發生額外的延伸反應,稱之為初級超前反應。若初級超前反應僅延伸一個堿基,則該DNA分子會立刻被過量的底物進一步延伸,稱之為次級超前反應;而若初級超前延伸了不止一個堿基,則上述次級超前反應不會發生。即,次級超前反應發生的條件可以被歸納為單堿基滑動。
利用“虛擬測序儀”,研究者探索了DNA分子在不同反應條件下的延伸規律,找到了影響單堿基滑動的關鍵因素。依據單堿基滑動這一失相模式,作者還建立了一個失相校正算法,并證明該算法可用于校正至少500輪的測序反應(對應1000 bp的測序讀長)。 最后,作者還將失相校正算法推廣到了具有更高準確度的雙色糾錯碼測序上,并在實際測序中進行了驗證。“單堿基滑動”這一新型失相規律的發現和歸納,不僅僅對“糾錯碼測序方法”提供了更加深刻的理解,同時對于如何更加快速高效地實現對測序化學反應信號的解讀和推算,提供了一個實用的解決方案。
責任編輯:lq
-
算法
+關注
關注
23文章
4599瀏覽量
92642 -
DNA
+關注
關注
0文章
243瀏覽量
30982 -
測序儀
+關注
關注
0文章
18瀏覽量
7065
原文標題:黃巖誼課題組:利用虛擬測序儀,揭示“糾錯碼測序”中的失相模式 | NSR
文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學術圈】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論