昨天,百度研究院宣布他們開發了一種深度學習算法,在檢測乳腺癌的微轉移方面超過了人類病理學醫生的表現。以下是論智對該項目的編譯報道。
癌癥是目前醫學領域的重大挑戰之一,應對癌癥最有效的方法之一就是早發現、早治療,這對提高病人的生存率有著重要意義。早期檢測的主要方法就是檢查淋巴結是否有癌細胞的微轉移。目前,對活組織檢查的病理研究通常被視作金標準。然而,檢查病理片子也并不容易,很多時候需要經驗豐富的病理醫生進行診斷。放大40倍的數字化病理圖片通常含有數十億個像素,可能會占用好幾個G的磁盤空間。在這些大型文件里,病理醫生們有時還需要找到癌癥的微轉移,或者象征癌癥早期的小范圍腫瘤細胞。這些腫瘤細胞群的直徑可能還不到1000個像素。所以想在醫學影像中不放過任何細微并且有價值的標記,是非常復雜且耗時的工作。如下圖,就展示了這一過程的難度。
注:在放大40倍的數字化病理圖像中,一個像素約為0.243微米。而微轉移的判斷標準通常為最大直徑為200微米以上的腫瘤細胞群,大約相當于823個像素。
目前為止,有許多科學家提出用基于深度學習的算法幫助病理醫生進行醫學影像分析,檢測癌癥是否轉移。由于原始電子影像體積非常大,大多數算法目前只是將影像分割成更小的圖像塊,例如256×256像素的小圖。之后,人們會訓練一個深度卷積神經網絡,將包含腫瘤細胞的圖像和正常組織圖像區分開來。但是,有些時候如果不參考周圍的組織,就很難判斷某張圖片中是否含有腫瘤細胞,誤報也會經常出現。下圖就是這樣難以判斷的例子:
最近,百度研究院的科學家們提出了一種新的深度學習算法,在輸入時不只輸入單一的圖像,而是將其分割成網格狀,連同周圍的圖像一同作為輸入,用神經條件隨機場(NCRF)對周圍圖像的空間關系進行建模,預測它們是腫瘤細胞還是正常細胞。這種技術可以看做是病理醫生將醫學影像縮小,視野進一步擴大,從而能做出更可靠的判斷。相鄰幾張圖片之間的空間關系通過一種特殊的概率圖形模型進行建模,該模型成為“條件隨機場(conditional random fields)”。而整個深度學習框架可以在端到端GPU上進行訓練,并且不需要任何后期處理。
算法的基本架構如下圖所示:
NCRF有兩個主要部分組成:CNN和CRF。CNN主要作為特征提取器,將網格一樣的圖像輸入CNN中后,它會將每個圖像塊編碼成固定長度的向量表示(即嵌入)。這些嵌入之后被輸入到CRF中,并對它們的空間關系進行建模。CRF最后輸出的是每個圖像塊的邊緣分布(marginal distribution),用來表示這是正常組織還是腫瘤細胞的圖像。
在實驗過程中,百度所提出的NCRF方法與其他沒有CRF的傳統算法有三點不同:
NCRF有著更光滑的概率圖,其中邊界更清晰
NCRF的分類準確度更高
NCRF在檢測癌癥轉移時,比普通方法表現得更好
通過分析相鄰圖像間的空間關系,研究人員所提的算法產生的誤報率更少。下圖展示了該算法所預測出的腫瘤區域,以及和之前不考慮相鄰區域的算法之間的對比。可以看到基于NCRF的算法有更少的誤報情況:
(a)原始影像圖片;(b)經過病理醫生標注過的圖像,白色區域表示腫瘤細胞轉移;(c)傳統算法預測的腫瘤區域;(d)我們的算法預測的腫瘤區域
第二,NCRF通過在訓練時結合周圍圖像之間的空間關系,提高了CNN特征提取器的準確度。下圖顯示了在ResNet-18架構上,傳統方法和NCRF方法的不同。
可以看到,NCRF在訓練時的精確度比傳統方法要高。
另外,在評估NCRF檢測腫瘤轉移性能的實驗上,研究人員得到了以下結果:
最后,在Camelyon16挑戰賽的測試集上,該算法在腫瘤定位分數(FROC)上取得了0.8096的成績,不僅比上一次挑戰賽的冠軍算法(0.8074)優秀,還比一位專業病理學醫生更準確(0.7240)。目前,這一算法已經在GitHub上開源,希望能促進AI在病理分析的發展。
這項新的腫瘤檢測算法能讓醫生更多的關注算法高亮區域,而不是大海撈針似的在整幅圖像中搜尋腫瘤的痕跡。這對于提高病理檢測的效率和準確性都有重要意義。未來我們將在更大的數據集上系統地評估這一算法,并且嘗試使用大于3×3的圖像網格作為輸入,因為它能應對更大的接受域,并能在癌癥轉移檢測中表現出更好地性能。
-
百度
+關注
關注
9文章
2255瀏覽量
90255 -
深度學習
+關注
關注
73文章
5492瀏覽量
120977
發布評論請先 登錄
相關推薦
評論