隨著近年來乳腺癌的發病率逐漸上升,在現代醫學的眾多研究領域中,如何盡早發現和治療乳腺癌,早已成為了一個十分重要的核心課題。
近日,麻省理工學院計算機科學與人工智能實驗室(CSAIL)和馬薩諸塞州綜合醫院(MGH)合作,共同打造了一個新的深度學習模型,可以通過分析乳房 X 光圖像,找出人眼不易察覺的特征和規律,從而預測女性是否可能在未來五年內罹患乳腺癌(注意:是預測而非診斷)。
訓練結果顯示,該模型的預測準確率約為31%,遠超傳統預測方法的18%。研究團隊認為,以深度學習驅動的預測系統有望推動新的乳腺癌篩查計劃,可以將基于年齡的傳統篩查建議,變成基于風險因素的更加科學的個性化篩查建議。
該研究成果以論文的形式發表于期刊Radiology上。
不完善的傳統篩查建議
乳腺 X 線攝影技術,是目前醫療領域最常用的乳腺癌臨床檢查方法,經過一個世紀的發展,已被證明可以降低乳腺癌的死亡率。但由于 X 光的強輻射性和乳腺本身的敏感性,業內對篩查頻率和何時開始仍有爭議。
美國癌癥協會建議,所有女性都應該從 45 歲開始進行年度篩查。不過因為每個人的體質和生長環境不同,罹患乳腺癌的風險也不一樣,以年齡劃分篩查頻率過于泛化,很容易錯過乳腺癌的早期狀態,錯失最佳的治療時機(早期乳腺癌的5年生存率高達 98-100%)。
圖 | 乳腺X線攝影技術
在麻省理工學院的研究人員看來,相比采用一刀切的方式,如果能夠預測出女性罹患乳腺癌的風險系數,就可以制定更完善的個性化篩查方案,比如讓高危人群在 30 多歲時就每年檢查一次,低危人群則每三年檢查一次,那么或許可以將更多的乳腺癌扼殺在搖籃中,抑制它的發病率增長趨勢。
這種預測類型的任務,非常適合使用深度學習技術。實際上,已經有很多關于乳腺癌的研究團隊,正在嘗試使用人工智能和深度學習,幫助他們診斷乳腺癌(詳情請見:神經網絡的巧妙組合,乳腺癌診斷準確率竟媲美專業醫生)。
與眾不同的是,MIT團隊想要打造的是預測模型,并非診斷模型。換句話說,當 X 光照片還沒有出現乳腺癌的癥狀時,診斷模型只能給出沒有患病的結論,但預測模型應該給出未來一段時間內的患病概率,其難度可想而知。
設計預測模型
研究人員首先聯合了美國馬薩諸塞州綜合醫院,獲得了超過 6 萬名患者的 9 萬余張乳房 X 光圖像,以及她們是否在 5 年內被診斷出乳腺癌的信息,其中有 2.1 萬人沒有跟蹤檢查信息或者出現了其它癌癥,因此被排除在外。由于很多女性進行了多次 X 光掃描和跟蹤篩查,所以每一次掃描的圖像都會被分離出來,成為一個獨立的掃描案例。
之后,他們總結出了一系列與乳腺癌和個體有關的風險因素,包括族裔、年齡、體重和身高等基本信息,還有初次月經年齡、乳房密度、是否生產、初次懷孕年齡、是否患有卵巢癌、家族乳腺癌史等高度差異化的信息,甚至精確到家族中患有乳腺癌的是父母,姐妹,還是兄弟。
圖 | 神經網絡通過細微特征預測是否會出現乳腺癌(來源:MIT)
獲得這些精準信息,可以讓預測模型考慮的因素更加全面。每一個風險因素都會經過獨熱編碼(one-hot encoding)——一種在機器學習中常見的變量轉換機制,可以將某一變量的狀態用 0 和 1 組成的二進制向量表示出來——將所有編碼整合起來,就組成了一個大的風險因素向量,作為邏輯回歸模型(Logistic Regression,預測模型的一部分)的輸入值。
在此基礎上,研究人員又開發了一套以卷積神經網絡(CNN)為核心的圖片識別模型,使用的是開源的預訓練模型 ResNet-18。他們并沒有根據圖片分辨率變化調整模型,而是直接以1664 x 2048 像素的乳房 X 光圖片作為輸入值。
最后,他們整合了邏輯回歸和圖像識別兩個模型,制作了一個混合模型(Hybrid Model)。結合風險因素和圖像信息,該模型開始學習預測五年內是否會出現乳腺癌。
訓練和測試結果顯示,混合模型的 3-5 年患癌預測準確率約為 31.2%。乍看之下這一數字似乎不夠亮眼,但要知道,目前業界主流的Tyrer-Cuzick(TC)乳腺癌風險預測模型,在相同測試中的準確率只有 18.2%,不及麻省理工學院深度學習模型的六成。
圖 | 四套模型的準確率(AUC)對比:TC傳統模型,邏輯回歸模型,圖像識別模型和混合模型(來源:MIT/Radiology)
更重要的是,深度學習模型對不同族裔女性的預測準確率相同,而包括Tyrer-Cuzick 模型在內的很多現有模型大多依照白人女性數據建立,對非白人族裔的預測效果較差,可能有超過10%的差距。在深度學習的幫助下,這一誤差或將不復存在。
混合模型還發現了一些與現有認知矛盾的現象,比如業界主流聲音認為,乳房密度與乳腺癌風險相關,致密型乳房患癌風險較高(原因未知)。
但該模型預測結果顯示,存在有致密型乳房的低風險人群,也有低密度乳房的高風險人群,兩者患病率相差較大,因此僅憑乳房密度判斷患癌風險有失偏頗,可能會影響醫療決策。
圖 | 致密型乳房 + 低風險人群患癌率1.4%(左下)VS 低密度乳房 + 高風險人群發病率4.0%(右上)(來源:論文)
仔細分析和比對結果后,研究人員認為這一模型擁有巨大潛力。經過改進的版本有望替代現有的傳統乳腺癌風險預測模型,甚至是推動乳腺癌篩查策略的進步,制定更科學的醫療建議。
下一步,他們將著重突破現有研究的局限性,比如收集更全面的患者信息,并且與更多醫療機構合作,拓展 X 光圖像的來源,獲得不同設備拍攝的 X 光圖像,從而更好地改進預測模型的準確率。他們希望有朝一日,可以將其大規模拓展,用來預測心腦血管或胰腺癌等其它疑難疾病。
-
MIT
+關注
關注
3文章
253瀏覽量
23363 -
深度學習
+關注
關注
73文章
5492瀏覽量
120977
原文標題:MIT用深度學習預測乳腺癌患病概率,五年內準確率幾乎翻倍!
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論