融合T-Rank和Softmax的提取算法
近年來,由于科學技術的發展以及基因診斷的進步,人們對高維生物數據有了更深的認識,基因表達譜數據一次性可以獲得成千上萬個基因片段的表達值,然而很多疾病只與少數幾個關鍵致病基因有關。利用特征選擇算法有助于在缺乏先驗知識的情況下縮小致病關鍵基因的候選范圍,并深入研究在分子層面上致病機理。目前關于關鍵特征基因篩選的方法大致可以分為三類:過濾法、纏繞法、混合法。過濾法主要是用指標對基因進行排序篩選,方法簡單,但忽略了基因間的相互信息,分類準確性較差。纏繞法主要將特征選擇與分類器纏繞在一起,使得選擇的特征能有較好的分類準確性,然而該方法對于高維數據計算量極大。混合法則是上述兩種的結合?;虮磉_數據的高維性和冗余性使得基于機器學習的混合法有著較好應用。李霞等較早地提出了一種基于遞歸分類樹的集成特征選擇方法EFST,該方法對不同的分類器都有較好的適應性。李穎新等較早的將支持向量機應用到了腫瘤分類特征基因識別中。呂颯麗等使用決策森林來進行特征選擇,再使用人工神經網絡作為分類器,獲得了很好的分類效果。張飛等在肺鱗狀癌細胞發展的特征基因提取中建立了四步篩選方案:相關性篩選、顯若性篩選、偏最小二乘算法、基于模式識別分類精度的綜合篩選,實證分析顯示了多重篩選機制的必要性,構建的分類器對三個集有較好的準確率,重要的是篩選出的特征基因得到了分子生物學層面的解釋。銀屑病是一種常見的慢性復發性炎癥性皮膚病,但是銀屑病的病因尚未闡明。本文將針對銀屑病基因表達譜數據提出一種新的特征選擇算法,并構建銀屑病基因診斷的分類模型。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%