資料介紹
在數據挖掘領域中,通常以分類精度作為分類算法效果的評估標準。這一標準是建立在假設任意一實例被誤分類為任意類時都具備同樣代價的基礎上的。當此假設不成立時,直接使用傳統分類方法就無法取得良好的分類和預測效果。針對這一問題,通過改進編解碼方法以及在適應度函數中集成樣本的不同誤分類代價,提出了一種基于基因表達式程序設計的代價敏感分類算法(CSC-GEP),并在三個UCI數據集上對該算法進行了測試,實驗結果表明CSC-GEP是一種有效的代價敏感分類算法。
關 鍵 詞 分類; 代價敏感; 誤分類代價; 基因表達式程序設計
In data mining reseach, the classification algorithms generally pursue more highly accuracy. It is based on the assumption that all misclassifications have the same cost. However, the assumption is not correct in the real world, so that the normal classification algorithms do not perform well. By improving the encode/decode methods and taking different misclassification cost into account, this paper concerns a new cost-sensitive algorithm called CSC-GEP based on Gene Expression Programming (GEP). The experimental results show that the new algorithm is effective.
Key words classification; cost-sensitive; cost of misclassification; gene expression programming
在數據挖掘中,分類的任務通常是建立一個期望誤分類數量最小的分類器,比較典型的例子如C4.5的決策樹算法,在傳統上都是基于分類錯誤具有相同的代價的假定上的。而在現實中,不同的分類錯誤通常會導致不同的代價。以UCI數據集中的Heart disease數據集為例,錯誤地將健康的人分類為患病的代價僅僅是使健康的人接受更多的檢查,但如果將患病的人分類為健康,則有可能延誤病人的治療。很明顯,第二種錯誤分類會令使用者付出遠比第一種錯誤分類更大的代價。仍以Heart disease數據集為例,在這一數據集上建立分類器的目的是為了檢測出患病的就診者。對某一特定疾病而言,可能存在的情況是全部就診者中僅有極少數是患病者,則在最糟糕的情況下,使用傳統分類方法產生的分類器只需要犧牲全部患病者的實例作為誤分類即可獲得一個在傳統意義上的高精度分類結果。但此時這個分類器也就喪失了存在的意義。因此在處理誤分類代價不統一的數據集時,單純地以分類精度作為分類器的評估標準就變得不恰當了。一種合理的解決方法是以代價敏感(Cost Sensitive Classification,CSC)的分類取代精度敏感的分類。
本文通過在GEP的適應度函數中加入代價矩陣,提出了基于基因表達式編程的代價敏感分類算法CSC-GEP。通過在UCI數據集中的Heart disease數據集、Sick數據集和Credit數據集上的分類算法與傳統算法進行實驗對比,結果證明CSC-GEP是一種有效的代價敏感分類算法。
- 緩存敏感的多屬性不等值連接操作算法 5次下載
- 計算二類代價矩陣的通用計算公式 8次下載
- 基于機器人操作系統的代價地圖自適應膨脹半徑算法 6次下載
- 基于約束關鍵路徑的代價優化調度算法 2次下載
- 基于直方圖條件熵的水聲數據分類算法 9次下載
- 一種基于BERT模型的社交電商文本分類算法 8次下載
- 最大化AUC關系的PU分類應用及相關算法 12次下載
- 集成WL-CNN和SL-Bi-LSTM的旅游問句文本分類算法 5次下載
- 結合BERT模型的中文文本分類算法 6次下載
- 如何使用跨尺度代價聚合實現改進立體匹配算法 10次下載
- 如何使用直方圖條件熵實現水聲數據分類的算法 22次下載
- 如何使用多線性分類器擬合實現攻擊模擬算法 2次下載
- 新的基于代價敏感集成學習的非平衡數據集分類方法NIBoost 12次下載
- 分類規則挖掘算法綜述
- 代價敏感支持向量機在垃圾郵件過濾中的應用
- 基于Python實現隨機森林算法 1017次閱讀
- 邊緣計算計算卸載與資源分配聯合優化算法 1033次閱讀
- 常見排序算法分類 783次閱讀
- 實現敏感薄膜的高性能化的主要途徑 519次閱讀
- 采用DSP芯片實現星敏感器運算電路系統的應用方案 5415次閱讀
- 機器學習算法的技巧分享 4244次閱讀
- 詳解機器學習分類算法KNN 5930次閱讀
- 圖像分類的5種技術,總結并歸納算法、實現方式,并進行實驗驗證 7.3w次閱讀
- 基于System Generator中實現算法的FPGA設計方案詳解 1693次閱讀
- 解決二分類問題的算法——AdaBoost算法 1.1w次閱讀
- 基于FPGA的Cordic算法實現的設計與驗證 2568次閱讀
- 分水嶺算法(理論+opencv實現) 8233次閱讀
- 貝葉斯分類算法及其實現 7380次閱讀
- 學習KNN算法的基本原理,并用Python實現該算法以及闡述其應用價值 5835次閱讀
- 詳細解析scikit-learn進行文本分類 4626次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多