基于中心向量的多級(jí)分類KNN算法研究
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)KNN算法在中文文本分類時(shí)的兩個(gè)不足:訓(xùn)練樣本分布不均,分類時(shí)計(jì)算開銷大的問題,在已有改進(jìn)算法的基礎(chǔ)上進(jìn)行了更深入的研究,提出多級(jí)分類KNN算法。算法首先引入基于密度的思想對(duì)訓(xùn)練樣本進(jìn)行調(diào)整,通過樣本裁減技術(shù)使樣本分布更趨于理想的均勻狀態(tài),同時(shí)計(jì)算各類別的類中心向量。在保證類中心向量準(zhǔn)確性的前提條件下,使分類階段的復(fù)雜計(jì)算提前到分類器的訓(xùn)練過程中。最后一級(jí)選用合適的m值(預(yù)選類別個(gè)數(shù)),根據(jù)最近鄰思想對(duì)待分類文本進(jìn)行所屬類別判定。實(shí)驗(yàn)結(jié)果表明,該算法在不損失分類精度的情況下,不僅降低了計(jì)算復(fù)雜度,而且顯著提高了分類速度。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于中心向量的多級(jí)分類KNN算法研究下載
相關(guān)電子資料下載
- 大模型卷價(jià)格,向量數(shù)據(jù)庫(kù)“卷”什么? 1556
- 開源芯片系列講座第20期:基于RISC-V向量擴(kuò)展的開源GPGPU軟硬件設(shè)計(jì) 140
- 應(yīng)用于MEMS執(zhí)行器的8英寸硅晶圓上的KNN無鉛技術(shù)介紹 345
- 如何利用一些小技巧實(shí)現(xiàn)SVM的增量式訓(xùn)練 321
- 深度解析機(jī)器學(xué)習(xí)各大模型原理 1144
- 泛林集團(tuán)宣布推出全球首款面向量產(chǎn)的脈沖激光沉積(PLD)機(jī)臺(tái) 715
- 搭載英偉達(dá)GPU,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù) 285
- 飛騰信息技術(shù)有限公司:復(fù)數(shù)向量卷積處理技術(shù)及設(shè)備 183
- Zilliz攜手大模型生態(tài)企業(yè)玩轉(zhuǎn)GDC 2024,向量數(shù)據(jù)庫(kù)和RAG成行業(yè)焦點(diǎn) 214
- 與NVIDIA深度參與GTC,向量數(shù)據(jù)庫(kù)大廠Zilliz與全球頂尖開發(fā)者共迎AI變革時(shí)刻 215