精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

Spark下的并行多標(biāo)簽最近鄰算法

大小:1.06 MB 人氣: 2017-11-22 需要積分:2

  隨著大數(shù)據(jù)時(shí)代的到來(lái),大規(guī)模多標(biāo)簽數(shù)據(jù)挖掘方法受到廣泛關(guān)注。多標(biāo)簽最近鄰算法ML_KNN是一種簡(jiǎn)單高效、應(yīng)用廣泛的多標(biāo)簽分類方法,其分類精度在很多應(yīng)用中都高于其他常見(jiàn)的多標(biāo)簽學(xué)習(xí)方法。然而隨著需要處理的數(shù)據(jù)規(guī)模越來(lái)越大,傳統(tǒng)串行ML-KNN算法已經(jīng)難以滿足大數(shù)據(jù)應(yīng)用中時(shí)間和存儲(chǔ)空間上的限制。結(jié)合Spark的并行機(jī)制和其基于內(nèi)存的迭代計(jì)算特點(diǎn),提出了一種基于Spark并行框架的ML_KNN算法SML-KNN。在Map階段分別找到待預(yù)測(cè)樣本每個(gè)分區(qū)的K近鄰,隨后Reduce階段根據(jù)每個(gè)分區(qū)的近鄰集合確定最終的K近鄰,最后并行地對(duì)近鄰的標(biāo)簽集合進(jìn)行聚合,通過(guò)最大化后驗(yàn)概率準(zhǔn)則輸出待預(yù)測(cè)樣本的目標(biāo)標(biāo)簽集合。串行和并行環(huán)境下的對(duì)比實(shí)驗(yàn)結(jié)果表明,SML_KNN在保證分類精度的前提下性能與計(jì)算資源呈近似線性關(guān)系,提高了ML_KNN算法對(duì)大規(guī)模多標(biāo)簽數(shù)據(jù)的處理能力。

Spark下的并行多標(biāo)簽最近鄰算法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?