結合詞向量和聚類算法的話題演進分析
大小:0.74 MB 人氣: 2017-11-24 需要積分:0
標簽:聚類算法(12092)
話題演進分析主要是挖掘話題內容隨著時間流的演進情況。話題的內容可用關鍵詞來表示。利用word2vec對75萬篇新聞和微博文本進行訓練,得到詞向量模型。將文本流處理后輸入模型,獲得時間序列下所有詞匯的詞向量,利用K-means對詞向量進行聚類,從而實現話題關鍵詞的抽取。實驗對比了基于PLSA和LDA主題模型下的話題抽取效果,發現本文的話題分析效果優于主題模型的方法。同時,采集足夠大量、內容足夠豐富的語料,可訓練得到泛化能力比較強的模型,有利于實時話題演進分析研究工作。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
結合詞向量和聚類算法的話題演進分析下載
相關電子資料下載
- 基于K-means聚類算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類算法 498
- 如何在 Python 中安裝和使用頂級聚類算法 415
- 10種聚類算法和Python代碼4 1118
- 10種聚類算法和Python代碼3 960
- 10種聚類算法和Python代碼2 796
- 10種聚類算法和Python代碼1 644
- YOLOv5中的autoanchor.py代碼解析 1242
- 視覺新范式!COCs:將圖像視為點集 636
- 10種頂流聚類算法Python實現(附完整代碼) 989