基于MapReduce數據流相似性搜索并行算法
大小:0.92 MB 人氣: 2017-12-07 需要積分:2
設計時間序列數據在Hadoop分布式文件系統(HDFS)中的有效存儲方式,利用分布式緩存工具Distributed Cache將各子序列分發到Hadoop集群的計算節點上,將動態時間彎曲距離矩陣劃分成多個子矩陣,采取并行迭代計算每條反對角線上子矩陣的方法,基于MapReduce編程模型,實現高效并行計算時間序列動態彎曲距離,通過改進剪裁冗余計算方法,設計實現一種數據流多模式相似性搜索并行算法。中國雪深長時間序列數據集的實驗結果表明,當每條時間序列的長度達到5000以上時,并行計算動態彎曲距離所需時間少于串行計算所需時間,當每條時間序列的長度達到9000以上時,參與計算的集群節點越多,并行計算所需時間越少;當模式長度達到4000、參與計算的集群節點數達5個以上時,從數據流中并行搜索出與模式匹配的相似子序列所需時間約為串行搜索所需時間的20%。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于MapReduce數據流相似性搜索并行算法下載
相關電子資料下載
- 倍加福打造工業4.0解決方案 實現無縫數據流通 3786
- 比無縫漫游更高級的無感漫游,你聽說過嗎? 234
- 2024年春節通信行業網絡運行安全穩定,移動數據流量與漫游業務大幅增長 363
- 8-1多路復用器有哪些應用場景呢 627
- 實時交換機與非實時交換機的區別是什么? 1703
- 傳輸控制協議TCP特點及三次握手過程 845
- 可重構數據流計算引領架構創新 639
- labview編寫程序的一般步驟 1191
- 《愛立信移動市場報告》:5G強勁成長-全球移動數據流量在未來六年增長三倍 512
- 傳輸層的主要功能是什么 1802