Spark漸進填充分區映射算法
大?。?/span>1.17 MB 人氣: 2018-01-14 需要積分:3
標簽:SPARK(19784)
分析Spark的作業執行機制,建立了執行效率模型和Shuffle過程模型,給出了分配適應度(AFD,allocation fitness degree)的定義,提出了算法的優化目標。根據模型的相關定義求解,設計了漸進填充分區映射算法(PFPM,progressive filling partitioning and mapping algorithm),通過擴展式分區和漸進填充映射,建立適應Reducer計算能力的數據分配方案,有效縮減Shuffle過程的同步延時,提高集群計算效率。實驗表明該算法提高了Shuffle過程數據分配的合理性,優化了并行計算框架Spark的作業執行效率。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
Spark漸進填充分區映射算法下載
相關電子資料下載
- 天數智芯主導的DeepSpark開源社區發布百大應用開放平臺24.06版本 436
- spark運行的基本流程 92
- Spark基于DPU的Native引擎算子卸載方案 180
- 百度前高管景鯤與朱凱華創立AI搜索公司,Genspark產品驚艷上線 458
- 關于Spark的從0實現30s內實時監控指標計算 111
- “Spark+Hive”在DPU環境下的性能測評 | OLAP數據庫引擎選型白皮書(24版)DPU部分 212
- 芯科科技和Arduino合作創建SparkFun Thing Plus Matter板 234
- Sparkle撼與科技發布TBX-750FA-V2顯卡塢,支持3.5槽厚顯 243
- 如何注冊星閃Sparklink設備媒體接入層標識、地址碼? 246
- 如何利用DPU加速Spark大數據處理? | 總結篇 661