布爾矩陣乘的分布式異構并行優化
大小:0.53 MB 人氣: 2017-11-21 需要積分:0
布爾多項式求解是當今密碼代數分析中的關鍵步驟,F4算法是布爾多項式求解的高效算法。分析了Lachartre為F4矩陣專門設計的高斯消去算法,針對其中布爾矩陣乘這一耗時的計算步驟,設計并實現了分布式異構(CPU+ MIC)并行算法。布爾矩陣相對于普通矩陣主要體現在矩陣元素取值區間不一樣上,由于布爾矩陣元素(O,1)導致矩陣乘操作的特殊性,普通矩陣乘的優化方法不能很好地滿足布爾矩陣乘的需求。分別從布爾矩陣的存儲、OpenMP多線程組織、訪存、任務劃分和調度等方面進行了性能優化,實現了布爾矩陣乘的分布式異構并行算法。通過隨機生成布爾矩陣測試,優化后的分布式異構并行程序相較于分布式同構并行程序達到了2. 45的加速比,體現了良好的性能提升。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%