資料介紹
并行矩陣乘法是線性代數中最重要的基本運算之一,同時也是許多科學應用的基石。隨著高性能計算(HPC)向E級計算發展,并行矩陣乘法的通信開銷所占比重越來越大。如何降低并行矩陣乘法的通信開銷,提高并行矩陣乘的可擴展性是當前研究的熱點之一。本文提出一種新型的分布式并行稠密矩陣乘算法,即2.5D版本的PUMMA( Parallel Universal matrix Multiplication Algorithm)算法,該算法是通過將初始的進程分成c組,利用計算節點的額外內存,在每個進程組上同時存儲矩陣A、B和執行1/c的 PUMMA算法,最后通過規約操作來得到矩陣乘的最終結果。本文基于 BLACS( Basic Linear Algebra Communication Subprograms)通信庫實現了一種從2D到2.5D的新型數據重分配算法,與 PUMMA算法相結合,最終得到2.5 D PUMMA算法,可直接替換 PDGEM( Parallel double- precision General Matrix-matrix Multiplication),具有良好的可移植性。與國際標準算法庫 ScalaPACK( Scalable Linear algebra Package)中的 PDGEMM等經典D算法相比,本文算法縮減了通信次數,提高了數據局部性,具有更好的可擴展性。在進程數較多時,例如4096進程時,系統測試表明相對 PDGEMM的加速比可達到2.20~2.93.進一步地,本文將2.5 D PUMMA算法應用于加速計算對稱三對角矩陣的特征值分解,其加速比可達到1.2以上本文通過大量數值算例分析了2.5DMMA算法的性能,并給出了實用性建議和總結了未來的工作。
- MapReduce框架下分布式編碼計算容錯算法 2次下載
- 深層轉導式非負矩陣分解并行算法 16次下載
- 輕量級分布式機器學習系統及算法 16次下載
- 基于分布式編碼的同步隨機梯度下降算法 2次下載
- 基于分布式數據Cache的實時動態遷移機制 20次下載
- 結合網絡推演和失效檢測算法的航電分布式顯控 13次下載
- 增量式約簡最小二乘孿生攴持向量回歸機算法 15次下載
- 一種分布式網絡掃描架構和任務調度算法 19次下載
- 快速在線分布式對偶平均優化算法 5次下載
- 基于并行遺傳算法的VOD系統負載均衡研究 0次下載
- FIR數字濾波器分布式算法的原理及FPGA實現
- 分布式并行BOD系統資源管理算法研究
- 基于DSP的分布式并行遺傳算法
- 基于ProActive的分布式并行Web Spider設計
- 分布式數據挖掘計算過程-DDCP算法研究
- 一種完全分布式的點線協同視覺慣性導航系統 470次閱讀
- Java手寫分布式鎖的實現 612次閱讀
- tldb提供分布式鎖使用方法 923次閱讀
- 基于PyTorch的模型并行分布式訓練Megatron解析 3196次閱讀
- 深入理解redis分布式鎖 988次閱讀
- 如何對spmv算法進行優化 1257次閱讀
- 鴻蒙分布式相機“踩坑”分享 1910次閱讀
- 一文讀懂經典雙目稠密匹配算法SGM 1564次閱讀
- 利用NI VeriStand 2010實現分布式同步系統的設計 3437次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應用 8835次閱讀
- Redis 分布式鎖的正確實現方式 3615次閱讀
- 淺談分布式塊存儲的元數據服務設計 4951次閱讀
- 并行計算和分布式計算的區別和聯系 3.6w次閱讀
- 一種基于分布式算法的低通FIR濾波器 3282次閱讀
- 深度解讀分布式存儲技術之分布式剪枝系統 1861次閱讀
下載排行
本周
- 1A7159和A7139射頻芯片的資料免費下載
- 0.20 MB | 55次下載 | 5 積分
- 2PIC12F629/675 數據手冊免費下載
- 2.38 MB | 36次下載 | 5 積分
- 3PIC16F716 數據手冊免費下載
- 2.35 MB | 18次下載 | 5 積分
- 4dsPIC33EDV64MC205電機控制開發板用戶指南
- 5.78MB | 8次下載 | 免費
- 5STC15系列常用寄存器匯總免費下載
- 1.60 MB | 7次下載 | 5 積分
- 6AN158 GD32VW553 Wi-Fi開發指南
- 1.51MB | 2次下載 | 免費
- 7模擬電路仿真實現
- 2.94MB | 2次下載 | 免費
- 8AN095 提高GD32溫度傳感器使用精度的方法
- 631.03KB | 1次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 452次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 140次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 137次下載 | 免費
- 4A7159和A7139射頻芯片的資料免費下載
- 0.20 MB | 55次下載 | 5 積分
- 5PIC12F629/675 數據手冊免費下載
- 2.38 MB | 36次下載 | 5 積分
- 6如何正確測試電源的紋波
- 0.36 MB | 19次下載 | 免費
- 7PIC16F716 數據手冊免費下載
- 2.35 MB | 18次下載 | 5 積分
- 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統EMC試驗方法及要求
- 1.97 MB | 8次下載 | 10 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論
查看更多