摩爾線程開源高性能線性代數模板庫MUTLASS

近日，摩爾線程宣布開源高性能線性代數模板庫MUTLASS，以便開發者能夠更高效針對摩爾線程全功能GPU的MUSA Core及Tensor Core等單元進行編程，加速基于國產GPU的算子開發以及算法創新。

在數值計算和深度學習領域，矩陣乘法（GEMM）及其變種(如FlashAttention、Convolution）是構建復雜上層應用的基石。然而，為了追求更高的算子融合效率或者更創新的算法，開發者們往往需要超越標準化計算接口的限制，如標準BLAS接口以及芯片廠商的計算庫接口，以實現高性能的定制化算子。

MUTLASS（MUSA Templates for Linear Algebra Subroutines）正是為滿足這一需求而設計。作為摩爾線程專為MUSA架構優化的高性能計算庫，MUTLASS是基于開源模板庫CUTLASS進行的MUSA適配和定制化開發、優化，針對矩陣乘法及相關變種，MUTLASS提供了一系列高性能的C++模板組件，并采用了與muDNN庫類似的分層分解及數據搬運策略，以確保性能的充分發揮。

在本次開源的版本中，摩爾線程適配了CuTe后端庫，為其增加了第三代MUSA架構的MMA計算原語，支持TF32/FP16/BF16/INT8等多種數據精度，并以此為基礎，初步實現了矩陣乘法、默認實例庫、性能測試器及相關工具包的支持。

借助MUTLASS，開發者們既可以靈活復用不同層級的模板組件，也可以按需修改各種模板組件的實現細節，以較低的開發成本實現定制化的高性能算子，從而在摩爾線程全功能GPU上充分釋放性能，并嘗試更多的算法創新。

摩爾線程將持續優化MUTLASS的性能，并不斷引入新的功能。我們誠邀廣大開發者體驗MUTLASS，并提供寶貴的反饋意見，共同促進MUTLASS在性能和功能上的持續完善，攜手推動基于國產GPU的生態建設。

關于摩爾線程

摩爾線程成立于2020年10月，以全功能GPU為核心，致力于向全球提供加速計算的基礎設施和一站式解決方案，為各行各業的數智化轉型提供強大的AI計算支持。

我們的目標是成為具備國際競爭力的GPU領軍企業，為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4752

瀏覽量
129041
開源

開源

+關注

關注
3

文章
3368

瀏覽量
42566
摩爾線程

摩爾線程

+關注

關注
2

文章
200

瀏覽量
4597

原文標題：開源MUTLASS｜摩爾線程加速基于國產GPU的算子開發以及算法創新

文章出處：【微信號：moorethreads，微信公眾號：摩爾線程】歡迎添加關注！文章轉載請注明出處。

摩爾線程完成股改，籌備上市

近日，摩爾線程智能科技（北京）股份有限公司（簡稱“摩爾線程”）宣布已完成股改，并正積極籌備上市。據國家企業信用信息公示系統最新查詢結果顯示，摩爾

發表于 11-12 14:15 ?493次閱讀

摩爾線程成立摩爾學院，賦能GPU開發者

近日，摩爾線程宣布正式成立摩爾學院，為GPU開發者生態建設揭開新篇章。摩爾學院作為一個專業的GPU技術培訓與交流平臺，現已正式對外開放。

發表于 10-28 17:03 ?462次閱讀

摩爾線程與超圖軟件完成產品兼容認證

。據悉，為了確保產品間的兼容性，摩爾線程與超圖軟件進行了嚴格的測試工作。經過雙方的努力，適配調優后的軟件在摩爾線程GPU上展現出了卓越的性能

發表于 10-24 10:25 ?487次閱讀

摩爾線程與羽人科技完成大語言模型訓練測試

近日，摩爾線程與羽人科技攜手宣布，雙方已成功實現夸娥（KUAE）千卡智算集群與羽人系列模型解決方案的訓練兼容適配。在本次測試中，羽人科技通過摩爾線程夸娥千卡智算集群，高效完成了70億參

發表于 08-27 16:19 ?549次閱讀

摩爾線程正式開源音頻理解大模型MooER

近日，國內領先的GPU創新企業摩爾線程宣布了一項重大技術突破——正式開源其自主研發的音頻理解大模型MooER（摩耳）。這一舉動標志著我國在音頻處理與理解領域邁出了堅實的一步，特別是在基于國產硬件的AI模型研發上取得了顯著成就。

發表于 08-27 15:24 ?517次閱讀

摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配

近日，摩爾線程與北京智源人工智能研究院（簡稱：智源研究院）已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾

發表于 08-02 11:06 ?903次閱讀

摩爾線程攜手東華軟件完成AI大模型推理測試與適配

近日，摩爾線程與東華軟件云筑AI創新中心宣布，雙方已完成大模型推理測試與適配。依托摩爾線程的全功能GPU國產算力，東華軟件打造安全可信的基于私有化大模型的“智多型（A.I.Cognif

發表于 07-31 10:51 ?757次閱讀

摩爾線程和樂創能源簽署戰略合作協議

近日，摩爾線程和樂創能源簽署了戰略合作協議，雙方將聚焦能源大模型的創新與應用，圍繞新能源領域的電池、新能源發電、負荷管理、需求側響應等產品技術方向，共同研發能源大模型。依托摩爾線程全功

發表于 07-11 14:35 ?749次閱讀

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作，共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力，還涉及了基于摩爾

發表于 06-14 16:40 ?1100次閱讀

摩爾線程和滴普科技完成大模型訓練與推理適配

近日，摩爾線程與滴普科技宣布了一項重要合作成果。摩爾線程的夸娥（KUAE）千卡智算集群與滴普科技的企業大模型Deepexi已完成訓練及推理適配，共同實現了700億參數LLaMA2大語言

發表于 05-30 10:14 ?562次閱讀

集特摩爾線程顯卡#顯卡

顯卡摩爾線程

jf_67464575
發布于 :2024年05月07日 15:11:28

國產顯卡摩爾線程MTT S30講評

摩爾線程

國產計算機小秦
發布于 :2024年03月20日 16:20:37

摩爾線程MUSA/MUSIFY未受影響

近日，我們關注到網絡上對于英偉達CUDA兼容相關的報道，并對摩爾線程MUSA/MUSIFY也表示了關切。

發表于 03-06 09:50 ?754次閱讀

國產摩爾線程顯卡驅動重磅升級！

今日，摩爾線程正式發布版本號為v250.60的Windows驅動程序，著重對DirectX 11游戲性能進行了大幅優化。

發表于 02-21 09:13 ?1111次閱讀

MTVerse XR重磅上線，摩爾線程元計算版圖穩步展開

的應用程序通過高性能網絡和USB流式傳輸到XR設備。結合摩爾線程全功能GPU的強大能力，為用戶提供高質量的XR體驗。 MTVerse XR提供了低延時、高質量XR串流能力，同時支持無線WIFI和有線USB

發表于 01-09 20:14 ?955次閱讀

摩爾線程
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 摩爾線程MTT S系列GPU與愛特云V2.0完成適配
Hot 摩爾線程與長城超云構建智能云計算與綠色數據中心解決方案

New 摩爾線程發布最新圖形顯卡驅動程序v280.90.1
New 摩爾線程發布v280.90圖形顯卡驅動程序

精選推薦
更多

文章

資料

帖子

三菱電機超小型全SiC DIPIPM解析

三菱電機半導體
22分鐘前

65 閱讀

使用AMD Vitis進行嵌入式設計開發用戶指南

Xilinx賽靈思官微
4小時前

197 閱讀

晶振在工業相機中的應用

揚興科技
19小時前

224 閱讀

既然增益帶寬積中的增益是開環增益及其帶寬，那如何用增益帶寬積計算電路閉環帶寬呢？

硬件那點事兒
5小時前

229 閱讀

海信116英寸RGB-Mini LED：一朵綻放在科技穹頂的中國花火

腦極體
5小時前

234 閱讀

摩托羅拉A1200手機電路圖

小黑羊
4772

10積分

1474下載

openharmony第三方組件適配移植的3D翻轉功能

姚小熊27
2.95 MB

免費

2下載

用于openharmony和動畫的加載視圖控件

姚小熊27
1.64 MB

免費

4下載

QOwnNotes帶有Markdown支持的純文本記事本

斗地主之神
24.31 MB

2積分

3下載

Luau基于Lua的腳本編程語言

hsdou月半
5.17 MB

2積分

1下載

SMT貼片空焊異常

jf_61640453
14小時前

5 閱讀

HarmonyOS NEXT 原生應用開發：社交通訊發現界面實現

李洋水蛟龍
14小時前

10 閱讀

用于課題的無線轉速霍爾傳感器，新人應該從哪里開始學習

jf_48213409
14小時前

15 閱讀

labview怎樣實現成績圖錄入程序圖，還要顯示信息

jf_70720794
14小時前

173 閱讀

嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-初識設備樹之設備樹組成和結構

jf_13411809
14小時前

167 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

摩爾線程開源高性能線性代數模板庫MUTLASS

評論

摩爾線程完成股改，籌備上市

摩爾線程成立摩爾學院，賦能GPU開發者

摩爾線程與超圖軟件完成產品兼容認證

摩爾線程與羽人科技完成大語言模型訓練測試

摩爾線程正式開源音頻理解大模型MooER

摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配

摩爾線程攜手東華軟件完成AI大模型推理測試與適配

摩爾線程和樂創能源簽署戰略合作協議

摩爾線程與智譜AI完成大模型性能測試與適配

摩爾線程和滴普科技完成大模型訓練與推理適配

集特摩爾線程顯卡#顯卡

國產顯卡摩爾線程MTT S30講評

摩爾線程MUSA/MUSIFY未受影響

國產摩爾線程顯卡驅動重磅升級！

MTVerse XR重磅上線，摩爾線程元計算版圖穩步展開