色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產GPU繞不開的CUDA生態(tài)

jf_C6sANWk1 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2022-11-29 09:36 ? 次閱讀

國內GPU廠家或許嘗試,摸著英偉達過河。

近日,摩爾線程在北京發(fā)布多款軟硬件新品,包括新一代GPU“春曉”、面向個人電腦的消費級顯卡MTT S80和服務器計算卡MTT S3000、一體化計算設備“MCCX元計算一體機”,以及開發(fā)套件、數(shù)字人解決方案等。GPU“春曉”做為本次發(fā)布會的核心產品受到廣泛關注。

“春曉”是摩爾線程的第二顆GPU,也是摩爾線程首顆面相國內消費級市場發(fā)售的GPU,它強調游戲、元宇宙與渲染用途,最重要的是,這個GPU支持英偉達CUDA生態(tài)。

其實經常關注顯卡的同學總能從英偉達的發(fā)布會上聽到CUDA這個詞,例如最新的RTX3060有擁有多少顆CUDA核心,某某游戲首發(fā)即支持CUDA生態(tài)等。作為顯卡領域的高頻詞匯,很多人好奇CUDA到底是什么?為什么國產顯卡會用到英偉達的技術?本文將帶你了解即熟悉又陌生的CUDA。

CUDA是什么?

CUDA(Compute Unified Device Architecture,統(tǒng)一計算架構)是由英偉達所推出的一種集成技術,是該公司對于GPGPU的正式名稱。通過這個技術,用戶可利用NVIDIA的GPU進行圖像處理之外的運算,CUDA也是首次可以利用GPU作為C-編譯器的開發(fā)環(huán)境。簡單來說,程序員平時如果不使用特定框架都是針對CPU進行編程的,CUDA是全球最大GPU廠商英偉達推出的針對GPU的編程的架構。

2006年,英偉達發(fā)布了CUDA,它提供了GPU編程的簡易接口,程序員可以基于CUDA編譯基于GPU的應用程序,利用GPU的并行計算能力更高效的解決復雜計算難題。在CUDA發(fā)布之前,程序員需要到顯卡內核并利用機器碼進行編譯,編程過程相當繁瑣也很困難。CUDA的發(fā)布,相當于將較為復雜的底層代碼封裝成了一個個簡單接口,使用時直接調用,其在GPU編程領域的革命性不亞于C、Python、PHP等高等編程語言的發(fā)明。當然,CUDA本身也是兼容C語言的,其本身就類似C語言,這可以幫助程序員更快速上手CUDA。現(xiàn)在主流的深度學習框架大多都基于CUDA進行GPU加速運算。

7ca6dda0-6f82-11ed-8abf-dac502259ad0.png

CUDA工作流程 圖源:CSDN

從硬件角度看,英偉達會經常宣傳自家顯卡擁有的CUDA Core數(shù)量。CUDA Core其實就是英偉達的流處理器,也就是FP32計算單元,同樣的結構在AMD的GPU內叫做SP。與CUDA Core相對的還有Tensor Core張量核心,從字面上就能看出該核心主要針對深度學習中的Tensor計算設計。Tensor計算就是混合精度計算,即在底層硬件算子層面用半精度(FP16)進行輸入和輸出,使用全精度(FP32)進行計算放置丟失過多精度的操作,這個底層硬件就是Tensor Core。CUDA 9.0引入了一個“warp矩陣函數(shù)” C++語言API,以便開發(fā)者可以使用GPU上的Tensor Core。

7cb9a84a-6f82-11ed-8abf-dac502259ad0.png

CUDA Core 圖源:知乎

CUDA與 GPGPU的概念一脈相承。GPU就是傳統(tǒng)意義上的顯卡與圖形加速卡。隨著人工智能產業(yè)爆炸式增長,導致計算復雜化和算力不足,CPU并行計算能力遠不如GPU,使得GPU在通用計算領域逐漸領先,為了進一步專注通用計算,GPGPU便應運而生。GPGPU與CUDA之間關系十分密切。GPGPU其實是去掉了圖形顯示功能的GPU,它將全部能力都投入到通用計算上,CUDA的出現(xiàn)讓GPU真正實現(xiàn)更廣泛的通用計算。CUDA與GPGPU也直接推動了AI與深度學習的發(fā)展與產業(yè)革命。

為什么要兼容CUDA?

當我們了解了CUDA是怎么回事,也就方便解釋為什么國產GPU需要兼容CUDA。

前文提到,目前世界上的主流深度學習架構都在使用CUDA,其主要原因就是深度學習的重要載體—GPU市場已被英偉達占領大半。隨之而來的,就是市面上絕大部分GPU相關軟件都是用CUDA開發(fā),國產GPU兼容CUDA可以同時“繼承”英偉達打造好的軟件生態(tài),也有更多資料可供學習,這對于蹣跚起步的國產GPU行業(yè)來說,減輕了不少開發(fā)難度,也降低了推廣壓力。

從開發(fā)角度分析。業(yè)內GPU工程師稱目前GPU市場可以籠統(tǒng)的分成兩大塊,分別是計算和渲染。此前國內GPU廠商通常專注與計算方面的研發(fā),也有少部分渲染產品問世,最近摩爾線程發(fā)布的GPU強調其具有強大的渲染能力。然而渲染賽道難度較大,其計算復雜度更高,除了通用計算,還包圖形渲染、前后端著色器配置、物體幾何屬性等需要處理。目前世界上標準API主要是CUDA與OpenCL,CUDA是英偉達系統(tǒng)架構,OpenCL則主要被AMD采用。采用標準化的API接口,無論是CUDA還是OpenCL,都可以極大減少開發(fā)渲染類GPU的前提投入,后期可以再做相應的優(yōu)化,這樣可以降低與CUDA等 “地位”穩(wěn)固的GPU生態(tài)直接競爭的難度。

從市場推廣角度看。英偉達的CUDA生態(tài)已經問世多年,與下游軟件、驅動廠家已經有了深度合作。大部分廠家對于GPU生態(tài)的觀點,往往是不在乎GPU本身好與壞,而是關注GPU好不好用、能不能用。好不好用的評價較為主觀,但采用現(xiàn)成的英偉達CUDA接口進行編程,可以規(guī)避大多數(shù)未知風險,多數(shù)初創(chuàng)企業(yè)開發(fā)GPU軟件采用統(tǒng)一接口也能增加開發(fā)穩(wěn)定性,降低人才招聘難度。所以,構建自己的GPU生態(tài)要慢慢起步,一味求快推廣自家生態(tài)只會把風險轉嫁給更多下游開發(fā)者。

國產GPU要挑戰(zhàn)CUDA嗎?

CUDA本身涵蓋了多個技術領域,其開發(fā)與后續(xù)更新都與英偉達自家GPU高度綁定,即使全部開源,第三方廠家也難以完美移植到自家GPU上。從另一個角度看,英偉達在GPU領域的壟斷地位主要通過CUDA平臺上的軟件生態(tài)實現(xiàn)。國產GPU若想真正做到與英偉達一較高下,CUDA生態(tài)是繞不開的最終BOSS。

知乎用戶對英偉達GPU生態(tài)做出分析。國產GPU廠商若無法做到與英偉達的架構、封裝技術、驅動優(yōu)化等都保持完全一致,CUDA生態(tài)就一定不會完美適配其他顯卡。做到完全移植,CUDA生態(tài)內的各種庫以及套件等都需要做相應調試,工作量太大。

此外,CUDA也并不是一成不變的。每隔一代GPU,CUDA架構就會發(fā)生很大變化。每個驅動小版本推送,CUDA都會做出部分微調。國產GPU如果完全基于CUDA生態(tài)進行開發(fā),那它的硬件更新將完全綁定英偉達的開發(fā)進程,這樣就失去了主動性,且永遠慢人一步。

不過內開發(fā)者也不用悲觀。CUDA本質是一個計算結構,甚至是一個理念,它并不需要英偉達的完全授權。我們可以參考英偉達的有力競爭者AMD。AMD的生態(tài)雖然基于開源生態(tài)OpenCL開發(fā),但AMD也制作了HIP的編程模式,與CUDA相比,其開發(fā)函數(shù)甚至可以進行直接替換。如果說英偉達在GPU領域是摸著石頭過河的,那AMD就是摸著英偉達過河。國內GPU廠家或許可以參考AMD發(fā)展模式,前期借鑒可以是后期創(chuàng)新的基礎。

寫在最后

CUDA作為英偉達壟斷GPU領域的關鍵力量,是國產廠商必須面對的挑戰(zhàn)。CUDA在誕生之初,為人們在深度學習與AI領域攻堅克難立下汗馬功勞,但如果它被用來鉗制新力量的發(fā)展,CUDA也將成為英偉達的馬奇諾防線。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4768

    瀏覽量

    129217
  • CUDA
    +關注

    關注

    0

    文章

    121

    瀏覽量

    13656
  • 英偉達
    +關注

    關注

    22

    文章

    3842

    瀏覽量

    91680

原文標題:國產GPU繞不開的CUDA生態(tài)

文章出處:【微信號:阿寶1990,微信公眾號:阿寶1990】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內容。 6. 故障排除:針對NVIDIA驅動安裝、多GPU設置、GPU模式、硬件識別、CUDA錯誤、TCC模式等問題給出了相應的解決方法。
    發(fā)表于 12-16 14:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應的單元。 倒金字塔結構GPU存儲體系 共享內存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構中,線程
    發(fā)表于 11-03 12:55

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理
    發(fā)表于 10-20 09:14

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達在GPU領域最大的護城河,尤其是隨著目前AI領域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)
    的頭像 發(fā)表于 07-19 00:16 ?4800次閱讀

    大模型發(fā)展下,國產GPU的機會和挑戰(zhàn)

    電子發(fā)燒友網站提供《大模型發(fā)展下,國產GPU的機會和挑戰(zhàn).pdf》資料免費下載
    發(fā)表于 07-18 15:44 ?10次下載
    大模型發(fā)展下,<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>的機會和挑戰(zhàn)

    英國公司實現(xiàn)英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在GPU計算領域,NVIDI
    的頭像 發(fā)表于 07-18 14:40 ?691次閱讀

    軟件生態(tài)上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。 ? 英偉達——CUDA的絕對統(tǒng)治 ? 相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUD
    的頭像 發(fā)表于 06-20 00:09 ?3754次閱讀

    借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

    Aerial CUDA 加速無線接入網 (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。
    的頭像 發(fā)表于 05-24 11:10 ?642次閱讀
    借助NVIDIA Aerial <b class='flag-5'>CUDA</b>增強5G/6G的DU性能和工作負載整合

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發(fā)表于 04-11 07:56

    大模型時代,國產GPU面臨哪些挑戰(zhàn)

    國產GPU在不斷成長的過程中也存在諸多挑戰(zhàn)。 ? 在大模型訓練上存在差距 ? 大語言模型是基于深度學習的技術。這些模型通過在海量文本數(shù)據(jù)上的訓練,學習語言的語法、語境和語義等多層次的信息,用于理解和生成自然語言文本。大語言模型是
    的頭像 發(fā)表于 04-03 01:08 ?4725次閱讀
    大模型時代,<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>面臨哪些挑戰(zhàn)

    國產GPU在AI大模型領域的應用案例一覽

    電子發(fā)燒友網報道(文/李彎彎)近一年多時間,隨著大模型的發(fā)展,GPU在AI領域的重要性再次凸顯。雖然相比英偉達等國際大廠,國產GPU起步較晚、聲勢較小。不過近幾年,國內不少GPU廠商成
    的頭像 發(fā)表于 04-01 09:28 ?3990次閱讀
    <b class='flag-5'>國產</b><b class='flag-5'>GPU</b>在AI大模型領域的應用案例一覽

    盤點國產GPU在支持大模型應用方面的進展

    電子發(fā)燒友網報道(文/李彎彎)目前談到GPU,大家首先想到的應該就是英偉達了。近一年多時間來,隨著大模型的發(fā)展,英偉達GPU的強大實力可謂無人不知。而相比之下,國產GPU的聲勢就小了許
    的頭像 發(fā)表于 03-29 00:27 ?7244次閱讀
    盤點<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>在支持大模型應用方面的進展

    國產GPU搭配國產處理器平臺主機

    處理器gpu
    GITSTAR 集特工控
    發(fā)布于 :2024年03月27日 14:11:32

    一文詳解GPU硬件與CUDA開發(fā)工具

    CPU 和 GPU 的顯著區(qū)別是:一個典型的 CPU 擁有少數(shù)幾個快速的計算核心,而一個典型的 GPU 擁有幾百到幾千個不那么快速的計算核心。
    的頭像 發(fā)表于 03-21 10:15 ?1308次閱讀
    一文詳解<b class='flag-5'>GPU</b>硬件與<b class='flag-5'>CUDA</b>開發(fā)工具

    GPU CUDA 編程的基本原理是什么

    神經網絡能加速的有很多,當然使用硬件加速是最可觀的了,而目前除了專用的NPU(神經網絡加速單元),就屬于GPU對神經網絡加速效果最好了
    的頭像 發(fā)表于 03-05 10:26 ?896次閱讀
    <b class='flag-5'>GPU</b> <b class='flag-5'>CUDA</b> 編程的基本原理是什么
    主站蜘蛛池模板: 吃春药后的女教师 | 亚洲国产精品久久人人爱 | 日本精品无码久久久久APP | 伊人无码高清 | 日欧一片内射VA在线影院 | 试看2分钟AA片 | 久热在线这里只有精品7 | Chinesetube国产中文 | 中文亚洲大香伊蕉不卡一区 | 全球真实小U女视频合集 | 成年黄网站免费大全毛片 | 岳打开双腿开始配合日韩视频 | 郭德纲于谦2012最新相声 | 在线亚洲精品福利网址导航 | 青草在线在线d青草在线 | 国产精品丰满人妻AV麻豆 | 成人国产AV精品久久久久 | 女人被弄到高潮叫床免 | 国产树林野战在线播放 | 性欧美video另类hd高清 | 伊人久久大香线蕉综合亚洲 | 果冻传媒免费观看 | 国产在线一区二区AV视频 | 国内精品乱码卡一卡2卡三卡 | 国产在线不卡 | 99热都是精品 | 黑吊大战白女出浆 | 青草久久精品亚洲综合专区 | 曰产无码久久久久久精品 | 天天狠狠弄夜夜狠狠躁·太爽了 | 色欲AV精品人妻一区二区三区 | 国产精品96久久久久久AV网址 | 自拍视频亚洲综合在线精品 | 杨幂视频1分11未删减在线观看 | 亚州日韩精品AV片无码中文 | 亚洲 日韩 国产 制服 在线 | 欧美性猛交XXXX乱大交极品 | 伊人免费在线 | 少女10声大哥喊退色狼 | 在线观看国产高清免费不卡 | 在线免费观看成年人视频 |