色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU技術的關鍵參數有哪些和應用場景詳細說明

Wildesbeast ? 來源:今日頭條 ? 作者:晗狄技術觀 ? 2020-01-12 10:25 ? 次閱讀

隨著云計算,大數據和人工智能技術發展,邊緣計算發揮著越來越重要的作用,補充數據中心算力需求。計算架構要求多樣化,需要不同的CPU架構來滿足不斷增長的算力需求,同時需要GPU,NPU和FPGA等技術加速特定領域的算法和專用計算。以此,不同CPU架構,不同加速技術應用而生。

理解 GPU 和 CPU 之間區別的一種簡單方式是比較它們如何處理任務。CPU 由專為順序串行處理而優化的幾個核心組成,而 GPU 則擁有一個由數以千計的更小、更高效的核心(專為同時處理多重任務而設計)組成的大規模并行計算架構。

CPU是一個有多種功能的優秀領導者。它的優點在于調度、管理、協調能力強,計算能力則位于其次。而GPU相當于一個接受CPU調度的“擁有大量計算能力”的員工。

GPU可以利用多個CUDA核心來做并行計算,而CPU只能按照順序進行串行計算,同樣運行3000次的簡單運算,CPU需要3000個時鐘周期,而配有3000個CUDA核心的GPU運行只需要1個時鐘周期。

簡而言之,CPU擅長統領全局等復雜操作,GPU擅長對大數據進行簡單重復操作。CPU是從事復雜腦力勞動的教援,而GPU是進行大量并行計算的體力勞動者。那么,GPU的重要參數有哪些呢?

CUDA核心;CUDA核心數量決定了GPU并行處理的能力,在深度學習機器學習等并行計算類業務下,CUDA核心多意味著性能好一些

顯存容量:其主要功能就是暫時儲存GPU要處理的數據和處理完畢的數據。顯存容量大小決定了GPU能夠加載的數據量大小。(在顯存已經可以滿足客戶業務的情況下,提升顯存不會對業務性能帶來大的提升。在深度學習、機器學習的訓練場景,顯存的大小決定了一次能夠加載訓練數據的量,在大規模訓練時,顯存會顯得比較重要。

顯存位寬:顯存在一個時鐘周期內所能傳送數據的位數,位數越大則瞬間所能傳輸的數據量越大,這是顯存的重要參數之一。

顯存頻率:一定程度上反應著該顯存的速度,以MHz(兆赫茲)為單位,顯存頻率隨著顯存的類型、性能的不同而不同。顯存頻率和位寬決定顯存帶寬。

顯存帶寬:指顯示芯片與顯存之間的數據傳輸速率,它以字節/秒為單位。顯存帶寬是決定顯卡性能和速度最重要的因素之一。

其他指標:除了顯卡通用指標外,NVIDIA還有一些針對特定場景優化的指標,例如TsnsoCore、RTCoreRT等能力。例如TensenCore專門用于加速深度學習中的張量運算。

評估一個顯卡的性能不能單純看某一個指標的性能,而是結合顯卡的個指標及客戶業務需求的綜合性能。

GPU是協處理器,與CPU端存儲是分離的,故GPU運算時必須先將CPU端的代碼和數據傳輸到GPU,GPU才能執行kernel函數。涉及CPU與GPU通信,其中通信接口PCIe的版本和性能會直接影響通信帶寬。

GPU的另一個重要參數是浮點計算能力。浮點計數是利用浮動小數點的方式使用不同長度的二進制來表示一個數字,與之對應的是定點數。同樣的長度下浮點數能表達的數字范圍相比定點數更大,但浮點數并不能精確表達所有實數,而只能采用更加接近的不同精度來表達。

FP32單精度計算

單精度的浮點數中采用4個字節也就是32位二進制來表達一個數字,1位符號,8位指數,23位小數,有效位數為7位。

FP64雙精度計算

雙精度浮點數采用8個字節也就是64位二進制來表達一個數字,1位符號,11位指數,52位小數,有效位數為16位。

FP16半精度計算

半精度浮點數采用2個字節也就是16位二進制來表達一個數字, 1位符號、5位指數、10位小數,有效位數為3位。

因為采用不同位數的浮點數的表達精度不一樣,所以造成的計算誤差也不一樣。

對于需要處理的數字范圍大而且需要精確計算的科學計算來說,就要求采用雙精度浮點數,例如:計算化學,分子建模,流體動力學。

對于常見的多媒體和圖形處理計算、深度學習、人工智能等領域,32位的單精度浮點計算已經足夠了。

對于要求精度更低的機器學習等一些應用來說,半精度16位浮點數就可以甚至8位浮點數就已經夠用了。

對于浮點計算來說,CPU可以同時支持不同精度的浮點運算,但在GPU里針對單精度和雙精度就需要各自獨立的計算單元,一般在GPU里支持單精度運算的單精度ALU(算術邏輯單元)稱之為FP32 core,而把用作雙精度運算的雙精度ALU稱之為DP unit或者FP64 core,在Nvidia不同架構不同型號的GPU之間,這兩者數量的比例差異很大。

談到GPU,Nvidia是行業技術的領先者和技術奠基者,其產品主要分以下幾個系列,分別面向不同的應用類型和用戶群體。

? GeForce系列:主要面向3D游戲應用的GeForce系列,幾個高端型號分別是GTX1080TI、Titan XP和GTX1080,分別采用最新的Pascal架構和Maxwell架構;最新的型號RTX 2080TI,Turing架構。因為面向游戲玩家,對雙精度計算能力沒有需求,出貨量也大,單價相比采用相同架構的Tesla系列產品要便宜很多,也經常被用于深度學習、人工智能、計算機視覺等。

? Quadro系列:主要面向專業圖形工作站應用,具備強大的數據運算與圖形、圖像處理能力。因此常常被用在計算機輔助設計及制造CAD/CAM、動畫設計、科學研究(城市規劃、地理地質勘測、遙感等)、平面圖像處理、模擬仿真等。

? GPU加速計算Tesla系列:專用GPU加速計算,Tesla本是第一代產品的架構名稱,后來演變成了這個系列產品的名稱了,包括V100、P100、K40/K80、M40/M60等幾個型號。K系列更適合用作HPC科學計算,M系列則更適合機器學習用途。

Tesla系列高端型號GPU加速器能更快地處理要求超級嚴格的 HPC 與超大規模數據中心的工作負載。從能源探測到深度學習等應用場合,處理速度比使用傳統 CPU 快了一個數量級。

? GPU虛擬化系列:Nvidia專門針對虛擬化環境應用設計GRID GPU產品,該產品采用基于 NVIDIA Kepler 架構的 GPU,首次實現了 GPU 的硬件虛擬化。這意味著,多名用戶可以共享單一 GPU。

GRID GPU產品主要包含K1和K2兩個型號,同樣采用Kepler架構,實現了GPU的硬件虛擬化,可以讓多個用戶共享使用同一張GPU卡,適用于對3D性能有要求的VDI或云環境下多租戶的GPU加速計算場景。

GPU散熱方式分為散熱片和散熱片配合風扇的形式,也叫作主動式散熱和被動式散熱方式。

一般一些工作頻率較低的顯卡采用的都是被動式散熱,這種散熱方式就是在顯示芯片上安裝一個散熱片即可,并不需要散熱風扇。因為較低工作頻率的顯卡散熱量并不是很大,沒有必要使用散熱風扇,這樣在保障顯卡穩定工作的同時,不僅可以降低成本,而且還能減少使用中的噪音。

NVIDIA Tesla Family采用被動散熱、QUADRO Family和GeForce Family采用主動散熱。

NVIDIA GPU架構的發展類似Intel的CPU,針對不同場景和技術革新,經歷了不同架構的演進。

Turing架構里,一個SM中擁有64個半精度,64個單精度,8個Tensor core,1個RT core。

Kepler架構里,FP64單元和FP32單元的比例是1:3或者1:24;K80。

Maxwell架構里,這個比例下降到了只有1:32;型號M10/M40。

Pascal架構里,這個比例又提高到了1:2(P100)但低端型號里仍然保持為1:32,型號Tesla P40、GTX 1080TI/Titan XP、Quadro GP100/P6000/P5000

Votal架構里,FP64單元和FP32單元的比例是1:2;型號有Tesla V100、GeForce TiTan V、Quadro GV100專業卡。

深度學習是模擬人腦神經系統而建立的數學網絡模型,這個模型的最大特點是,需要大數據來訓練。因此,對電腦處理器的要求,就是需要大量的并行的重復計算,GPU正好有這個專長,時勢造英雄,因此,GPU就出山擔當重任了。

訓練:我們可以把深度學習的訓練看成學習過程。人工神經網絡是分層的、是在層與層之間互相連接的、網絡中數據的傳播是有向的。訓練神經網絡的時候,訓練數據被輸入到網絡的第一層。然后所有的神經元,都會根據任務執行的情況,根據其正確或者錯誤的程度如何,分配一個權重參數(權值)。

推理:就是深度學習把從訓練中學習到的能力應用到工作中去。不難想象,沒有訓練就沒法實現推斷。我們人也是這樣,通過學習來獲取知識、提高能力。深度神經網絡也是一樣,訓練完成后,并不需要其訓練時那樣的海量資源。

高性能計算應用程序涵蓋了物理、生物科學、分子動力學、化學和天氣預報等各個領域。也都是通過GPU實現加速的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4766

    瀏覽量

    129190
  • 人工智能
    +關注

    關注

    1793

    文章

    47604

    瀏覽量

    239526
  • 機器學習
    +關注

    關注

    66

    文章

    8437

    瀏覽量

    132892
收藏 人收藏

    評論

    相關推薦

    LCR數字電橋的技術原理和應用場景

    LCR數字電橋是一種高精度的電子測量儀器,其技術原理和應用場景可以詳細闡述如下:技術原理LCR數字電橋基于電學濾波理論和數字技術,通過信號源
    發表于 09-19 16:47

    參數分析儀的技術原理和應用場景

    參數分析儀的技術原理和應用場景因其具體類型和用途的不同而有所差異。以下是對參數分析儀技術原理和應用場景
    發表于 10-17 14:42

    實時示波器的技術原理和應用場景

    實時示波器是一種高性能的電子測量儀器,其技術原理和應用場景對于電子工程和通信技術領域具有重要意義。以下是對實時示波器的技術原理和應用場景
    發表于 10-23 14:22

    求3525電路詳細說明

    求3525電路詳細說明,越詳細越好,謝謝!
    發表于 04-18 08:21

    stc下載燒錄詳細說明

    stc下載燒錄詳細說明
    發表于 01-05 16:28

    適合NB-IoT技術的垂直應用場景哪些

    該部分分享的是物聯網各垂直應用領域里,NB-IoT技術的部署,看看適合NB-IoT技術的垂直應用場景哪些?垂直應用服務商又該如何部署?1 NB-IoT適合的垂直應
    發表于 07-27 07:51

    volatile關鍵字應用場景及示例

    volatile關鍵字1.應用場景2.示例1.應用場景volatile關鍵字分析,往往應用在三種場合1)多線程編程共享全局變量的時候,該全局變量要加上volatile進行修飾,讓編譯器
    發表于 08-24 07:21

    ARM的技術特征是什么?應用場景哪些?

    ARM的技術特征是什么?應用場景哪些?
    發表于 11-05 07:32

    GPU八大主流的應用場景

    的不斷增長,未來GPU應用市場將會被多領域劃分,誰將是增長最快的應用市場呢?答案或許就在以下GPU八大應用場景中。游戲設備如果你是一位游戲愛好者,你大概率會知道購買游戲設備,會更看重其GPU
    發表于 12-07 10:04

    Nano 型串口屏的技術參數詳細說明

    串口屏技術文檔之Nano型系列技術參數資料詳細說明,Nano 系列主要應用單色/黑白屏升級、低成本和界面簡單等工業應用場合。
    發表于 07-20 11:35 ?24次下載

    51單片機的C語言關鍵詳細說明

    本文檔的主要內容詳細介紹的是51單片機的C語言關鍵詳細說明
    發表于 08-21 17:31 ?5次下載
    51單片機的C語言<b class='flag-5'>關鍵</b>字<b class='flag-5'>詳細說明</b>

    單片機C語言編程的關鍵詳細說明

    本文檔的主要內容詳細介紹的是單片機C語言編程的關鍵詳細說明
    發表于 12-10 17:32 ?23次下載
    單片機C語言編程的<b class='flag-5'>關鍵</b>字<b class='flag-5'>詳細說明</b>

    常用小型穩壓LDO等芯片哪些詳細說明

    本文檔的主要內容詳細介紹的是常用小型穩壓LDO等芯片哪些詳細說明
    發表于 01-13 16:53 ?41次下載

    設計機器人所需要的參數詳細說明

    本文檔的主要內容詳細介紹的是設計機器人所需要的參數詳細說明
    發表于 03-18 08:00 ?1次下載
    設計機器人所需要的<b class='flag-5'>參數</b><b class='flag-5'>詳細說明</b>

    常用光敏電阻的參數資料詳細說明

    本文檔的主要內容詳細介紹的是常用光敏電阻的參數資料詳細說明免費下載。
    發表于 02-03 14:11 ?29次下載
    主站蜘蛛池模板: 狂躁美女BBBBBB视频| 国产成人精品s8p视频| 欧美最猛12teevideos| 国产日韩欧美三级| 国产亚洲精品久久久久久久软件| 岳扒开让我添| 无人在线观看免费高清视频播放| 麻豆精品人妻一区二区三区蜜桃| 国产私拍福利精品视频| 成人高清护士在线播放| 中文字幕乱偷无码AV蜜桃| 小小水蜜桃3视频在线观看| 欧美性猛交AAA片免费观看| 久久久无码精品亚洲A片猫咪| 国产乱码精品一区二区三区四川| 饥渴的新婚女教师| yellow在线中文| 91热久久免费精品99| 亚洲午夜久久久久中文字幕| 天天干夜夜曰| 日韩精品真人荷官无码| 暖暖视频免费观看视频| 久久青青热| 精品熟女少妇AV久久免费A片 | 国产成人综合在线| 俺来也俺去也视频久久| 91亚洲精品福利在线播放| 在线中文字幕| 在线精品国精品国产不卡| 亚洲蜜桃AV色情精品成人| 午夜一区欧美二区高清三区| 日本女人水多| 日本国产黄色片| 日本人吃奶玩奶虐乳| 秋霞电影网午夜免费鲁丝片| 欧美激情视频在线观看一区二区三区 | 久久人妻少妇嫩草AV蜜桃35I| 国内高清在线观看视频| 国产香蕉九九久久精品免费| 国产女人视频免费观看| 国产精品69人妻无码久久|