NVIDIA 發(fā)布的 CUDA 開發(fā)環(huán)境 CUDA 11.6 的最新版本。本版本的重點(diǎn)是增強(qiáng) CUDA 應(yīng)用程序的編程模型和性能。 CUDA 繼續(xù)推動(dòng) GPU 加速度的邊界,并為 HPC 、可視化、 AI 、 ML 和 DL 和數(shù)據(jù)科學(xué)中的新應(yīng)用奠定基礎(chǔ)。
CUDA 11.6 有幾個(gè)重要特性。這篇文章概述了關(guān)鍵功能:
GSP 驅(qū)動(dòng)程序架構(gòu)現(xiàn)在默認(rèn)為圖靈和安培 GPU
新 API 允許禁用實(shí)例化圖中的節(jié)點(diǎn)
完全支持 128 位整數(shù)類型
協(xié)作組命名空間更新
CUDA 編譯器更新
Nsight Compute 2022.1 版本
CUDA 11.6 附帶 R510 驅(qū)動(dòng)程序,這是一個(gè)更新分支。 CUDA 11.6 工具包可供下載 。
GSP 驅(qū)動(dòng)程序體系結(jié)構(gòu)
GSP 驅(qū)動(dòng)程序體系結(jié)構(gòu)現(xiàn)在是所有列出的圖靈和安培 GPU 的默認(rèn)驅(qū)動(dòng)程序模式。較舊的驅(qū)動(dòng)程序體系結(jié)構(gòu)作為后備支持。有關(guān)更多信息,請(qǐng)參閱 R510 驅(qū)動(dòng)程序自述 。
實(shí)例化的圖形節(jié)點(diǎn) API 添加
我們添加了一個(gè)新的 API cudaGraphNodeSetEnabled,以允許禁用實(shí)例化圖中的節(jié)點(diǎn)。在此版本中,支持僅限于內(nèi)核節(jié)點(diǎn)。相應(yīng)的 API cudaGraphNodeGetEnabled允許查詢節(jié)點(diǎn)的啟用狀態(tài)。我們還添加了禁用空內(nèi)核圖節(jié)點(diǎn)啟動(dòng)的功能。
128 位整數(shù)支持
CUDA 11.6 包括 128 位整數(shù)(__int128)數(shù)據(jù)類型的完整版本,包括編譯器和開發(fā)工具支持。主機(jī)端編譯器必須支持__int128類型才能使用此功能。
協(xié)作組名稱空間
協(xié)作組名稱空間已更新為新函數(shù),以提高命名、函數(shù)范圍以及單元維度和大小的一致性。
CUDA 編譯器
在編譯過程中向目標(biāo)安裝的 GPU 添加了-arch=native編譯選項(xiàng)。這擴(kuò)展了現(xiàn)有的-gencode=arch=compute_xx,code=sm_xx體系結(jié)構(gòu)規(guī)范
添加從nvlink創(chuàng)建 PTX 文件的功能
不推薦的功能
不推薦使用用于設(shè)備上 fork 和 join 并行的cudaDeviceSynchronize(),以便為具有更高性能的替換編程模型做準(zhǔn)備。這些函數(shù)在本版本中繼續(xù)工作,但這些工具會(huì)發(fā)出有關(guān)即將發(fā)生的更改的警告。
CentOS Linux 8 已經(jīng)到了生命的盡頭 在 2021 年 12 月 31 日,對(duì)這個(gè)操作系統(tǒng)的支持現(xiàn)在在 CUDA 工具包中被棄用。 CentOS Linux 8 支持將在未來版本中完全取消。
關(guān)于作者
Rob Armstrong 是 CUDA 工具包的主要技術(shù)產(chǎn)品經(jīng)理。 20 多年來,他一直專注于使用異構(gòu)硬件平臺(tái)加速軟件,并對(duì)計(jì)算機(jī)體系結(jié)構(gòu)和硬件/軟件交互特別感興趣。
Arthy Sundaram 是 CUDA 平臺(tái)的技術(shù)產(chǎn)品經(jīng)理。她擁有哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位。她感興趣的領(lǐng)域是操作系統(tǒng)、編譯器和計(jì)算機(jī)體系結(jié)構(gòu)。
Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高級(jí)產(chǎn)品營銷經(jīng)理。弗雷德?lián)碛屑又荽髮W(xué)戴維斯分校計(jì)算機(jī)科學(xué)和數(shù)學(xué)學(xué)士學(xué)位。他的職業(yè)生涯開始于一名 UNIX 軟件工程師,負(fù)責(zé)將內(nèi)核服務(wù)和設(shè)備驅(qū)動(dòng)程序移植到 x86 體系結(jié)構(gòu)。他喜歡《星球大戰(zhàn)》、《星際迷航》和 NBA 勇士隊(duì)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5021瀏覽量
103256 -
gpu
+關(guān)注
關(guān)注
28文章
4753瀏覽量
129061
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論