當(dāng)NVIDIA基于新一代Ampere安培架構(gòu)的GeForce RTX 30系列顯卡發(fā)布之時(shí),幾乎在所有玩家的內(nèi)心都默默的宣判了AMD的死刑。
因?yàn)榇饲霸诹?a target="_blank">處理器數(shù)量相同的情況下,同時(shí)代的NVIDIA顯卡性能是遠(yuǎn)強(qiáng)于AMD顯卡,就算是RDNA構(gòu)架也不能難幸免。RX 5700 XT無(wú)法戰(zhàn)勝擁有相同2560個(gè)流處理器數(shù)量的RTX 2070 Super,前者是7nm,后者是12nm。
新一代RTX 3090一上來(lái)就宣告擁有10496個(gè)流處理器,帶來(lái)的震撼可想而知!至于傳說(shuō)中的RDNA2,很早之前大家就知道了,它最多擁有5120個(gè)流處理器。恐怕那時(shí)沒人會(huì)覺得RNDA2會(huì)威脅到RTX 3090,甚至RTX 3080都可以高枕無(wú)憂。
不過(guò)如同Zen3處理器帶給大家的震撼一樣,10月29日發(fā)布的RDNA2 GPU的實(shí)際性能表現(xiàn)幾乎超出了所有人的預(yù)料!
RDNA 2雖然是RDNA架構(gòu)的更新版本,并不是完全重新設(shè)計(jì)。但在RDNA原有的基礎(chǔ)上,RDNA2性能提升1倍,能效提升至少50%,ROP單元翻倍,完整支持DX12 Ultimate等技術(shù)特性,支持硬件光線追蹤。
可以發(fā)現(xiàn)整體布局沒有太大變化,當(dāng)然各個(gè)功能模塊都是調(diào)整優(yōu)化過(guò)的,而最突出的,一是增加了獨(dú)立的Infinity Cache高速緩存,二是在每個(gè)計(jì)算單元內(nèi)加入了專用的光追加速器Ray Accelerator。
至于RDNA 2架構(gòu)的底層細(xì)節(jié),比如說(shuō)計(jì)算單元的變化,AMD這次沒有給出更多資料,只是簡(jiǎn)單提到了幾點(diǎn),包括精簡(jiǎn)TLB以降低延遲、重新設(shè)計(jì)32位像素流水線并支持HDR格式、優(yōu)化幾何分派與曲面細(xì)分、全方位精細(xì)時(shí)鐘門控、頻率樹分離與門控、最小化數(shù)據(jù)轉(zhuǎn)移、重新平衡流水線、高性能庫(kù)等等,但沒有任何圖示。
以下是RDNA2構(gòu)架新技術(shù)解析:
1、Smart Access Memory (SAM)顯存智取技術(shù)
在游戲運(yùn)行的時(shí)候,CPU是不能一次性訪問(wèn)全部顯存的,比如RTX 3090有24GB顯存,而CPU只能訪問(wèn)其中的256MB。于是有大量數(shù)據(jù)會(huì)回到內(nèi)存后給CPU處理器完成后再轉(zhuǎn)移到顯存,此時(shí)不僅浪費(fèi)了帶寬也造成了無(wú)謂的資源浪費(fèi)。
Smart Access Memory (SAM)可以讓搭載AMD 500系列芯片組在搭載Zen3 CPU和RDNA2 GPU的時(shí)候,讓Zen3 CPU可以完整訪問(wèn)全部顯存,而且?guī)掃€是PCIe 4.0的速度,理論上最多可以讓游戲性能提升13%。
2、Ray Accelerator單元
在RDNA2構(gòu)架中,加入了硬件光追單元Ray Accelerator!與NVIDIA的完全專用RT Core相比,RDNA2的Ray Accelerator緊密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的現(xiàn)有HW。
這是AMD放出的RNA 2光追渲染效果圖,可以看到RDNA2實(shí)時(shí)光線追蹤效果與傳統(tǒng)光柵化渲染的差別。
AMD聲稱,相比于軟件方案,RDNA 2架構(gòu)的硬件加速光追性能,可以提升10倍之多,同時(shí)給出了部分游戲的實(shí)際性能,2K分辨率下《使命召喚:現(xiàn)代戰(zhàn)爭(zhēng)》可以跑出95FPS,《孤島危機(jī)重制版》可達(dá)90FPS,《戰(zhàn)地5》能有70FPS。
3、全局Infinity Cache
在大容量三級(jí)緩存的加持下,Zen3的IPC性能獲得了巨大的性能提升。如今AMD將這個(gè)理念帶入了GPU領(lǐng)域。
傳統(tǒng)的GPU構(gòu)架中,一般只有1.5~4MB的緩存,RDNA2除了4MB的L2緩存之外,還加入了128MB的全局Infinity Cache緩存,所有的CU單元均可以訪問(wèn)。
AMD Infinity Cache 作為一個(gè)巨大的帶寬放大器,其有效帶寬可以達(dá)到256 位 16 Gbps GDDR6 顯存的 4 倍。在Infinity Cache的帶動(dòng)下,512GB/s帶寬的RX 6900 XT的性能表現(xiàn)足以媲美936GB/s帶寬的RTX 3090。
4、Fidelity FX超分辨率抗鋸齒技術(shù)
針對(duì)NVIDIA DLSS深度學(xué)習(xí)超采樣抗鋸齒技術(shù),AMD也提出了超分辨率(FidelityFX Super Resolution),簡(jiǎn)稱FSR。目前這個(gè)技術(shù)正在開發(fā)中,不久之后會(huì)在新驅(qū)動(dòng)中提供支持
歷代AMD顯卡在ROP單元數(shù)量上都非常保守,最頂級(jí)型號(hào)的GPU最多就只有64個(gè)ROP。這一次AMD非常的激進(jìn),RX 6800 XT直接就配備了128個(gè)ROP,也是GPU歷史上第一款擁有128個(gè)ROP的顯卡。
責(zé)任編輯:pj
-
處理器
+關(guān)注
關(guān)注
68文章
19404瀏覽量
230924 -
amd
+關(guān)注
關(guān)注
25文章
5490瀏覽量
134532 -
cpu
+關(guān)注
關(guān)注
68文章
10901瀏覽量
212770
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論