色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

做通用GPU究竟有多難?

硬件設(shè)計(jì) ? 2019-12-31 23:15 ? 次閱讀

根據(jù)“牧村波動(dòng)”(Makimoto’s Wave)顯示,半導(dǎo)體產(chǎn)品未來(lái)可能將沿著“標(biāo)準(zhǔn)化”與“定制化”交替發(fā)展的路線前進(jìn),每十年波動(dòng)一次。2020 年將至,過(guò)去數(shù)年我們一直在呼喚AI 芯片和高性能計(jì)算芯片,如果 “牧村波動(dòng)”仍然奏效,那么下一個(gè)波峰將是超高靈活度集成的芯片。而這也解釋了為什么英偉達(dá)所開(kāi)創(chuàng)的GPGPU在過(guò)去幾年里賺的缽滿盆滿。

其實(shí)仔細(xì)想想,除了“牧村波動(dòng)”所昭示的進(jìn)化規(guī)則,通用GPU之所以能夠成為當(dāng)前的主流趨勢(shì),并引來(lái)眾多企業(yè)趨之若鶩,至少有一明一潛兩大驅(qū)動(dòng)因素。明面上,現(xiàn)在是異構(gòu)計(jì)算的天下,近年來(lái)傳統(tǒng)以CPU為核心的服務(wù)器市場(chǎng)增長(zhǎng)比較平緩,而GPU服務(wù)器的增速迅猛,年增長(zhǎng)率據(jù)稱超60%。

潛在因素,5G時(shí)代的到來(lái)推動(dòng)了物聯(lián)網(wǎng)的迅猛發(fā)展,應(yīng)用場(chǎng)景更加豐富多元,這要求云端的計(jì)算資源能應(yīng)對(duì)各種復(fù)雜場(chǎng)景的需求提供豐富靈活的計(jì)算支撐,工程師們肯定更愿意將能“通吃”的芯片焊在服務(wù)器上。

打鐵還需自身硬

想要吃到通用GPU這份蛋糕還是需要企業(yè)有足夠深厚的功底。相較于開(kāi)發(fā)定制化的AI芯片等,通用GPU在技術(shù)上有更高的難度。從硬件角度看,最核心的是指令集。指令集的覆蓋面、顆粒度、效率等決定一款芯片能否覆蓋到足夠?qū)挼膽?yīng)用市場(chǎng)領(lǐng)域,并對(duì)軟件開(kāi)發(fā)和產(chǎn)品迭代足夠友好。無(wú)論是英偉達(dá)還是AMD的GPGPU,指令集都在千條量級(jí),而目前國(guó)內(nèi)的AI芯片指令集大多數(shù)都在百條以內(nèi)。類型與數(shù)量的差別映射到硬件高效實(shí)現(xiàn)的復(fù)雜程度,差距是巨大的,在這方面國(guó)內(nèi)的團(tuán)隊(duì)還存在著一定的差距。另一個(gè)重要方面就是基于硬件層的任務(wù)管理和智能調(diào)度,這可以讓芯片從硬件層即提高算力的利用率,也就是大家常說(shuō)的實(shí)際算力。大多數(shù)AI芯片的做法是完全依賴于軟件層的調(diào)度實(shí)現(xiàn),但這種方式第一增加了軟件開(kāi)發(fā)的復(fù)雜度,第二降低了硬件算力的利用率,第三減緩了軟件棧迭代更新的速度,這在AI領(lǐng)域,面向算法模型、開(kāi)發(fā)環(huán)境、應(yīng)用場(chǎng)景加速更新的大背景下無(wú)疑大大增加了產(chǎn)品落地與工程化的難度。

在軟件方面,毫無(wú)疑問(wèn),最重要的必然是開(kāi)發(fā)生態(tài),GPGPU通過(guò)英偉達(dá)十多年的耕耘,已經(jīng)建立起了一個(gè)超過(guò)160萬(wàn)開(kāi)發(fā)用戶的龐大而成熟的生態(tài)-CUDA。AI芯片則需要搭建全新的生態(tài),它會(huì)帶來(lái)兩個(gè)維度顯著的問(wèn)題,第一個(gè)維度是客戶端,客戶需要冗長(zhǎng)的適配期,從原有的開(kāi)發(fā)環(huán)境切換到新的軟件生態(tài),這不僅帶來(lái)了資源投入,推遲了業(yè)務(wù)部署時(shí)間窗口,增加了業(yè)務(wù)的不確定性,更嚴(yán)重的是不利于保護(hù)已有的軟件投資,軟件的很多部分都要重新來(lái)寫(xiě)并適配,這對(duì)企業(yè)級(jí)用戶來(lái)講恰恰是非常敏感與慎重的事情。另一個(gè)維度是產(chǎn)品開(kāi)發(fā)端,從底層芯片與系統(tǒng)軟件,跳過(guò)CUDA層去直接支持開(kāi)發(fā)框架,必然帶來(lái)巨大的軟件投入,不停得追趕現(xiàn)有框架的新版本,以及生態(tài)巨頭的新框架,這在底層軟件人員缺乏的背景下矛盾顯得尤其突出。

而以上兩點(diǎn)說(shuō)到底都是需要人來(lái)解決的,恰恰在這方面的人才是目前中國(guó)企業(yè)最缺少的。目前只有英偉達(dá)和AMD擁有豐富的團(tuán)隊(duì),這也側(cè)面證明了為什么Intel自己折騰幾年,最后還是請(qǐng)了原AMD RTG顯卡部門(mén)負(fù)責(zé)人Raja、Zen架構(gòu)的功勛領(lǐng)袖Jim Keller、顯卡技術(shù)市場(chǎng)總監(jiān)Damien Triolet這幾位大神。

曲線救國(guó)還是正面突破?

圍繞GPGPU,國(guó)外已是龍爭(zhēng)虎斗,反觀國(guó)內(nèi),能夠洞悉GPGPU發(fā)展機(jī)遇并付諸行動(dòng)的芯片廠商少之又少。

華為是為數(shù)不多看到通用GPU趨勢(shì)的芯片廠商之一,而且看起來(lái)正在嘗試兩條腿走路通往GPGPU的路上。一條路是,華為通過(guò)其在手機(jī)芯片方面的積累,希望從移動(dòng)端GPU出發(fā),逐步延展至平板電腦端、桌面端、服務(wù)器端,走這種從簡(jiǎn)單到復(fù)雜、從小芯片到大芯片的路徑。

另一條路有點(diǎn)“天龍寺眾高僧合練六脈神劍”的意思。通用GPU復(fù)雜、難做,華為就“化繁為簡(jiǎn)”,今天先做AI-GPU,明天再做“區(qū)塊鏈GPU”,后天再做“超算GPU”……到最后再來(lái)個(gè)“集大成”,“六脈神劍”通用GPU就成了??雌饋?lái)很棒對(duì)吧?但是這種想法可能過(guò)于理想化了。通用GPU不是簡(jiǎn)單的“1+1”,十個(gè)人會(huì)一陽(yáng)指,也及不上一個(gè)人會(huì)六脈神劍,一個(gè)道理。

筆者還聽(tīng)說(shuō),阿里旗下的芯片部門(mén)也想做GPGPU,只不過(guò)阿里巴巴的野心大則大矣,只是眼下還沒(méi)有足夠大的技術(shù)團(tuán)隊(duì)能支持這件事。

其他廠商中,包括寒武紀(jì)、依圖、比特大陸、燧原科技等企業(yè),目前也都重點(diǎn)布局于AI芯片,并分別利用自身的優(yōu)勢(shì)走出了自己的風(fēng)格和水平。

而在GPGPU賽道上,一家名為“天數(shù)智芯”的公司選擇了正面“剛”。這家公司目前圍繞GPGPU的系統(tǒng)研發(fā)已聚集了一支百余人的技術(shù)團(tuán)隊(duì),其中不乏AMD在美國(guó)和上海做 GPU的核心團(tuán)隊(duì)成員、行業(yè)經(jīng)驗(yàn)超20年的世界級(jí)技術(shù)專家。今年剛剛試水發(fā)布了一款邊緣端芯片,并計(jì)劃明年正式發(fā)布GPGPU大芯片產(chǎn)品。

國(guó)內(nèi)企業(yè)的機(jī)遇與挑戰(zhàn)

有一點(diǎn)毋庸置疑,算力經(jīng)濟(jì)時(shí)代,整個(gè)世界正面臨半導(dǎo)體市場(chǎng)的增長(zhǎng)大潮,市場(chǎng)上也涌現(xiàn)出越來(lái)越多的半導(dǎo)體企業(yè)百舸爭(zhēng)流。而英偉達(dá)早早憑借強(qiáng)大的GPU+CUDA方案切入各個(gè)領(lǐng)域,用大筆研發(fā)投入和時(shí)間堆積起堅(jiān)不可摧的生態(tài)城墻,而這恰恰是國(guó)內(nèi)外其他玩家的薄弱環(huán)節(jié)。

國(guó)產(chǎn)芯片企業(yè),特別是處在創(chuàng)業(yè)初期的那些,“正確選擇勝過(guò)百倍努力”。筆者認(rèn)為可通用的GPU確然是個(gè)非常值得投入的方向。GPGPU誕生也只有十?dāng)?shù)年時(shí)間,“護(hù)城河”并非堅(jiān)不可摧。

只不過(guò)在現(xiàn)階段,國(guó)產(chǎn)替代方案還要在CUDA生態(tài)的基礎(chǔ)上推廣自己的芯片產(chǎn)品,在兼容CUDA的同時(shí),建設(shè)新生態(tài)。在這個(gè)過(guò)程中,每一步都關(guān)鍵且充滿挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    澎峰科技計(jì)算軟件棧與沐曦GPU完成適配和互認(rèn)證

    ?近期,澎峰科技與沐曦完成了對(duì)PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺(tái))與沐曦的曦云系列通用計(jì)算GPU的聯(lián)合測(cè)試,測(cè)試結(jié)果表明PerfXLM、PerfXCloud軟件與沐曦GPU產(chǎn)品實(shí)現(xiàn)了全面兼容。
    的頭像 發(fā)表于 01-21 09:51 ?81次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024的GPU計(jì)算指南。涵蓋GPU計(jì)算
    發(fā)表于 12-16 14:25

    請(qǐng)問(wèn)通用有源低通濾波器應(yīng)該用什么芯片比較好呢?

    通用有源低通濾波器應(yīng)該用什么芯片比較好呢?我用的OPA820的效果不太理想啊
    發(fā)表于 09-12 07:06

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說(shuō)話

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說(shuō)話
    的頭像 發(fā)表于 08-10 18:20 ?4632次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    請(qǐng)問(wèn)STM32F407 USB的FIFO究竟有多少空間?

    FIFO 連接。但是另一方面,在CSR存儲(chǔ)器映射圖中,一個(gè)主機(jī)通道的 FIFO地址范圍為 0x1000 (4KB),并且主機(jī)模式下有8個(gè)這樣的通道。所以真搞不明白究竟 FIFO真正有多少空間?
    發(fā)表于 07-04 07:46

    請(qǐng)問(wèn)ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區(qū)別是什么?

    如題:ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區(qū)別 這兩個(gè)模組,85℃和105℃究竟有哪些區(qū)別?包括工藝、功能、價(jià)格的區(qū)別?
    發(fā)表于 07-02 06:37

    軟件生態(tài)上超越CUDA,究竟有多難

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日,英偉達(dá)憑借持續(xù)上漲的股價(jià),正式超過(guò)了微軟成為全球市值最高的公司,這固然離不開(kāi)GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開(kāi)軟件的加持,真正將其推向
    的頭像 發(fā)表于 06-20 00:09 ?3754次閱讀

    新手小白怎么學(xué)GPU云服務(wù)器跑深度學(xué)習(xí)?

    新手小白想用GPU云服務(wù)器跑深度學(xué)習(xí)應(yīng)該怎么? 用個(gè)人主機(jī)通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動(dòng),如何實(shí)現(xiàn)更經(jīng)濟(jì)便捷的實(shí)現(xiàn)GPU云服務(wù)器深度學(xué)習(xí)?
    發(fā)表于 06-11 17:09

    STM32的DAC輸出有個(gè)BUFFER功能,BUFFer的驅(qū)動(dòng)能力究竟有多大,普通的運(yùn)放輸出可以嗎?驅(qū)動(dòng)LED可以嗎?

    DAC是輸出模擬電壓給外界參考,STM32的DAC輸出有個(gè)BUFFER功能,但不知這個(gè)BUFFer的驅(qū)動(dòng)能力究竟有多大,普通的運(yùn)放輸出可以嗎?驅(qū)動(dòng)LED可以嗎?有沒(méi)有人做過(guò)這塊,給個(gè)建議,因?yàn)樽罱O(shè)計(jì)個(gè)DAC輸出調(diào)節(jié)運(yùn)放輸出,希望能有個(gè)參考。 如果外接跟隨的話,用LM358可以嗎?請(qǐng)一起討論下?。?!
    發(fā)表于 05-15 07:42

    共模電感選型依據(jù)究竟有哪些

    電子發(fā)燒友網(wǎng)站提供《共模電感選型依據(jù)究竟有哪些.docx》資料免費(fèi)下載
    發(fā)表于 05-06 10:26 ?1次下載

    SMT貼片加工中元器件移位的原因究竟有哪些?

    ,元器件移位的問(wèn)題仍然時(shí)有發(fā)生。那么,造成SMT貼片加工中元器件移位的原因究竟有哪些呢?接下來(lái)深圳佳金源錫膏廠家來(lái)講一下:首先,貼片機(jī)吸嘴的氣壓是影響元器件位置的重要
    的頭像 發(fā)表于 04-26 16:00 ?608次閱讀
    SMT貼片加工中元器件移位的原因<b class='flag-5'>究竟有</b>哪些?

    貼片功率電感究竟有沒(méi)有正負(fù)極之分

    電子發(fā)燒友網(wǎng)站提供《貼片功率電感究竟有沒(méi)有正負(fù)極之分.docx》資料免費(fèi)下載
    發(fā)表于 02-28 10:15 ?0次下載

    什么是DMA?DMA究竟有多快!

    助于提高數(shù)據(jù)傳輸速度和系統(tǒng)效率。 那么,DMA究竟有多快呢? 實(shí)踐出真知 恰好,最近有個(gè)多通道數(shù)據(jù)采集的項(xiàng)目,受限于通道數(shù)多、分辨率高,而系統(tǒng)帶寬有限,為了盡可能充分利用有限帶寬,就得想辦法優(yōu)化時(shí)序,把時(shí)間都留給數(shù)據(jù)采集和傳輸。 優(yōu)化方向就是DMA。 硬件鏈路是A
    的頭像 發(fā)表于 02-22 10:43 ?2152次閱讀
    什么是DMA?DMA<b class='flag-5'>究竟有</b>多快!

    濾波電路究竟有什么作用

    如前面所述的那樣,電容的放電特性與由負(fù)載電阻R和電容C所決定的時(shí)間常數(shù)=CR有關(guān),因此有①~④所示的輸出波形(參見(jiàn)圖)
    的頭像 發(fā)表于 02-04 18:20 ?1570次閱讀
    濾波電路<b class='flag-5'>究竟有</b>什么作用
    主站蜘蛛池模板: 2020年国产精品午夜福利在线观看 | 国内精品久久人妻无码HD浪潮| 97在线观看免费| 一区二区不卡在线视频| 向日葵视频app下载18岁以下勿看| 日本国产黄色片| 欧美视频 亚洲视频| 快播免费电影| 久久中文字幕人妻熟AV女蜜柚M| 日本另类xxxx| 依人青青青在线观看| 最新国产av.在线视频| 中文字幕无码一区二区免费| 100国产精品人妻无码| 92午夜免费福利757| 把腿张开再深点好爽宝贝| 成人影片下载网站| 德国美女密密麻麻浓毛| 国产精品视频免费视频| 国产一区二区三区四区五在线观看 | 黄页网站18以下勿看免费| 久久re视频这里精品一本到99| 护士们的母狗| 久久无码人妻中文国产| 欧美91精品久久久久网免费| 日韩欧美高清一区| 无人在线观看免费高清视频播放 | 木凡的天空在线收听| 日本欧美午夜三级| 97精品免费视频| 久久婷婷五月综合色情| 影音先锋av丝袜天堂| 久久精品黄色| 尤物久久99国产综合精品| 九九电影伦理片| 日韩一区二区在线免费观看| 99热只有这里有精品| 国产精品久久久久久人妻精品蜜桃| 国产真实夫妇交换视频| 先锋影音av无码第1页| 国产精品成人无码免费视频|