今天這篇文章,我們來聊聊算力。 ? 這兩年,算力可以說是ICT行業(yè)的一個(gè)熱門概念。在新聞報(bào)道和大咖演講中,總會(huì)出現(xiàn)它的身影。 ? 那么,究竟到底什么是算力?算力包括哪些類別,分別有什么用途?目前,全球算力正處于怎樣的發(fā)展?fàn)顟B(tài)?? ?
?什么是算力
算力的字面意思,大家都懂,就是計(jì)算能力(Computing Power)。 ? 更具體來說,算力是通過對(duì)信息數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)目標(biāo)結(jié)果輸出的計(jì)算能力。 ?
? ? 我們?nèi)祟悾鋵?shí)就具備這樣的能力。在我們的生命過程中,每時(shí)每刻都在進(jìn)行著計(jì)算。我們的大腦,就是一個(gè)強(qiáng)大的算力引擎。 ? 大部分時(shí)間里,我們會(huì)通過口算、心算進(jìn)行無工具計(jì)算。但是,這樣的算力有點(diǎn)低。所以,在遇到復(fù)雜情況時(shí),我們會(huì)利用算力工具進(jìn)行深度計(jì)算。 ? 遠(yuǎn)古時(shí)期,我們的原始工具是草繩、石頭。后來,隨著文明的進(jìn)步,我們有了算籌(一種用于計(jì)算的小棍子)、算盤等更為實(shí)用的算力工具,算力水平不斷提升。 ? 到了20世紀(jì)40年代,我們迎來了算力革命。 ? 1946年2月,世界上第一臺(tái)數(shù)字式電子計(jì)算機(jī)ENIAC誕生,標(biāo)志著人類算力正式進(jìn)入了數(shù)字電子時(shí)代。 ? ? ? 再后來,隨著半導(dǎo)體技術(shù)的出現(xiàn)和發(fā)展,我們又進(jìn)入了芯片時(shí)代。芯片成為了算力的主要載體。
時(shí)間繼續(xù)推移。 ? 到了20世紀(jì)70-80年代,芯片技術(shù)在摩爾定律的支配下,已經(jīng)取得了長足進(jìn)步。芯片的性能不斷提升,體積不斷減小。終于,計(jì)算機(jī)實(shí)現(xiàn)了小型化,PC(個(gè)人電腦)誕生了。 ? ?
? PC的誕生,意義極為深遠(yuǎn)。它標(biāo)志著IT算力不再僅為少數(shù)大型企業(yè)服務(wù)(大型機(jī)),而是昂首走向了普通家庭和中小企業(yè)。它成功打開了全民信息時(shí)代的大門,推動(dòng)了整個(gè)社會(huì)的信息化普及。 ? 在PC的幫助下,人們充分感受到IT算力帶來的生活品質(zhì)改善,以及生產(chǎn)效率提升。PC的出現(xiàn),也為后來互聯(lián)網(wǎng)的蓬勃發(fā)展奠定了基礎(chǔ)。 ? 進(jìn)入21世紀(jì)后,算力再次迎來了巨變。 ? 這次巨變的標(biāo)志,是云計(jì)算技術(shù)的出現(xiàn)。 ? ?
? 在云計(jì)算之前,人類苦于單點(diǎn)式計(jì)算(一臺(tái)大型機(jī)或一臺(tái)PC,獨(dú)立完成全部的計(jì)算任務(wù))的算力不足,已經(jīng)嘗試過網(wǎng)格計(jì)算(把一個(gè)巨大的計(jì)算任務(wù),分解為很多的小型計(jì)算任務(wù),交給不同的計(jì)算機(jī)完成)等分布式計(jì)算架構(gòu)。 ? 云計(jì)算,是分布式計(jì)算的新嘗試。它的本質(zhì),是將大量的零散算力資源進(jìn)行打包、匯聚,實(shí)現(xiàn)更高可靠性、更高性能、更低成本的算力。 ? 具體來說,在云計(jì)算中,中央處理器(CPU)、內(nèi)存、硬盤、顯卡(GPU)等計(jì)算資源被集合起來,通過軟件的方式,組成一個(gè)虛擬的可無限擴(kuò)展的“算力資源池”。 ? 用戶如果有算力需求,“算力資源池”就會(huì)動(dòng)態(tài)地進(jìn)行算力資源的分配,用戶按需付費(fèi)。 ? 相比于用戶自購設(shè)備、自建機(jī)房、自己運(yùn)維,云計(jì)算有明顯的性價(jià)比優(yōu)勢(shì)。 ?
算力云化之后,數(shù)據(jù)中心成為了算力的主要載體。人類的算力規(guī)模,開始新的飛躍。 ?
?算力的分類
云計(jì)算和數(shù)據(jù)中心之所以會(huì)出現(xiàn),是因?yàn)樾畔⒒蛿?shù)字化的不斷深入,引發(fā)了整個(gè)社會(huì)強(qiáng)烈的算力需求。 ? 這些需求,既有來自消費(fèi)領(lǐng)域的(移動(dòng)互聯(lián)網(wǎng)、追劇、網(wǎng)購、打車、O2O等),也有來自行業(yè)領(lǐng)域的(工業(yè)制造、交通物流、金融證券、教育醫(yī)療等),還有來自城市治理領(lǐng)域的(智慧城市、一證通、城市大腦等)。 ? 不同的算力應(yīng)用和需求,有著不同的算法。不同的算法,對(duì)算力的特性也有不同要求。 ? 通常,我們將算力分為兩大類,分別是通用算力和專用算力。 ?
大家應(yīng)該都聽說過,負(fù)責(zé)輸出算力的芯片,就有分為通用芯片和專用芯片。 ? 像x86這樣的CPU處理器芯片,就是通用芯片。它們能完成的算力任務(wù)是多樣化的,靈活的,但是功耗更高。
FPGA,是可編程集成電路。它可以通過硬件編程來改變內(nèi)部芯片的邏輯結(jié)構(gòu),但軟件是深度定制的,執(zhí)行專門任務(wù)。 ? ASIC,是專用集成電路。顧名思義,它是為專業(yè)用途而定制的芯片,其絕大部分軟件算法都固化于硅片。 ? ASIC能完成特定的運(yùn)算功能,作用比較單一,不過能耗很低。FPGA,介于通用芯片和ASIC之間。 ?
我們以比特幣挖礦為例。 ? 以前,人們都是用PC(x86通用芯片)挖礦,后來越挖難度越大,算力不夠。于是,開始使用顯卡(GPU)去挖礦。再后來,顯卡的能耗太高,挖出來的幣值還抵不上電費(fèi),就開始采用FPGA和ASIC集群陣列挖礦。 ? 在數(shù)據(jù)中心里,也對(duì)算力任務(wù)進(jìn)行了對(duì)應(yīng)劃分,分為基礎(chǔ)通用計(jì)算,以及HPC高性能計(jì)算(High-performance computing)。 ? HPC計(jì)算,又繼續(xù)細(xì)分為三類: ? 科學(xué)計(jì)算類:物理化學(xué)、氣象環(huán)保、生命科學(xué)、石油勘探、天文探測(cè)等。 工程計(jì)算類:計(jì)算機(jī)輔助工程、計(jì)算機(jī)輔助制造、電子設(shè)計(jì)自動(dòng)化、電磁仿真等。 智能計(jì)算類:即人工智能(AI,Artificial Intelligence)計(jì)算,包括:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等。 ? 科學(xué)計(jì)算和工程計(jì)算大家應(yīng)該都聽說過,這些專業(yè)科研領(lǐng)域的數(shù)據(jù)產(chǎn)生量很大,對(duì)算力的要求極高。 ? 以油氣勘探為例。油氣勘探,簡單來說,就是給地表做CT。一個(gè)項(xiàng)目下來,原始數(shù)據(jù)往往超過100TB,甚至可能超過1個(gè)PB。如此巨大的數(shù)據(jù)量,需要海量的算力進(jìn)行支撐。 ? 智能計(jì)算這個(gè),我們需要重點(diǎn)說一下。 ? AI人工智能是目前全社會(huì)重點(diǎn)關(guān)注的發(fā)展方向。不管是哪個(gè)領(lǐng)域,都在研究人工智能的應(yīng)用和落地。 ? 人工智能的三大核心要素,就是算力、算法和數(shù)據(jù)。 ?
大家都知道,AI人工智能是一個(gè)算力大戶,特別“吃”算力。在人工智能計(jì)算中,涉及較多的矩陣或向量的乘法和加法,專用性較高,所以不適合利用CPU進(jìn)行計(jì)算。 ? 在現(xiàn)實(shí)應(yīng)用中,人們主要用GPU和前面說的專用芯片進(jìn)行計(jì)算。尤其是GPU,是目前AI算力的主力。 ? GPU雖然是圖形處理器,但它的GPU核(邏輯運(yùn)算單元)數(shù)量遠(yuǎn)超CPU, 適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行,從而完成圖形處理或大數(shù)據(jù)處理中的海量簡單操作。 ? 因此,GPU更合適處理計(jì)算密集型、高度并行化的計(jì)算任務(wù)(例如AI計(jì)算)。 ? 這幾年,因?yàn)槿斯ぶ悄苡?jì)算的需求旺盛,國家還專門建設(shè)了很多智算中心,也就是專門進(jìn)行智能計(jì)算的數(shù)據(jù)中心。 ?
除了智算中心之外,現(xiàn)在還有很多超算中心。超算中心里面,放的都是“天河一號(hào)”這樣的超級(jí)計(jì)算機(jī),專門承擔(dān)各種大規(guī)模科學(xué)計(jì)算和工程計(jì)算任務(wù)。 ? ? 我們平時(shí)看到的數(shù)據(jù)中心,基本上都屬于云計(jì)算數(shù)據(jù)中心。 ?
? 任務(wù)比較雜,基礎(chǔ)通用計(jì)算和高性能計(jì)算都有,也有大量的異構(gòu)計(jì)算(同時(shí)使用不同類型指令集的計(jì)算方式)。因?yàn)楦咝阅苡?jì)算的需求越來越多,所以專用計(jì)算芯片的比例正在逐步增加。 ? 前幾年逐漸開始流行起來的TPU、NPU和DPU等,其實(shí)都是專用芯片。 ?
? 大家現(xiàn)在經(jīng)常聽說的“算力卸載”,其實(shí)不是刪除算力,而是把很多計(jì)算任務(wù)(例如虛擬化、數(shù)據(jù)轉(zhuǎn)發(fā)、壓縮存儲(chǔ)、加密解密等),從CPU轉(zhuǎn)移到NPU、DPU等芯片上,減輕CPU的算力負(fù)擔(dān)。 ? 近年來,除了基礎(chǔ)通用算力、智能算力、超算算力之外,科學(xué)界還出現(xiàn)了前沿算力的概念,主要包括量子計(jì)算、光子計(jì)算等,值得關(guān)注。 ?
算力的衡量
算力既然是一個(gè)“能力”,當(dāng)然就會(huì)有對(duì)它進(jìn)行強(qiáng)弱衡量的指標(biāo)和基準(zhǔn)單位。大家比較熟悉的單位,應(yīng)該是FLOPS、TFLOPS等。 ? 其實(shí),衡量算力大小的指標(biāo)還有很多,例如MIPS、DMIPS、OPS等。 ?
? MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是FLOPS的不同量級(jí)。具體關(guān)系如下: ?
浮點(diǎn)數(shù)有FP16、FP32、FP64不同的規(guī)格 ? 不同的算力載體之間,算力差異是非常巨大的。為了便于大家更好地理解這個(gè)差異,小棗君又做了一張算力對(duì)比表格: ?
? 前面我們提到了通用計(jì)算、智算和超算。從趨勢(shì)上來看,智算和超算的算力增長速度遠(yuǎn)遠(yuǎn)超過了通用算力。 ? 根據(jù)GIV的數(shù)據(jù)統(tǒng)計(jì),到2030年,通用計(jì)算算力(FP32)將增長10倍,達(dá)到3.3 ZFLOPS。而AI智算算力(FP16),將增長500倍,達(dá)到105 ZFLOPS。 ?
算力的現(xiàn)狀與未來
早在1961年,“人工智能之父”約翰·麥卡錫就提出Utility Computing(效用計(jì)算)的目標(biāo)。他認(rèn)為:“有一天,計(jì)算可能會(huì)被組織成一個(gè)公共事業(yè),就像電話系統(tǒng)是一個(gè)公共事業(yè)一樣”。 ? 如今,他的設(shè)想已經(jīng)成為現(xiàn)實(shí)。在數(shù)字浪潮下,算力已經(jīng)成為像水、電一樣的公共基礎(chǔ)資源,而數(shù)據(jù)中心和通信網(wǎng)絡(luò),也變成了重要的公共基礎(chǔ)設(shè)施。 ? 這是IT行業(yè)和通信行業(yè)辛苦奮斗大半個(gè)世紀(jì)的成果。???? ? 對(duì)于整個(gè)人類社會(huì)來說,算力早已不是一個(gè)技術(shù)維度的概念。它已經(jīng)上升到經(jīng)濟(jì)學(xué)和哲學(xué)維度,成為了數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,以及全社會(huì)數(shù)智化轉(zhuǎn)型的基石。
? 我們每個(gè)人的生活,還有工廠企業(yè)的運(yùn)轉(zhuǎn),政府部門的運(yùn)作,都離不開算力。在國家安全、國防建設(shè)、基礎(chǔ)學(xué)科研究等關(guān)鍵領(lǐng)域,我們也需要海量的算力。 ? 算力決定了數(shù)字經(jīng)濟(jì)發(fā)展速度,以及社會(huì)智能發(fā)展高度。 ? 根據(jù)IDC、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合發(fā)布的數(shù)據(jù)顯示,計(jì)算力指數(shù)平均每提高1點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰。 ?
? 全球各國的算力規(guī)模與經(jīng)濟(jì)發(fā)展水平,已經(jīng)呈現(xiàn)出顯著的正相關(guān)關(guān)系。一個(gè)國家的算力規(guī)模越大,經(jīng)濟(jì)發(fā)展水平就越高。 ?
世界各國算力和GDP排名 (來源:遲九虹,華為算力時(shí)代峰會(huì)演講) ? 在算力領(lǐng)域,國家之間的競(jìng)爭博弈日益激烈。 ? 2020年,我國算力總規(guī)模達(dá)到135 EFLOPS,同比增長55%,超過全球增速約16個(gè)百分點(diǎn)。目前,我們的絕對(duì)算力,排名世界第二。 ? 但是,從人均角度來看,我們并不占優(yōu)勢(shì),僅處于中等算力國家水平。 ?
世界各國人均算力對(duì)比 (來源:唐雄燕,華為算力時(shí)代峰會(huì)演講) ? 尤其是在芯片等算力核心技術(shù)上,我們與發(fā)達(dá)國家還有很大的差距。很多掐脖子技術(shù)未能解決,嚴(yán)重影響了我們的算力安全,進(jìn)而影響了國家安全。
所以,腳下的路還有很長,我們還需要繼續(xù)努力。 ?
未來社會(huì),信息化、數(shù)字化和智能化將會(huì)進(jìn)一步加快。萬物智聯(lián)時(shí)代的到來,大量智能物聯(lián)網(wǎng)終端的引入,AI智能場(chǎng)景的落地,將產(chǎn)生難以想象的海量數(shù)據(jù)。 ? 這些數(shù)據(jù),將進(jìn)一步刺激對(duì)算力的需求。 ? 根據(jù)羅蘭貝格的預(yù)測(cè),從2018年到2030年,自動(dòng)駕駛對(duì)算力的需求將增加390倍,智慧工廠需求將增長110倍,主要國家人均算力需求將從今天的不足500 GFLOPS,增加20倍,變成2035年的10000 GFLOPS。 ? 根據(jù)浪潮人工智能研究院的預(yù)測(cè),到2025年,全球算力規(guī)模將達(dá)6.8 ZFLOPS,與2020年相比提升30倍。 ? 新一輪的算力革命,正在加速啟動(dòng)。 ? ?
結(jié)語
? 算力是如此重要的資源,但事實(shí)上,我們對(duì)算力的利用仍然存在很多問題。 ? 比如算力利用率問題,以及算力分布均衡性問題。根據(jù)IDC的數(shù)據(jù)顯示,企業(yè)分散的小算力利用率,目前僅為10%-15%,存在很大的浪費(fèi)。 ? 摩爾定律從2015年開始放緩,單位能耗下的算力增速已經(jīng)逐漸被數(shù)據(jù)量增速拉開差距。我們?cè)诓粩嗤诰蛐酒懔摿Φ耐瑫r(shí),必須考慮算力的資源調(diào)度問題。 ? 那么,我們?cè)撊绾螌?duì)算力進(jìn)行調(diào)度呢?現(xiàn)有的通信網(wǎng)絡(luò)技術(shù),能夠滿足算力的調(diào)度需求嗎? ? ?
編輯:黃飛
評(píng)論
查看更多