短短幾年,人工智能就從一個被擱置“冷宮”的學術研究,變成商業化最前沿的“網紅”,在安防、金融、教育、制造、家居、娛樂等各個與人們生活息息相關的領域,掀起了一股智能化升級和萬物互聯的颶風。
這場前所未有的技術革命需要仰賴源源不斷提供高密度計算能力的AI硬件提供商。AI硬件應用場景通常分為云端和終端,云端主要指大規模數據中心和服務器,終端包括手機、車載、安防攝像頭、機器人等各種場景。
無論是在線翻譯、語音助手、個性化推薦,還是各種降低開發者使用門檻的AI開發平臺,背后都需要云端AI芯片夜以繼日地為數據中心提供強大的算力支撐。于是,AI芯片成為科技巨頭們的必爭之地。這其中以支持游戲視覺GPU出名的英偉達暫時領先,而老牌芯片巨頭英特爾則通過買買買扶搖直上。
兩大芯片巨頭在AI時代開啟了一場全新的較量。2019年,二者在云端AI芯片戰場開始了一場新的戰役。誰能主導這場云端AI芯片戰事,誰就能在將來的云計算和AI市場的戰爭中贏得更多話語權。
號角再次吹響
財報數據顯示,英偉達2020財年也就是2019年第三季度營收30.14億美元,同比下滑5%,環比增長17%;凈利潤8.99億美元,同比下滑27%,環比增長63%;調整后凈利潤為11.03億美元,同比下滑4%,環比增長63%。
這已經是英偉達營收連續第四個季度下降。但是,財報發布后股價并未有太大波動,且華爾街仍看好其前景。
對此,筆者認為,本季英偉達營收貢獻最大的游戲部門雖與以往同期相比有所下降,但卻高于預期的15.4億美元;代表英偉達未來發展方向的數據中心業務實現7.26億美元收入,雖略低于預期的7.542億美元,但與上季度相比,也在持續增長中。游戲部門是英偉達的基本盤,基本盤穩定,投資人自然也就放心了,所以對股價影響不大;而目前英偉達正處于轉型之中,數據中心業務一直在持續增長,這是華爾街仍然看好英偉達的原因。
過去幾年,由于趕上了深度學習的東風,英偉達通用圖形處理單元(GPGPU)扶搖直上,把2015年還是20美元的股價提高到了2018年10月292美元的高點,一躍成為AI領域第一股。其火箭般的漲勢讓半導體巨頭英特爾坐不住了,意圖通過收購突破自身限制,重塑市場版圖。二者的競爭在2019年變得更為直白和更加激烈。
我們知道,圖形和視覺處理領域是英偉達的傳統強項。而在11月13日2019英特爾人工智能峰會期間,英特爾展示了兩款分別面向AI訓練和推理的Nervana神經網絡處理器(NNP),以及下一代Movidius視覺處理單元(VPU),就是在向英偉達宣戰。
其中,兩款Nervana神經網絡處理器包括面向訓練的NNP-T1000和面向推理的NNP-I1000。這兩顆芯片都是專為云端環境定制的ASIC(特殊應用集成電路)芯片,可以并接多個芯片,加速AI模型的開發。會上,英特爾宣告兩款芯片正式開始商用交付,為百度、Facebook等人工智能客戶定制開發產品。英特爾物聯網集團副總裁Jonathan Ballon還特地強調了為AI和機器學習“專門制造”芯片的重要性,暗示其產品對英偉達GPU產品的優勢。
對于下一代Movidius VPU,該芯片旨在為低功率設備中的AI圖像和視頻處理系統提供動力,面向開發電腦機器人視覺相關用途,例如依靠機器學習來繞過障礙物的無人機和無人駕駛汽車等。會上,英特爾也非常自信地將其和英偉達的產品做出比較,據說這款代號為Keem Bay的VPU能提供的算力是英偉達Xavier芯片的4倍,在充分利用的情況下,該芯片可幫客戶獲得50%的額外性能。并且這款新一代的視覺處理單元將于2020年上半年上市。
這些芯片是英特爾在2016年收購兩家AI初創公司后,成果的集中展示。英特爾稱,一系列產品的推出旨在針對從云端到邊緣的AI計算市場,實現加速AI開發、部署和性能提升,以便在與AI芯片的對手英偉達的競爭中實現超越。也就是說,“雙英”戰事開始正式升級。
AI計算大致分為兩個層面,首先是對模型進行訓練(Training),整個過程可能耗時數天或數周;之后是對訓練出的模型做出推理(Inference)。在AI市場的驅動下,一些公司開發專有AI芯片,實現更好的AI計算效能。AI計算目前已經成為GPU巨頭英偉達的利潤驅動因素。
運用GPU進行部分運算密集工作負載,提供比傳統CPU在每瓦效能上更大的提升效果,通過采用英偉達GPU投入機器學習(ML)算法加速應用,可讓AI神經網絡的訓練和推理更加快速且準確率更高,從而掀起由英偉達領軍的全球AI研究與應用的爆炸式成長。
目前,在更考驗計算力的AI訓練市場,英偉達更具優勢,其數據中心業務也在不斷增長。不過,英特爾表示,其基于AI解決方案的產品組合得到進一步強化,今年會創造超過35億美元的營收。目前在數據中心領域,憑借CPU市場優勢,其已贏下了AI推理市場,因為多數云端推理都是由至強CPU完成的。
在傳統芯片架構上,英特爾仍然是可以提供最完整解決方案的公司,而在GPU領域,英特爾也將向英偉達發起挑戰。“CPU是AI的基礎所在,絕大多數的企業已經在現有的架構基礎上,通過軟件來部署AI的應用。我們很快也會有更強大的GPU來加入我們的產品家族。”英特爾全球副總裁兼人工智能產品事業部總經理Naveen Rao在會上說。
在三季度業績發布電話會議中,英偉達CEO黃仁勛指出,英偉達已經轉型為軟件公司,無論是AI、數據分析還是游戲圖形,這些平臺其實都是從功能強大的軟件開始,所以一直以來,英偉達大部分業務其實都高度軟件相關,這也使得英偉達的利潤能力正逐漸提高。他強調,就如同英偉達產品近期贏得的推理性能測試,這不僅是仰賴芯片本身,還有軟件堆棧和編譯程序的貢獻。
無獨有偶,Naveen Rao也在2019英特爾人工智能峰會上強調軟件對使用AI芯片功能開發的重要性。目前,英偉達憑借CUDA程序框架以及一系列用于并行計算和神經網絡的應用程序編程接口,是其AI崛起的關鍵。對此,英特爾宣布推出Dev Cloud for Edge,使得開發人員可以在購買硬件前,能夠在各類英特爾處理器上嘗試、部署原型和測試AI解決方案。
無論是硬件還是軟件,無論是云端還是終端,無論是訓練還是推理,英偉達和英特爾都是你追我趕,步步緊逼,忙得不亦樂乎。
數據紅利的誘惑
同為芯片及計算領域巨頭,“雙英”在AI時代互掐不是頭一回了,畢竟英特爾的CPU與英偉達的GPU在管理協調和計算能力方面的優劣爭吵,伴隨深度學習的誕生就天然存在。不過這次掐得尤其厲害。
今年3月,英偉達擊敗英特爾,豪擲69億美元與以色列公司Mellanox達成其史上最大規模收購。Mellanox是一家成立于1999年的芯片提供商,總部位于以色列Yokneam和加利福尼亞桑尼維爾。這家主要做服務器和存儲連接方案的網絡設備供應商,幾乎覆蓋了包括網絡控制芯片、網卡、交換機、軟件等在內的各類數據中心網絡產品,全球前十的大型公司有九家都選用了Mellanox的方案,谷歌、亞馬遜、微軟都是其客戶。
其中,用于高性能計算的計算機網絡通信標準InfiniBand市場幾乎被Mellanox和英特爾二分天下,尤其是Mellanox幾乎占據了超過70%的市場,而其生產的芯片則用于加速計算機服務器之間的信息流動。2018年,Mellanox的收入飆升26%,首次超過10億美元,另外Mellanox已經在納斯達克上市。英偉達表示,這筆收購一旦完成,預計將立即增加其利潤和自由現金流。
“雙英”巨資爭奪Mellanox顯然是因為“數據紅利”。“數據中心比以往任何時候都重要”,英偉達創始人兼CEO黃仁勛說,“我們很高興能將NVIDIA的加速計算平臺與Mellanox世界知名的加速網絡平臺結合在一起,創建下一代數據中心規模的計算解決方案”。他表示,英偉達將利用其新獲得的技術使那些“裝滿機械的巨型倉庫”(數據中心)更加高效和有效。
同是3月,在GTC技術峰會上,英偉達宣布推出自動駕駛行業“第一個”安全力場(SFF)安全模型,結果被英特爾全資子公司Mobileye的CEO發文諷刺,說SFF是抄襲Mobileye的決策模型RSS。到了3月末,據說英偉達技術營銷總監湯姆·皮特森宣布離職,加盟英特爾。這位技術大牛曾參與英偉達的重要顯示技術G-Sync的研發,其名下專利多達50項。
總之就是,剛一開年,“雙英”就開始了好不淡定的互掐。英特爾這邊從2016年底就希望將業務從以晶體管為中心轉向以數據為中心,實現作為芯片巨頭的新時代轉型,提振業績。為此,英特爾還專門拿出了不少專業機構的研究數據來佐證“數據是新石油”這一轉型的合理性和前瞻性。
目前看,英特爾取得了不錯的階段性成果,從2016年起,英特爾連續三年創下營收新高,2018年度營收首次突破700億美元,達到708億美元。其中,2018年以數據為中心的業務占比高達48%,預計在2019年將超過“以PC為中心”的業務。
而另一邊,英偉達也沒閑著。在GTC峰會上,黃仁勛高調提出,要“發展以數據中心為載體的數據科學”。追逐數據紅利對英偉達而言是“必須”,一方面因數字加密貨幣采礦熱潮退卻,英偉達挖礦圖形芯片的市場需求銳減,再加上中國游戲芯片需求疲軟,英偉達整體業務受到顯著影響,“庫存積壓、股價遭腰斬、業績低迷”成了其過去一年的主基調。
另一方面,英特爾等競爭對手也開始發力GPU市場,甚至一些AI芯片初創公司也在試圖蠶食英偉達的市場優勢,這讓其壓力倍增。于是,承擔數據收集、存儲等多個重要環節的數據中心便首當其沖成為英偉達的重點布局對象。
英偉達目前的數據中心業務發展勢頭也不錯,最新財報顯示,其已有約1/4的營收來自數據中心。“數據科學是計算機科學領域發展最快的領域,它也是高性能計算機群的新一輪挑戰”,黃仁勛說,“我們希望在數據中心業務上加倍努力”。
英特爾進攻英偉達的GPU大本營,英偉達就直接奪了Mellanox,一來一往,正面進攻和側翼突擊,沒毛病。
英特爾本來具備資料中心所需的連網解決方案,倘若能收購Mellanox,就能搖身一變,成為資料中心連網方案的龍頭供應商,但卻被英偉達搶走。資料中心基本上仍是服務器的處理器最關鍵,所以在該市場還是以英特爾馬首是瞻,其生態系統也以英特爾為核心展開。但資料中心的另一關鍵,就是資料中心與服務器間的資料交換速度能否有效提升,借此發揮整體綜效,強化服務業者的服務質量。
以Mellanox的解決方案來看,該公司不只是一家單純的網通芯片供應商,其旗下亦有板卡、網絡交換器與網通軟件方案,主要客戶群除了服務器還有資料中心廠商,例如騰訊、Netflix與百度等,某種程度上說Mellanox是網通方案供應商更貼切。
英偉達搶奪Mellanox是因為其也開始為客戶提供系統級產品,像是與服務器相關的HGX與DGX系列,車用領域針對自駕車專用的Pegasus系統等,收購Mellanox對英偉達的好處一是可以強化和既有客戶如Dell、HPE與百度等的合作關系,二是也可強化其在資料中心市場的話語權。
英特爾與英偉達的核心競爭力分屬CPU與GPU,本是合作大于競爭的共存關系,但這幾年AI議題發酵,使得雙方競爭意味增強,而對Mellanox的爭奪則更加劇了二者的競爭態勢,因此當英偉達最終完成收購后,“雙英”在2020年及之后的互動關系將會更有看點。
30年風云跌宕
芯片巨頭的戰場從不寂寞,在激烈的捉對廝殺中,英特爾、英偉達的對峙已經延續了近30載。芯片市場早期,在英特爾與AMD的激烈爭斗中,英偉達只是一個趁人不備偷偷發展的行業“小弟”,之后發展成為GPU之王,并在AI新時代如魚得水。
英偉達之所以能夠后來居上、驚艷世人,最重要的原因是抓住了時代風口:計算和圖像處理能力使其在云計算和AI業務上更有優勢。正如亞馬遜抓住電商零售的時代之匙,沃爾瑪“沉淪”;阿里和騰訊抓住IM的時代之匙,百度“沉淪”。在10年以上的行業大機遇面前,英偉達恰好站在了風口之上。
創建于1968年的英特爾因為重視技術和研發在1985年前后登上了傳統芯片行業的“鐵王座”。1985-2005年的20年間,英特爾忙于和AMD打官司、剛技術之時,創立于1990年的行業新人英偉達選擇圖像領域發展,并順利轉向GPU。
1996年,在摸索了3年后,年輕的英偉達把業務重心定位在了圖形處理器上,之后幾年風生水起,游戲整機廠紛紛下訂單,1999年營收破1.5億美元且順利在納斯達克掛牌上市。
然而,凜冬說至就至。隨后的2000-2003年三年,英偉達卻撞上“至暗時刻”:未能如期如要求完成微軟的Xbox用圖形芯片訂單,導致微軟反水轉投死對頭ATI;日后的旗艦產品Geforce系列此時正不停爆出質量事故,黃仁勛還因此喜提了“兩彈一勛”稱號。他只能一面忍辱負重向微軟服軟認錯、爭取訂單,一面和英特爾達成了專利交叉許可協議。
平靜了沒兩年,英偉達又遭遇了AMD翻臉、英特爾停止專利交叉共享的變故,只好自己擼袖子進入3D圖形加速器領域、投入大量人力財力研發CUDA(通用并行計算平臺),燒錢又沒有短期收益,股價一度從37美元跌到6美元。CUDA最終于2006年上市,是全球首款GPU上的通用計算解決方案,為編程人員帶來更便捷的入門體驗,逐漸為英偉達GPU積累了強健穩固的開發者生態。
而此時,在經歷過和數十家對手的激烈廝殺,與AMD成為圖形顯卡領域的兩大霸主之后,英偉達總營收規模已達30億美元,于是黃仁勛做了一個冒險但卻對英偉達影響深遠的決定:每年為CUDA項目砸5億美元,累計總額近100億美元,通過一系列改動和軟件開發,將GPU轉化成更通用的計算工具。
2012年,隨著人工智能、深度神經網絡技術的突破發展,此時已經進化為提供算力基礎設施的英偉達終于熬到了咸魚翻身的機會,基于CUDA架構的大規模并行運算芯片Tesla迎來了AI時代。黃仁勛在CUDA上的堅持開始產生回報。
這一年,在ImageNet大賽中,加拿大多倫多大學教授、機器學習領域泰斗、神經網絡之父Geoffrey Hinton帶領課題組用GPU訓練卷積神經網絡(CNN)AlexNet,他們使用兩個GPU實現了準確率10.8%的大幅提升,一舉拿下了ImageNet圖像識別比賽的冠軍。到了2013年,比賽的所有參賽者都采用深度學習算法,也都跑在英偉達的GPU和CUDA上。
在原來的云計算環境下,計算主力是英特爾CPU,到了AI計算場景,計算主力變成了GPU和其他專用加速器。GPU并非為深度學習而生,其并行計算能力卻與深度學習算法的邏輯一拍即合。每個GPU有數千個內核并行,這些核心通常執行許多低級的、繁復的數學運算,非常適合運行深度學習算法。之后,越來越強的“CUDA+GPU”組合,憑借無敵的處理速度和多任務處理能力,迅速俘獲一大批研究人員的芳心,很快就成為全球各大數據中心和云服務基礎設施的必備組件。
終于迎來自己時代的英偉達,2012年與Google的人工智能團隊合作,建造了當時最大的人工神經網絡,之后各深度學習團隊開始廣泛大批量使用英偉達顯卡。2013年,英偉達與IBM在建立企業級數據中心方面達成合作。2017年,英偉達發布了面向L5完全無人駕駛開發平臺Pegasus。過去3年多,英偉達在高端GPU、高性能計算HPC和數據中心等業務領域保持著一騎絕塵的姿態,被坊間稱為是深度學習得以突破發展的三大元勛之一。
2012年前后,英特爾正忙于與高通爭奪移動芯片市場,同時還要應對來自AMD的絕地大反彈。2014年后,因為摩爾定律失效,英特爾的10納米芯片已經跳票三年,一再拖延上市日期,根本無暇顧及新興的AI市場。直到2015年英特爾方才如夢初醒,啟動了全方位的AI戰略。
英特爾先是設法讓自己的X86與英偉達跑得一樣快,然后是并購為深度學習而生的專用芯片,像神經網絡處理器Nervana、計算機視覺Movidius、自動駕駛技術方案Mobileye等。再然后是做生態,這也是英特爾最擅長的事。
英偉達得益于GPU芯片在深度學習熱潮中大受歡迎,股價一路飆升,在全球服務器用GPU市場占了96%的份額。數據中心已是英偉達第二大業務,從2017年二季度開始,保持每個季度同比增長100%+。
起步早加上生態穩健讓英偉達很快便成為云端AI芯片市場的領導者,陸續展示出令人驚嘆的Tensor Core、NVSwitch等技術,不斷打造新的性能標桿。此外,它還通過構建了GPU云使得開發者隨時可以下載新版的深度學習優化軟件堆棧容器,極大地降低了AI研發與應用的門檻。
對峙與糾纏
英偉達牛氣沖天最終登頂,英特爾自然不會視而不見。2017年11月,英特爾甚至宣布和AMD結盟,聯手對付英偉達。當時沒有搭上數據中心這班車、技術制程也出現停滯的英特爾并沒有坐以待斃,而是采取了收購這個他山之石以為己用的策略。
如前所述,深度學習通過訓練深度學習模型,然后部署到實際生產環境中叫做推理(AI inference)。過去兩年,英偉達在訓練市場占據了絕對份額,但隨著AI部署到實際生產環境中,產品比拼的不僅是速度,還有性價比、性能功耗比和低延遲,而這恰是英偉達所害怕的。
英特爾瞅準要害,2015年12月砸下167億美元買走當時的可編程邏輯器件(FPGA)的千年老二Altera,如今英特爾憑著“Xeon+Altera FPGA”異構芯片的打法,將數據中心某些任務提速十倍有余,其陸續推出的號稱史上最快FPGA芯片的Stratix 10系列,更是獲得了微軟的青睞。
去年12月,英特爾還在重慶落戶了其全球最大的FPGA創新中心,今年4月又亮出悄然打磨了數年,集成了英特爾最先進的10nm工藝、3D封裝、第二代HyperFlex等多種創新技術的新武器——全新架構的FPGA Agilex。
如今,英特爾的FPGA已經在服務器市場初步站穩腳跟,而另一項重要的交易還處于蟄伏期。2016年8月,英特爾花了三四億美元買下專注于打造深度學習專用于硬件的加州創企Nervana,被用來對抗在性能提升方面有如神速的英偉達。收購后不久,前Nervana CEO就被晉升為英特爾AI事業部總負責人,首款采用臺積電28nm工藝的深度學習專用芯片Lake Crest在2018年量產,據稱性能是當時最快的GPU的10倍。
2017年3月,Nervana以及Xeon、Xeon Phi和Altera四個部分的人工智能相關業務和資源被整合進一個部門,即人工智能產品事業部(AIPG),這個新部門將整合公司包括工程、實驗室、軟件等資源,打造英特爾Nervana平臺,既包括Nervana云計算服務、數據庫,又包括Nervana專用芯片。整合之后,英特爾AIPG于2017年推出Crest家族系列產品線,每隔一段時間推出一款升級產品來PK英偉達最新的GPU。
實際上,盡管GPU的高能耗遭到業界越來越多的吐槽,但因其無與倫比的并行運算能力,使得云端AI訓練領域至今尚未出現能與英偉達GPU分庭抗禮的玩家。挑戰這一領域的玩家主要是傳統芯片巨頭和創企,跨界的科技巨頭有谷歌、百度和華為,主要采用的架構是通用GPU和ASIC。
而在更注重能耗、時延、成本、性價比等綜合能力的云端AI推理領域,入局的玩家相對更多,FPGA和ASIC的優勢相對高于GPU。擁有全面AI芯片布局的英特爾勢頭正猛,中美幾大互聯網巨頭也基本上全部加入戰局,或憑借自身規模優勢和充足資源為高成本研發提供資金支持,或公布了AI芯片開發計劃。
結語
在訓練領域,英偉達穩固的生態體系依然是難以撼動的一座高山,并基于自身在GPU領域的強大產品技術實力發展起了穩固的生態圈,成本也更低。
英特爾以“全能冠軍”策略對抗英偉達,研制一體、業務全面布局設備端、邊緣端和云端,綜合CPU、GPU、FPGA和各種專用芯片打造一個完整的體系,并通過結盟構建了聲勢浩大的生態圈,如合作建設了FPGA中國創新中心,聯合發起成立了開放數據中心聯盟、CXL開放合作聯盟、邊緣計算產業聯盟等等。
英偉達的優勢領域深度學習訓練市場需求不會減弱。但正在發展、隨著人工智能普及未來市場難以估量的推理領域,GPU的增速并不確定,前些年加速卡已經賣得很多了,市場可能會增速減緩甚至保持平緩狀態。
而且技術的突破性變革也是一種變數,隨著深度學習技術的不斷完善,未來人工智能的機器推理能力會越來越完善,不排除會有某種革新式硬件出來引發整個生態系統的變遷,而且也說不定哪一天半路會殺出一種終極算法,來取代英偉達。
當然,英偉達也在順應時勢,比如在GTC上黃仁勛特意在AI工作流程中把機器學習、數據中心等與GPU加速深度學習一起納入了英偉達的“AI定義域”。這意味著,英偉達將逐漸調整過度倚重GPU的AI戰略,將產業布局擴展至AI產業各個鏈條。
在擴展生態圈方面,英偉達則采取了不同策略,比如基于最新發布的推理服務器芯片T4與亞馬遜云AWS、阿里云達成合作等。總之,英偉達和英特爾的對峙和競爭,可能是一場馬拉松,短期難分勝負。
評論
查看更多