根據(jù)行業(yè)的參考標準,AI將是下一件大事,或?qū)⒃谙乱患笫轮邪l(fā)揮重要作用。這也就解釋了過去18個月里人工智能領(lǐng)域活動的瘋狂。大公司支付數(shù)十億美元收購創(chuàng)業(yè)公司,甚至投入更多的資金用于研發(fā)。此外,各國政府正在向大學和研究機構(gòu)投入數(shù)十億美元。全球競賽正在進行,目的是創(chuàng)建的最佳的架構(gòu)和系統(tǒng)來處理AI工作所必需的海量數(shù)據(jù)。
市場預測也相應(yīng)上升。 根據(jù)Tractica研究所的數(shù)據(jù),到2025年,AI年收入預計將達到368億美元。Tractica表示,迄今為止已經(jīng)確定了AI的27種不同的細分行業(yè)以及191個使用案例。
但隨著我們深入挖掘,很快就可以明顯地看到,并不存在一個的最好的方式來解決AI問題。甚至對于AI是什么,或需要分析的數(shù)據(jù)類型,我們尚沒有一致的定義。
圖1 AI收入增長預測。來源:Tractica
OneSpin Solutions總裁兼首席執(zhí)行官Raik Brinkmann說,“在人工智能芯片中,你有三個問題需要解決。首先,你需要處理大量的數(shù)據(jù)。其次,構(gòu)建用于并行處理的互連。第三是功率,這是你移動數(shù)據(jù)量的直接結(jié)果。所以你亟須從馮諾依曼架構(gòu)轉(zhuǎn)變到數(shù)據(jù)流架構(gòu)。但它究竟是什么樣子?”
目前的答案很少,這就是為什么AI市場的第一顆芯片包括現(xiàn)成的CPU,GPU,FPGA和DSP的各種組合。雖然新設(shè)計正在由諸如英特爾、谷歌、英偉達、高通,以及IBM等公司開發(fā),但目前還不清楚哪家的方法會勝出。似乎至少需要一個CPU來控制這些系統(tǒng),但是當流數(shù)據(jù)并行化時,就會需要各種類型的協(xié)處理器。
AI的許多數(shù)據(jù)處理涉及矩陣乘法和加法。大量并行工作的GPU提供了一種廉價的方法,但缺點是更高的功率。具有內(nèi)置DSP模塊和本地存儲器的FPGA更節(jié)能,但它們通常更昂貴。這也是軟件和硬件真正需要共同開發(fā)的領(lǐng)域,但許多軟件遠遠落后于硬件。
Mentor Graphics董事長兼首席執(zhí)行官Wally Rhines表示:“目前,研究和教育機構(gòu)有大量的活動。有一場新的處理器開發(fā)競賽。也有標準的GPU用于深度學習,同時還有很多人在從事CPU的工作。目標是使神經(jīng)網(wǎng)絡(luò)的行為更像人腦,這將刺激一次全新的設(shè)計浪潮?!?/p>
當視覺處理開始涉及到AI時,便受到了極大的關(guān)注,主要是因為特斯拉在預計推出自動駕駛汽車的15年前就已經(jīng)提出了自動駕駛概念。這為視覺處理技術(shù),以及為處理由圖像傳感器、雷達和激光雷達收集的數(shù)據(jù)所需的芯片和整體系統(tǒng)架構(gòu)開辟了巨大的市場。但許多經(jīng)濟學家和咨詢公司正尋求超越這個市場,探討AI將如何影響整體生產(chǎn)力。Accenture最近的報道預測,AI將使一些國家的GDP翻番(見下圖2)。雖然這將導致就業(yè)機會大幅減少,但整體收入的提高不容忽視。
Synopsys董事長兼聯(lián)合首席執(zhí)行官Aart de Geus指出了電子學的三個浪潮——計算和網(wǎng)絡(luò)、移動、數(shù)字智能。在后一種類型中,焦點從技術(shù)本身轉(zhuǎn)移到它可以為人們做什么。
“You’ll see processors with neural networking IP for facial recognition and vision processing in automobiles,” said de Geus. “Machine learning is the other side of this. There is a massive push for more capabilities, and the state of the art is doing this faster. This will drive development to 7nm and 5nm and beyond.”
de Geus說:“你將看到具有面部識別和汽車視覺處理的神經(jīng)網(wǎng)絡(luò)IP。機器學習是其另一面。它對于更多的能力會產(chǎn)生一種巨大的推動,目前的技術(shù)水平可以快速完成這些。這將推動芯片發(fā)展到7nm、5nm,甚至更高的水平。”
目前的方法
自動駕駛中的視覺處理在AI當前研究中占主導地位,但該技術(shù)在無人機和機器人中的作用也越來越大。
Achronix公司總裁兼首席執(zhí)行官Robert Blake說:“對于圖像處理的AI應(yīng)用,計算復雜度很高。對于無線技術(shù),數(shù)學很好理解。對于圖像處理,數(shù)學就像西部拓荒,工作負載復雜多變。大概花費5~10年時間才能解決市場問題,但是它對于可編程邏輯肯定會有很大的作用,因為我們需要能夠以高度并行的方式完成的變精度數(shù)學?!?/p>
FPGA非常適合矩陣乘法。最重要的是,它的可編程性增加了一些必要的靈活性和面向未來的設(shè)計,因為在這一點上,不清楚所謂的智能將存在于一個設(shè)計的哪部分。用于做決策的數(shù)據(jù)一些將在本地處理,一些將在數(shù)據(jù)中心中處理。但在每個實現(xiàn)中,其百分比可能會改變。
這對AI芯片和軟件設(shè)計有很大的影響。雖然AI的大局并沒有太大的變化(大部分所謂的AI更接近于機器學習,而非真正的AI),但是對于如何構(gòu)建這些系統(tǒng)的理解卻發(fā)生了重大的變化。
圖3:谷歌TPU開發(fā)板 來源:谷歌
Arteris營銷副總裁Kurt Shuler說:“對于自動駕駛汽車,人們正在做的就是把現(xiàn)有的東西放在一起。為了使一個真正高效的嵌入式系統(tǒng)能夠?qū)W習,它需要一個高效的硬件系統(tǒng)。我們采用了幾種不同的方法。如果你關(guān)注視覺處理,你要做的是試圖弄清楚器件看到的是什么,以及你如何推斷。這包括來自視覺傳感器、激光雷達和雷達的數(shù)據(jù),然后應(yīng)用專門的算法。這里的很多事情都是試圖模仿大腦中的事情,方法是利用深度卷積神經(jīng)網(wǎng)絡(luò)。”
它與真正的AI的不同之處是,現(xiàn)有技術(shù)水平能夠檢測和避開物體,而真正的AI能夠擁有推理能力,例如如何通過一群人正在橫穿的街道,或判斷玩皮球的小孩子是否會跑到街道上。對于前者,判斷是基于各種傳感器的輸入,而傳感器的輸入是基于海量數(shù)據(jù)處理和預編程的行為。對于后者,機器能夠作出價值判斷,例如判斷轉(zhuǎn)彎避開孩子可能會造成的很多結(jié)果,并做出最佳選擇。
Shuler說:“傳感器融合是20世紀90年代出現(xiàn)的一種理念。你要把它變成機器可以處理的通用的數(shù)據(jù)格式。如果你在軍隊里,你擔心有人向你開槍。對于自動駕駛汽車而言,這就像面前有人推嬰兒車。所有這些系統(tǒng)都需要非常高的帶寬,并且都必須在其中內(nèi)置安全措施。最重要的是,你必須保護數(shù)據(jù),因為安全正在成為越來越大的問題。因此,你需要的是計算效率和編程效率?!?/p>
這是今天的許多設(shè)計中所缺少的,因為太多的開發(fā)是由現(xiàn)成的零件搭建的。
Cadence高級架構(gòu)師以及深度學習小組總監(jiān)Samer Hijazi說:“如果你優(yōu)化網(wǎng)絡(luò)、優(yōu)化問題、最小化位數(shù),并使用為卷積神經(jīng)網(wǎng)絡(luò)定制的硬件,那么你可以實現(xiàn)功率降低2~3倍的改進。效率來自軟件算法和硬件IP?!?/p>
谷歌正嘗試改變這個公式。谷歌開發(fā)了Tensor處理單元(TPU),這是專門為機器學習而創(chuàng)建的ASIC。為了加快AI的發(fā)展,谷歌在2015年開源了TensorFlow軟件。
其他公司擁有自己的平臺。但這些都不是最終產(chǎn)品。這是進化的過程,沒有人能確定未來十年AI將如何發(fā)展。部分是因為AI技術(shù)的使用案例正在逐漸被發(fā)現(xiàn)。在某個領(lǐng)域里有效的AI技術(shù)(如視覺處理)不一定適用于另一個領(lǐng)域(例如確定某種氣味是危險的還是安全的,抑或是二者的組合)。
NetSpeed Systems營銷和業(yè)務(wù)開發(fā)副總裁Anush Mohandass說:“我們在黑暗中摸索,我們知道如何做機器學習和人工智能,但卻不知道它們真正的工作方式。目前的方法是使用大量擁有不同計算能力和不同種類的計算引擎——用于神經(jīng)網(wǎng)絡(luò)應(yīng)用的CPU、DSP,你需要確定它是有效的。但這只是第一代AI。重點是計算能力和異構(gòu)性?!?/p>
然而,隨著問題的解決變得更有針對性,這有望改變。就像早期版本的物聯(lián)網(wǎng)器件一樣,沒有人知道各類市場如何演變,因此系統(tǒng)公司投入了一切,并使用現(xiàn)有的芯片技術(shù)將產(chǎn)品推向市場。在智能手表的案例中,結(jié)果是電池充電后只能續(xù)航幾個小時。隨著針對這些特定應(yīng)用的新芯片的開發(fā),功耗和性能會實現(xiàn)平衡,方法是更有針對性的功能、本地處理與云處理之間更智能的分布、以及對于設(shè)計中的瓶頸的更深入的理解這三者的結(jié)合。
ARM模型技術(shù)總監(jiān)Bill Neifert說:“我們的挑戰(zhàn)是找到未知的瓶頸和限制。但根據(jù)于工作負載,處理器與軟件的交互方式不同,軟件本質(zhì)上是并行應(yīng)用程序。因此,如果你正在考慮工作負載,如金融建模或天氣圖,它們強調(diào)基礎(chǔ)系統(tǒng)的方式是不同的。你只能通過深入探索來理解?!?/p>
Neifert指出,軟件方面需要解決的問題需要從更高層次的抽象來看,因為這使得它們更容易約束和修復。這是拼圖的一個關(guān)鍵部分。隨著AI進軍更多市場,所有這些技術(shù)都需要發(fā)展,以達到一般技術(shù)行業(yè),特別是半導體行業(yè)的同等效率。
Mohandass說:“現(xiàn)在我們發(fā)現(xiàn),如果他們只處理好一種類型的計算,那么架構(gòu)就會很困難。但異構(gòu)性的缺點是,將整體分而治之的方法變得土崩瓦解。因此,該解決方案通常涉及到超量供應(yīng)或供應(yīng)不足?!?/p>
新方法
隨著AI的應(yīng)用案例超越了自動駕駛汽車領(lǐng)域,其應(yīng)用將會擴展。
這就是為什么英特爾去年八月收購了Nervana。Nervana開發(fā)了2.5D深度學習芯片,該芯片利用高性能處理器內(nèi)核,將數(shù)據(jù)通過中介層移動到高帶寬內(nèi)存。 Nervana聲稱的目標是,與基于GPU的解決方案相比,該芯片訓練深度學習模型的時間將縮短100倍。
eSilicon營銷副總裁Mike Gianfagna說:“這些看起來很像高性能計算芯片,本質(zhì)上是使用硅中介層的2.5D芯片。你將需要大量的吞吐量和超高帶寬內(nèi)存。我們已經(jīng)看到一些公司在關(guān)注它,但尚不足幾十家。它還為時尚早,實現(xiàn)機器學習和自適應(yīng)算法,以及如何將這些與傳感器和信息流整合,是非常復雜的。例如自動駕駛汽車,它從多個不同的來源串流數(shù)據(jù)并添加自適應(yīng)算法,以避免碰撞?!?/p>
Gianfagna表示,實現(xiàn)這些器件有兩個挑戰(zhàn)。其一是可靠性和認證。其二是安全。
對于AI,可靠性需要在系統(tǒng)級考慮,其中包括硬件和軟件。ARM在12月收購Allinea提供了一個參照。另一個參照來自斯坦福大學,研究人員試圖量化來自軟件的裁剪計算的影響。他們發(fā)現(xiàn),大規(guī)模切割或修剪不會對最終產(chǎn)品產(chǎn)生顯著影響。加州大學伯克利分校已經(jīng)開發(fā)了一個類似的方法,基于的計算接近100%的準確率。
正在研究節(jié)能深度學習的斯坦福大學博士研究生韓松說“與精粒修剪相比,粗粒修剪不會降低精度?!彼硎荆固垢i_發(fā)的稀疏矩陣要求計算減少10倍,內(nèi)存占用減少8倍,比DRAM的能耗減少120倍。它應(yīng)用于斯坦福所謂的高效語音識別引擎,壓縮導致了推理過程的加快。(Cadence最近的嵌入式神經(jīng)網(wǎng)絡(luò)峰會上提出了這些發(fā)現(xiàn)。)
量子計算為AI系統(tǒng)增加了另一個選擇。 Leti首席執(zhí)行官Marie Semeria表示,量子計算是她的團隊未來的方向之一,特別是AI應(yīng)用。IBM Research的科學與解決方案團隊副總裁Dario Gil解釋說,使用經(jīng)典計算,如果四張卡片三藍一紅,那么有四分之一的機會猜中那張紅色的卡片。使用量子計算機和量子比特的疊加和糾纏,通過扭轉(zhuǎn)糾纏,系統(tǒng)每次都會給出正確答案。
結(jié)論
AI不是一件事,因此沒有單一的系統(tǒng)在任何地方都能完美地工作。但AI系統(tǒng)有一些通用要求,如下圖所示。
AI在許多市場都有應(yīng)用,所有這些都需要廣泛的改進、昂貴的工具,以及支持它們的生態(tài)系統(tǒng)。經(jīng)過多年來依靠萎縮器件來提高功率、性能和成本,如今整個市場部門都在重新思考如何進入新市場。這對于架構(gòu)師來說是一個巨大的勝利,這為設(shè)計團隊增加了巨大的創(chuàng)造性選擇,也將刺激從工具和IP供應(yīng)商一直到包裝和流程開發(fā)的巨大發(fā)展。這就像為技術(shù)行業(yè)按下了重啟按鈕,可以證明,這對于未來整個生態(tài)系統(tǒng)的業(yè)務(wù)都是有益的。
評論
查看更多