AI 芯片近兩年成為大熱門,養出不少獨角獸,但在今年下半年行業已經出現不小震蕩,先是深鑒科技被美國半導體公司賽靈思(Xilinx)收購,華為在全聯接大會上推出了昇騰 910、昇騰 310 兩款 AI 芯片,坐實了傳聞已久華為要自己做芯片的說法。而 2 個月前,阿里巴巴宣布設立平頭哥半導體公司。
有人選擇被收購,有人面對危機就是轉機,也有新人加入戰局,包括華為及阿里巴巴,后續 AI 芯片初創領域又會怎么發展?“大廠已經投入資源切入,就是行業洗牌的時候!”,耐能創始人劉峻誠在接受 DT 君采訪時說。對于同屬 AI 芯片創業一員的耐能,其開發的神經網路處理器(NPU,Neural Processing Unit)芯片,預計明年第二季出貨,并通過與 3D 傳感供應商合作,全力搶攻 3D 傳感商機。
不同于幾家媒體上常曝光的 AI 芯片初創公司多是從學術圈走向創業,耐能的創始團隊則是來自半導體業內人士,劉峻誠曾任職于高通、三星,耐能首席科學家李湘村則是前高通多媒體研發部門總監,也曾在展訊、朗訊(Lucent Technologies)擔任高管。
云端的 AI 服務可以通過 GPU、服務器、高性能計算機群(HPC)提供強大的算力,但越是終端的產品隨著系統計算能力的減弱,可以運行的深度學習網絡就越小,因此如何讓終端設備也能執行一定程度的 AI 功能,就是耐能鎖定的市場。
2016 年推出自家第一款終端裝置專用的 NPU 以及軟體開發套件“重組式人工智能神經網路(Reconfigurable Artificial Neural Network)”,芯片體積小、功耗低,更做到可以在終端上跑 ResNet、SSD(Single Shot MultiBox Detector)等深度學習網絡框架。
在深度學習領域有幾個被廣泛使用的模型架構,像是 AlexNet 有 5 或 8 個網絡層,ResNet 有 18 層、50 層、101 層、152 層等,而 SSD VGG-300、VGG-512 則是龐大的模型,目前主要應用在安防領域,讓機器可以在空間中判斷出各個物體的位置、距離等。耐能的 NPU 使用 ARM Cortex-A7、A9 處理器,卻能跑得動 ResNet 和 SSD,這就是其技術獨到之處。
正因如此,吸引了不少重量級投資者,去年底耐能宣布完成超過千萬美元的 A 輪融資,就是由阿里創業者基金(Alibaba Entrepreneurs Fund)領投,其他投資者還包括高通、中科創達、紅杉資本等。今年 5 月耐能完成由香港富商李嘉誠旗下維港投資(Horizons Ventures)領投的 1800 萬美元 A1 輪融資,累計融資金額超過 3300 萬美元。
盡管大股東自己當起了平頭哥,要做 NPU 以及嵌入式芯片,但并不影響耐能的生意,劉峻誠透露,近期將宣布完成新一筆融資,此輪金額將超過先前累計的 3300 萬美元。另外,耐能最初的商業模式是采取先賣軟體、NPU IP 授權的商業模式,合作客戶包括 ARM、家電巨頭格力等,隨著營收來源穩固,明年將開始銷售自有 NPU IC。
進軍 3D 傳感,協同大廠供貨結構光、雙目方案
蘋果 Face ID 刷臉解鎖技術的問世,定義了整個科技行業的新方向,不僅 Android 陣營的手機品牌全部跟進 3D 傳感,也延伸到了新零售,像是刷臉支付,或是通過掃描面部或身體的 3D 建模,可為消費者定制化產品,還有門禁解鎖,就有汽車公司思考通過 3D 傳感技術來取代車鑰匙。
除了取代人們口袋中的東西,像是錢包、鑰匙之外,還有 AR 應用,業界就盛傳蘋果有意在 iPad 平板電腦采用 ToF 技術,預計在 2019 或 2020 年問世。在蘋果的力拱下,3D 傳感技術無疑依舊是 2019 年產業的熱點。
不過,目前 3D 傳感技術的問題在于方案成本仍昂貴,舉例來說,蘋果 Face ID 的結構光模組打出 3 萬多個光點到用戶的臉,然后把這些訊息丟到 iPhone 的主芯片 A12 Bionic,這塊主芯片里有一個神經網絡引擎(Neural Engine),由這個人工智能專用加速處理器執行運算,而結構光模組成本大概是 20 多美元,主芯片大概是 70~80 美元,兩者加起來就逼近 100 美元的成本,并不是所有終端產品都適合,例如物聯網產品、智能家居產品等。
簡單來說,3D 傳感方案包括 3D 傳感器以及后段的運算處理,目前較流行的做法是利用 NPU 芯片或神經網絡引擎來進行后段的運算,3D 傳感器取得光的信息和深度信息后,由 NPU 來運算這些數據。因此,耐能的戰略是開發一個專門處理 3D 傳感的 NPU 芯片,實時進行三維建模,像是人臉識別、物體或行為識別,同時解決耗能高及成本的問題,他進一步指出,一些簡單的功能靠這一顆芯片就可獨立運作,“該芯片價格大概在 10 美元左右”,并可搭配不同的傳感器如結構光、雙目或 ToF。目前已與奇景光電及***半導體公司鈺創分別合作結構光、雙目方案,進攻 3D 傳感市場。
除了新零售應用,劉峻誠指出,3D 傳感應用在安防領域是一大商機,將 2D 平面信息轉為 3D 模型,立體化之后的好處是提高準確度,除了多加了“深度”信息之外,還能用光來感測體溫,拿了照片、甚至是蠟像、雕像也無法矇混過關,除了強化系統安全性,另一個優點在于“賦予行為識別能力”,過去安防領域是通過 2D 視頻來判斷,可能因為角度錯位導致系統容易出現誤報,通過 3D 傳感讓機器具有行為識別能力,促使安防產品進入下一個時代。
另一個就是產線的異常檢測,目前在工廠生產線上采用自動化光學檢測(AOI)技術已行之有年,也就是利用高精度跟高速度的光學鏡頭來協助檢查產品是否有缺陷,不過,近來 AOI 也興起一股很明顯往機器學習靠攏的趨勢。劉峻誠認為,傳統 AOI 主要是應用在“平面的”印刷電路板(PCB)、面板等行業,其他行業的曲面、立體的產品不見得適用,另外 AOI 準確度仍有很大的改進空間,更多時候是需要靠人力來檢查,通過 3D AI 技術即時 3D 建模,可以更精確檢查產品的焊錫是否準確等,同時成本得以下降。
從賣 IP 到賣 IC,瞄準物聯網及新應用
從初期賣 NPU IP 到準備開始賣自有 IC,特別是耐能的投資方還有一個芯片巨頭高通,難道不怕得罪投資方?“在手機跟安防領域,我們是不可能自己做芯片去跟巨頭競爭,”劉峻誠說得很坦白。
他進一步分析,目前手機市場就只有前五大業者才有出貨量,但手機芯片行業已被高通及聯發科拿下,而在安防領域,行業巨頭??低?/u>、大華也自己跳下來做晶片,“今天做個晶片跟巨頭 PK,那我就是找死!而且 NPU 其實只是一個協處理器,耐能做的是幫助客人強化他們的產品線,”因此耐能在手機及安防領域的策略就是銷售 NPU IP,一是讓客戶的芯片在 3D AI 功能更強大,二是讓新切入芯片領域的巨頭能夠加速 IP 整合、開發芯片。
在手機跟安防領域不直接與巨頭競爭,耐能瞄準的是物聯網以及新興應用,“有些領域并沒有這種獨占性,物聯網至今就沒有所謂的贏家,但是有很多生態鏈,像騰訊、阿里巴巴、小米等,”劉峻誠指出,這些就是耐能將直接銷售 NPU 芯片的領域。
芯片是老師傅當道,AI 芯片初創公司的前景如何?
對于今年 AI 芯片初創公司陸續有一些變化,未來整個市場發展又會如何?他認為,“大廠已經投入資源進來,華為就是一個代表”,華為的兩款升騰芯片 910 和 310,各自對準云跟端,“當大廠切進來打的時候,這個行業洗牌的時候就到了”,“半導體芯片門檻還是高的,是老師傅當道”,例如,高通是不會讓一個 7 年以下工作經驗的人到第一線做產品,“直接做大型晶片,跟大廠競爭是傻的”。
其實可以檢視一下 AI 芯片獨角獸們的產品策略,有兩家企圖攻進云端市場,像是數據中心,但云端市場早已是巨頭把持的天下,谷歌自研的 TPU 已經開始對外提供服務,除了半導體巨頭 NVIDIA 之外,更不用說還有一個在數據中心具有極高市占率的英特爾,不只芯片,內存以及傳輸介面(Interface)都是它的強項,因此英特爾的優勢在于“整體系統”的性能強大。
另外,汽車領域也吸引了不少芯片初創企業投入,國內就有一家知名的獨角獸推出了自動駕駛芯片,“但車的整個開發周期是三年到五年,時間很長,小公司沒有營收,發展會比較辛苦”,更重要的是,在這個領域會遇到 NVIDIA。眾所皆知,NVIDIA 跟國際車廠包括奔馳、奧迪等,已經建立深厚的關系,而且汽車并不在意功耗問題,只重視系統的穩定度及可靠度,因此想要跟 NVIDIA 搶食自動駕駛芯片的蛋糕,難度其實很高。
因此,耐能的策略很清楚,“我們不碰“云”跟“汽車”行業,專攻“端”,”劉峻誠強調,把過去依賴大量云端算力進行的 AI 計算,搬到終端上來實現,也就是邊緣運算,但盡管是鎖定“端”的 AI 市場,在安防跟手機領域是以賣 IP 為主,不會去跟大廠競爭,而是幫助他們技術提升,抓住自己的獨有性。
內存跟 I/O 將是下一個重要趨勢
面對這場 AI 芯片大混戰,劉峻誠倒是看得很冷靜,“估值喊得再高,本質還是要創造價值”,就是“比誰的氣比較長”,“能做的就是趕快找一些細分領域做突破、做前沿技術開發”,他進一步分析兩大趨勢,AI 發展后,未來一定是多個 NPU 多核堆疊起來,因此內存跟中間的 I/O 傳輸會是下一個非常重要的領域,像是內存內計算(In Memory Computing)以及高速傳輸介面 SerDes。
由于 AI 或認知運算都需要處理非常大量的資料,如何有效率處理這些數據就成了關鍵,現今的電腦架構都是使用馮諾伊曼架構(von Neumann architecture)來運行,但基于馮諾伊曼架構,在執行 AI 應用時,處理器和記憶體之間需要大量傳輸資料,耗費資源且效能不佳。
許多重量級研究機構都已經投入相關研究,除了美國美國國防高級研究計劃局(DARPA)資助開發一種全新的非馮諾伊曼(non-von-Neumann)架構處理器之外,今年 4 月 IBM 研究團隊發表了一個全新的混合式精確內存內運算架構(Mixed-precision in-memory computing),將計算型內存單元(Computational memory unit)加入馮紐曼架構(von Neumann architecture),來提高 AI 訓練的效能。
隨著 AI 芯片的行業正走向洗牌,初創公司必須開始做出差異化,因此耐能已經投入上述兩大領域的開發,希望在未來的前沿領域仍可跟巨頭競爭。
-
阿里巴巴
+關注
關注
7文章
1617瀏覽量
47308 -
3D傳感
+關注
關注
2文章
123瀏覽量
14140
原文標題:【專訪】耐能打造“殺手級AI應用”獲阿里、李嘉誠青睞
文章出處:【微信號:DIGITIMES,微信公眾號:DIGITIMES】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論