近日,由電子發(fā)燒友主辦的“2019年人工智能技術峰會”在深圳成功舉行。本次峰會以“加速人工智能技術落地”為主題,匯聚了人工智能產(chǎn)業(yè)鏈上下游領先企業(yè),超過一千名專業(yè)觀眾,近30位企業(yè)高管、行業(yè)專家縱論產(chǎn)業(yè)發(fā)展之道,從不同領域、不同產(chǎn)業(yè)環(huán)節(jié)出發(fā),對2019年人工智能在中國市場的進一步落地,進行了探討及預測。
rm中國市場部負責人梁泉與Arm中國AI產(chǎn)品經(jīng)理楊磊也參與演講,為現(xiàn)場的觀眾帶去了Arm中國對于人工智能技術市場的預測以及Arm中國周易人工智能平臺的最新進展。
連接無處不在,如何把AI“放”進每個終端?
回顧計算發(fā)展的歷史,梁泉表示經(jīng)歷了主機計算時代、個人計算和軟件、互聯(lián)網(wǎng)、移動和云計算這四次浪潮,第五次浪潮將是一個由數(shù)據(jù)驅動的全面計算時代,Arm生態(tài)系統(tǒng)在這波浪潮中將迎來巨大的機遇,推動經(jīng)濟增長及社會進步。但是,只有把當前的先進技術轉化為堅實的業(yè)務,第五次浪潮才會成為現(xiàn)實。
Arm中國市場部負責人梁泉
根據(jù)Arm此前的預測,到2035年,全球將有一萬億設備實現(xiàn)互聯(lián)。飛速發(fā)展的物聯(lián)網(wǎng)已成為人類文明史中推進速度最快的新興經(jīng)濟體系,全球累計物聯(lián)網(wǎng)設備產(chǎn)生的新產(chǎn)值已達到30萬億美元,而在接下來的20年內,預計累計中國物聯(lián)網(wǎng)相關設備及產(chǎn)值就將達到60萬億元以上。
此外,機器學習算法和深度學習芯片組在取得不斷突破的同時,AI也持續(xù)向不同垂直行業(yè)領域、邊緣終端縱橫滲透,賦能邊緣設備發(fā)展,應用于每個IoT終端節(jié)點,從軟/硬兩方面實現(xiàn)降本增效及體驗升級。整個AI產(chǎn)業(yè)生態(tài)正在構建,新的秩序正在形成。“目前,90%的AI智能設備都基于Arm IP,Arm IP極大驅動了人工智能和機器學習技術的發(fā)展。Arm希望與合作伙伴共建面向未來的智能生態(tài),實現(xiàn)這些優(yōu)勢?!绷喝獜娬{道。
在此大趨勢下,如何滿足嵌入式平臺日益增長的人工智能智能處理需求?梁泉指出,分布式計算成為未來方向,邊緣處理在帶寬、電源、成本、延遲、可靠性和安全性方面提供了好處。因為并非所有數(shù)據(jù)都需要發(fā)給數(shù)據(jù)中心去處理,在數(shù)據(jù)被搜集和使用的節(jié)點也應該具有這一能力。這意味著不僅要在筆記本電腦處理器中啟用這種邊緣處理能力,還要在性能、功耗和內存方面有限的小型嵌入式設備上實現(xiàn)這種計算水平。
此外,梁泉還提到,去年Arm中國推出的本土工程團隊第一個成果——周易人工智能平臺,采用完全自主開發(fā)的AI處理器和軟件框架,讓芯片廠商能夠在現(xiàn)有的技術能力上,快速部署人工智能計算的算力,在同等的成本功耗情況下,能做到人工智能應用所需要的算力。它的核心包含兩部分,一是Tengine軟件框架,二是AIPU(人工智能處理單元),主要處理卷積神經(jīng)網(wǎng)絡、深度神經(jīng)網(wǎng)絡為代表的AI計算。從優(yōu)化端側芯片開發(fā)的角度看,周易平臺降低了兩個門檻:一方面是SoC集成AI功能的設計門檻,另一方面是上層軟件的開發(fā)門檻。
梁泉表示:“未來的智能生態(tài),所有基礎革命都必須通過開放生態(tài)系統(tǒng)把成本功耗降下來,又能通過共同的標準和體系讓大家協(xié)作,在同一個開發(fā)環(huán)境中,把應用服務做好?!?/p>
周易AIPU賦能邊緣AI設備
眾所周知,過去幾年AI從一個被輕視的學術冷門研究突然爆紅,一路狂奔到商業(yè)化的最前沿,在安防、金融、教育、制造、家居、娛樂等各個與人們生活息息相關的領域掀起了一股智能化升級和萬物互聯(lián)的颶風。
Arm中國AI產(chǎn)品經(jīng)理楊磊
而在Arm中國AI產(chǎn)品經(jīng)理楊磊看來,AI芯片的基礎技術格局可分為云端和邊緣端,目前AI訓練基本上都是在云端進行的,需要用到的芯片主要是CPU、GPU和TPU等計算能力相對更強的芯片;但AI推理就不同了,有在云端進行的,也有在設備端進行的,而且現(xiàn)在越來越多的推理被放到了邊緣側實現(xiàn)。這就導致了目前人工智能應用面臨以下三大挑戰(zhàn):
一、數(shù)據(jù)隱私性。目前人工智能應用最多的領域是視頻和圖片,以及自然語音處理,這些數(shù)據(jù)的處理基本都是在云端進行的,但這些數(shù)據(jù)傳到云端后會有一個隱私問題,有些數(shù)據(jù)人們其實是不想傳送到云端的。
二、算力問題。由于AI需要做的事情很多,比如物體檢測、人體檢測和識別、跟蹤,以及行為分析等等,加上現(xiàn)在的攝像頭分辨率越來越高,從720p 到 1080p ,再到4K,使得AI對算力的要求越來越高。這就要求芯片具有更高的性能,從幾百GOPS到幾TOPS。
三、功耗問題。因為邊緣側功耗限制,設備一般只有幾瓦,留給AI運算的部分只有幾百mW到2W,這就需要新技術來應對這個難題。
為了應對這三大挑戰(zhàn),Arm中國周易人工智能平臺,使用的AI處理器Zhouyi AIPU,采用了全新的為AI設計的專用指令集,具有高性能和高靈活性,單核有0.5、1、2、4TOPS可選,還支持多核;是一個具有硬件IP、軟件SDK和NBB的全棧解決方案;更重要的是,它支持安全擴展。
具有周易AIPU的參考芯片框架圖
全新的專用指令集是如何實現(xiàn)高性能和高靈活性的呢?楊磊解釋說,這是因為Arm采用了不同顆粒度的指令集,客戶可以根據(jù)自己的需求用類似搭積木的方式來設計自己的AI處理器?!爸噶罴鶕?jù)運算能力從小到大,可分為標量指令、向量指令和面向AI硬件加速的AI固定指令。”此外,為了滿足定制化和差異化需求,周易人工智能平臺還支持用戶根據(jù)特定場景,自定義擴展AI Fix Function指令。現(xiàn)場Arm中國的展示臺上,秀出的16通道人臉識別監(jiān)控系統(tǒng)Demo,正是由于周易平臺Framework作加速,支持的通道數(shù)很多,處理速度也得到了進一步的加快。
楊磊還特別指出,在人工智能開發(fā)過程中工具鏈也是相當重要的,Arm可以提供完整的工具鏈供工程師使用。其“一鍵式”周易軟件工具鏈,包括比如Build Tool/Driver、性能優(yōu)化庫、軟件仿真器,以及AI算法示例等,可以實現(xiàn)一鍵從算法模型到周易可執(zhí)行文件生成。
邊緣計算已經(jīng)成為未來趨勢。在物聯(lián)網(wǎng)應用中,讓智能思考留在本地,其不僅可以降低功耗、降低時延、節(jié)約帶寬,而且能夠提高設備的獨立性、安全性和私密性?!耙ㄟ^邊緣計算實現(xiàn)物聯(lián)網(wǎng)設備的本地計算,需要具備以下幾方面先決條件:具備優(yōu)化的DSP,充分保證功能性安全,以及安全的平臺架構、異構系統(tǒng)架構、機器學習能力、可擴展處理能力,而Arm也在提供周易人工智能平臺這樣的全棧式解決方案積極促進邊緣智能計算的應用落地。”楊磊強調道。
-
ARM
+關注
關注
134文章
9164瀏覽量
368707 -
互聯(lián)網(wǎng)
+關注
關注
54文章
11184瀏覽量
103698 -
計算機
+關注
關注
19文章
7534瀏覽量
88477 -
人工智能
+關注
關注
1796文章
47642瀏覽量
239775
原文標題:加速人工智能技術落地,揭秘Arm中國的AI布局路線圖
文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論