CSDN 出品的《2018-2019 中國人工智能產(chǎn)業(yè)路線圖》V2.0 版即將重磅面世!
V1.0 版發(fā)布以來,我們有幸得到了諸多讀者朋友及行業(yè)專家的鼎力支持,在此表示由衷感謝。此次 V2.0 版路線圖將進行新一輪大升級,內(nèi)容包括 3 大 AI 前沿產(chǎn)業(yè)趨勢分析,10 位 AI 特邀專家的深度技術(shù)分析,15 家一線互聯(lián)網(wǎng)企業(yè)的 AI 實力大巡展,以及 20 個 AI 優(yōu)秀應(yīng)用案例,力求為讀者呈現(xiàn)更全面的中國人工智能產(chǎn)業(yè)發(fā)展概況和趨勢判斷。
V2.0 版將于 11 月 8 日舉辦的 2018 AI 開發(fā)者大會上正式發(fā)布,在此之前,我們將不間斷公布精要內(nèi)容,以饗讀者。此為 V2.0 版中深度技術(shù)分析系列稿件第 1 篇,作者為 CSDN 特邀 AI 專家大華股份研發(fā)中心副總裁殷俊。
視覺是最重要的感官之一,我們通過眼睛看到大千世界,通過大腦分析看懂場景,并能回憶過往的視覺記憶。計算機視覺,就是利用電子、信息、計算機等技術(shù),采用電子成像系統(tǒng)作為基礎(chǔ)的感知單元采集視頻圖像,并通過信息化技術(shù),分析并解釋采集到的視頻圖像。計算機視覺從學(xué)術(shù)上分類,包括圖像處理、模式與圖像識別、事件分析、場景理解等眾多圖像相關(guān)的技術(shù)學(xué)科,以及計算機、信號處理、物理學(xué)、數(shù)學(xué)、生物學(xué)等多個基礎(chǔ)學(xué)科,且隨著人工智能技術(shù)的演進還在不斷發(fā)展。
利用計算機視覺,我們最終期望通過技術(shù)的發(fā)展,計算機能和人一樣通過視覺觀察和理解世界,并且能夠具備自主適應(yīng)和認(rèn)知環(huán)境的能力。
▌計算機視覺技術(shù)百花齊放,加速多個產(chǎn)業(yè)升級
深度學(xué)習(xí)是當(dāng)前人工智能領(lǐng)域最為熱點的技術(shù)之一,其發(fā)展非常迅猛,通過深度學(xué)習(xí)技術(shù),可以在短時間內(nèi)達到傳統(tǒng)模式識別技術(shù)的性能。深度學(xué)習(xí)技術(shù)源于 80 年代的神經(jīng)網(wǎng)絡(luò)技術(shù),最近兩年的發(fā)展才真正實現(xiàn)大規(guī)模商業(yè)化落地,背后驅(qū)動這項人工智能技術(shù)的突飛猛進源于芯片技術(shù)發(fā)展帶來的計算能力指數(shù)級提升,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)技術(shù)發(fā)展提供了海量的數(shù)據(jù),深度學(xué)習(xí)技術(shù)開源推動算法的快速工程化與迭代升級。
2018 年是深度學(xué)習(xí)為代表的計算機視覺技術(shù)百花齊放的元年,創(chuàng)業(yè)公司和成熟企業(yè)在人工智能的浪潮里相互競爭,加速多個產(chǎn)業(yè)的升級。在算法層面,眾多創(chuàng)業(yè)公司推出了很多高性能的人工智能算法,成熟的行業(yè)領(lǐng)導(dǎo)企業(yè)也迅速完成了技術(shù)突破和解決方案升級;在芯片層面,創(chuàng)業(yè)公司和巨頭企業(yè)也發(fā)布了各類神經(jīng)網(wǎng)絡(luò)的 IP 和芯片,形成 GPU、DSP、xNN、FPGA 各自發(fā)力的格局,滿足邊緣計算、中心計算和云計算的計算力需求。從計算機視覺應(yīng)用的產(chǎn)業(yè)板塊上分析,以視頻應(yīng)用為基礎(chǔ)的視頻安防、工業(yè)視覺是目前最快落地的行業(yè),醫(yī)療、智能駕駛領(lǐng)域的技術(shù)正在快速發(fā)展中,未來技術(shù)突破將會產(chǎn)生巨大的商業(yè)應(yīng)用價值。
人工智能技術(shù)和計算能力的突破勢必帶來產(chǎn)品和解決方案的全面升級,從而加速客戶應(yīng)用的規(guī)模化效應(yīng)。我們現(xiàn)在在交通道路上可以看到非常多的攝像機拍攝路面的情況,這些基本都具備人工智能能力,能夠?qū)Φ缆飞宪囕v的行駛情況分析,比如判斷是否違章。
以前要使用智能化分析交通行為,攝像機要連接到工控服務(wù)器,在服務(wù)器里部署視頻處理的算法實現(xiàn)智能分析。直到 2007 年,以大華股份為代表的企業(yè)通過技術(shù)創(chuàng)新,推出了業(yè)內(nèi)一體化智能交通攝像機,把當(dāng)時高性能的 DSP 嵌入到攝像機,利用一臺攝像機實現(xiàn)了交通違章和車牌識別功能,從而加速行業(yè)的快速升級和新型產(chǎn)品的普及。現(xiàn)在隨著深度學(xué)習(xí)技術(shù)的引入以及芯片計算能力的革命性提升,一臺交通攝像機可以處理幾十種的違章行為,而且還能進一步分析行人、非機動車的行為,實現(xiàn)對視頻的全結(jié)構(gòu)化解析,這又是一次里程碑式的發(fā)展。
同樣以人臉識別技術(shù)的應(yīng)用為例,2017 年人臉識別技術(shù)取得關(guān)鍵性突破,大規(guī)模的人臉識別率達到 90% 以上,引發(fā)商業(yè)和產(chǎn)品化的快速落地。現(xiàn)在我們可以使用刷臉支付、刷臉開門、刷臉考勤等便捷的服務(wù),我們同樣可以采用這項人工智能技術(shù)實現(xiàn)商業(yè)的分析和數(shù)據(jù)服務(wù)。另一方面,隨著產(chǎn)品計算能力的大幅提升,新型人工智能的一體化產(chǎn)品取代了傳統(tǒng)解決方案里需要部署的一套復(fù)雜的系統(tǒng)。
盡管計算機視覺在深度學(xué)習(xí)技術(shù)推動下取得驚人的成果,但我們也需要清醒的看到人工智能技術(shù)還存在很多瓶頸。當(dāng)前的人工智能還不夠真正的智能,離機器自主認(rèn)知還有很長的路要走,現(xiàn)有技術(shù)還只能做到高效地解決單一或特定的任務(wù)。此外深度學(xué)習(xí)算法是個黑盒子,網(wǎng)絡(luò)內(nèi)部各層的解釋性差,在實際工程過中存在不可預(yù)見性,尤其是算法還無法達到普適性要求,復(fù)雜性和融合性應(yīng)用帶來很多誤差和相互干擾。
由于深度學(xué)習(xí)技術(shù)采用的是大規(guī)模數(shù)據(jù)驅(qū)動,大規(guī)模的數(shù)據(jù)訓(xùn)練本身對超算中心的能力是很大的挑戰(zhàn),同時在實際工程化應(yīng)用中場景非常復(fù)雜多變,這會出現(xiàn)很多無法預(yù)測的干擾數(shù)據(jù),導(dǎo)致很容易計算出未知的異常結(jié)果。更為重要的是雖然人工智能已經(jīng)有了非常高的性能指標(biāo),但客戶對人工智能應(yīng)用的期望卻往往超越現(xiàn)有的算法表現(xiàn)結(jié)果,這也需要計算機視覺技術(shù)持續(xù)突破來解決的實際問題。
▌視頻安防和工業(yè)視覺領(lǐng)域應(yīng)用發(fā)展最快
2018 年計算機視覺技術(shù)在視頻安防和工業(yè)視覺領(lǐng)域應(yīng)用是發(fā)展最快的兩個領(lǐng)域,尤其在視頻安防領(lǐng)域,也是業(yè)內(nèi)公認(rèn)最適合落地的行業(yè)。安防應(yīng)用的攝像機每天產(chǎn)生超 3000PB 的數(shù)據(jù),這些數(shù)據(jù)里 99% 的數(shù)據(jù)都是無效的,而依靠人工智能技術(shù)可以快速對視頻數(shù)據(jù)進行結(jié)構(gòu)化分析,可以挖掘出其中的價值數(shù)據(jù),進一步結(jié)合大數(shù)據(jù)技術(shù)將數(shù)據(jù)進行時空碰撞,從而實現(xiàn)數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)檢索應(yīng)用。
計算機視覺作為物聯(lián)網(wǎng)的視覺感知和視覺認(rèn)知的重要環(huán)節(jié),除了視頻安防的智慧城市和智能交通的應(yīng)用外,已廣泛應(yīng)用于在智慧金融、智慧樓宇、智慧教育、智慧環(huán)保、智慧城管等各個采用視頻應(yīng)用的行業(yè),即使是傳統(tǒng)的視頻安防行業(yè)應(yīng)用也已經(jīng)從安全管理延伸到城市管理、綠色出行等新型應(yīng)用。
以視頻結(jié)構(gòu)化技術(shù)的應(yīng)用為例,這是一種基于視頻內(nèi)容進行信息提取的技術(shù)。視頻結(jié)構(gòu)化解析技術(shù)實現(xiàn)了人、機動車、非機動車和行為的解析,其中人的基本特征包括面部、性別、年齡、身高、發(fā)飾、衣著、帽子、包、口罩、傘等;機動車的基本特征包括車牌、車標(biāo)、顏色、車型車系、車貼、駕駛座人員、車飾、車窗等;非機動車的特征包括車型、顏色、非機動車牌、乘車人等;行為的基本特征包括絆線入侵、穿越圍欄、區(qū)域入侵、徘徊檢測、物品遺留、物品搬移、快速奔跑、打架斗毆、人員聚集等。
道路擁堵治理也是當(dāng)前城市道路管理的痛點之一,人工智能技術(shù)可以發(fā)揮巨大的價值,在管理區(qū)域內(nèi)的每個攝像機可以識別出視頻中的人、車的行為,即時分析違章,還能獲取到道路實時通行的人流、車流、密度等數(shù)據(jù),依靠大量攝像機數(shù)據(jù)聯(lián)動,結(jié)合紅綠燈管理系統(tǒng),對道路車輛通行按需管理并進行分流提醒,可以達到有效提升道路通行平均速度的目的。
同樣在生產(chǎn)制造過程中,質(zhì)檢環(huán)節(jié)需要大量工人靠人眼去評判生產(chǎn)零件、整機的質(zhì)量。現(xiàn)在計算機視覺高速發(fā)展,可以通過攝像機安裝在流水線上,高幀率拍攝視頻圖像并實時分析零部件的表面各種工藝缺陷,例如液晶屏的劃傷、裂紋,金屬零件的完整性,整件安裝的角度一致性等,同時還可以直接掃碼,實現(xiàn)生產(chǎn)過程自動化錄入。因此在工業(yè)視覺領(lǐng)域,隨著人工智能的能力快速適配,機器開始逐步取代人工,再極大程度上降低生產(chǎn)成本的同時還提升了產(chǎn)品質(zhì)量。
此外,現(xiàn)在在人臉識別、文字識別、物品識別、行為識別、肢體識別等各個領(lǐng)域都有非常豐富的應(yīng)用出現(xiàn),人工智能已經(jīng)融入到人們的生活、出行等各個方面,比如刷臉支付、拍攝翻譯、動植物分類識別、體感游戲等等。可見,視覺技術(shù)的升級和應(yīng)用的拓展,將帶來相關(guān)產(chǎn)業(yè)升級和用戶體驗創(chuàng)新。
▌計算機視覺產(chǎn)業(yè)新一輪發(fā)展的起步年
2017 年計算機視覺產(chǎn)業(yè)處于井噴期,眾多的創(chuàng)業(yè)公司、巨頭企業(yè)以及跨界公司參與到了這個產(chǎn)業(yè)里,各類的新技術(shù)和新應(yīng)用出現(xiàn)在視野內(nèi)。2018 年更多的是技術(shù)到產(chǎn)業(yè)的落地,成熟達到商用的視覺技術(shù)結(jié)合市場的需求在行業(yè)中持續(xù)開拓市場,尚在演進中的技術(shù)正在探索挖掘試點應(yīng)用,一些偽智能的技術(shù)則被快速淘汰,同時學(xué)術(shù)界和工業(yè)界也在創(chuàng)新地研究新的技術(shù)點并尋求突破。
2018 年是計算機視覺產(chǎn)業(yè)新一輪發(fā)展的起步年,市場才剛剛啟動,經(jīng)歷過去兩年市場和用戶認(rèn)知的培養(yǎng),當(dāng)前業(yè)務(wù)應(yīng)用開始逐步從試用走向使用,在這個過程中技術(shù)也得到持續(xù)發(fā)展,解決了試用過程中碰到的種種問題。
隨著市場需求的打開,在芯片、算法、應(yīng)用各個層面有了更多的企業(yè)參與。從個別的算力平臺到多元化計算芯片的格局,從早期少數(shù)算法公司技術(shù)創(chuàng)新到當(dāng)前眾多成熟公司共同參與,從算法單點爆發(fā)吸引眼球到現(xiàn)在人工智能推動產(chǎn)業(yè)升級與應(yīng)用融合,目前市場格局已經(jīng)發(fā)生重大的轉(zhuǎn)變,走向了從技術(shù)驅(qū)動型轉(zhuǎn)換到應(yīng)用驅(qū)動型的發(fā)展。
計算機視覺的市場規(guī)模非常巨大,這是一種推動各個產(chǎn)業(yè)升級的力量,我們無法單純衡量它的市場價值。可以預(yù)見,占據(jù)應(yīng)用市場以及技術(shù)領(lǐng)先型的公司將在未來人工智能浪潮中獲取核心價值,并引領(lǐng)行業(yè)的發(fā)展。
▌未來 2-3 年發(fā)展趨勢
展望未來 2-3 年,計算機視覺領(lǐng)域在技術(shù)、應(yīng)用、產(chǎn)業(yè)各個層面必然會有新的突破。在算法方面,深度學(xué)習(xí)技術(shù)會繼續(xù)發(fā)展,但可能會有新的技術(shù)方法誕生引發(fā)新的變革。芯片方面,市場上會有更多高性能低功耗的神經(jīng)網(wǎng)絡(luò) SoC 芯片發(fā)布,同時部分固化的視覺算法會內(nèi)嵌集成到芯片里。
應(yīng)用方面未來應(yīng)該會持續(xù)蓬勃發(fā)展,這對于企業(yè)和用戶而言都是非常巨大的市場和想象空間:
首先在現(xiàn)有的基礎(chǔ)上,會更貼近用戶的實際使用需求,算法的迭代升級也會快速提升用戶體驗;
其次新算法的推出也會帶來更多的應(yīng)用場景和業(yè)務(wù)需求;
最后,應(yīng)用的拓展將推動產(chǎn)業(yè)的發(fā)展,隨著新一代產(chǎn)品和解決方案的發(fā)布和普及,更多融合型、跨界型的業(yè)務(wù)模式會產(chǎn)生。
當(dāng)下人工智能、物聯(lián)網(wǎng)、云與大數(shù)據(jù)、5G、云計算等主導(dǎo)未來的核心技術(shù)正在加速發(fā)展與演進,計算機視覺行業(yè)生態(tài)在這些技術(shù)力量的驅(qū)動下,必將形成新的技術(shù)和市場格局。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4779瀏覽量
101032 -
人工智能
+關(guān)注
關(guān)注
1794文章
47622瀏覽量
239593 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46074
原文標(biāo)題:從試用到使用:計算機視覺產(chǎn)業(yè)新一輪發(fā)展的起步年
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論