人工智能技術(shù)已經(jīng)從理論走向市場(chǎng),滲透到千千萬萬的行業(yè)之中。作為人工智能基石的數(shù)據(jù),發(fā)揮出越來越重要的作用,影響著人工智能場(chǎng)景應(yīng)用的最終效果。現(xiàn)階段,在各個(gè)細(xì)分應(yīng)用場(chǎng)景的需求下,人工智能對(duì)數(shù)據(jù)的還原度、準(zhǔn)確度提出了更高要求。那么,怎樣的“數(shù)據(jù)”才最符合人工智能越來越精細(xì)化的場(chǎng)景落地需求?
細(xì)分場(chǎng)景數(shù)據(jù)的缺失
舉個(gè)例子,根據(jù)佐治亞理工學(xué)院的一項(xiàng)研究——通過對(duì)8個(gè)圖像識(shí)別系統(tǒng)的測(cè)試,發(fā)現(xiàn)自動(dòng)駕駛汽車的傳感器和攝像頭,更善于檢測(cè)膚色較淺的人,而膚色較深被檢測(cè)出的準(zhǔn)確率平均會(huì)低5%。
結(jié)論一經(jīng)報(bào)道,諸如「AI行業(yè)也存在種族歧視」的言論便充斥在各大媒體上。
然而,從技術(shù)角度來看,計(jì)算機(jī)視覺是通過RGB或RGBD識(shí)別人(物體)的信息,黑色或深色的RGB整體數(shù)值偏小,是最難被識(shí)別的。在實(shí)際情況中,算法在訓(xùn)練時(shí)由于欠缺黑色及深色的細(xì)分場(chǎng)景數(shù)據(jù),由此導(dǎo)致算法模型不夠精確,最終技術(shù)在實(shí)際落地應(yīng)用時(shí)出現(xiàn)差錯(cuò)。
其實(shí),不僅是圖像識(shí)別,各個(gè)行業(yè)領(lǐng)域?qū)?chǎng)景化數(shù)據(jù)的需求也十分迫切。AI在各種各樣垂直領(lǐng)域進(jìn)行落地,比如說教育、法律、智能駕駛、銀行金融等,每個(gè)領(lǐng)域都有細(xì)分專業(yè)化的要求。比如道路安防攝像頭,攝像頭中囊括行人、機(jī)動(dòng)車、自行車數(shù)據(jù),卻唯獨(dú)缺少行人跌倒數(shù)據(jù);在自動(dòng)駕駛領(lǐng)域,監(jiān)測(cè)系統(tǒng)需要采集駕駛員各種狀態(tài)數(shù)據(jù),但缺少疲勞狀態(tài)的數(shù)據(jù)。
云測(cè)數(shù)據(jù)的場(chǎng)景化數(shù)據(jù)采集實(shí)踐
這些數(shù)據(jù)采集需求相對(duì)復(fù)雜、聚焦,難度較大,對(duì)AI數(shù)據(jù)服務(wù)商的場(chǎng)景化采集能力提出了很高的要求。隨著人工智能對(duì)長尾場(chǎng)景的數(shù)據(jù)需求進(jìn)一步擴(kuò)大,未來,場(chǎng)景數(shù)據(jù)將擁有更廣闊的增量空間,具有相關(guān)采集工具、資源、能力的數(shù)據(jù)采集標(biāo)注服務(wù)商將擁有極大的競(jìng)爭(zhēng)優(yōu)勢(shì)。以數(shù)據(jù)采集標(biāo)注頭部企業(yè)——云測(cè)數(shù)據(jù)為例,為進(jìn)一步滿足場(chǎng)景化數(shù)據(jù)的需求,首創(chuàng)了“數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室”進(jìn)行相應(yīng)的場(chǎng)景化數(shù)據(jù)生產(chǎn)。
以多角度多姿態(tài)的動(dòng)作采集為例,云測(cè)數(shù)據(jù)總經(jīng)理賈宇航表示,云測(cè)數(shù)據(jù)專門在橫店建了一個(gè)數(shù)據(jù)采集基地,根據(jù)項(xiàng)目需求,進(jìn)行特定動(dòng)作和表情的捕捉。據(jù)了解,云測(cè)數(shù)據(jù)也是現(xiàn)在市面上唯一采用群演來做人工智能數(shù)據(jù)采集的數(shù)據(jù)服務(wù)商。目前,云測(cè)數(shù)據(jù)深度合作伙伴覆蓋了汽車、手機(jī)、工業(yè)、家居、金融、安防、教育、新零售、地產(chǎn)、生態(tài)系統(tǒng)等行業(yè)。其中包含眾多世界500強(qiáng)企業(yè)、高校科研機(jī)構(gòu)、政府機(jī)構(gòu),頭部AI企業(yè)和大型互聯(lián)網(wǎng)企業(yè)覆蓋率超90% ,涵蓋了計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理、知識(shí)圖譜等AI主流技術(shù)領(lǐng)域。
正如賈宇航所言,云測(cè)數(shù)據(jù)的采標(biāo)業(yè)務(wù)正是整個(gè)人工智能產(chǎn)業(yè)所迫切需要的,橫店群演的采集只是場(chǎng)景化數(shù)據(jù)的一個(gè)縮影。根據(jù)企業(yè)數(shù)據(jù)需求,還原AI應(yīng)用真實(shí)場(chǎng)景,這不僅需要深入理解需求,還需要快速構(gòu)建場(chǎng)景。這背后,需要云測(cè)數(shù)據(jù)根據(jù)項(xiàng)目經(jīng)驗(yàn)及實(shí)地調(diào)查來明確需求,此后再細(xì)化、優(yōu)化需求,運(yùn)用專業(yè)的軟/硬件設(shè)備,以達(dá)到覆蓋盡可能多的實(shí)際場(chǎng)景及邊際場(chǎng)景的目的,保證采集數(shù)據(jù)契合算法模型,為人工智能提供高精度的采集數(shù)據(jù),保證算法訓(xùn)練所需數(shù)據(jù)的純凈。
精耕細(xì)作是行業(yè)趨勢(shì)
當(dāng)然,這些不僅是有趣或者單一客戶需求所驅(qū)動(dòng)的成果,而是整個(gè)AI數(shù)據(jù)服務(wù)行業(yè)從粗放的勞動(dòng)密集型時(shí)代走向精耕細(xì)作所必須的過程。
從細(xì)分結(jié)構(gòu)來看,隨著人工智能技術(shù)的不斷成熟,更多的場(chǎng)景和行業(yè)開始嵌入使用人工智能技術(shù),AI行業(yè)應(yīng)用場(chǎng)景逐漸趨于長尾和碎片化,產(chǎn)生了大量新興垂直領(lǐng)域的數(shù)據(jù)需求,如疫情期間的口罩識(shí)別應(yīng)用等;同時(shí),從AI應(yīng)用迭代、用戶體驗(yàn)完善的角度來看,AI應(yīng)用需要更加貼合具體使用場(chǎng)景的數(shù)據(jù)進(jìn)行迭代更新。
《2020年中國AI數(shù)據(jù)服務(wù)行業(yè)研究報(bào)告》中指出,隨著互聯(lián)網(wǎng)技術(shù)發(fā)展,市場(chǎng)AI需求愈發(fā)明顯,同時(shí)在經(jīng)濟(jì)、政策不斷利好下,AI數(shù)據(jù)服務(wù)行業(yè)市場(chǎng)前景廣闊。優(yōu)秀的AI數(shù)據(jù)服務(wù)商作為人工智能產(chǎn)業(yè)上游的關(guān)鍵,必須至少具備三種能力:對(duì)場(chǎng)景數(shù)據(jù)深度還原的采集能力、高精確度的標(biāo)注能力、領(lǐng)先的標(biāo)注平臺(tái)技術(shù)能力。
場(chǎng)景數(shù)據(jù)深度還原的采集能力決定著最終AI產(chǎn)品是否貼合使用場(chǎng)景乃至產(chǎn)品生命周期,高精確度的標(biāo)注能力影響著最終AI應(yīng)用的用戶體驗(yàn),標(biāo)注平臺(tái)技術(shù)能力則影響著數(shù)據(jù)生產(chǎn)的效率、質(zhì)檢等方方面面。在這幾點(diǎn)上,云測(cè)數(shù)據(jù)已經(jīng)準(zhǔn)備好,運(yùn)用更專業(yè)、更高質(zhì)、更大的實(shí)力規(guī)模,幫助現(xiàn)代企業(yè)從AI數(shù)據(jù)開始,一起開啟人工智能化的浪潮。
責(zé)任編輯:YYX
-
AI
+關(guān)注
關(guān)注
87文章
31155瀏覽量
269489 -
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
239006
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論