在AI大行其道的當(dāng)下,算法、算力與數(shù)據(jù)這驅(qū)動(dòng)AI崛起的三大因素,誰(shuí)將成為檢驗(yàn)其能否產(chǎn)業(yè)化的試金石?答案必然是數(shù)據(jù)。
眾所周知,深度學(xué)習(xí)作為當(dāng)前AI技術(shù)的研究前沿,其成功與否背后直接與產(chǎn)品落地直接掛鉤。從學(xué)術(shù)角度來(lái)講,深度學(xué)習(xí)的原理是將標(biāo)注的數(shù)據(jù)特征反向輸送給機(jī)器,以實(shí)現(xiàn)機(jī)器智能這一目標(biāo)。然巧婦難為無(wú)米之炊,沒(méi)有AI數(shù)據(jù)便無(wú)法應(yīng)用更復(fù)雜的模型,亦無(wú)法得出效果更優(yōu)的算法。
尤其隨著AI技術(shù)在行業(yè)內(nèi)的落地應(yīng)用,原有通用AI數(shù)據(jù)集很難對(duì)算法準(zhǔn)確率與魯棒性能力實(shí)現(xiàn)進(jìn)步一提升,因此破局之道全部寄希望在了場(chǎng)景化的高質(zhì)量AI數(shù)據(jù)之上。
數(shù)據(jù)難求?高質(zhì)量AI數(shù)據(jù)更可遇不可求
回歸本質(zhì)來(lái)看,以近年來(lái)炒得最熱的CV+AI為例,其不僅可實(shí)現(xiàn)人臉識(shí)別,也可應(yīng)用于養(yǎng)殖領(lǐng)域。而這套模式之所以能在其他領(lǐng)域跑通,原理在于技術(shù)本身是有共性的,差異取決于所訓(xùn)練的AI數(shù)據(jù)樣本。
在這其中算法僅是一小部分,核心依舊離不開(kāi)AI數(shù)據(jù)。誰(shuí)能夠擁有高質(zhì)量的還原落地場(chǎng)景的AI數(shù)據(jù),誰(shuí)便能快人一步實(shí)現(xiàn)產(chǎn)業(yè)化落地。
因此對(duì)于人工智能企業(yè)來(lái)說(shuō),優(yōu)質(zhì)AI數(shù)據(jù)的必要性毋庸置疑。企業(yè)深知AI數(shù)據(jù)的真正價(jià)值已不在數(shù)據(jù)本身之上,而在于背后所反映出的真實(shí)性與科學(xué)性。但數(shù)據(jù)難求,高質(zhì)量的AI數(shù)據(jù)更是可遇而不可求,也正是基于這樣一個(gè)背景,數(shù)據(jù)標(biāo)注行業(yè)開(kāi)始出現(xiàn)在視野中。
然目前來(lái)看,早期的數(shù)據(jù)標(biāo)注發(fā)展仿佛讓人們看到了十年前IT外包行業(yè)的縮影。層層眾包與轉(zhuǎn)包的服務(wù)模式,致使數(shù)據(jù)交付精度層次不齊、數(shù)據(jù)隱私無(wú)法保障等現(xiàn)象頻發(fā),直接拉低了AI數(shù)據(jù)行業(yè)整體服務(wù)質(zhì)量。
此外,過(guò)于依賴人力的標(biāo)注方式,也讓各個(gè)環(huán)節(jié)暴露了大量弊端。如在語(yǔ)音轉(zhuǎn)寫(xiě)類標(biāo)注時(shí),人類標(biāo)注員很難在長(zhǎng)時(shí)間下保持時(shí)刻專注。再比如機(jī)器視覺(jué)類項(xiàng)目中,一套項(xiàng)目至少涉及數(shù)以萬(wàn)計(jì)的圖片標(biāo)注工作,常會(huì)引發(fā)標(biāo)注任務(wù)不夠細(xì)化、缺乏定制化標(biāo)注能力等問(wèn)題。而此時(shí)若投入大量人力,則又會(huì)產(chǎn)生極大成本負(fù)荷,外加中間商等各項(xiàng)因素的影響,久而久之讓行業(yè)進(jìn)入了一個(gè)惡性循環(huán)當(dāng)中。
云測(cè)數(shù)據(jù)服務(wù)成果發(fā)布?引領(lǐng)數(shù)據(jù)標(biāo)注跨入高質(zhì)量時(shí)代
反觀整個(gè)數(shù)據(jù)標(biāo)注市場(chǎng),雖有公開(kāi)數(shù)據(jù)集、標(biāo)注工具、以及半監(jiān)督學(xué)習(xí)一類技術(shù)的存在,但對(duì)于現(xiàn)階段AI產(chǎn)品面臨落地的產(chǎn)業(yè)環(huán)境,沒(méi)有高質(zhì)量還原場(chǎng)景的AI數(shù)據(jù)的支撐,想要產(chǎn)業(yè)落地?zé)o疑是空中樓閣。
正如行業(yè)流行的那句話所言——“前面有多少智能?后面就有多少人工”。因此如何將人類經(jīng)驗(yàn)與學(xué)習(xí)規(guī)則充分結(jié)合以獲取符合算法需求的高質(zhì)量標(biāo)注數(shù)據(jù),如何制定標(biāo)準(zhǔn)審核流程和控制標(biāo)注質(zhì)檢成本等問(wèn)題,既是擋在AI產(chǎn)業(yè)化前方的攔路虎,也是擺在高質(zhì)量AI數(shù)據(jù)獲取面前的難題。
為解決行業(yè)存在的現(xiàn)實(shí)問(wèn)題,助力企業(yè)占領(lǐng)未來(lái)發(fā)展高地。在9月6日的北京服貿(mào)會(huì)上,Testin云測(cè)旗下AI數(shù)據(jù)服務(wù)品牌——云測(cè)數(shù)據(jù)的服務(wù)成果正式發(fā)布,并向外界展示了最高交付精準(zhǔn)度達(dá)99.99%這一傲人成果。
區(qū)別于傳統(tǒng)模式,云測(cè)數(shù)據(jù)以自建形式搭建了數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室與數(shù)據(jù)標(biāo)注基地來(lái)對(duì)相應(yīng)AI數(shù)據(jù)進(jìn)行生產(chǎn)。以標(biāo)準(zhǔn)化服務(wù)為抓手,在前期幫助客戶梳理更貼合實(shí)際情況的需求,試標(biāo)驗(yàn)收合格后開(kāi)始大規(guī)模作業(yè)。作業(yè)提交后,還有三層質(zhì)檢環(huán)節(jié)和抽檢環(huán)節(jié)來(lái)確保AI數(shù)據(jù)的高質(zhì)量輸出,并有項(xiàng)目經(jīng)理全程跟蹤數(shù)據(jù)交付的流程。通過(guò)這種服務(wù)模式來(lái)解決AI數(shù)據(jù)質(zhì)量參差不齊這一詬病。
再者,過(guò)往數(shù)據(jù)標(biāo)注人員常以單臺(tái)電腦部署軟件形式為主,這種工作模式基本毫無(wú)協(xié)同性可言,極大程度拖慢了人員效率與項(xiàng)目周期。而云測(cè)數(shù)據(jù)在AI數(shù)據(jù)生產(chǎn)中,設(shè)計(jì)了從創(chuàng)建任務(wù)、分配任務(wù)、標(biāo)注流轉(zhuǎn)、到質(zhì)檢/抽檢環(huán)節(jié)和最后的驗(yàn)收等更完善的管理流程,每個(gè)環(huán)節(jié)有相應(yīng)專業(yè)人員來(lái)把控?cái)?shù)據(jù)標(biāo)注的質(zhì)量和時(shí)間節(jié)點(diǎn),進(jìn)行好上下游工作環(huán)節(jié)銜接,得以在保證質(zhì)量的前提現(xiàn)下將效率最大化。
另一方面,與多數(shù)開(kāi)源與在線標(biāo)注工具相比,后者存在著極高的部署門(mén)檻與學(xué)習(xí)成本,如不同版本間的不同編譯與配置部署、標(biāo)簽設(shè)置繁瑣、數(shù)據(jù)導(dǎo)出限制過(guò)多等問(wèn)題。這對(duì)于技術(shù)驅(qū)動(dòng)型的AI企業(yè)而言,將成為業(yè)務(wù)最致命的死穴。
而云測(cè)數(shù)據(jù)這套模式,全方位支持企業(yè)在文本、語(yǔ)音、圖像、視頻等各類AI數(shù)據(jù)處理需求,且已完成對(duì)智慧城市、智能家居、智能駕駛、智慧金融等不同行業(yè)的覆蓋。這種服務(wù)體驗(yàn),將企業(yè)精力重新聚焦在業(yè)務(wù)自身之上,從長(zhǎng)遠(yuǎn)來(lái)看也更符合當(dāng)前降本增效的業(yè)務(wù)需求。
Testin云測(cè)總裁徐琨在采訪中指出:“為客戶降本增效,不斷為客戶創(chuàng)造價(jià)值,幫助客戶在這個(gè)充滿不確定性的時(shí)代,或保持優(yōu)勢(shì),或突圍而出,依然是我們的初衷。”
此外,考慮到不同業(yè)務(wù)類型不同敏感級(jí)別的數(shù)據(jù)隱私需求,云測(cè)數(shù)據(jù)亦設(shè)置了一系列嚴(yán)格措施。其中一條核心原則就是數(shù)據(jù)絕不復(fù)用,當(dāng)AI數(shù)據(jù)合格交付后絕不留底。其二便是所有與云測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)采集的用戶都會(huì)簽訂數(shù)據(jù)授權(quán)協(xié)議,從來(lái)源上確保企業(yè)用于訓(xùn)練的AI數(shù)據(jù)合法合規(guī)。并通過(guò)內(nèi)部設(shè)定的數(shù)據(jù)隔離、質(zhì)量保障等一系列數(shù)據(jù)安全流程和技術(shù),從多個(gè)維度破解潛在的數(shù)據(jù)泄露風(fēng)險(xiǎn)。
高質(zhì)量數(shù)據(jù)攻破AI行業(yè)天花板
復(fù)盤(pán)近年來(lái)AI發(fā)展,這個(gè)時(shí)代標(biāo)志性技術(shù),已然從學(xué)術(shù)界逐步走進(jìn)了產(chǎn)業(yè)界中。雖然其催生出的大量新業(yè)態(tài)被看好,但真正能夠支撐落地的應(yīng)用仍屬鳳毛麟角。
如近幾年炒的異常火熱的無(wú)人駕駛,之所以很難脫離測(cè)試道路,原因便在于機(jī)器對(duì)復(fù)雜道路的理解不盡人意,而究其根源依舊是高質(zhì)量AI數(shù)據(jù)的稀缺。再如近期發(fā)表在《歐洲心臟雜志》上的一項(xiàng)AI看診新技術(shù),之所以對(duì)其的描述仍為‘深度學(xué)習(xí)工具邁出的新一步’,問(wèn)題本質(zhì)仍出在精確度遠(yuǎn)未達(dá)到推廣到臨床環(huán)境中所需水平方面。
不可置否,高質(zhì)量AI數(shù)據(jù)已是AI能否實(shí)現(xiàn)產(chǎn)業(yè)化的關(guān)鍵。尤其在當(dāng)前5G商用落地加速以及“新基建”的雙重帶動(dòng)下,產(chǎn)業(yè)與經(jīng)濟(jì)結(jié)構(gòu)的調(diào)整升級(jí)、新舊動(dòng)能穩(wěn)步轉(zhuǎn)換推進(jìn)已是大勢(shì)所趨。因此,云測(cè)數(shù)據(jù)最高交付精準(zhǔn)度達(dá)99.99%的這一成果,必將成為AI產(chǎn)業(yè)打破自身天花板的一個(gè)全新變量。
正如Testin云測(cè)總裁徐琨所說(shuō):“效率的提升最終都是通過(guò)技術(shù)來(lái)實(shí)現(xiàn)的,新技術(shù)孕育著新機(jī)會(huì)。人工智能是劃時(shí)代的技術(shù),我相信,在不久的未來(lái),人工智能將成為像互聯(lián)網(wǎng)一樣的通用型技術(shù),云測(cè)數(shù)據(jù)作為人工智能技術(shù)的AI數(shù)據(jù)服務(wù)提供商,將成為AI創(chuàng)新的土壤和支撐。”
責(zé)任編輯:pj
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7085瀏覽量
89204 -
AI
+關(guān)注
關(guān)注
87文章
31155瀏覽量
269482 -
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
238994
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論