在AI產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素。在當(dāng)前人工智能行業(yè)發(fā)展進(jìn)程中,有監(jiān)督的深度學(xué)習(xí)算法,是推動(dòng)人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的支撐則是有監(jiān)督的深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ),訓(xùn)練數(shù)據(jù)早已成為算法模型發(fā)展和演進(jìn)的燃料。
AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)快速增長(zhǎng)
當(dāng)前,全球基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)正處于快速成長(zhǎng)期,市場(chǎng)規(guī)模具有較大的增長(zhǎng)空間。從AI產(chǎn)業(yè)鏈的發(fā)展情況和未來(lái)發(fā)展趨勢(shì)來(lái)看,中國(guó)基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的市場(chǎng)規(guī)模也將不斷擴(kuò)大。
一方面,隨著算法模型、技術(shù)理論和應(yīng)用場(chǎng)景的優(yōu)化和創(chuàng)新,AI產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)的拓展性需求和前瞻性需求均快速增長(zhǎng);另一方面,隨著行業(yè)內(nèi)對(duì)訓(xùn)練數(shù)據(jù)需求類型的增加以及對(duì)服務(wù)標(biāo)準(zhǔn)要求的提高,產(chǎn)業(yè)鏈的專業(yè)化分工將愈加清晰,專業(yè)化的訓(xùn)練數(shù)據(jù)服務(wù)提供商將扮演更加重要的角色。
根據(jù)IDC預(yù)測(cè),2025年中國(guó)人工智能市場(chǎng)規(guī)模有望達(dá)到184.3億美元(約1200億人民幣)。其中,關(guān)于基礎(chǔ)數(shù)據(jù)部分,預(yù)計(jì)中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模近5年來(lái)的復(fù)合年增長(zhǎng)率達(dá)到47%,預(yù)期2025年將突破120億元,達(dá)到中國(guó)人工智能市場(chǎng)支出總額的約10%。
在當(dāng)前技術(shù)發(fā)展進(jìn)程中,深度學(xué)習(xí)算法是推動(dòng)人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的訓(xùn)練支撐則是深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ)。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。因此,要使算法模型實(shí)現(xiàn)從技術(shù)理論到應(yīng)用實(shí)踐的落地過(guò)程,就需要提供大量的訓(xùn)練數(shù)據(jù),對(duì)算法模型加以訓(xùn)練。
2021年,全球人工智能和機(jī)器學(xué)習(xí)領(lǐng)域最權(quán)威的學(xué)者之一吳恩達(dá)教授提出二八定律:AI研究80%的工作應(yīng)該放在數(shù)據(jù)準(zhǔn)備上,確保數(shù)據(jù)質(zhì)量是最重要的工作。
然而,從自然數(shù)據(jù)源簡(jiǎn)單收集取得的原料數(shù)據(jù)并不能直接用于有監(jiān)督的深度學(xué)習(xí)算法訓(xùn)練, 必須經(jīng)過(guò)專業(yè)化的采集、加工,形成相應(yīng)的工程化訓(xùn)練數(shù)據(jù)集后才能供深度學(xué)習(xí)算法等訓(xùn)練使用。目前,應(yīng)用有監(jiān)督學(xué)習(xí)的算法對(duì)于訓(xùn)練數(shù)據(jù)的需求遠(yuǎn)大于現(xiàn)有的標(biāo)注效率和投入預(yù)算,基礎(chǔ)數(shù)據(jù)服務(wù)將持續(xù)釋放其對(duì)于算法模型的基礎(chǔ)支撐價(jià)值。
海天瑞聲為全球科技企業(yè)提供數(shù)據(jù)服務(wù)
海天瑞聲主要從事AI訓(xùn)練數(shù)據(jù)的研發(fā)設(shè)計(jì)、生產(chǎn)及銷售業(yè)務(wù)。公司通過(guò)設(shè)計(jì)數(shù)據(jù)集結(jié)構(gòu)、組織數(shù)據(jù)采集、對(duì)取得的原料數(shù)據(jù)進(jìn)行加工,最終形成可供AI算法模型訓(xùn)練使用的專業(yè)數(shù)據(jù)集,通過(guò)軟件形式向客戶交付。
自2005年成立以來(lái),該公司始終致力于為AI產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開(kāi)發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。經(jīng)過(guò)多年發(fā)展,公司已成為人工智能基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域具有較強(qiáng)國(guó)際競(jìng)爭(zhēng)力的國(guó)內(nèi)頭部企業(yè),并實(shí)現(xiàn)了標(biāo)準(zhǔn)化產(chǎn)品、定制化服務(wù)、相關(guān)應(yīng)用服務(wù)全覆蓋。
海天瑞聲所提供的訓(xùn)練數(shù)據(jù)涵蓋智能語(yǔ)音(語(yǔ)音識(shí)別、語(yǔ)音合成等)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言等多個(gè)核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能家居、智能駕駛、智慧金融、智能安防等多種創(chuàng)新應(yīng)用場(chǎng)景。
其產(chǎn)品和服務(wù)已獲得字節(jié)跳動(dòng)、阿里巴巴、騰訊、百度、科大訊飛、海康威視、微軟、 亞馬遜、三星、中國(guó)科學(xué)院、清華大學(xué)等國(guó)內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個(gè)人助手、智能音箱、語(yǔ)音導(dǎo)航、搜索服務(wù)、短視頻、虛擬人、智能駕駛、機(jī)器翻譯等多種產(chǎn)品相關(guān)的算法模型訓(xùn)練過(guò)程中。
目前公司客戶累計(jì)數(shù)量 740 家,覆蓋了科技互聯(lián)網(wǎng)、社交、IoT、智能駕駛、智慧金融等領(lǐng)域的主流企業(yè),教育科研機(jī)構(gòu)以及部分政企機(jī)構(gòu)。
最近由OpenAI推出的ChatGPT大火,微軟也宣布將ChatGPT功能集成到公司的產(chǎn)品中,包括必應(yīng)。海天瑞聲日前表示,微軟是公司的重要客戶之一,公司向微軟提供智能語(yǔ)音-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、自然語(yǔ)言-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、計(jì)算機(jī)視覺(jué)-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、訓(xùn)練數(shù)據(jù)相關(guān)的應(yīng)用服務(wù)。
可以看到海天瑞聲的業(yè)務(wù)已經(jīng)遍布國(guó)內(nèi)外,除了國(guó)內(nèi)字節(jié)跳動(dòng)、阿里巴巴、騰訊、百度等之外,海天瑞聲也與多家海外知名科技企業(yè)合作,包括Microsoft、Meta、Samsung、Google等。
海天瑞聲表示,相比于境內(nèi),海外市場(chǎng)空間更加廣闊。根據(jù)IDC數(shù)據(jù),全球AI投入約為中國(guó)AI投入的10倍以上,廣闊的市場(chǎng)空間意味著更多的市場(chǎng)參與者與更加激烈的競(jìng)爭(zhēng)環(huán)境,過(guò)往多年公司憑借在語(yǔ)音方面的深厚積累,尤其是多語(yǔ)種方面的積累和能力,獲得眾多境外客戶認(rèn)可,公司的多語(yǔ)種、以及OCR數(shù)據(jù)集幫助眾多海外公司進(jìn)行其全球化擴(kuò)張。
截至目前,公司已覆蓋超過(guò)190種語(yǔ)種/方言,不僅包括含英、法、德、意、西、日、韓等常見(jiàn)語(yǔ)種,還包括東南亞、一帶一路等國(guó)家地區(qū)的罕見(jiàn)多語(yǔ)種,尤其在亞洲多語(yǔ)種的服務(wù)上具備獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
小結(jié)
隨著ChatGPT大火,預(yù)計(jì)大模型的訓(xùn)練和部署將會(huì)加速,而數(shù)據(jù)作為AI產(chǎn)業(yè)鏈中的一環(huán),重要作用不可忽視。在這個(gè)領(lǐng)域,國(guó)內(nèi)已經(jīng)有一批早早入局的企業(yè),在技術(shù)上已經(jīng)具備深厚積累,這對(duì)于國(guó)內(nèi)在發(fā)展大模型技術(shù)方面來(lái)說(shuō),無(wú)疑是很好的基礎(chǔ)。
審核編輯 :李倩
-
算法
+關(guān)注
關(guān)注
23文章
4622瀏覽量
93056 -
AI
+關(guān)注
關(guān)注
87文章
31133瀏覽量
269456 -
人工智能
+關(guān)注
關(guān)注
1792文章
47425瀏覽量
238957
原文標(biāo)題:算法模型發(fā)展的燃料,AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模快速增長(zhǎng)!
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論