數(shù)據(jù)的作用在人工智能發(fā)展道路上愈發(fā)被重視。7月27日,在廣州舉行的GMIC大會(huì)上,網(wǎng)易有道技術(shù)總監(jiān)林會(huì)杰表示目前AI+教育還在初級(jí)階段,對(duì)于這一行業(yè)而言,得數(shù)據(jù)者得先機(jī)。這家擁有國(guó)內(nèi)最大用戶量(全平臺(tái)8億用戶)的互聯(lián)網(wǎng)教育公司也首次對(duì)外集體亮相AI能力,神經(jīng)網(wǎng)絡(luò)翻譯、圖像識(shí)別、語音交互技術(shù)和自適應(yīng)學(xué)習(xí)四項(xiàng)AI能力聯(lián)合為教育加碼。
幾乎所有企業(yè)都想搭上AI這趟車。
這的確是大勢(shì)所趨,但比起匆忙加入浪潮,先看看手里有著怎樣的牌,才能在這戰(zhàn)場(chǎng)上打得更漂亮。
傳統(tǒng)企業(yè)轉(zhuǎn)型AI,占據(jù)垂直化場(chǎng)景優(yōu)勢(shì);有數(shù)據(jù)的公司拿起AI武器,“殺傷力”驚人;擁有大量用戶基礎(chǔ)、以用戶為導(dǎo)向的企業(yè),更易開發(fā)出To C端產(chǎn)品。
最重要的是有技術(shù)加持,這就是時(shí)候向AI發(fā)力了。
7月27日,在廣州GMIC(全球移動(dòng)互聯(lián)網(wǎng)大會(huì))上,網(wǎng)易有道技術(shù)總監(jiān)林會(huì)杰在題為《AI+教育的進(jìn)化之路》演講中表示:
目前AI+教育還在非常初級(jí)的階段,得數(shù)據(jù)者得先機(jī),如何更好地采集數(shù)據(jù)、處理數(shù)據(jù)、從數(shù)據(jù)中學(xué)習(xí)更好地規(guī)律,是當(dāng)前整個(gè)AI+教育行業(yè)的重點(diǎn)。
網(wǎng)易有道技術(shù)總監(jiān)林會(huì)杰
這也是網(wǎng)易有道首次對(duì)外集體亮相AI能力,翻譯、圖像識(shí)別、語音和自適應(yīng)教育四項(xiàng)AI能力聯(lián)合為教育加碼:
神經(jīng)網(wǎng)絡(luò)翻譯(NMT):在學(xué)習(xí)和新聞測(cè)試集中,有道NMT的中英互譯準(zhǔn)確度均優(yōu)于同行,最好成績(jī)領(lǐng)先7個(gè)百分點(diǎn)。
圖像識(shí)別(OCR):擁有國(guó)內(nèi)可識(shí)別語言最多的OCR識(shí)別引擎,且能應(yīng)對(duì)多種高難度場(chǎng)景,平均準(zhǔn)確率可達(dá)95%;
語音識(shí)別與合成:有道語音識(shí)別技術(shù)在一些場(chǎng)景上識(shí)別準(zhǔn)確率超過98%,支持中、英、日、韓多個(gè)語言;有道語音合成引擎音色逼近真人,支持中、英、日、韓、葡等多個(gè)語言;
自適應(yīng)學(xué)習(xí):配合自研的智能學(xué)習(xí)硬件,實(shí)現(xiàn)實(shí)時(shí)采集書寫數(shù)據(jù),并且提供如學(xué)情分析、知識(shí)圖譜評(píng)估、智能推題等一系列自適應(yīng)學(xué)習(xí)輔助。
一直深耕技術(shù)的網(wǎng)易有道在AI方面的成績(jī)單逐漸浮出水面,數(shù)據(jù)和技術(shù)加速轉(zhuǎn)換成勢(shì)能。
積累全平臺(tái)8億用戶發(fā)力“AI+教育”,得數(shù)據(jù)者得先機(jī)
在人工智能產(chǎn)業(yè)落地的浪潮中,“AI+教育”更是處于風(fēng)口。中國(guó)K12教育市場(chǎng)規(guī)模前景明朗,市場(chǎng)空間大。
成熟的AI+教育產(chǎn)品難以落地,根本原因是缺乏足量學(xué)習(xí)場(chǎng)景下的一手真實(shí)數(shù)據(jù)。
處處都是機(jī)遇,也處處都是挑戰(zhàn)。如同艾瑞咨詢?cè)趫?bào)告中指出,“AI+教育”領(lǐng)域邊際明顯,初期投入巨大,但越往后數(shù)據(jù)的反哺能力越強(qiáng)。
例如,在AI自適應(yīng)學(xué)習(xí)產(chǎn)品中,由數(shù)據(jù)來訓(xùn)練算法,輸出更接近真實(shí)情況的學(xué)習(xí)模型,學(xué)習(xí)系統(tǒng)進(jìn)而得到增強(qiáng),從而吸引更多學(xué)生使用,更多數(shù)據(jù)也會(huì)隨之產(chǎn)生,形成良性循環(huán)。
來源:艾瑞咨詢研究院
數(shù)據(jù)對(duì)于AI的作用早已不容小覷。
此前,對(duì)于深度學(xué)習(xí)發(fā)展已到瓶頸的問題,業(yè)內(nèi)也有人提出數(shù)據(jù)處理是一劑良藥。
在深度學(xué)習(xí)上,投入算法不一定能見到成效,但投入數(shù)據(jù)一定能見效,數(shù)據(jù)會(huì)推動(dòng)人工智能的發(fā)展,會(huì)將人工智能帶入一個(gè)新臺(tái)階。
發(fā)展AI技術(shù)前就已積累大量數(shù)據(jù),這對(duì)一個(gè)企業(yè)來講無疑是一大優(yōu)勢(shì)。網(wǎng)易有道技術(shù)總監(jiān)林會(huì)杰在GMIC大會(huì)上表示,對(duì)于AI+教育行業(yè)而言,得數(shù)據(jù)者得先機(jī)。
AI模型的進(jìn)化需要大量數(shù)據(jù)進(jìn)行算法訓(xùn)練,然而線下傳統(tǒng)教育仍是現(xiàn)在的主流,用戶尚未習(xí)慣純線上交互,大量學(xué)習(xí)數(shù)據(jù)都留存在線下難以采集。
以產(chǎn)品作為數(shù)據(jù)接口,是企業(yè)做AI的先天優(yōu)勢(shì)。網(wǎng)易有道本身的背景是一家100%用戶導(dǎo)向的教育科技公司,全平臺(tái)用戶量8億+,能夠獲取更多樣化的第一手?jǐn)?shù)據(jù)。
同時(shí),針對(duì)AI+教育的進(jìn)程是否太慢這一問題,林會(huì)杰提出一個(gè)比喻,AI滲透教育行業(yè)的過程好比“為行駛中車輛換輪胎”,存在數(shù)年的教育行業(yè)有一套成熟的運(yùn)行邏輯,如同一輛行駛中的車輛,現(xiàn)在行業(yè)想要換上AI這一新輪胎“提速”,需要在不影響現(xiàn)有運(yùn)行情況下,讓技術(shù)逐漸滲透,最終完成AI+教育的迭代。
先機(jī)已得,技術(shù)自然要跟上步伐。
NMT準(zhǔn)確度可信賴:中英互譯BLEU值盲測(cè)中,最好成績(jī)領(lǐng)先7個(gè)百分點(diǎn)
先來看看有道“起家”的翻譯技術(shù)。
移動(dòng)互聯(lián)網(wǎng)熱潮來襲,有道團(tuán)隊(duì)“切掉”了連接計(jì)算機(jī)的那條線,上線有道詞典移動(dòng)版,迎來了巨大的用戶紅利,如今在全平臺(tái)擁有8億用戶。
人工智能熱潮又一次來襲,翻譯這一王牌領(lǐng)域成為有道要絕對(duì)堅(jiān)守的陣地。早在2016年,網(wǎng)易有道首席科學(xué)家段亦濤就已經(jīng)帶領(lǐng)團(tuán)隊(duì)攻堅(jiān)神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)(NMT)。
如今,有道神經(jīng)網(wǎng)絡(luò)翻譯已經(jīng)支持12種語言的中文互譯,10種語言的英文互譯。
在準(zhǔn)確度方面,神經(jīng)網(wǎng)絡(luò)的翻譯水平已經(jīng)達(dá)到國(guó)際領(lǐng)先水平。在2017年周楓接受新智元采訪時(shí),在國(guó)際通用的BLEU評(píng)測(cè)中,網(wǎng)易有道針對(duì)翻譯引擎不同的使用場(chǎng)景(學(xué)習(xí)、新聞、口語、用戶日志)采集不同的評(píng)測(cè)數(shù)據(jù),分別作出評(píng)測(cè)。
當(dāng)時(shí)的有道翻譯準(zhǔn)確度在學(xué)習(xí)、新聞、口語和用戶日志中就已高于其他國(guó)家引擎。
BLEU(雙語評(píng)估研究-Bilingual Evaluation Understudy)是一種用于評(píng)估自然語言之間機(jī)器翻譯的文本質(zhì)量的算法,它是與人類質(zhì)量判斷高度相關(guān)的指標(biāo)之一,也是最普遍使用的自動(dòng)指標(biāo)。
BLEU值越高,代表翻譯準(zhǔn)確度越高。
到2019年,在學(xué)習(xí)與新聞?lì)I(lǐng)域,無論是英譯中還是中譯英,有道的盲測(cè)集BLEU值也有了較大提升。據(jù)有道最新盲測(cè)數(shù)據(jù)顯示,在學(xué)習(xí)和新聞測(cè)試集中,有道NMT的中英互譯準(zhǔn)確度均優(yōu)于同行,最好成績(jī)領(lǐng)先7個(gè)百分點(diǎn)。
2019年3月29日評(píng)測(cè)結(jié)果
之所以能有這樣的技術(shù)優(yōu)勢(shì),領(lǐng)域自適應(yīng)模型是網(wǎng)易有道的法寶之一。
用戶的需求是是多元的,有些用戶對(duì)金融信息有需求,有些要查計(jì)算機(jī)術(shù)語,若想要用一個(gè)模型來覆蓋所有用戶需求,必然會(huì)影響翻譯的準(zhǔn)確度。
機(jī)器翻譯中的領(lǐng)域自適應(yīng)模型是指,若想要讓翻譯質(zhì)量更好,需要給它更多垂直領(lǐng)域的數(shù)據(jù),更多的平行語料。有道對(duì)于一些特定領(lǐng)域有單獨(dú)的模型,系統(tǒng)會(huì)判定語料適應(yīng)的領(lǐng)域,分配不同的模型進(jìn)行翻譯。
除基礎(chǔ)翻譯技術(shù)過硬外,有道翻譯用戶不斷增長(zhǎng)的另一因素是注重產(chǎn)品交互的創(chuàng)新與改變,例如在2018年和2019年增添AR實(shí)景翻譯、語音同傳、文檔翻譯和網(wǎng)頁翻譯等多個(gè)場(chǎng)景化很強(qiáng)的功能。
擁有國(guó)內(nèi)可識(shí)別語言最多的OCR識(shí)別引擎,賦能AIoT學(xué)習(xí)硬件
如今,這些新功能背后的技術(shù)已經(jīng)成為幫助有道拓展AI業(yè)務(wù)邊界的兩把利刃。
OCR是網(wǎng)易有道王牌技術(shù)之一,盡管2014年就已上線基于傳統(tǒng)規(guī)則方法的OCR技術(shù),但2017年,有了基于神經(jīng)網(wǎng)絡(luò)技術(shù)的加持,OCR引擎的質(zhì)量明顯邁向了新臺(tái)階。
OCR技術(shù)最直觀的功能表現(xiàn)就是拍照翻譯。截止2019年5月15日,有道OCR識(shí)別技術(shù)已經(jīng)支持26種主流語言文字的支持,是目前國(guó)內(nèi)識(shí)別語言最多的OCR識(shí)別引擎。
同時(shí),網(wǎng)易有道的OCR技術(shù)是國(guó)際市場(chǎng)首家支持以下功能:
多語種全自動(dòng)判別與混合識(shí)別
支持360度任意角度圖像的文字識(shí)別
支持文字語義方向?yàn)闄M排、豎排或者混合排列的文字識(shí)別
同時(shí),針對(duì)“AI+教育”這一場(chǎng)景,有道OCR團(tuán)隊(duì)進(jìn)行了專項(xiàng)優(yōu)化,研發(fā)出了一系列在國(guó)內(nèi)市場(chǎng)上處于壟斷性的優(yōu)勢(shì)技術(shù),例如:
實(shí)現(xiàn)了公式識(shí)別,支持公式轉(zhuǎn)為L(zhǎng)aTeX功能,準(zhǔn)確率達(dá)到93%。輸入圖示例:
除此之外,有道的OCR技術(shù)也能應(yīng)對(duì)拼音識(shí)別、超模糊手寫體識(shí)別、多角度多語種混合排版識(shí)別等高難度場(chǎng)景,平均準(zhǔn)確率可達(dá)95%。
超模糊手寫體識(shí)別案例
同時(shí),針對(duì)K12用戶(尤其是少兒用戶)高難度手寫場(chǎng)景進(jìn)行優(yōu)化,識(shí)別準(zhǔn)確率高達(dá)85%以上,是業(yè)內(nèi)唯一支持高難度教育場(chǎng)景的手寫OCR服務(wù)。
K12手寫體識(shí)別案例
這些均可離線的AI技術(shù)將這些能力部署在多種移動(dòng)端上,滿足各種AIoT硬件的需求。目前有道的各個(gè)AI技術(shù)均支持離線,OCR識(shí)別的模型離線后加起來只要50M。
有道OCR以主流智能教育硬件為基礎(chǔ),構(gòu)建了完整的教育場(chǎng)景OCR技術(shù)鏈路。
同樣還能實(shí)現(xiàn)離線的另一王牌AI技術(shù)還有智能語音。
2017年,智能語音技術(shù)被有道正式提上日程,投入研發(fā),在語音識(shí)別(ASR)、語音合成(TTS)、語音評(píng)測(cè)、語種識(shí)別、聲學(xué)前端增強(qiáng)等五大方面均有涉及:
2017年6月份啟動(dòng)ASR技術(shù)相關(guān)的研發(fā),目前,支持中、英、日、韓、俄、西班牙等語言的識(shí)別,在一些場(chǎng)景上識(shí)別準(zhǔn)確率超過98%。
于2017年開始語音評(píng)測(cè)技術(shù)的研發(fā),目前在評(píng)分準(zhǔn)確度方面和專家人工打分的相關(guān)性達(dá)到0.8。
從2017年開始自主研發(fā)語音合成系統(tǒng),采用端到端的技術(shù)框架構(gòu)建,達(dá)到和真人相當(dāng)?shù)恼Z音自然度、高并發(fā)、低延時(shí),目前已經(jīng)支持中、英、日、韓、葡等多個(gè)語種。
擴(kuò)展其它相關(guān)語音技術(shù)的研發(fā),例如聲紋識(shí)別、說話人日志、語音前端增強(qiáng)等。
在國(guó)際競(jìng)賽方面,有道語音團(tuán)隊(duì)參加了DIHARD Challenge2019競(jìng)賽,取得兩階段均第三名的成績(jī)。
依托TEACH產(chǎn)品矩陣和業(yè)務(wù)場(chǎng)景的海量資源優(yōu)勢(shì),有道語音技術(shù)團(tuán)隊(duì)在場(chǎng)景化聲學(xué)建模、分領(lǐng)域語言建模、數(shù)據(jù)輔助標(biāo)注等專項(xiàng)技術(shù)方面形成了和語音應(yīng)用系統(tǒng)相互配合、密不可分的技術(shù)矩陣,達(dá)到較好的協(xié)同效應(yīng)。
相關(guān)核心技術(shù)的整體框架結(jié)構(gòu)如下圖所示:
值得一提的是,有道的語音技術(shù)不僅提供云端高精度的解決方案,還提供完善的離線部署和低資源嵌入式集成方案,可以在保證精度的同時(shí)減少對(duì)網(wǎng)絡(luò)的依賴,極大擴(kuò)展了應(yīng)用場(chǎng)景。
紙筆交互:熟悉的自適應(yīng)學(xué)習(xí),新鮮的硬件加持
除此之外,網(wǎng)易有道為旗下產(chǎn)品“有道精品課”自研了一款有道智能筆。
簡(jiǎn)單來講,這支筆除了正常書寫功能外,內(nèi)置了一個(gè)攝像頭和一顆處理芯片,你在進(jìn)行習(xí)題練習(xí)時(shí),內(nèi)置的攝像頭會(huì)自動(dòng)記錄書寫內(nèi)容并同步上傳到精品課APP中。
這其中OCR識(shí)別引擎就發(fā)揮了重要作用,同時(shí)運(yùn)用點(diǎn)陣碼追蹤技術(shù),完整地還原了線下作業(yè)體驗(yàn)并實(shí)現(xiàn)了實(shí)時(shí)上傳。
完成記錄并上傳只是完成了一部分任務(wù),有道還開發(fā)了一套AI智能學(xué)習(xí)系統(tǒng):通過分析智能筆上傳的做題數(shù)據(jù),進(jìn)而提供如學(xué)情分析、知識(shí)圖譜評(píng)估、智能推題等一系列自適應(yīng)學(xué)習(xí)輔助。
這套系統(tǒng)由有道自主開發(fā)的題庫和大數(shù)據(jù)推薦算法組成,目前有道自有題庫容量已有5000萬。
以初中數(shù)學(xué)為例,題庫共收錄了教學(xué)大綱中的數(shù)百個(gè)知識(shí)點(diǎn)、每個(gè)知識(shí)點(diǎn)對(duì)應(yīng)上百道習(xí)題。題目和知識(shí)點(diǎn)均由老師人工標(biāo)注難度及重要程度,為算法推薦提供依據(jù)。
事實(shí)上,有為K12用戶專門打造的、有硬件加持的自適應(yīng)學(xué)習(xí)系統(tǒng)在業(yè)內(nèi)非常罕見,并且這還原了學(xué)生熟悉的紙筆交互系統(tǒng),這也是網(wǎng)易有道“AI+教育”業(yè)務(wù)的重要技術(shù)壁壘。
發(fā)力AI的基因與籌碼兼?zhèn)洌W(wǎng)易有道商業(yè)化道路將迎質(zhì)變
有道智能筆這類獨(dú)特硬件的出現(xiàn)也能看出有道對(duì)在線教育資源掌控的決心與判斷。
根據(jù)有道在AI技術(shù)上的布局,可以看出2017年是這家公司全力擁抱AI的一年。
同時(shí),穩(wěn)握8億用戶、100%用戶導(dǎo)向的原則,網(wǎng)易有道發(fā)力AI的基因與籌碼都已具備。
單拿“AI+教育”領(lǐng)域來說,網(wǎng)易有道所走得路線也相對(duì)“穩(wěn)妥”,屬于均衡發(fā)展的選手,注重實(shí)用性與應(yīng)用落地。
與轉(zhuǎn)型擁抱AI的新東方、好未來等傳統(tǒng)教育企業(yè)相比,它沒有擁有絕對(duì)場(chǎng)景優(yōu)勢(shì),但積累的用戶基礎(chǔ)極大,進(jìn)而擁有數(shù)據(jù)優(yōu)勢(shì),并且有多年的自研技術(shù)積累。
但與AI企業(yè)相比,網(wǎng)易有道沒有經(jīng)歷通過純靠技術(shù)“廝殺”的階段。
作為網(wǎng)易旗下第三個(gè)獨(dú)立融資的事業(yè)部門,AI浪潮興起的時(shí)候,網(wǎng)易有道早已不是初創(chuàng)企業(yè),它對(duì)于如何將新技術(shù)落地商業(yè)化更有經(jīng)驗(yàn)。
“AI+教育”行業(yè)尚處于發(fā)展早期的升溫階段,概念模糊,泡沫難免。保持清醒,注重實(shí)用性的確能保護(hù)企業(yè)避免觸礁。
發(fā)力AI基因與籌碼已兼?zhèn)洌劣诤螘r(shí)走向資本市場(chǎng)、商業(yè)化道路迎來質(zhì)變也是可遇見的未來。
-
AI
+關(guān)注
關(guān)注
87文章
31494瀏覽量
270258 -
網(wǎng)易
+關(guān)注
關(guān)注
0文章
127瀏覽量
14545
原文標(biāo)題:8億用戶AI有道,超強(qiáng)神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)大解密!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論