色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新方法開啟了多種語(yǔ)言快速翻譯、精準(zhǔn)翻譯的大門

zhKF_jqr_AI ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-04 10:26 ? 次閱讀

自動(dòng)語(yǔ)言翻譯是NLP領(lǐng)域研究的一大熱門,它可以免去語(yǔ)言不通的煩惱,讓用戶隨意瀏覽信息、接受服務(wù)。為了保證質(zhì)量,現(xiàn)有的機(jī)器翻譯系統(tǒng)需要用大量的翻譯文本做訓(xùn)練樣本。這樣就使得機(jī)器翻譯只有在一小部分樣本數(shù)量充足的語(yǔ)言表現(xiàn)良好。

這一領(lǐng)域目前研究的重點(diǎn)就是在不需要任何源翻譯的情況下訓(xùn)練機(jī)器翻譯模型,即無(wú)監(jiān)督訓(xùn)練。Facebook的研究團(tuán)隊(duì)在EMNLP 2018上展示的研究成果正式最近針對(duì)這一問(wèn)題的研究,并獲得了EMNLP 2018的最佳論文,論智將大概內(nèi)容編譯如下:

我們的新方法在此前無(wú)監(jiān)督翻譯的基礎(chǔ)上得到了極大地提升,并且達(dá)到了和有將近10萬(wàn)份翻譯參考樣本的監(jiān)督式方法的水平。BLEU分?jǐn)?shù)是衡量機(jī)器翻譯準(zhǔn)確性常用的準(zhǔn)則,提高1分就已經(jīng)很有說(shuō)服力了,而我們的方法最終提升了10個(gè)BLEU分?jǐn)?shù)。

總的來(lái)說(shuō),這是機(jī)器翻譯領(lǐng)域的重要研究成果,尤其是對(duì)世界上數(shù)千種缺乏樣本的小眾語(yǔ)言來(lái)說(shuō),是非常有用的。對(duì)資源較少的語(yǔ)言,現(xiàn)在有一種方法能學(xué)習(xí)彼此間互相翻譯了,例如烏爾都語(yǔ)和英語(yǔ)之間的翻譯,只需要一段英語(yǔ)和與之無(wú)關(guān)的烏爾都語(yǔ)即可互譯,無(wú)需對(duì)應(yīng)的文本。

這一新方法開啟了多種語(yǔ)言快速翻譯、精準(zhǔn)翻譯的大門。

詞對(duì)詞翻譯

為了達(dá)到我們的研究目的,第一步就是讓系統(tǒng)學(xué)習(xí)雙語(yǔ)詞典,也就是將一個(gè)單詞和目標(biāo)語(yǔ)言中的翻譯版本聯(lián)系起來(lái)。為了做到這一點(diǎn),我們用了此前論文中的方法,讓系統(tǒng)首先學(xué)習(xí)各種語(yǔ)言中每個(gè)單詞的詞嵌入(單詞的向量表示)。

詞嵌入經(jīng)過(guò)訓(xùn)練,是為了根據(jù)語(yǔ)境預(yù)測(cè)單詞(例如給定一個(gè)單詞,猜測(cè)前面五個(gè)單詞和后面五個(gè)單詞分別是什么)。雖然這一過(guò)程簡(jiǎn)單,但詞嵌入可以捕捉有趣的予以結(jié)構(gòu)。例如,“kitty”的最近鄰單詞是“cat”,并且單詞“kitty”的詞嵌入與“animal”的嵌入比與“rocket”更近(因?yàn)椤皉ocket”幾乎很少在由“kitty”的語(yǔ)境中出現(xiàn))。

并且,不同語(yǔ)言的詞嵌入的近鄰結(jié)構(gòu)是相似的,因?yàn)槭澜绺鞯氐娜藗儗?duì)事物的認(rèn)知是一樣的。例如在英語(yǔ)中,“cat”和“fluffy”的關(guān)系和西班牙語(yǔ)中的“gato”和“peludo”的關(guān)系是一樣的,因?yàn)檫@些詞出現(xiàn)的語(yǔ)境相似。

基于這種相似性,我們提出讓系統(tǒng)學(xué)習(xí)某種語(yǔ)言詞嵌入的旋轉(zhuǎn),用多種技術(shù)的結(jié)合,例如對(duì)抗訓(xùn)練,來(lái)匹配另一種語(yǔ)言的詞嵌入。有了這一信息,我們可以不用任何翻譯來(lái)推斷出相當(dāng)準(zhǔn)確的雙語(yǔ)詞典,進(jìn)行詞對(duì)詞的翻譯。

兩種語(yǔ)言的二維詞嵌入(左)可以通過(guò)簡(jiǎn)單的旋轉(zhuǎn)連接起來(lái)(右)

翻譯語(yǔ)句

用無(wú)監(jiān)督的雙語(yǔ)詞典推斷法進(jìn)行詞對(duì)詞翻譯并不是好的翻譯方法,因?yàn)樵~語(yǔ)可能會(huì)丟失,或打亂順序,或出現(xiàn)錯(cuò)誤。但是,它能最大程度地保留文本的意思。我們可以用語(yǔ)言模型對(duì)其進(jìn)行本地化編輯,該模型經(jīng)過(guò)單一語(yǔ)言數(shù)據(jù)的訓(xùn)練,可以對(duì)詞語(yǔ)的順序進(jìn)行打分。

如果我們有一個(gè)大型的烏爾都語(yǔ)數(shù)據(jù)集,就可以訓(xùn)練一個(gè)烏爾都語(yǔ)模型和同樣的英語(yǔ)模型。有了語(yǔ)言模型和詞對(duì)詞翻譯,我們可以建立起翻譯系統(tǒng)的早期版本。

雖然這一版本還不夠完美,但是該系統(tǒng)已經(jīng)比單純的詞對(duì)詞翻譯要好了,并且可以從很多源語(yǔ)言翻譯成目標(biāo)語(yǔ)言。

接下來(lái),我們將這些系統(tǒng)翻譯(從烏爾都語(yǔ)翻譯成英語(yǔ))看作是標(biāo)準(zhǔn)數(shù)據(jù),反過(guò)來(lái)用它們訓(xùn)練機(jī)器翻譯系統(tǒng)(從英語(yǔ)翻譯成烏爾都語(yǔ))。可以想到,作為輸入的英語(yǔ)語(yǔ)句可能會(huì)有些許遺漏,因?yàn)樵诘谝淮畏g時(shí)會(huì)有誤差。這一技術(shù)由R. Sennrich等人于ACL 2015上提出,是機(jī)器翻譯系統(tǒng)的半監(jiān)督學(xué)習(xí)(其中可使用少量平行文本)。這是該技術(shù)第一次用于完全的無(wú)監(jiān)督系統(tǒng)中,重要的是,它最初是在監(jiān)督數(shù)據(jù)上訓(xùn)練的。

我們現(xiàn)在有了烏爾都語(yǔ)語(yǔ)言模型了,我們可以將反向翻譯的平行語(yǔ)句和烏爾都語(yǔ)語(yǔ)言模型生成的正確語(yǔ)句相結(jié)合,訓(xùn)練從英語(yǔ)到烏爾都語(yǔ)的翻譯系統(tǒng)。

系統(tǒng)訓(xùn)練完成后,我們可以用它翻譯很多英語(yǔ)語(yǔ)句,建造起另一個(gè)數(shù)據(jù)集,幫助之前的烏爾都語(yǔ)-英語(yǔ)翻譯系統(tǒng)提高性能。一個(gè)系統(tǒng)變得更好,就可以用它生成用于訓(xùn)練反向系統(tǒng)的數(shù)據(jù),不斷進(jìn)行迭代。

模型結(jié)合

在我們的研究中,我們?cè)O(shè)立了三個(gè)步驟:

詞對(duì)詞翻譯初始化

語(yǔ)言建模

反向翻譯

這三個(gè)步驟是無(wú)監(jiān)督機(jī)器翻譯的重要原則,有了這些原則,我們可以衍生出不同的模型,我們將這些原則應(yīng)用于兩種不同的方法處理無(wú)監(jiān)督機(jī)器翻譯問(wèn)題。

首先是無(wú)監(jiān)督神經(jīng)模型,比詞對(duì)詞翻譯更流暢,但是無(wú)法生成我們想要的翻譯質(zhì)量。但是它們可以用于反向翻譯,在反向翻譯中,這種方法被看作有10萬(wàn)條平行句子的監(jiān)督式模型。

接下來(lái),我們將上述三原則應(yīng)用于另一個(gè)基于經(jīng)典數(shù)據(jù)模型的方法,即基于短語(yǔ)的機(jī)器翻譯。這些模型在小眾語(yǔ)言上表現(xiàn)得較好,非常有趣。但是這是首次應(yīng)用于無(wú)監(jiān)督機(jī)器翻譯上,在這種情況下,我們發(fā)現(xiàn)翻譯結(jié)果中,詞語(yǔ)的使用是正確的,但不夠流暢。不過(guò)這一方法同樣比此前的無(wú)監(jiān)督模型表現(xiàn)得要好。

最后,我們將這兩種模型結(jié)合得到了最好的模型,既能流暢生成語(yǔ)句,又能翻譯無(wú)誤。我們首先訓(xùn)練了神經(jīng)模型,然后通過(guò)基于短語(yǔ)的模型,用額外的反向翻譯語(yǔ)句對(duì)其進(jìn)行訓(xùn)練。

重要的是,這種復(fù)合型模型極大地提高了吳建德機(jī)器翻譯的精確度,在英語(yǔ)-法語(yǔ)和英語(yǔ)-德語(yǔ)翻譯上提高了10個(gè)BLEU分?jǐn)?shù),這兩種翻譯常被用作基準(zhǔn)。

我們同樣在其他語(yǔ)言互譯上測(cè)試了這種新方法,例如在英語(yǔ)-羅馬尼亞語(yǔ)、英語(yǔ)-烏爾都語(yǔ)這樣小眾的翻譯,結(jié)果都比之前有很大的進(jìn)步,甚至有些超過(guò)了用平行數(shù)據(jù)訓(xùn)練處的監(jiān)督式方法。

德語(yǔ)-英語(yǔ)翻譯案例的結(jié)果如下:

結(jié)語(yǔ)

提高10個(gè)BLEU對(duì)我們來(lái)說(shuō)是很大的驚喜了,然而更值得關(guān)注的是未來(lái)機(jī)器翻譯進(jìn)步的空間。在短期內(nèi),技術(shù)的進(jìn)步一定會(huì)讓更多語(yǔ)言翻譯變得更加容易、翻譯質(zhì)量更好。但這次的研究成果和基本研究準(zhǔn)則不會(huì)僅僅用于機(jī)器翻譯。在其他無(wú)監(jiān)督學(xué)習(xí)領(lǐng)域,此次研究的成果也可讓智能體利用無(wú)標(biāo)記數(shù)據(jù)執(zhí)行多種任務(wù)。這次的研究證明了,系統(tǒng)可以在無(wú)監(jiān)督的情況下學(xué)習(xí),并搭建多種系統(tǒng),其中的元素會(huì)在多次迭代中提高性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    14922
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1209

    瀏覽量

    24789

原文標(biāo)題:EMNLP 2018最佳論文 | Facebook提出二合一無(wú)監(jiān)督機(jī)器翻譯,BLEU分?jǐn)?shù)提高10個(gè)點(diǎn)

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    LabVIEW做百度翻譯助手

    做天氣預(yù)報(bào)程序的時(shí)候,用過(guò)論壇一個(gè)UTF8_TO_GBK的VI,這個(gè)用此VI也沒(méi)用,所以現(xiàn)階段只能中譯英。更新:已經(jīng)解決中文顯示問(wèn)題,現(xiàn)在可以實(shí)現(xiàn)多種語(yǔ)言的互相翻譯,居然還有文言文的。要運(yùn)行程序需要安裝JSON API庫(kù),我已
    發(fā)表于 07-28 11:41

    語(yǔ)言翻譯技術(shù)一流的智能翻譯機(jī)-訊飛翻譯機(jī)3.0

    體驗(yàn)不僅快速而且更精確。  訊飛翻譯機(jī)3.0采用了訊飛智能翻譯內(nèi)核和高通八核CPU,更有CDN全球部署的助力,無(wú)縫協(xié)作讓翻譯的響應(yīng)速度更快。訊飛翻譯
    發(fā)表于 08-18 09:56

    求大佬分享按鍵掃描的新方法

    求大佬分享按鍵掃描的新方法
    發(fā)表于 01-17 06:50

    基于淺層句法信息的翻譯實(shí)例獲取方法研究

    翻譯實(shí)例庫(kù)是基于實(shí)例的機(jī)器翻譯系統(tǒng)的主要知識(shí)源。本文采用基于淺層句法分析的方法進(jìn)行翻譯實(shí)例的獲取。首先根據(jù)淺層句法信息劃分源語(yǔ)言和目標(biāo)
    發(fā)表于 11-24 15:32 ?13次下載

    利用C語(yǔ)言和GEL語(yǔ)言的Flash編程新方法

    利用C語(yǔ)言和GEL語(yǔ)言的Flash編程新方法 以TMS320VC5402為例,探討一種綜合運(yùn)用C語(yǔ)言、數(shù)據(jù)文件及GEL語(yǔ)言的Flash編程
    發(fā)表于 03-29 15:13 ?1632次閱讀
    利用C<b class='flag-5'>語(yǔ)言</b>和GEL<b class='flag-5'>語(yǔ)言</b>的Flash編程<b class='flag-5'>新方法</b>

    日本AI翻譯耳機(jī)可精準(zhǔn)翻譯三國(guó)語(yǔ)言 精準(zhǔn)率達(dá)90%

    近幾年人們對(duì)人工智能的興趣與日俱增,各大科技巨頭也是爭(zhēng)先在這個(gè)領(lǐng)域進(jìn)行大面積的產(chǎn)品布局。據(jù)報(bào)道,日本研發(fā)出了一款A(yù)I翻譯耳機(jī),可以精準(zhǔn)翻譯三國(guó)語(yǔ)言
    發(fā)表于 12-28 11:23 ?1584次閱讀

    一眾科技廠商競(jìng)相推出“翻譯蛋”“翻譯機(jī)”等各色智能翻譯設(shè)備

    以網(wǎng)易翻譯蛋為例,目前支持包括英語(yǔ)、法語(yǔ)、俄語(yǔ)、泰語(yǔ)、韓語(yǔ)、日語(yǔ)等多種語(yǔ)言,只需要在連接網(wǎng)絡(luò)后,對(duì)其說(shuō)出句子,它就能清晰地翻譯出相應(yīng)的外語(yǔ),而且還可以朗讀出來(lái)。而對(duì)方在回復(fù)時(shí),也只需要按著翻譯
    的頭像 發(fā)表于 07-27 16:41 ?6903次閱讀

    關(guān)于roobo聯(lián)手中譯語(yǔ)通對(duì)人工智能翻譯時(shí)代的分析和介紹

    單純的人工翻譯必然跟不上當(dāng)前節(jié)奏,高質(zhì)量的機(jī)器翻譯終將改變語(yǔ)言服務(wù)產(chǎn)業(yè)的未來(lái),而提供多種語(yǔ)言服務(wù)的翻譯機(jī)器人將徹底顛覆
    的頭像 發(fā)表于 10-09 11:09 ?1390次閱讀

    阿里宣布完成全球首個(gè)多語(yǔ)言實(shí)時(shí)翻譯的電商直播

    今日,阿里宣布完成全球首個(gè)多語(yǔ)言實(shí)時(shí)翻譯的電商直播,該直播實(shí)現(xiàn)將中文直播內(nèi)容精準(zhǔn)翻譯成英語(yǔ)、俄語(yǔ)、西班牙語(yǔ)等
    的頭像 發(fā)表于 10-27 11:39 ?1989次閱讀

    Facebook的AI翻譯系統(tǒng)能翻譯100種語(yǔ)言

    近日,F(xiàn)acebook 宣稱已經(jīng)開發(fā)出一種人工智能翻譯系統(tǒng),能夠在 100 種語(yǔ)言之間進(jìn)行精確翻譯,而不需要像許多現(xiàn)有 AI 翻譯那樣先翻譯
    的頭像 發(fā)表于 10-30 09:25 ?2942次閱讀

    人工智能翻譯mRASP:可翻譯32種語(yǔ)言

    包括以了解信息或以交流信息為目的的機(jī)器翻譯。 多語(yǔ)言翻譯是機(jī)器翻譯需要面臨的一大技術(shù)現(xiàn)實(shí)。其中,一個(gè)理想的模型是一個(gè)統(tǒng)一的具備多種語(yǔ)言能力的
    的頭像 發(fā)表于 12-01 14:03 ?3257次閱讀
    人工智能<b class='flag-5'>翻譯</b>mRASP:可<b class='flag-5'>翻譯</b>32種<b class='flag-5'>語(yǔ)言</b>

    語(yǔ)言翻譯新范式的工作:機(jī)器翻譯界的BERT

    今天給大家介紹EMNLP2020的一篇關(guān)于多語(yǔ)言翻譯新范式的工作multilingual Random Aligned Substitution Pre-training (mRASP)[1],核心
    的頭像 發(fā)表于 03-31 17:24 ?3019次閱讀
    多<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>翻譯</b>新范式的工作:機(jī)器<b class='flag-5'>翻譯</b>界的BERT

    專業(yè)中英文翻譯機(jī)推薦:訊飛雙屏翻譯機(jī)打破語(yǔ)言障礙

    得云里霧里。針對(duì)這些難題,專注人工智能22年的AI翻譯領(lǐng)軍者科大訊飛,推出了一款專業(yè)中英文翻譯機(jī)——訊飛雙屏翻譯機(jī),通過(guò)軟硬件雙向升級(jí),開創(chuàng)翻譯雙屏?xí)r代,帶來(lái)全新流暢體驗(yàn),為廣大用戶提
    發(fā)表于 08-30 16:25 ?1849次閱讀
    專業(yè)中英文<b class='flag-5'>翻譯</b>機(jī)推薦:訊飛雙屏<b class='flag-5'>翻譯</b>機(jī)打破<b class='flag-5'>語(yǔ)言</b>障礙

    智能翻譯機(jī)就選訊飛雙屏翻譯機(jī),83種語(yǔ)言在線即時(shí)翻譯供你選

    擁有一款智能翻譯機(jī)是什么感覺(jué)?大概就是在國(guó)外旅游,不用再緊急學(xué)幾個(gè)日常詞匯,說(shuō)著蹩腳的英語(yǔ),然后利用“豐富”的肢體語(yǔ)言交流;亦或者看滿是外語(yǔ)的化妝品使用介紹時(shí),不用擔(dān)心看不懂它的具體功能和用法等等
    發(fā)表于 10-25 15:28 ?1021次閱讀
    智能<b class='flag-5'>翻譯</b>機(jī)就選訊飛雙屏<b class='flag-5'>翻譯</b>機(jī),83種<b class='flag-5'>語(yǔ)言</b>在線即時(shí)<b class='flag-5'>翻譯</b>供你選

    IC封裝中快速創(chuàng)建結(jié)構(gòu)的新方法

    IC封裝中快速創(chuàng)建結(jié)構(gòu)的新方法
    的頭像 發(fā)表于 12-06 16:34 ?617次閱讀
    IC封裝中<b class='flag-5'>快速</b>創(chuàng)建結(jié)構(gòu)的<b class='flag-5'>新方法</b>
    主站蜘蛛池模板: 60老妇性xxxxhd| aaa在线观看视频高清视频| 欧美日韩高清一区二区三区| 青青青草国产| 欧美阿v在线天堂| 色戒床震视频片段| 亚洲欧美中文日韩v在线| 亚洲国产精品高清在线 | 亚洲国产在线2020最新| 久久视频这里只精品99热在线| 999久久久国产精品蜜臀AV| 亚洲婷婷天堂综合国产剧情| 无修肉动漫在线观看影片| 羞羞漫画免费漫画页面在线看漫画秋蝉| 色综合色综合久久综合频道| 国产欧美精品一区二区色综合| 一个人免费完整在线观看影院| 3d无遮挡h肉动漫在线播放| 亚洲男人的天堂久久精品麻豆| 9277在线观看资源| 国产AV视频二区在线观看| 国产成人高清亚洲一区app| 国产极品美女视频福利| 精品久久久久亚洲| 日本视频一区二区免费观看| 十分钟在线观看免费视频高清WWW| 色偷偷男人天堂| 中文字幕伊人香蕉在线| 国产精品久久久久影院色| 麻豆最新免费版| 人妻熟女斩五十路0930| 神马电影我不卡4k手机在线观看| 在线成人精品国产区免费| 97碰成视频免费| 韩国hd高清xxx| 久章草一区二区| 强奸美女老师| 永久午夜福利视频一区在线观看| 97久久久久| 极品内射少妇精品无码视频| 日韩欧美三区|