色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從發展滯后到不斷突破 NLP已成為AI又一燃爆點?

WpOh_rgznai100 ? 來源:yxw ? 2019-07-11 14:36 ? 次閱讀

自然語言處理:人工智能連接主義復興浪潮中的下一個突破口

AI 行業應用是一片新的大陸,深度學習作為新大陸的基石,經歷了一輪又一輪突破。過去十年,在計算機視覺語音識別、棋類 AI 等計算和感知智能技術上,深度學習率先取得成功。而最近深度學習在認知智能/自然語言處理上的進展,特別是 Transformer 衍生模型加上兩階段預訓練語言模型范式的成功,正在將自然語言處理變成人工智能下一個最有可能的突破口。

計算機視覺與語音的成功是破繭成蝶,而非橫空出世

2010 年到 2017 年,從 LeNet 到 AlexNet、Inception、VGGNet、ResNet 及其衍生結構,深度神經網絡加上集成學習技術在計算機視覺研究中大放異彩,在 ImageNet 大規模深度視覺挑戰(ILSVRC)圖像分類任務上的錯誤率從 28.2% 一路降低到了 2% 左右。盡管這仍然是“實驗室環境”下的結果,但當 AI 在某一個單點任務上的表現接近或者超越人類的時候,就會給行業帶來巨大的商機。在視覺分類、檢索、匹配、目標檢測等各項任務上,隨著相關算法越來越準確,業界也開始在大量商業場景中嘗試這些技術。

人臉識別,作為計算機視覺技術取得突破的一個代表性應用,就是在這個大背景下從技術研究期進入成熟商業期,爆發成為一個千億甚至萬億級別的市場。

但在計算機視覺技術商業化的歷程中,其實也有一段不短的蟄伏期。在深度卷積神經網絡興起之前,微軟亞洲研究院研究人臉識別的團隊曾在內部長期遭受質疑:做了十多年,準確率總是只有 70% 到 80%,看上去挺好玩,但這個準確率能有什么實際的應用價值呢?然而 2010 年深度學習浪潮迅速掃清了質疑,長期研究這個方向的被質疑者們,成了這個新商業領域的領導者,從火種涅槃成為滿天繁星。而連接主義學派的忠實信徒、蟄伏近三十年的深度學習三劍客 Geoff Hinton、Yann LeCun 和 Yoshua Bengio,也是因為在統計機器學習盛行的數十年間受盡冷眼的厚積,才有了 2010 年后因 GPU 算力和神經網絡模型不斷加深而產生的薄發,從而一舉獲得圖靈獎。

為什么自然語言處理領域的發展要相對滯后?

深度學習在計算機視覺、語音識別等感知智能技術上率先取得成功并不是偶然。深度學習秉承連接主義學派的范式,相較傳統統計機器學習技術的最大進化在于其利用了高于統計方法數個數量級的參數和極其復雜的函數組合,通過引入各種非線性和多層級感知能力,構成了遠強于統計機器學習模型的擬合能力。ResNet-152 的參數量已經達到六千萬的級別,GPT-2.0 的參數量達到了驚人的 15 億。而其他上億甚至數億級別的網絡更是數不勝數。如此復雜的模型對數據的擬合能力達到了前所未有的水平,但是同時也極大提高了過擬合的風險。這對數據提出了極高的要求。訓練數據的數量、維度、采樣均衡度、單條數據本身的稠密度(非0、不稀疏的程度),都需要達到極高的水平,才能將過擬合現象降低到可控范圍。

視覺信息(圖像、視頻)恰好是這樣一類自然連續信號:一張圖片通常就有數百萬甚至上千萬像素,而且每個像素上通常都有顏色,數據量大、數據的表示稠密、冗余度也高。往往在丟失大量直接視覺信號的情況下,人還能迅速理解圖片的語義信息,就是因為自然連續信號,如圖像中的場景和物體往往具有視覺、結構和語義上的共性。一個 30MB 的位圖圖片能被壓縮到 2MB 而讓人眼基本無法感知區別;一個 30MB 的 wave 音頻文件被壓縮到 3MB 的 MP3 還能基本保持主要旋律和聽感,都是因為這類自然連續信號中存在大量不易被人的感官所感知的冗余。

視覺信息這種的豐富和冗余度,讓深度神經網絡得以從監督信號中一層層提煉、一層層感知,最終學會部分判斷邏輯。深度神經網絡在感知智能階段中在視覺任務和語音任務上的成功,離不開視覺、語音信號自身的這種數據特點。

今天,屬于感知智能的視覺和語音應用已經全面開花,但屬于認知智能的自然語言處理卻發展滯后。這種發展狀態與自然語言處理技術中的數據特征也有密不可分的關系。

相對于圖片、語音給出的直接信號,文字是一種高階抽象離散信號。較之圖片中的一個像素,文本中一個單元信息密度更大、冗余度更低,往往組成句子的每一個單詞、加上單詞出現的順序,才能正確表達出完整的意思。如何利用單個文本元素(字/詞)的意思,以及如何利用語句中的順序信息,是近年來自然語言處理和文本分析技術的主要探索脈絡。

2013 年,詞的分布式向量表示(Distributed Representation)出現之前,如何在計算機中高效表示單個字/詞是難以逾越的第一個坎。在只能用One-hot向量來表示字/詞的年代,兩個近義詞的表示之間的關系卻完全獨立,語義相似度無法計算;上表示一個字/詞所需的上萬維向量中只有一個維度為1,其他維度都為0,稀疏度極高。面對這類信號,深度神經網絡這類復雜的模型所擅長的化繁為簡的抽象、提煉、總結能力便束手無策,因為輸入信號已經極簡到了連最基礎的自我表示都難以做到。

NLP 中的兩大重要挑戰:特征表示、結構/語義理解正取得關鍵進展

而分布式詞向量將語言的特征表示向前推進了一大步。分布式詞向量提出了一個合理的假設:兩個詞的相似度,可以由他們在多個句子中各自的上下文的相似度去度量,而上下文相似的兩個詞會在向量空間中由兩個接近的向量來表示。這種做法部分賦予了詞向量“語義”,因此我們不必再讓機器去查百科全書告訴我們“蘋果”的近義詞是“梨子”,而是直接從大量的互聯網語料中去學習,原來“蘋果”的近義詞也可以是“三星”、“華為”。因為人們常常會說“我購買了一個蘋果手機”,也常說“我購買了一個三星手機”,模型會敏銳的學習到“蘋果”和“三星”在大量語料中出現時其上下文高度相似,因而認為兩個詞相似。分布式詞向量讓無語義、極稀疏的 One-hot 向量壽終正寢,而為大家提供了嵌入語義信息、稠密的特征表示,這才使得深度神經網絡在自然語言處理和文本分析上的應用真正變得可能。

捕捉語句中在獨立的詞集合基礎之上、詞序列構成的句子結構信息也是自然語言處理和文本分析中的一個主要方向。傳統條件隨機場(CRF)考慮了前后相鄰元素和當前元素之間的依賴;長短時記憶網絡模型(LSTM)以一種衰減形式考慮了當前元素之前的元素序列;seq2seq 通過注意力和編解碼的機制使得解碼時的當前元素不光能用上已經解碼完畢的元素序列,還能用上編碼前的序列的完整信息;近期各類基于 Transformer 結構,如 ELMo 、BERT、GPT-2.0、XLNet,則利用兩階段(基于自編碼的預訓練加基于任務的調優)模式,能夠以自監督的方式更好地利用大規模的無標注語料訓練不同句子結構中詞語之間的關系,并且突破傳統線性序列結構中存在的難以建立長距離、雙向依賴關系的問題,學習到質量更高的中間語言模型,再通過調優就能在文本生成、閱讀理解、文本分類、信息檢索、序列標注等多個任務上取得當前最為領先的準確率。

以機器閱讀理解任務為例,在 SQuAD1.0 數據集上,BERT 和 XLNet 都已大幅超越人類的 91.22(F1分),分別達到了 93.16 和 95.08;在更加復雜的 SQuAD2.0 數據集上,XLNet 也已經達到了 89.13。

又如在 2019 年 3 月舉行的第十四屆 NTCIR 上,短文本情感對話任務(STC3)提出的要求是:中文回答不僅需要內容合理,語句流暢,而且需要情感合宜。例如,如果用戶說“我的貓昨天去世了”,如果機器人想表達悲傷的情感,那么最合適的回答可能是“這太悲傷了,很抱歉聽到”,但如果想表達安慰的情感,則應該說 “壞事永遠發生,我希望你會快樂”。對情感表達要求的增加,無疑增加了難度。

而在這個比賽中,一覽群智和人民大學信息學院聯合組成的團隊獲得了冠軍,其使用的方法便是基于 Transformer 改進的網絡模型,以情感識別、情感領域對話子模型、集成學習等方法相結合,擊敗了十幾支強勁對手。類似的探索,讓 AI 在特定任務下的認知能力,朝著人類水平一步步發展。

認知智能進入快車道

自然語言處理領域的發展雖然比計算機視覺和語音領域滯后幾年,但是我們看到自然語言處理已經進入快車道。近兩年來語言模型上的飛速進步,讓我們感受到之前制約自然語言處理和文本分析發展的主要難點,正在被更好的模型結構、訓練和使用方法、更大的算力逐漸克服。為自然語言任務加入“常識”,也是另一個新興重要探索方向,這個方向則與知識圖譜技術緊密結合。

我們正處于認知智能的黃金發展期,新技術的出現與逐步成熟,使得更多行業的應用場景變得可能。一覽群智一直在探索認知智能的基礎技術發展與前沿行業應用,圍繞自然語言處理技術的變與不變,在這個過程中有著自己的思考和總結,并且通過智語這個核心技術產品,給出自己的答案。就像 BERT、GPT-2.0、XLNet 在兩階段范式上的殊途同歸,我們也認為基礎語言模型在不同任務上可以存在一些不變性,但在不同場景中一定要做特殊語料與任務下的調優與適配。出于對文本信號特性的理解和自然語言處理技術發展階段的認識,我們構建認知智能核心產品智語平臺的思路,也是圍繞這種變與不變在展開。

“智語” 自然語言處理平臺的智能流程

但認知智能在金融、公安、媒體等場景中的變化部分給 AI 廠商帶來的挑戰非常明顯。一個算法往往在不同場景下要利用不同的標注語料去形成不同的模型,一個媒體場景的 10 類新聞分類模型,無法給另一個媒體的 12 類分類體系使用。

為了解決數據標注難、封閉環境下模型訓練難、部署難等問題,一覽群智的智語平臺提供了標注管理、智能標注加速、自然語言處理、文本模型訓練、一鍵部署等端到端功能,提升了團隊在應對不同場景時的效率與效果。例如智能標注加速功能,利用主動學習的先進技術,將訓練一個分類或者序列標注模型的標注量有效降低至原有的 30%-50%,同時保證模型性能基本不變;加上平臺高效能的標注管理,總體效率提升可達數倍。而傻瓜式的訓練和部署,使得初級團隊成員通過短期培訓也能有效形成 AI 的生產力。

“智語” 自然語言處理平臺端到端流程方案

結語

回顧 AI 連接主義學派復興的十年,就像一個螺旋梯,算法與算力應用相互促進、不斷攀升。在見證 ImageNet 圖像分類錯誤率從 30% 一路降低到 2%左右;見證 AlphaGo 擊敗樊輝、李世石、柯潔之后,我們開始見證基于 BERT/GPT-2.0/XLNet 在閱讀理解任務超越人類。十年后再回顧,會發現今天之于自然語言處理,也許恰如 2014 年之于人臉識別。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31490

    瀏覽量

    269883
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46074
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121408

原文標題:從發展滯后到不斷突破,NLP已成為AI又一燃爆點?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LITESTAR 4D在建筑外墻照明中的應用

    隨著城市建設的不斷發展,人民經濟、文化和物質生活水平迅速提高,城市夜景照明得到蓬勃發展,已成為城市建設的個重要組成部分。 以下是由Litestar 4D關于建筑照明的案例 1.工程數
    發表于 01-24 08:47

    LITESTAR 4D在建筑外墻照明中的應用

    隨著城市建設的不斷發展,人民經濟、文化和物質生活水平迅速提高,城市夜景照明得到蓬勃發展,已成為城市建設的個重要組成部分。 以下是由Litestar 4D關于建筑照明的案例 1.工程數
    發表于 12-13 09:51

    Rockchip SoC 賦能 AI 與視覺創新:推動智能設備的未來發展

    隨著人工智能(AI)和計算機視覺技術不斷推動各行各業的創新,Rockchip 已成為提供強大系統級芯片(SoC)解決方案的領先廠商。該公司已開發出多款集成 AI 功能并支持先進多媒體與
    的頭像 發表于 11-05 18:02 ?534次閱讀
    Rockchip SoC 賦能 <b class='flag-5'>AI</b> 與視覺創新:推動智能設備的未來<b class='flag-5'>發展</b>

    AI模型市場分析

    隨著人工智能技術的快速發展AI模型已成為全球科技競爭的新高地、未來產業的新賽道以及經濟發展的新引擎。下面,AI部落小編分析了當前
    的頭像 發表于 11-01 09:51 ?191次閱讀

    RISC-V在AI領域的發展前景怎么樣?

    隨著人工智能的不斷發展,現在的視覺機器人,無人駕駛等智能產品的不斷更新迭代,發現ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領域有哪些參考方案?
    發表于 10-25 19:13

    AI汽車發展的新階段、新要素、新挑戰

    ”和“好玩”的駕乘體驗。促進汽車與人工智能產業生態融合,拓展產業鏈、價值鏈,將成為我國汽車產業高質量發展又一戰略支點。AI
    的頭像 發表于 10-16 08:07 ?583次閱讀
    <b class='flag-5'>AI</b>汽車<b class='flag-5'>發展</b>的新階段、新要素、新挑戰

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    農業、環保等,為人類社會的可持續發展做出貢獻。 總結 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們展示了個充滿希望和機遇的未來。在這個
    發表于 10-14 09:21

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    for Science的技術支撐”的學習心得,可以以下幾個方面進行歸納和總結: 1. 技術基礎的深入理解 在閱讀第二章的過程中,我對于AI for Science所需的技術基礎有了更加深入的理解。這章詳細闡述了
    發表于 10-14 09:16

    變阻器的未來發展趨勢和前景如何?是否有替代品出現?

    通信,實現遠程控制和監測。 節能環保將成為變阻器發展的重要方向,隨著能源緊缺和環境問題的日益突出,減少能源消耗和環境污染已成為全球共識。因此,未來的變阻器將更加注重提高能源利用效率,降低能耗。例如
    發表于 10-10 14:35

    在當今的醫療行業中,智慧醫院建設已成為種趨勢

    智慧醫院建設:信息技術引領后勤管理升級 在當今的醫療行業中,智慧醫院建設已成為種趨勢。通過應用信息技術和先進的管理理念,智慧醫院可以提升醫療機構的服務水平和管理效率。 在后勤管理方面,以下是
    的頭像 發表于 08-07 17:15 ?285次閱讀

    努比亞發布自主研發的星云大模型,在AI技術領域又一重大突破

    7月23日最新資訊,努比亞于今日下午盛大召開“AI+雙旗艦”新品發布會,震撼發布了其自主研發的星云大模型,標志著公司在AI技術領域的又一重大突破
    的頭像 發表于 07-23 16:50 ?1151次閱讀

    庫克:Vision Pro已成為日常生活中不可或缺的部分

    據知名科技媒體MacRumors援引的消息,蘋果公司首席執行官蒂姆·庫克在近期接受《太陽報》專訪時,興奮地分享了他個人對蘋果最新力作——Vision Pro的深切體驗與高度評價。庫克透露,自這款創新產品登陸英國市場以來,Vision Pro已成為他日常生活中不可或缺的
    的頭像 發表于 07-15 15:29 ?664次閱讀

    NLP技術在人工智能領域的重要性

    在自然語言處理(Natural Language Processing, NLP)與人工智能(Artificial Intelligence, AI)的交織發展中,NLP技術作為連接人
    的頭像 發表于 07-04 16:03 ?653次閱讀

    后到臺前,智微工業的成長看國產工業品牌的發展

    隨著全球化競爭的加劇,國產品牌替代已成為我國工業自動化發展的重要趨勢。這趨勢也將國內工控企業帶入了個全新的發展階段,逐漸擺脫過去的OEM
    的頭像 發表于 06-13 08:05 ?144次閱讀
    <b class='flag-5'>從</b>幕<b class='flag-5'>后到</b>臺前,<b class='flag-5'>從</b>智微工業的成長看國產工業品牌的<b class='flag-5'>發展</b>

    對基于 FPGA 的 AI 視覺應用進行基準測試

    和信號發生器與相機的幀時鐘不同步,預計延遲會發生變化。為了解釋這一點,請考慮下:我們以 30 fps 的幀速率使用 MIPI 相機,即幀之間有 33 毫秒。LED 關閉到開啟的轉換可以在 33ms
    發表于 02-02 10:26
    主站蜘蛛池模板: 久久精品免费看网站 | 伦理在线影院伦理电影 | 精品久久久无码21P发布 | 回复术士人生重启在线观看 | 亚洲欧美日韩国产另类电影 | 日本色高清 | 日本无码毛片久久久九色综合 | 青青草久久伊人 | 黑丝女仆恋上我 | 亚洲精品入口一区二区乱麻豆精品 | 成年黄网站免费大全毛片 | 伊人久久大香线蕉电影院 | 777久久人妻少妇嫩草AV | 国拍自产精品福利区 | 成人伊人青草久久综合网 | 人人插人人射 | 一二三四视频免费社区5 | 国产91综合 | 亚洲国产精品免费线观看视频 | 男人边吃奶边挵进去呻吟漫画 | 国产精品高清视亚洲一区二区 | 欧美AAAA片免费播放观看 | 樱花草在线观看影院 | 中文字幕午夜福利片 | 亚洲精品久久久久中文字幕二区 | 久久国产精品高清一区二区三区 | 花蝴蝶免费观看影视 | 久久午夜伦理 | 久久精品影视 | 99pao成人国产永久免费视频 | 九九视频在线观看视频6 | 久久精品无码成人国产毛 | 国产一区精选播放022 | 午夜无码片在线观看影院 | a亚洲在线观看不卡高清 | 同时和两老师双飞 | 天美传媒 免费观看 | bl肉yin荡受np各种play | 日本熟妇乱妇熟色A片蜜桃亚洲 | 草莓国产视频免费观看 | 国产传媒18精品A片在线观看 |