在人工智能發(fā)展的早期,研究人員意識(shí)到了能夠理解人類語音的含義和細(xì)微差別的機(jī)器的功能和可能性。對(duì)話和人類語言是計(jì)算機(jī)特別具有挑戰(zhàn)性的領(lǐng)域,因?yàn)閱卧~和交流不精確。人類語言充滿了細(xì)微差別,上下文,文化和社會(huì)深度以及不精確性,可能導(dǎo)致各種各樣的解釋。如果計(jì)算機(jī)可以理解我們談話時(shí)的意思,然后以一種我們可以理解的方式與我們交流,那么很顯然,我們已經(jīng)實(shí)現(xiàn)了人工智能的目標(biāo)。
對(duì)話互動(dòng)是AI的一種模式
AI的這種特殊應(yīng)用是如此深刻,以至于構(gòu)成了AI的七個(gè)基本模式之一:對(duì)話和人類交互模式。對(duì)話模式的基本目標(biāo)是使機(jī)器能夠以人類自然語言模式與人類進(jìn)行交流,并使機(jī)器能夠以他們所理解的語言與人類進(jìn)行交流。對(duì)話模式不要求人類遵循諸如打字,滑動(dòng),點(diǎn)擊或使用計(jì)算機(jī)編程語言之類的交互機(jī)器模式,而是可以以彼此交互的方式與機(jī)器交互:以我們的大腦已經(jīng)被理解的方式進(jìn)行寫作和交流。
當(dāng)今AI狹義應(yīng)用的許多情況都集中在人類交流上。如果計(jì)算機(jī)能夠理解人類在交流時(shí)的含義,那么我們可以創(chuàng)建各種具有實(shí)用價(jià)值的應(yīng)用程序,從聊天機(jī)器人和對(duì)話代理到可以讀取我們?cè)谖臋n和電子郵件中寫的內(nèi)容的系統(tǒng),甚至可以準(zhǔn)確地翻譯出一個(gè)人的系統(tǒng)。人類語言,而又不會(huì)失去意義和語境。
機(jī)器對(duì)人,機(jī)器對(duì)機(jī)器以及人對(duì)機(jī)器的交互都是AI如何交流和理解人類交流的例子。現(xiàn)實(shí)生活中的一些示例包括語音助手,內(nèi)容生成,聊天機(jī)器人,情緒分析,情緒分析和意圖分析,以及機(jī)器驅(qū)動(dòng)的翻譯。對(duì)話模式的應(yīng)用是如此廣泛,以至整個(gè)市場領(lǐng)域都專注于使用具有AI功能的對(duì)話系統(tǒng),從對(duì)話金融到遠(yuǎn)程醫(yī)療等等。除了簡單地理解書面或口頭語言外,AI對(duì)話模式的力量還可以通過機(jī)器理解情感,情緒和意圖的能力來體現(xiàn),或者通過視覺手勢(shì)將其轉(zhuǎn)換為機(jī)器可理解的形式。
自然語言處理:在過去的幾十年中不斷發(fā)展
準(zhǔn)確地處理和生成人類語言特別復(fù)雜,過去六十年來,技術(shù)不斷發(fā)展。解決問題的一種方法是將音頻波形轉(zhuǎn)換為機(jī)器可讀的文本,稱為自動(dòng)語音識(shí)別(ARS)。盡管ASR的實(shí)現(xiàn)有些復(fù)雜,但它通常不需要機(jī)器學(xué)習(xí)或AI功能,并且?guī)资陙硪呀?jīng)出現(xiàn)了一些相當(dāng)準(zhǔn)確的語音轉(zhuǎn)文本技術(shù)。語音轉(zhuǎn)文字不是自然語言的理解。當(dāng)計(jì)算機(jī)記錄人類在說什么時(shí),它會(huì)獲取它能理解的波形并將其轉(zhuǎn)換為文字。它不會(huì)解釋正在聽到的數(shù)據(jù)。
文本轉(zhuǎn)換為語音的逆向功能也不需要太多的機(jī)器學(xué)習(xí)或AI方式。文本到語音只是由計(jì)算機(jī)生成的波形,用以說出已知的單詞。僅使用文本到語音時(shí),對(duì)這些單詞的含義沒有任何了解。文字語音轉(zhuǎn)換技術(shù)已經(jīng)存在了很多年,您可以在電影《戰(zhàn)爭游戲》(1983年)中聽到:“您想玩游戲嗎?”
但是,即使機(jī)器學(xué)習(xí)已幫助文本轉(zhuǎn)語音變得更人性化,并且語音轉(zhuǎn)文本更準(zhǔn)確,語音轉(zhuǎn)文本和文本轉(zhuǎn)語音也不是需要AI和機(jī)器學(xué)習(xí)的地方。自然語言處理(NLP)不僅涉及波形的轉(zhuǎn)換和音頻波形的生成。僅僅因?yàn)槟形淖植⒉灰馕吨鴻C(jī)器可以理解它。為了獲得這種理解,機(jī)器需要能夠理解和生成詞性,提取和理解實(shí)體,確定單詞的含義以及使用更為復(fù)雜的處理活動(dòng)將概念,短語,概念和語法連接在一起,從而形成更大的畫面。意圖和意義。
自然語言處理包括兩個(gè)部分:自然語言理解和自然語言生成。自然語言理解是指計(jì)算機(jī)解釋諸如語音或文本之類的人類輸入并將其轉(zhuǎn)換為機(jī)器能夠以預(yù)期方式使用的東西。自然語言理解由許多子域組成,這些子域試圖從音頻波形生成的文本或人類在文本模式交互(例如聊天機(jī)器人或消息傳遞界面)中鍵入的文本中理解意圖。AI應(yīng)用于詞法分析,以理解語法規(guī)則并將句子分解為結(jié)構(gòu)性成分。不管使用哪種方法,大多數(shù)自然語言理解系統(tǒng)都共享一些公共組件。然后,一旦確定了組件,每件作品都可以在語義上理解為基于上下文和單詞順序來解釋單詞。進(jìn)一步的邏輯分析和推論可用于使用知識(shí)圖和其他推論含義的方法,基于各個(gè)部分所指的內(nèi)容來確定含義。
自然語言的生成是AI能夠以任何自然的方式聽起來不像是計(jì)算機(jī)制作的形式為人類準(zhǔn)備交流的過程。為了使計(jì)算機(jī)過程被視為自然語言的生成,計(jì)算機(jī)實(shí)際上必須解釋內(nèi)容并理解其內(nèi)容以進(jìn)行有效的交流。這涉及自然語言理解中確定的許多步驟的逆轉(zhuǎn),這些概念采用概念并通過機(jī)器如何理解人類的交流方式來產(chǎn)生人類可理解的對(duì)話。
為什么機(jī)器便利的對(duì)話如此重要?
歸結(jié)為人與計(jì)算機(jī)通信的模式時(shí),它受到了極大的關(guān)注,因?yàn)橛袝r(shí)我們與系統(tǒng)的交互可能非常困難。鍵入或滑動(dòng)可能會(huì)花費(fèi)一些時(shí)間,并且無法正確傳達(dá)我們的需求,而閱讀諸如FAQ之類的靜態(tài)內(nèi)容可能對(duì)大多數(shù)客戶沒有幫助。人們希望與機(jī)器進(jìn)行高效交互。許多用戶界面對(duì)于人機(jī)交互而言并不是最理想的,需要混亂的菜單交互,過于簡單的交互式語音響應(yīng)系統(tǒng)或無法滿足用戶需求的基于規(guī)則的聊天機(jī)器人。
更加智能的對(duì)話系統(tǒng)的開發(fā)可以追溯到幾十年前,而ELIZA聊天機(jī)器人最早于1966年開發(fā),說明了機(jī)器介導(dǎo)的對(duì)話的可能性。如今,用戶更加熟悉語音助手,例如Alexa,Google Assistant,Apple Siri,Microsoft Cortana和基于Web的聊天機(jī)器人。但是,如果您最近與他們中的任何一個(gè)進(jìn)行過互動(dòng),那么他們?nèi)匀蝗狈υS多重要方式的理解。毫無疑問,人工智能研究人員的許多工作將致力于改善機(jī)器能夠理解和生成人類語言的方式,從而增強(qiáng)那些利用人工智能對(duì)話模式的應(yīng)用程序的功能。
-
AI
+關(guān)注
關(guān)注
87文章
31429瀏覽量
269832 -
自然語言處理
+關(guān)注
關(guān)注
1文章
619瀏覽量
13611
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論