微軟的研究人員正在給AI程序提供焦慮的粗略模擬,當(dāng)計(jì)算機(jī)學(xué)習(xí)駕駛虛擬世界時(shí),它會(huì)使用這些“恐懼”信號(hào)作為指導(dǎo):如果一個(gè)人會(huì)感到害怕,計(jì)算機(jī)也可能會(huì)冥想,“我做錯(cuò)了。”從而提升駕駛的安全性。
在迎合你的口味上,人工智能可能比你父母都了解你。我們可以完全信賴人工智能推薦的飯店、小說、電影。但當(dāng)涉及到人身財(cái)產(chǎn)安全的場(chǎng)景時(shí),人工智能就顯得沒那么值得信賴了。
人工智能就是一個(gè)冷冰冰的系統(tǒng),它沒有感情,不會(huì)高興、憤怒、悲傷或者恐懼。
機(jī)器有情緒,對(duì)人類有用嗎?
就目前人工智能完成的各項(xiàng)任務(wù)來看,似乎也不太需要AI產(chǎn)生什么感情?但如果我們把視線再往后移一點(diǎn),就會(huì)發(fā)現(xiàn)人類其實(shí)需要與這些機(jī)器建立情感聯(lián)系。并且可能在某些時(shí)候,會(huì)要求這些聯(lián)系是互惠和真實(shí)的,就像人與人之間發(fā)生的那樣。
在和人類產(chǎn)生交互的場(chǎng)景中,比如聊天機(jī)器人,可以通過屏幕上的眼睛傳遞情感,以及合成的語音來表達(dá)情緒。當(dāng)你表現(xiàn)的低落時(shí),它會(huì)安慰你;當(dāng)你表現(xiàn)的高興時(shí),它會(huì)激勵(lì)你,你會(huì)被它感染。尤其是當(dāng)被用來照顧人類的時(shí)候。你會(huì)覺得面對(duì)的不是一個(gè)冷冰冰的機(jī)器,而是能夠滿足內(nèi)心情感的一個(gè)對(duì)象。
但這并不意味著人工智能“具有情感”,只不過是人工智能應(yīng)用的產(chǎn)品經(jīng)理,按照社會(huì)工程學(xué)玩的一些小伎倆。換句話說,機(jī)器不一定是移情,它們只需要看似移情。
情緒有助于人們決定什么是重要的,并將復(fù)雜的信息整合到關(guān)鍵決策中。 因此,嘗試制造具有情感的機(jī)器人應(yīng)該是有用的。
從人類物種的優(yōu)勢(shì)來看,一些觀點(diǎn)認(rèn)為,如果人工智能系統(tǒng)有情感,他們就會(huì)富有同情心,也許會(huì)避免一些讓人擔(dān)心的事情發(fā)生,比如,自動(dòng)駕駛撞到人。
人自主神經(jīng)系統(tǒng)(ANS)由兩個(gè)分支組成。其中交感神經(jīng)系統(tǒng)(SNS)用于應(yīng)對(duì)潛在的危險(xiǎn)情況,會(huì)針對(duì)眼前的威脅會(huì)減少或繞過意識(shí)做出快速?zèng)Q策,保護(hù)自己免受危險(xiǎn)。
人類本能的會(huì)根據(jù)情緒做出不同的反應(yīng)。雖然這些預(yù)期反應(yīng)的主要作用是幫助人們做好行動(dòng)準(zhǔn)備,但同時(shí)也在我們對(duì)當(dāng)前處境做出評(píng)估的時(shí)候,發(fā)揮作用。
感官刺激、生理反應(yīng)和認(rèn)知評(píng)估的組合,形成影響人類學(xué)習(xí)、計(jì)劃和決策。例如當(dāng)我們心跳加速、手心出汗表示出內(nèi)心的“恐懼”時(shí),本能可能會(huì)希望采取行動(dòng),逃離當(dāng)前處境。此時(shí)如果要打斷這種逃避心理,就需要有明確目標(biāo)的外在動(dòng)機(jī)。
開車,是非常典型的依賴于本能和外在動(dòng)機(jī)并會(huì)出現(xiàn)重大的生理變化的例子。當(dāng)我們飆車的時(shí)候可能會(huì)處于一種高度覺醒的狀態(tài),比如在撞人之前會(huì)感受到極大的緊張從而開始迅速打輪避開。這種獎(jiǎng)勵(lì)機(jī)制,顯然要優(yōu)于基于“事后諸葛亮”形式的獎(jiǎng)勵(lì)機(jī)制。
學(xué)會(huì)恐懼吧,AI!
微軟的研究人員正在試圖教會(huì)計(jì)算機(jī)什么是“恐懼”。他們?cè)?a target="_blank">ICLR上發(fā)表了一篇論文,提出一種強(qiáng)化學(xué)習(xí)框架。該框架結(jié)合了用于實(shí)現(xiàn)特定任務(wù)目標(biāo)的獎(jiǎng)勵(lì)函數(shù),并且還最小化了與壓力相關(guān)的對(duì)環(huán)境的生理響應(yīng)的訓(xùn)練成本。
為了驗(yàn)證具有外在和內(nèi)在成分的這種獎(jiǎng)勵(lì)函數(shù)是否在強(qiáng)化學(xué)習(xí)環(huán)境中有用,他們?cè)隈{駛?cè)蝿?wù)中,訓(xùn)練了一個(gè)加入了真實(shí)人類生理反應(yīng)的模型。
在現(xiàn)實(shí)世界中應(yīng)用RL的主要挑戰(zhàn)包括需要大量的訓(xùn)練數(shù)據(jù)、以及相關(guān)的故障案例。例如,當(dāng)在自動(dòng)駕駛中使用RL時(shí),獎(jiǎng)勵(lì)通常是稀疏和傾斜的。不良行為可能導(dǎo)致災(zāi)難性的后果,并且恢復(fù)成本非常昂貴。
RL的大部分工作都是有任務(wù)或目標(biāo)依賴性的,而人類還會(huì)根據(jù)神經(jīng)系統(tǒng)的反應(yīng)做出決策。在強(qiáng)化學(xué)習(xí)智能體中加入這種機(jī)制,有助于降低樣本的復(fù)雜性。因?yàn)楠?jiǎng)勵(lì)可以持續(xù)獲得,并且在任務(wù)結(jié)束之前就可以發(fā)出成功或失敗的信號(hào)。這些生理反應(yīng)信號(hào)提供了警告機(jī)制,反過來又可以導(dǎo)致更安全的探索。
具體來說,就是考慮一個(gè)獎(jiǎng)勵(lì)函數(shù),包含兩個(gè)元素:外在動(dòng)機(jī)r,用來獎(jiǎng)勵(lì)特定任務(wù)的行為;內(nèi)在本能r?,用來預(yù)測(cè)人類對(duì)交感神經(jīng)系統(tǒng)的反饋,并獎(jiǎng)勵(lì)導(dǎo)致放松和減緩焦慮的行為。
為簡(jiǎn)單起見,本文中只考慮外在動(dòng)機(jī)和本能的獎(jiǎng)勵(lì)的線性組合。在形式上,考慮一個(gè)基于帶有獎(jiǎng)勵(lì)r的DQN的RL框架,然后使用一個(gè)r和r?的凸組合
公式如下:
其中λ是加權(quán)參數(shù),其提供了對(duì)任務(wù)完成(外在動(dòng)機(jī))和生理反應(yīng)(本能)的期望之間的權(quán)衡。
在凸幾何領(lǐng)域,凸組合(英語:convex combination)指點(diǎn)的線性組合,要求所有系數(shù)都非負(fù)且和為1。 此處的“點(diǎn)”可以是仿射空間中的任何點(diǎn),包括向量和標(biāo)量。
那么一個(gè)“會(huì)恐懼”的AI表現(xiàn)如何呢?
研究人員邀請(qǐng)了4位擁有7年駕齡的老司機(jī),2男2女,并在他們的手指上安裝探測(cè)機(jī),以記錄在駕駛模擬器中的脈搏振幅。并訓(xùn)練了五個(gè)模型,每個(gè)參與者對(duì)應(yīng)一個(gè)模型,另外一個(gè)統(tǒng)一面向全部參與者。
針對(duì)每種情況下,來自實(shí)驗(yàn)記錄的前75%的幀作為訓(xùn)練樣例,后25%作為測(cè)試數(shù)據(jù)。訓(xùn)練分組中的數(shù)據(jù)是隨機(jī)的,并且使用了一個(gè)擁有128個(gè)實(shí)例的batch。
獎(jiǎng)勵(lì)模型訓(xùn)練期間的損失是均方誤差。每個(gè)模型訓(xùn)練50個(gè)時(shí)期,之后所有模型的訓(xùn)練均方根誤差(RMSE)損失小于0.1。然后在獨(dú)立測(cè)試集上計(jì)算RMSE,對(duì)于所有參與者,RMSE在0.10和0.19之間。
隨機(jī)預(yù)測(cè)的測(cè)試損失平均為0.210。在所有情況下,CNN模型損失顯著低于隨機(jī)預(yù)測(cè)損失(基于未配對(duì)的T檢驗(yàn))。
根據(jù)Science報(bào)道,該實(shí)驗(yàn)仍然需要碰撞實(shí)驗(yàn)來驗(yàn)證模型的效果,但一個(gè)會(huì)恐懼的AI需要的碰撞數(shù)據(jù),要比無所畏懼的AI少1/4。聽起來不錯(cuò)。
人工智能是否有可能產(chǎn)生類似人類的情緒?
那么是否我們就可以認(rèn)為人工智能產(chǎn)生了像人類一樣,真正的恐懼呢?如果人工智能可以產(chǎn)生恐懼,那么是否可以產(chǎn)生其他情緒呢?
要回答這個(gè)問題,了解導(dǎo)致情緒和推理的原因非常重要。基本上情緒反應(yīng)可能是由我們的感官捕獲的外部刺激引起的,或者是內(nèi)部刺激引起的,這可能是體內(nèi)平衡(身體自動(dòng)調(diào)節(jié)系統(tǒng))的改變或由于我們自己的認(rèn)知。
處理刺激會(huì)在軀體狀態(tài)下產(chǎn)生非意識(shí)水平的變化,這被稱為情緒。如果情緒足夠強(qiáng)烈,那么就會(huì)進(jìn)行認(rèn)知,社交,語境和周圍相關(guān)的評(píng)估,我們稱之為體驗(yàn)情緒。
研究人類情緒的方法之一是研究人體內(nèi)發(fā)生的無意識(shí)和不可控的變化。由于神經(jīng)圖像和神經(jīng)技術(shù)的最新進(jìn)展,我們可以精確測(cè)量這些變化,然后進(jìn)行研究。
但這其中面臨的一些困難,例如反向推理問題(沒有與每種情緒相關(guān)的特定體細(xì)胞模式),主體間變異(沒有兩個(gè)大腦是相同的),以及主體間變異(一個(gè)人的大腦變化和進(jìn)化),導(dǎo)致我們還無法創(chuàng)建一種能夠復(fù)制人類情緒的算法。
當(dāng)前標(biāo)準(zhǔn)是使用校準(zhǔn)刺激來進(jìn)行研究,然后應(yīng)用機(jī)器學(xué)習(xí)算法搜索大腦活動(dòng)中測(cè)量的情緒反應(yīng)與EEG系統(tǒng)之間的相關(guān)性以及圖像的分類。隨后,計(jì)算機(jī)程序開發(fā)計(jì)算模型,用來表示特定人的大腦或神經(jīng)系統(tǒng)如何對(duì)特定刺激(圖像)作出反應(yīng),從而引發(fā)特定情緒。
測(cè)量人類情緒模式的最科學(xué)方法是采用腦電圖,而通過面部特征、皮膚電活動(dòng)和語音識(shí)別也是很好的輔助手段。
但計(jì)算模型不是人類的大腦的復(fù)刻,而且人類的情緒也取決于對(duì)外部世界和內(nèi)在自我的看法。人類通過感官獲得外部世界的感知,對(duì)內(nèi)心的感知?jiǎng)t依賴于體內(nèi)平衡,以及認(rèn)知。換句話說,計(jì)算機(jī)不會(huì)產(chǎn)生任何源于內(nèi)省的情緒,因此,很難感受到愛或嫉妒。
一個(gè)億Ray Kurzweil預(yù)測(cè)計(jì)算機(jī)將在2029年通過圖靈的測(cè)試,表現(xiàn)出與人類無法區(qū)分的智能行為,其中就包括展現(xiàn)出自我意識(shí)以及豐富的情感。
十年后,準(zhǔn)備迎接一個(gè)覺醒的人工智能吧!
-
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269911 -
人工智能
+關(guān)注
關(guān)注
1794文章
47642瀏覽量
239671 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13923瀏覽量
166831
原文標(biāo)題:ICLR論文:讓AI學(xué)會(huì)恐懼
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論