今天的報告分三個部分——人機交互的內涵外延、人機交互中知識問題、如何在交互中應用知識。從內涵的角度,人機交互是認知智能展現的窗口;人工智能技術改變世界的途徑,其中包括通過交互控制這種改變和提供人機互動的模態;人機交互是人工智能技術落地,改變我們生活和各種形態必要的而且是最重要的途徑。只有通過人和機器的交互,才能控制人工智能帶來技術上、生活上的各種變化,而避免人工智能“暴走”的風險。人工智能的外延角度,人機交互可以理解為落地的應用,最典型的是人機對話,如客服;其次有智能信息管理,例如語義信息查詢等,在這個數字經濟時代,信息智能管理或者是語義管理越來越重要;還有人機協同,比如輔助駕駛或者機器人助理,人們越來越感受到機器助理生活在你身邊。代表性的有SIRI。還會有各種APP給你做查詢、做規劃、做方案等。
知識相關問題可以分為兩個方面,一是常識性知識;一個是領域相關知識。常識性知識中包括知識認知問題和建模算法問題。從認知角度上講,做計算的利用知識,更多看到光明的一面。然而從社會學的角度有很多不同的聲音(不是誰對誰錯的問題)。
下面這張圖是多倫多大學Frank Rudzicz教授報告中的截圖。SIRI實際的反饋,被認為是AI倫理問題的例子。因為這些例子批評SIRI,我認為是不公平的,SIRI不可能回答這種問題。因為,系統沒有足夠的知識支持她回答這么深層語義的問題。
從算法的角度。大家都知道帶來這次人工智能春天的主要是基于統計學的機器學習算法。然而統計學有偏差。如下圖所示。
She is a doctor and he is a nurse這句話沒有問題。但是,其內容可能會影響系統輸出可信度,原因來自于訓練語料。這是法律專家認為人工智能有性別歧視問題給出的例子。第二個例子是關于四川料理是不是辣的問題。這樣的問題在機器對話中,往往叫做上下文不一致性問題。但是我認為這個是一個常識性問題。因為,不知道四川料理以辣為主的人,也會犯這樣的錯誤。
關于領域相關知識我想強調數據與知識庫構建兩個問題。現在是大數據時代,大數據的這一波熱潮興起在人工智能之前,包括移動互聯網帶來大數據時代,但是我們做知識相關實際項目時,它真的不見得是大數據,有時可能沒有大數據。給一個例子如下圖所示。
無法確定數據標注方法是最大的問題。
另一個問題是知識圖譜構建問題,其中包括如何構建、評價和更新知識圖譜,和誰去做知識圖譜構建這件事情。作為學術研究者,總覺得應該是企業懂業務的人構建知識圖譜。但是實際上行不通,企業業務專家的業務邏輯和我們想建的知識圖譜的邏輯不(完全)一致。因此,只有雙方坐下來反復、深入溝通,才可能完成。
知識應用有兩大方向——建模過程中融入知識和在系統框架中利用知識。
在建模中如何融入知識,包括知識表示、知識推理影射,以及多路徑融合和知識動態分析。這里介紹幾個我們課題組博士生的工作。論文列表如下:
舉一個例子,TransG模型。目前最通用的知識三元組表示方法是用向量關系表示實體關系,一個頭向量,一個尾向量,還有中間的關系向量。事實上,知識表達關系內涵特別豐富,例如,a part of這個關系,一個城市是一個國家的部分,一個椅子腿是桌子的部分.....用一個向量去表示是非常困難的。博士生所提出的混合高斯的方法可以比較好地解決這類問題。
另一個例子是2013年發表在SIGIR的工作,討論如何從動態變化的社交媒體內容上挖掘動態的、有時效性的知識。比如這是奧巴馬,隨著不同的時間在互聯網上尋找他相關的最熱的話題,對這個話題進行描述,展示相關內容。如下圖所示。最開始就是奧巴馬參加選舉,有各種各樣的話題。他連任時又有一些新的話題。這也是一個圖譜概念,把知識跟互聯網上的信息關聯起,不停獲取和更新知識。
在建模時融合知識的另一類工作是以生成模塊為背景的工作。如:
對生成語句的控制。“我非常餓”,在不同的情況下,可以給出不同的語句。這就是一種對機器的控制。我們希望機器人能被人控制的。對機器人的評價有“智能”和“智障”,有些用戶說“我寧愿機器智障,也不想讓他抽風”。因此,能夠控制機器的輸出,控制其語音行為、控制風險是非常重要的。
另一個工作是情緒化對話生成。控制機器表達的情緒,讓機器人可以更生動一些。也是通過控制機器的語言,進而控制其動作。另一個例子是個性化的對話生成。例如下圖,這個寶寶叫旺仔,是一個3歲、喜歡玩游戲和彈琴的男孩。這個工作生成的系統可以控制輸出內容,不僅僅是迎合用戶的問題,而是有自己的基本原則。
最后一部分是如何在系統架構中通過知識,迭代學習。還沒有很好的論文發表主要考慮如何將環境數據、語義理解和知識圖譜維護這三個環節聯合建模。
結論:知識是必須的,知識缺失的系統無法達成人類對智能系統的期待。知識是可用的,某種意義上已經能夠支持開放領域、特定領域多種信息服務。知識相關研究遠遠不夠,知識表示、知識融合、知識評估等有極大的發展空間。研究不是孤立的,知識的研究與多種信息處理技術息息相關。例如數據采集、語義計算、語義理解、推理等、等。簡而言之“任重道遠”。
-
人機交互
+關注
關注
12文章
1217瀏覽量
55469 -
人工智能
+關注
關注
1794文章
47622瀏覽量
239582
原文標題:CIIS2018演講實錄丨朱小燕:人機交互中知識問題
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論