2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將于9月21日-22日在青島膠州召開。加拿大滑鐵盧大學教授Shai Ben-David將出席大會并發表演講。
Shai Ben-David教授的研究興趣涉及計算機科學及其應用基礎理論,特別是在統計和機器學習方面有很多的研究。他一直在探索如何為一些十分流行的機器學習和數據挖掘范式提供理論基礎,用數學公式加深我們對這個世界的理解。
機器學習的可學習性如何判定?
在業界,近些年來機器學習在人機對弈、語音識別、圖像識別等場景下取得了蓬勃發展,引發了人們對人工智能改造未來社會的無限熱情和期待。但在學界,卻有不少科學家指出了機器學習的發展局限。而Shai Ben-David探索的就是這樣一個機器學習的本質問題:我們能不能判定人工智能的可學習性?
長久以來,我們一直認為只要給定了對學習任務的一個精準的描述,我們就可以去判定一個機器學習算法能否進行學習并執行這個任務。但Shai Ben-David通過研究給出一個驚人的答案:不一定!這項成果近期被發表了Nature Machine Intelligence一刊上。
他指出,如果一個問題只需要“是”或“否”的回答,我們還是可以確切地知道這個問題可否被機器學習算法解決。但是,一旦涉及到更一般的設置時,我們就無法區分可學習和不可學習的任務了。
存在無法用數學來證明或反駁的機器學習問題
在機器學習中,對于面部識別或推薦引擎等非線性可判斷問題,在定義機器學習的可學習性時,我們通常是要求這個機器學習模型是一族函數中的預測性能最佳的。于是,我們一般會通過維度分析的方式來解釋一個模型的可學習性。而在這項研究中,Shai Ben-David等人設計了一個機器學習問題EMX(Estimating the Maximum)。
舉個實際的例子來說,你希望在網站上投放廣告,并最大限度地讓這些廣告有更大目標觀眾數量。你有向面向不同的年齡段的用戶的不同的宣傳廣告,但你不知道誰會訪問這個網站,也不知道年齡分布。你如何選擇一組廣告,最大限度地增加你的目標觀眾數量?這就是一個現實的EMX問題。
在他的工作中,結果表明,EMX問題的解等價于連續統假設,即只有在連續統假設成立的情況下,EMX問題才是可解決的。這意味著,“人工智能是否具有可學習性?”這個問題的答案和連續統假設一樣不可知。
但進一步研究發現,產生這一結論的根源在于將可學習性定義為學習函數的存在性,而不是學習算法的存在性。與算法的存在相比,函數在無限域上的存在是一個微妙的問題。他的工作表明,當涉及到更一般的學習類型時,這種關于可學習性的集合論觀點代價很高。
結語
對于目前深度學習技術得到廣泛應用的狀況,Shai Ben-David教授也提出了自己的看法:“我們必須謹慎行事,現在有一種大趨勢,人們只關注于應用一個成功的工具,但是很少有人去關注為什么它會成功以及沒有理論保證它們會繼續取得成功。”
-
人工智能
+關注
關注
1794文章
47642瀏覽量
239643 -
機器學習
+關注
關注
66文章
8438瀏覽量
132928
原文標題:CCAI 2019 | Shai Ben-David:人工智能的可學習性能否判定?
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論