在認知智能領域,AI企業如何才能取得進一步的突破?科大訊飛高級副總裁、研究院院長胡國平在AI WORLD 2018峰會上分享了關于認知智能最新進展及下一步方向的思考:若想在認知智能上走得更遠,不能只停留在文字層面,更需要關注的是語言之下智慧本質。
計算智能、感知智能和認知智能,是探索人工智能道路上的三大臺階。
在計算智能方面,機器早已遠遠超過人類。而在感知智能方面,機器也已達到可媲美人類的水平。科大訊飛在語音識別錯誤率方面每年相對下降30%以上。在2018年CHiME-5國際多通道語音分離和識別大賽上,當面對更難、更復雜的語音識別任務時,科大訊飛依然獲得第一名。
基于深度網絡學習、語音合成、語義理解、圖像合成等技術,深耕語音識別19年的科大訊飛作為“中國智造”的影響力持續擴大。不僅認知智能國家重點實驗室已經在訊飛落戶,科大訊飛還在人工智能+腦科學等諸多領域展開了探索。
9月20日,AI WORLD 2018世界人工智能峰會重磅發布AI領域年度大獎——AI Era創新大獎,評選出2018年度對AI領域作出重大貢獻,切實推動AI進步和發展的人物、企業和產品。科大訊飛憑借領先世界的智能語音技術成功登榜「中國AI領軍企業TOP10」,科大訊飛創始人、董事長劉慶峰也被評選為「華人AI人物TOP10」。
中國AI領軍企業TOP10:阿里巴巴、騰訊、百度、華為、科大訊飛、字節跳動、螞蟻金服、京東、海康威視、小米
AI華人影響力TOP10:陳天石、胡郁、黃仁勛、李飛飛、劉慶峰、王海峰、王小川、吳恩達、顏水成、余凱
此外,本次峰會同時也頒發了「AI產品影響力TOP10」,訊飛翻譯機2.0成功入圍。目前,訊飛翻譯機2.0具備中文與33種語言即時互譯、離線翻譯、拍照翻譯、方言翻譯、以及全球上網等功能,英文翻譯水準達到大學六級水平。
AI產品影響力TOP10:寒武紀智能芯片MLU100、華為麒麟980、曠視Brain++、訊飛翻譯機2.0、百度Apollo3.0、阿里云ET城市大腦、英偉達Drive Xavier、百度大腦3.0、浪潮AI服務器、阿里量子計算云平臺
科大訊飛已經在感知智能以及認知智能領域中的自然語言處理技術上領先世界,科大訊飛高級副總裁、研究院院長胡國平在AI WORLD 2018世界人工智能峰會上說:“機器的自然語言理解能力已經超過人類的平均水平,這是認知智能重大的突破。”
然而當談到AI企業該如何徹底地邁上人工智能的最高臺階——認知智能時,胡國平表示:“在強調知識、推理能力的認知智能方面,機器與人類仍有差距。”自然語言處理技術的確是認知智能的重要技術基石,但即便是自然語言處理技術在特定領域已經超過人類,AI在認知智能層面依舊面臨艱巨挑戰。
現在多數產業在認知智能上面的做法大多停留在純文字層面,但語言只是人類智慧的載體和表層,如果只純粹在文字層面做認知智能,可能會有著極矮的天花板。胡國平針對這一問題在本次峰會上分享了認知智能下一步方向:若想在認知智能路上走得更遠,需要關注的是語言之下智慧本質。
下面就是科大訊飛高級副總裁、研究院院長胡國平在AI WORLD 2018世界人工智能峰會上的演講《認知智能最新進展及下一步思考》的主要內容:
胡國平:人工智能現在大家都習慣分為三個臺階,計算智能、感知智能和認知智能。計算智能方面,機器已經遠遠超過人類,而在感知智能方面,機器也可與人類媲美,而認知智能則強調知識、推理等相關的技能,要求能理解、會思考,這些方面機器與人之間依然存在差距。
全球首次通過國家執業醫師資格的機器人:自然語言理解能力強,分數趕超人類考生
關于感知智能,這里有兩個例子。首先是語音識別,大家都知道包括科大訊飛在內的很多公司都把語言識別做得非常厲害,在過去的六年里,語言識別每年錯誤率相對下降30%。換言之,大概識別率從2012年的85%左右一路飆升到現在的97-98%。
語音合成亦是如此,現在遠遠超過一般自然人的說話水平,今年1月份人工智能語音合成已經在中央電視臺《創新中國》節目上正式上崗應用:可以將已故播音員李易老師的聲音合成之后再現熒屏。
另外一方面,認知智能,涉及到語義理解、知識表達、聯想推理、智能問答、自主學習,大部分都認為認知智能是更難的任務,而且是至關重要的任務。未來十年最重要的任務、也是認知智能方面最典型的任務就是閱讀理解:目前機器的閱讀理解在精確匹配指標上已經超過人類的水平,機器的閱讀理解指標達到82.48,人類平均水平則是82.3,這也是認知智能重大的突破。
當機器具有閱讀能力后,科大訊飛訓練機器人閱讀醫學書籍,2017年,科大訊飛機器人“智醫助理”參加了中國真正的全國臨床執業醫師綜合筆試測試,并以456的高分輕松通過該考試,從而成為中國首臺通過此類考試的人工智能機器人。
此外,現在不僅認知智能國家重點實驗室已經在訊飛落戶,科大訊飛還在人工智能+腦科學等諸多領域展開了探索。
如何在認知智能路上走得更遠?不能只停留在純文字方面,更要重視語言之下的智慧本質
人工智能跟腦科學其實有非常多的結合地方,我下面要分享的內容則是關于認知智能下一步方向的思考。
先舉幾個例子,我們認為認知智能在現在的做法屬于純文字層面,甚至是把文字當做符號的層面。當我們看這樣一些例子,例如父愛如山,我們知道父愛如山是重的意思不是陡峭的意思。這里就存在著一個我們認為很重要的概念——語言的Grounding問題。
平頭哥,所有人知道云棲大會上發布的平頭哥,如果不了解這個詞匯肯定會去查,如果查到是這樣一段文字的描述,其實又叫蜜獾,你可能無法真正形成對這樣一個詞匯的真實理解或者大腦中的真實印象。于是乎,你需要一張圖片,甚至可能會去看一下它跟毒蛇搏斗的視頻,才能形成對平頭哥的概念、印象、知識。這個叫語言管理,你必須要有這樣的能力。Grounding之后才能理解這個世界,人類的智能基于多模態,不是能夠閉環自洽的,或者我們認為語言只是人類智慧的載體和表層,如果純粹在文字層面做認知智能,可能會有著極矮的天花板。
再舉一個例子,蘋果大還是雞蛋大?你絕對不會說想想蘋果10公分的長度,雞蛋5公分的長度,哦,蘋果比雞蛋大。其實你在腦袋中有一個蘋果的印象,有一個雞蛋的印象,直接問這兩個哪個大,自然而然基于多模態甚至物理的印象中直接能夠判斷出來。我們認為語言只是智能的表層和載體,更多的智能在語言之下,這是有關語言之下的智慧本質的一些思考。
認知智能的挑戰:難以像人類做到基于物體與時空感知的序列記憶和預測
生活在城市中的烏鴉為了吃到堅果,充分利用馬路上的汽車能夠把堅果碾碎以及紅綠燈會讓車停下來的知識,把堅果安全地吃到,在這樣一個觀察和運用,烏鴉實現了自己的智慧。沒有任何語言,通過觀察習得。我們認為語言之下智慧的本質還有一個通式,這個通式定義為對物體在三維空間加以時間坐標下序列的感知、記憶和預測的能力。在三維空間里,無論是人還是烏鴉,都在觀察過程中掌握了物體的移動或者變化的規律。
人類也是這樣一個學習的過程,在過程中實現了對物體、空間和時間的感知,并且把它融到一起,形成了智慧本質的通式的概念。無論是我們今天各位在座的也好,包括網上直播的網友也好,都在利用這種通式做很多的智能。
比如說一根火柴點燃之后,也許沒有書上寫出來這個火柴點燃之后會怎樣,但是所有人其實都很清楚,這根火柴點燃之后它燃燒的形狀,在你的腦中已經有了記憶。如果火柴點一根煙,煙會點著,這是你在記憶上掌握的知識。所有和環境的互動過程中就自然而然記下來了很多的智慧智能,而且我們這種智能在使用中或者預測的時候就有潛意識。
科技館有無源的自來水,一個空的水龍頭不停往下流水。所有小孩一開始都會很驚訝,他們在正常環境的訓練里已經認識到:水龍頭一定后面有根管子。這個概念其實也是整個記憶序列和預測中在實際人們工作生活中重復使用的概念。預測序列潛意識不自覺自動工作,這是人類智慧包括動物智慧很重要的一種模式。腦科學研究者認為,學習和記憶是大腦工作的基本機理。我們也認為,序列的預測和相應預測能力也是人類大腦工作很重要的模式。
未來展望:訓練AI機器的建模和預測能力,從而獲取智慧本質的通式
我們有一個猜想:最復雜的人類大腦本身的智慧也存在大道至簡的通式,多模態序列的記憶建模和預測的能力。這是有很大的可能性,雖然人類大腦中有很多能力或者功能包括多巴胺、邏輯思考等,但生活中很多的能力其實是靠多模態序列記憶和預測來實現知識的積累和智慧的應用。
我們也在想一件事情,如果讓我們的AI看了一億個比如車水馬龍道路的視頻之后,它到底能不能預測下一秒的路面會是什么樣?事實上,我并不清楚。這是驗證剛才所說的通式的比較理想的任務。我們希望這樣一個機器看了很多的視頻之后,在深度學習的方式下去做,這個任務的好處是什么?它解決了有監督訓練數據的問題,在所有的序列預測里面,它的答案一定程度上是在那里的,基于前面所有的路況去預測下一秒的路面情況的話,其實它的標注答案在那里,過了一秒之后答案還在那里。也許可以利用這次人工智能熱起來的深度學習端到端的模式,包括用抽象的能力去實現這樣一個任務上的建模和預測。
在未來科大訊飛希望用更有效的方法去訓練機器的建模和預測能力,探尋智慧的本質,從而獲取智慧本質的通式。例如,讓機器擁有路況的預測能力,把攝像頭換成駕駛員視角的高拍儀或者行車記錄儀,那么也許我們在無人駕駛或者很多其它場合下的應用上可以不止基于當前的路況來做預測,而是基于一秒鐘甚至更長時間之后路況進行準確預測,無人駕駛會因此變得更智能更安全。
當“Thanks”出現在演講屏幕的時候,其實你的序列預測能夠判斷出來我已經講完了,我會說謝謝,我會說下臺,序列預測中你們應該會鼓掌。
-
AI
+關注
關注
87文章
31490瀏覽量
269931 -
語音識別
+關注
關注
38文章
1742瀏覽量
112831 -
科大訊飛
+關注
關注
19文章
818瀏覽量
61434
原文標題:科大訊飛胡國平:如果AI企業的研發只停留在文字層面,可能會有著極矮的天花板
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論