近年來,人工智能技術(AI)一直是各行各業的討論焦點,與物聯網、分布式數據庫、5G、自然語言處理等等熱詞一同涌現在時代的浪潮前沿。然而,當各行各業關注于這些時代熱詞,探索研發新的AI場景時,卻常常忽視了最成熟也很重要的AI技術——知識圖譜。
或許你說不出知識圖譜的具體定義,但其實處于信息時代的我們早已離不開它。當你打開百度,搜索某個字怎么念,或者今年高考的高校錄取分數線,其結果的聯想就來自于知識圖譜的構建;當你打開淘寶或者今日頭條,其中按照你的興趣愛好定制的個性化推薦內容,背后也是知識圖譜在發揮作用……
而現在,互聯網巨頭們重新認識到在數據之上的知識的重要,紛紛在知識圖譜上暗暗較勁。
在百度新春內部演講中,李彥宏說,“知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智能當中非常基礎的構件,也是我們相對于其他任何一家公司的優勢所在。”在AI World 世界人工智能大會上,百度副總裁、AI技術平臺體系(AIG)總負責人王海峰也避開萬眾矚目的眾多熱詞,將重心聚焦于知識圖譜上。
除了百度,谷歌、阿里、華為等玩家也在積極部署知識圖譜。谷歌將語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬件產品均接入谷歌知識圖譜,以構建更大的知識網絡,阿里也利用自己的電商優勢捕獲海量數據形成更有效的用戶畫像并入自己的知識網絡,并聯合清華大學、中科院等機構組建高級知識圖譜研究團隊……
那究竟知識圖譜是什么?它又與人工智能有著怎樣的聯系呢?
中文知識圖譜(Chinese Knowledge Graph) ,最早起源于Google Knowledge Graph。Knowledge Graph是在2012年由谷歌提出的,用于增強其搜索引擎功能的知識庫。
知識圖譜本質上是一種語義網絡。其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關系。知識圖譜是一種結構化的語義知識庫,其基本組成單位是“實體-關系-實體”的三元組,以及實體及其相關屬性-值對,通過實體間的關系構成網狀的知識結構,每一個節點均為實體,實體具有屬性-值對,同時實體與實體之間通過關系相互連接,構成一個特定領域的知識網絡。
簡而言之,知識圖譜就是通過不同知識的關聯性而形成的網狀的知識結構。形成知識圖譜的過程實際上就是加工信息、建立認知、理解所應用的領域的過程。人類證實因為有了獲取知識、形成知識的能力才可以不斷進步;同樣,知識是人工智能的基石,知識圖譜對于人工智能的價值也正是在于它可以讓機器具備認知能力。
另外,知識對于AI的價值,王海峰的總結是,兩者結合可以正循環:“有了知識的人工智能會變得更強大,可以做更多的事情。反過來,因為更強大的人工智能,可以幫我們更好地從客觀世界中去挖掘、獲取和沉淀知識,這些知識和人工智能系統形成正循環,兩者共同進步。”
更具體而言,知識圖譜可以說是AI應用行業的先決條件。目前,人工智能已受到各行各業的關注,不只是BAT在戰略投資人工智能,金融、汽車、零售、娛樂、制造等等行業都在積極擁抱人工智能技術。然而,人工智能要在行業中得到應用,首先必須要對行業建立起認知,只有真正理解了行業和場景,才能實現智能化。也就是說,只有建立了行業知識圖譜,才能給出行業AI方案。
例如在金融行業。眾所周知,金融是百度最先商用的AI場景,正如李彥宏曾說:“金融的數據化本質,加上業務規則清晰,使它成為人工智能最佳的應用場景。”金融的知識相對垂直,因此也非常適合與知識圖譜技術結合。在五年前,百度就已將知識圖譜應用在股票領域,旗下產品股市通通過數據、信息與股票的關系,以及股票與股票之間的關系,在股票領域首創知識圖譜,實現智能選股。不只是百度金融(現度小滿)在應用知識圖譜,整個金融行業都在將知識圖譜應用在個人征信、貸款風控、保險銷售、保險策劃、金融指數、反欺詐、客戶管理管理、智能客服等領域,出現了不少提供金融AI技術或者是金融知識圖譜服務的創業公司,百度金融(現度小滿)也一直在積極地推進智能金融科技的開放,包括金融知識圖譜的開放。
除了金融領域,咨詢也是知識圖譜應用的典型場景。
隨著內容創作進入自媒體時代,目前內容分發信息流日益流行,而信息流的基礎就是個性化推薦技術。要做好個性化推薦技術只需做好兩點:一個是理解用戶的閱讀興趣;另一個是理解資訊內容。然而兩點要做到都不容易,理解用戶的前提是足夠多的用戶興趣數據,理解內容的前提則是知識圖譜,平臺必須要有一定的“認知”才知道不同內容意味著什么,適合哪些興趣的用戶,而不是簡單的關鍵詞匹配。
舉個例子,一個文章內容是馬云最新演講解讀,是將其推薦給電商行業人士,還是希望獲得成功的年輕人,還是李彥宏等企業家們?每個人都可能感興趣,如何推薦就要結合對內容的認知,以及對用戶興趣以及當前場景的理解,這時知識圖譜就派上用場了。特別是在視頻領域,要理解內容不是靠文字識別,而是要靠機器視覺技術,對內容本身的理解難度更高,知識圖譜在這時則顯得更為重要。
現在,今日頭條、百度、一點資訊、搜狐、網易、企鵝、UC、微博等等都在做信息流。百度世界大會上宣布百度信息流月活超過6億,相比去年5月剛推出時日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個成果,與知識圖譜的優勢密不可分。
王海峰在演講中也指出,“人工智能與傳統產業融合的過程中,要想為這個行業提供更好的服務,就需要對這個行業進行定制化,要有行業知識,這時候就需要在通用知識圖譜的基礎上,有相應的行業知識圖譜,進而幫助這個行業提升生產力,幫助這些行業、產業升級。”
從王海峰的邏輯,我們窺見一條未來人工智能走向應用的必經之路:
機器通過人工智能技術與用戶的互動,從中獲取數據、優化算法,更重要的是構建和完善知識圖譜,認知和理解世界,進而服務于這個世界,讓人類的生活更加美好。
-
人工智能
+關注
關注
1792文章
47444瀏覽量
239028 -
自然語言處理
+關注
關注
1文章
619瀏覽量
13592 -
知識圖譜
+關注
關注
2文章
132瀏覽量
7717
發布評論請先 登錄
相關推薦
評論