近年來,隨著人們對 AI 認知能力的積極探索,知識圖譜因其表達能力強、拓展性好,基于知識進行推理等優(yōu)勢得到了學界與業(yè)界的高度關(guān)注。知識圖譜,旨在描述客觀世界概念、實體、事件及其之間關(guān)系,具備可解釋性,而且可以用于解決復雜決策問題。這也意味著通過深度學習與知識圖譜的結(jié)合,模型底層特征空間與人類自然語言之間巨大的語義鴻溝問題有望得以解決。在大數(shù)據(jù)和機器學習兩大引擎下,大規(guī)模知識圖譜的自動化構(gòu)建成為現(xiàn)實,這就加快了知識圖譜的落地與應(yīng)用。
傳統(tǒng)意義上,知識圖譜可以劃分為通用知識圖譜和領(lǐng)域知識圖譜。例如,國外的谷歌搜索引擎和國內(nèi)的百度搜索引擎,這類通用領(lǐng)域知識圖譜是最先被大家熟知的應(yīng)用;而場景的不斷豐富、需求不斷增多、用戶對體驗與品質(zhì)的要求不斷提高,各行各業(yè)都亟需構(gòu)建領(lǐng)域知識圖譜。
那么,從趨勢到實際需要,知識圖譜已經(jīng)取得了哪些學術(shù)與技術(shù)成果,產(chǎn)業(yè)與應(yīng)用發(fā)生了哪些變化?當下知識圖譜領(lǐng)域最關(guān)注的問題又是什么?未來,知識圖譜又有哪些發(fā)展前景?近日,AI科技大本營采訪到了東南大學教授、博士生導師,東南大學認知智能研究所所長漆桂林。
漆桂林認為,目前知識圖譜整個領(lǐng)域最關(guān)注的問題還是如何能夠高效、低成本構(gòu)建知識圖譜,而這個問題對于研究人員來說,仍是一個非常大的挑戰(zhàn),比如現(xiàn)在大家都在關(guān)注如何在少量甚至無標注場景下進行知識圖譜構(gòu)建。
從知識抽取到知識推理,大家在關(guān)注什么?
漆桂林表示,近兩年知識圖譜研究有一些值得關(guān)注的成果,比如:
知識抽取,如何在少量甚至無標注場景下進行知識圖譜構(gòu)建是一個具有挑戰(zhàn)性的問題。目前大家都在關(guān)注基于圖神經(jīng)網(wǎng)絡(luò)、增強學習、交互式知識抽取等方法。
知識融合,代表性工作有交互式知識融合以及基于表示學習的知識融合的工作。
知識更新,針對百科類知識圖譜的自動化更新技術(shù)取得了一些突破,從而可以對百科知識進行自動化更新。
知識推理,最近兩年有不少混合式推理的方法出現(xiàn),也就是混合機器學習和符號推理的方法,這些方法的提出對于解決某些機器學習技術(shù)的不可解釋性,以及提升知識圖譜的推理能力都有作用。
與此同時,這些關(guān)鍵技術(shù)的應(yīng)用也有一些突破性的進展,尤其是在知識抽取和知識融合方面:一是人機交互的商業(yè)化系統(tǒng)的出現(xiàn),二是關(guān)于人機交互的信息抽取和知識融合的學術(shù)論文也開始。
在他看來,知識圖譜表示學習與推理也取得了很多進展,大家開始研究知識表示學習在多模態(tài)數(shù)據(jù)上的應(yīng)用,即結(jié)合文本、知識圖譜、圖像或者視頻的知識表示學習,以及基于知識表示學習的推理。
從通用走向領(lǐng)域:廣泛復雜的場景
知識圖譜從以前研究與產(chǎn)業(yè)界脫鉤,到現(xiàn)在領(lǐng)域知識圖譜成為研究的重點,開始面向解決實際的問題。比如最近司法知識圖譜的構(gòu)建出現(xiàn)了不少研究成果。另外,知識圖譜用于解決問答、推薦系統(tǒng)、圖像理解方面的論文也不斷在增加。
同時,知識圖譜在不同行業(yè)也得到了廣泛應(yīng)用,領(lǐng)域知識圖譜成為企業(yè)的迫切需求。例如,金融領(lǐng)域中的信用評估、風險控制、反欺詐問題;醫(yī)療領(lǐng)域中的智能問診問題。從通用知識圖譜到領(lǐng)域知識圖譜,知識圖譜開始在越來越廣泛、復雜的場景中落地并解決實際問題。
“在醫(yī)療、電商、金融、軍工、電力、司法、教育、公安、石油這幾個領(lǐng)域知識圖譜已經(jīng)落地并且取得了突出成果。”漆桂林談到。知識圖譜可以幫助這些領(lǐng)域的公司或研究機構(gòu)更好地處理多源異構(gòu)數(shù)據(jù),也就是說可以提供一個統(tǒng)一數(shù)據(jù)模型并且可以靈活地集成和關(guān)聯(lián)這些數(shù)據(jù),對這些數(shù)據(jù)進行關(guān)聯(lián)分析。
知識圖譜產(chǎn)學研相輔相成
“知識圖譜的產(chǎn)學研需要有一個整體規(guī)劃,這也是我一直在實踐的。”漆桂林表示。
在他看來,首先需要了解產(chǎn)業(yè)界對知識圖譜的需求,知道知識圖譜可以解決什么應(yīng)用問題,帶來什么價值。
其次,通過了解知識圖譜落地的挑戰(zhàn),確定知識圖譜的研究課題。
從短期和長期來看,短期課題是要解決產(chǎn)業(yè)界急迫的問題,比如少量標注情況下的信息抽取方法的研究;而長期課題是面向三年之后可能對知識圖譜落地有用的技術(shù),比如無標注場景下的信息抽取技術(shù)。
最后,讓知識圖譜技術(shù)可以快速普及。為了進一步貫徹知識圖譜的產(chǎn)學研,漆桂林還聯(lián)合學界、工業(yè)界的專家共同成立了 OpenKG 聯(lián)盟。
漆桂林簡介
漆桂林,東南大學教授,博士生導師,東南大學認知智能研究所所長。現(xiàn)任中國中文信息學會語言與知識計算專業(yè)委員會副主任和中國科學技術(shù)情報學會知識組織專業(yè)委員會副主任。2006年,漆教授獲得英國貝爾法斯特女皇大學計算機博士學位,導師為人工智能界著名專家 Weiru Liu 教授。2006年8月至2009年8月在德國Karlsruhe大學AIFB研究所做博士后研究,導師為語義 Web 界國際知名專家Rudi Studer教授。
目前,漆桂林的研究方向為:知識圖譜的表示和推理、通用知識圖譜構(gòu)建、情感分析、智能問答、關(guān)系抽取、多模態(tài)圖像處理。
在知識圖譜的表示和推理,知識圖譜融合和更新,通用知識圖譜引擎構(gòu)建,以及高效、低成本構(gòu)建知識圖譜方面取得了一些成果,包括:
一套并行本體推理引擎和一套規(guī)則引擎,可高效處理千萬級別本體推理,并且支持本體和規(guī)則的混合式推理;
一個通用知識圖譜系統(tǒng),可針對百科數(shù)據(jù)進行抽取、融合、更新、推理,還可針對各種社交網(wǎng)站數(shù)據(jù)自動化構(gòu)建知識分類體系;
一個針對通用知識圖譜的問答引擎,可處理復雜問句的問答;
一套在少量標注情況下的知識抽取工具。
-
機器學習
+關(guān)注
關(guān)注
66文章
8427瀏覽量
132777 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8897瀏覽量
137542 -
知識圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
7717
原文標題:人工智能的浪潮中,知識圖譜何去何從?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論