近幾年來,人工智能技術得到了飛速發展,其進展突出體現在以知識圖譜(Knowledge Graph)為代表的知識工程和以圖神經網絡(Graph Neural NetWorks, GNN)為代表的深度學習等相關領域。融合知識圖譜與圖神經網絡已然成為研究人員進一步完善知識圖譜學習與提升圖神經網絡模型推理能力的重要技術思路。
知識圖譜是以圖的形式表現客觀世界中的實體及其之間關系的知識庫,實體可以是真實世界中的物體或抽象的概念,關系則表示了實體間的聯系。因此,知識圖譜能夠以結構化的形式表示人類知識,通過知識表示和推理技術,可以給人工智能系統提供可處理的先驗知識,讓其具有與人類一樣的解決復雜任務的能力[1~3]。如何更好地構建、表示、補全、應用知識圖譜,已經成為認知和人工智能領域重要的研究方向之一。
圖 神 經 網 絡 的 概 念 最 早 于 2005 年 由 戈 里(Gori)等人[4] 提出,是一種專門用于處理圖結構數據的神經網絡模型。使用圖可以更準確和靈活地對現實應用中的數據建模,如在電子商務領域中的用戶 – 產品交互圖、化學領域的分子圖、醫藥領域的藥物副作用圖等。因此,研究者們設計了多種圖神經網絡模型,包括圖卷積網絡(Graph Convolu-tional Network,GCN)[5~7]、圖注意力網絡(Graph Attention Network,GAT)[8] 等。此外,由于異質圖具有更靈活的建模和融合信息的能力[9],研究者們還嘗試設計和應用基于異質圖的圖神經網絡模型[10~12]。如何設計更合理的圖神經網絡模型,使信息沿著圖結構更合理地傳播,從而提升模型對圖結構數據的擬合能力,是人工智能領域的一個熱點問題。
近年來,描述常識和事實的知識圖譜成為了學術界和工業界廣泛使用的知識表示方式,圖神經網絡在信息傳播、關系歸納偏置上也展現了優秀的性能[13]。考慮到知識圖譜本身恰好就是一種圖結構數據,因此采用圖構建知識和數據之間的關聯,同時應用圖神經網絡技術,有望結合知識和數據實現更好的可解釋和可信人工智能技術。一方面,利用圖神經網絡在學習節點、邊表示上的優勢,可以更好地學習知識圖譜的實體、關系的嵌入表示,改善關系抽取等任務,幫助構建知識圖譜,以及提高鏈接預測等任務,幫助補全知識圖譜 ;另一方面,利用圖神經網絡在信息傳播和推理上的優勢,可以更有效地在應用任務中引入知識圖譜中的信息,從而改善如文本挖掘、推薦系統、計算機視覺等領域中的應用效果,提供可解釋的模型。
本文將對知識圖譜與圖神經網絡模型相融合的方法及應用進行綜述。主要包括以下內容:
1 基于圖神經網絡的知識圖譜學習與計算
由于知識圖譜可以表征實體之間結構化的關系,如今已經成為認知和人工智能領域重要的研究方向。圖神經網絡利用深度神經網絡對圖數據中的拓撲結構信息和屬性特征信息進行整合,進而提供更精細的節點或子結構的特征表示,并能很方便地以解耦或端到端的方式與下游任務結合,巧妙地滿足了知識圖譜對學習實體、關系的屬性特征和結構特征的要求。本節主要從知識圖譜中的5個典型任務介紹基于圖神經網絡的知識圖譜學習方法。
知識圖譜表示學習
知識圖譜表示學習,即為知識圖譜中的實體和關系學習出一個低維度的向量表示,同時包含一些語義信息,從而得以在下游任務中更加方便地提取和利用知識圖譜中的信息,例如鏈接預測[10]、常識問答[1]等。通過應用圖神經網絡,在學習知識圖譜的表示時,每個實體都將利用到與其相關的其他實體中的信息,打破了彼此之間的孤立性,從而學得更完整更豐富的實體、關系表示。略
圖1 知識圖譜的表示學習方法
信息抽取
信息抽取是指從非結構化、半結構化文檔或句子中提取結構化信息的技術,與知識圖譜的構建有著密切的聯系,主要包括命名實體識別、實體消歧、關系抽取、指代消解等任務。近年來,已有許多研究將圖神經網絡應用于知識圖譜的關系抽取任務,而在其他任務上對圖神經網絡的探索還較少。通過圖神經網絡可以對句子內或句間詞與詞的關聯關系進行有效建模,從而更準確地捕捉實體間的關系。略
圖2 基于圖神經網絡的關系抽取
實體對齊
實體對齊是將從知識圖譜中學習到的描述同一目標的實體或概念進行合并,再將合并后的實體集與開放鏈接數據中抽取的實體進行合并,旨在融合多個知識圖譜形成一個更完整的知識圖譜。由于圖神經網絡具有識別同構子圖的能力[24],而可對齊的實體對周圍通常有相似的鄰居,即具有一定的同構特征,因此目前有許多研究者嘗試將圖神經網絡用于實體對齊。略
圖3 基于圖神經網絡的實體消歧方法GNED
鏈接預測
鏈接預測是用于預測知識圖譜中實體對之間所缺少關系的任務,具有廣泛的應用范圍,旨在解決知識圖譜不完整的問題。鏈接預測與知識圖譜表示學習有著不可分割的聯系,一方面表示學習通常需要用鏈接預測評價優劣[10, 15],另一方面鏈接預測的模型通常也會學得實體和關系的表示。許多工作利用圖神經網絡為實體引入鄰實體和對應關系的信息,學得更全面的實體表示,從而更準確地預測實體之間的鏈接關系。略
知識推理
與鏈接預測相似,知識推理是從給定的知識圖譜中推導出實體與實體之間的新關系,但知識推理所獲得的關系通常需要在知識圖譜中進行多跳的推理過程。知識推理是一些下游任務的重要支撐之一,如知識庫問答[1~3]。由于圖神經網絡在推理能力上的優勢[13],近年來被一些研究者嘗試用于知識推理任務。略
圖4 基于圖神經網絡的知識推理
2基于圖神經網絡的知識圖譜應用
描述常識和事實的知識圖譜是學術界和工業界廣泛使用的知識表示方式,采用圖構建知識和數據之間的關聯,是一種直接且有效的將知識和數據結合的方式。受益于圖神經網絡技術在信息傳播和推理上的優勢,知識圖譜中的先驗知識被有效地引入到應用任務中。
文本挖掘
知識圖譜由自然語言構建而來,因此與文本挖掘的聯系頗深。知識圖譜在大部分的文本挖掘任務中都有大量的應用,其中應用最廣泛的是知識庫問答任務。在文本分類、文本生成等任務中,知識圖譜也都扮演了非常重要的角色。略
圖5 融合知識圖譜的短文本分類方法HGAT
推薦系統
為了解決推薦系統中的稀疏性問題和冷啟動問題,一種可行的思路是將知識圖譜作為外部信息整合到推薦系統中,使推薦系統具有常識推理能力。研究者們基于圖神經網絡強大的聚合信息以及推理能力,設計了基于圖神經網絡和知識圖譜的推薦系統,有效地提升了推薦命中率。此外,圖神經網絡的信息傳播與推理能力也為推薦結構提供了一定的可解釋性。略
圖6 融合知識圖譜的推薦系統
計算機視覺
人類區別于現代計算機視覺算法的一個特征是獲得知識并使用該知識推理視覺世界的能力,從而可以通過很少的例子認知視覺世界[49]。研究者們考慮到圖神經網絡在學習節點和邊的表示方面的優勢,應用了圖神經網絡來學習利用圖像中的目標與知識圖譜之間的關聯關系。略
圖7 融合知識圖譜的圖像分類
3 總結與展望
結合知識圖譜和圖神經網絡的相關研究已經成為人工智能領域的一個熱點方向。知識圖譜可以為各類學習任務提供良好的先驗知識,圖神經網絡則可以更好地支持圖數據的學習任務。但是,目前基于圖神經網絡的知識圖譜學習、計算與應用的研究都還相對較少,未來仍有巨大的發展空間,例如基于圖神經網絡的知識圖譜自動構建、基于異質圖神經網絡的知識融合、基于元路徑或圖神經網絡的知識圖譜復雜推理、基于圖神經網絡的可解釋性學習等。
自動構建當前的知識圖譜高度依賴于人工構建,構建特定領域的知識圖譜又是企業應用里不可或缺的現實需求。在學習建模實體的時間信息和實體動力學方面,已有一些基于傳統深度學習的工作,但通常無法將知識圖譜作為一個整體對其動態性進行建模。因而,利用最近的一些動態圖神經網絡的方法例如圖時空網絡,同時建模并預測微觀層面上的實體以及宏觀層面上的圖譜的變化規律,是一個值得關注的方向。
融合知識采用圖構建知識和數據之間的關聯從而引入知識圖譜,是目前研究的一種主流思路之一。通常,真實數據中的交互關系有豐富的屬性特征(如用戶–商品交互圖中用戶和商品都帶有豐富的屬性特征),而知識圖譜則是關系特征豐富的,即相對更側重于結構性。此外,知識圖譜中的本體概念層包含大量的謂詞邏輯規則知識,如何設計更合適的圖神經網絡模型彌補這三者之間的語義鴻溝,從而更好地融合知識圖譜中的先驗知識,將是一個研究難點。一種直接的思路是利用異質圖神經網絡的方法,考慮節點的異質性和多模態性,從而用適合各類型的不同方式對不同的信息進行融合。
復雜推理由于基于嵌入的方法在復雜的邏輯推理上有局限性,因而可以進一步探討關系路徑和符號邏輯兩個方向。異質圖上的元路徑定義了高階的語義關系,而知識圖譜可看作一種特殊的異質圖,將基于異質圖神經網絡的消息傳遞與基于強化學習的路徑查找和約減相結合,是一種可行的處理復雜推理的思路。研究者們最近的工作將概率圖模型(如馬爾科夫網)與圖神經網絡相結合,旨在消息傳遞時發現并推理邏輯規則,而利用此類模型挖掘知識圖譜上的推理規則,也是一個值得注意的研究方向。
可解釋性深度學習的黑盒問題被人詬病已久,圖神經網絡的信息傳播機制相較傳統深度學習模型更具有可解釋性。知識圖譜提供了現實世界的事實知識,利用圖神經網絡模型尤其是概率圖神經網絡應用在知識圖譜中實現邏輯推理,從而顯式地生成基于知識圖譜的推理路徑,或許可以期待打開深度學習的黑盒。
-
神經網絡
+關注
關注
42文章
4772瀏覽量
100801 -
人工智能
+關注
關注
1791文章
47314瀏覽量
238614 -
知識圖譜
+關注
關注
2文章
132瀏覽量
7709
原文標題:【長文綜述】基于圖神經網絡的知識圖譜研究進展
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論