作者:cooldream2009?
我們構建知識圖譜的目的,在于利用知識圖譜來做一些事情。有效利用知識圖譜,就是要考慮知識圖譜的具備的能力,知識圖譜具有哪些能力呢,首先我們知道知識圖譜包含了海量的數據,是一個超級知識庫,所以我們可以依賴它進行搜索一些內容,由于知識圖譜的數據組織方式是計算機能理解的,具有語義,這種搜索可以定義為語義搜索。第二,對搜索進行延伸,搜索的結果可能會有很多,按照一定的規則排序,如果只取最可能的答案,就變成了問答系統,這也是知識圖譜的典型應用。第三,將知識圖譜與其它技術進行結合,可以充分利用知識圖譜的知識,比如將用戶的個性化特征與知識圖譜結合,能夠得到個性化推薦系統。第四,將知識圖譜的數據進行深度分析,按照一定的規則進行推斷,還可以得到輔助決策。
1 語義搜索
知識圖譜的概念,最早就是由谷歌提出,大家知道,谷歌是做搜索引擎的,它提出知識圖譜的概念,就是為了優化搜索。語義搜索作為一個概念,起源于常被稱為互聯網之父的Tim Berners-Lee 在2001 年《科學美國人》(Scientific American)上發表的一篇文章。其中,他解釋了語義搜索的本質。
語義搜索的本質是通過數學來擺脫當今搜索中使用的猜測和近似,并為詞語的含義以及它們如何關聯到我們在搜索引擎輸入框中所找的東西引進一種清晰的理解方式。
百科給出了更明確地定義,也更容易理解。
所謂語義搜索,是指搜索引擎的工作不再拘泥于用戶所輸入請求語句的字面本身,而是透過現象看本質,準確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進行搜索,從而更準確地向用戶返回最符合其需求的搜索結果。
舉例來說,我們用百度來搜索“現任美國總統的夫人”的圖片,搜出來的多數是美國總統特朗普的夫人,還有少量克林頓和奧巴馬夫人的圖片,說明搜索引擎理解了我們的搜索內容,給我們找到了我們想要的答案。少量前任總統夫人的結果,說明搜索技術還需要進一步完善,可以把這部分內容看作是噪聲,應該過濾掉的,隨著算法的改進,結果應該會更加準確。
語義搜索是知識圖譜最典型的應用,它首先將用戶輸入的問句進行解析,找出問句中的實體和關系,理解用戶問句的含義,然后在知識圖譜中匹配查詢語句,找出答案,最后通過一定的形式將結果呈現到用戶面前。
2 智能問答
智能問答,就是通過一問一答的形式,用戶和具有智能問答系統的機器之間進行交互,就像是兩個人進行問答一樣,具有智能問答系統的機器就像一個智者一樣,為用戶提供答案,友好的進行交談。
作為人工智能的一個重要應用案例,智能問答系統在很多場景中發揮作用。
比如原來很多的在線客服,正在部分的被智能問答系統取代,早些年銀行、電信等行業的在線客服,不同業務按不同的數字,在進入細分業務,繼續選不同的數字,一直要選很多次,有了智能問答,會簡化這些繁瑣的過程,直接根據用戶的問話,給出答案。當然,現在的智能問答,還不夠完善,只能部分取代在線客服,如果不能提供有效的答案,還是要由人工客服提供服務。還有一些智能問答機器人,也會提供一些簡單的服務,比如給孩子用的機器人,可以提供兒歌、算術、詩詞、語文、英語等方面的內容,代替了老師的一部分職能。還有一些聊天機器人,提供情景對話,就像一個人一樣,和用戶進行聊天。
同為智能問答,特點不同,依賴的知識圖譜技術也不同,聊天機器人,不僅提供情景對話,也能夠提供各行各業的知識,它依賴的知識圖譜是開放領域的知識圖譜,提供的知識非常寬泛,能夠為用戶提供日常知識,也能進行聊天式的對話。那些行業用的智能問答系統,依賴的是行業知識圖譜,知識集中在某個領域,專業知識豐富,能夠為用戶有針對性的提供專業領域知識。
智能問答,可以看作是語義搜索的延伸,語義搜索的結果會按照某種規則進行排序,依據一定的算法將最相關的排在前面,我們使用百度、谷歌搜索引擎進行搜索時,結果可能包括很多頁,就是語義搜索的常見形式。智能問答,屬于一問一答,只要一個答案,也就是將最相關的那個答案反饋給用戶,如果像聊天一樣,不斷地進行問答,回答不僅僅是在知識庫中搜索,還要考慮前面的聊天內容。
3 個性化推薦
個性化推薦是根據用戶的個性化特征,為用戶推薦感興趣的產品或內容。百度百科給出的定義是:
個性化推薦系統是互聯網和電子商務發展的產物,它是建立在海量數據挖掘基礎上的一種高級商務智能平臺,向顧客提供個性化的信息服務和決策支持。
我們上網的時候會經常查找一些我們感興趣的頁面或者產品,在瀏覽器上瀏覽過的痕跡會被系統記錄下來,放入我們的特征庫,比如對于電子商務網站來說,如果我們想購買筆記本,就會在電子商務網站上查看比較不同商家的筆記本,我們再次打開電子商務網站的時候,筆記本這個產品就會優先顯示在商品列表中,供我們選擇。再比如,瀏覽新聞,如果我們對體育類或者社會熱點很關注,新聞APP就會給我們推薦體育題材或者社會熱點的新聞。
個性化推薦系統通過收集用戶的興趣偏好、屬性,產品的分類、屬性、內容等,分析用戶之間的社會關系,用戶和產品的關聯關系,利用個性化算法,推斷出用戶的喜好和需求,從而為用戶推薦感興趣的產品或者內容。
4 輔助決策
輔助決策,就是利用知識圖譜的知識,對知識進行分析處理,通過一定規則的邏輯推理,得出對于某種結論,為用戶決斷提供支持。以下是百科給出的定義。
輔助決策系統,以決策主題為重心,以互聯網搜索技術、信息智能處理技術和自然語言處理技術為基礎,構建決策主題研究相關知識庫、政策分析模型庫和情報研究方法庫,建設并不斷完善輔助決策系統,為決策主題提供全方位、多層次的決策支持和知識服務。
隨著我國日益變為老齡化社會,養老問題成為人們關注的焦點,也成為研究的重要課題。對一個地區來說,應該采用什么樣的養老模式,配套設施應該如何建設,才能解決老人的養老問題。就需要對這個地區的老人、基礎設施、配套情況、周圍環境等建立知識庫,分析老人日常生活,發現問題,對數據進行匯總,根據已有事實得出結論,為政府制定政策提供決策支持。這里面最基礎的問題是建立所有數據的知識圖譜以及有效的推理規則,最后才能得出有意義的結論。
知識圖譜知識點:
一、知識圖譜概論
1.1知識圖譜的起源和歷史
1.2知識圖譜的發展史——從框架、本體論、語義網、鏈接數據到知識圖譜
1.3知識圖譜的本質和價值
1.4知識圖譜VS傳統知識庫VS關系數據庫
1.5經典的知識圖譜
1.5.1經典的CYC, WordNnet, WikiData, DBpedia, YAGO, NELL等知識庫
1.5.2行業知識圖譜:
Google知識圖譜,微軟實體圖,阿里知識圖譜,醫學知識圖譜,基因知識圖譜等知識圖譜項目
二、知識圖譜應用
2.1知識圖譜應用場景
2.2知識圖譜應用簡介
2.2.1知識圖譜在數字圖書館上的應用
2.2.2知識圖譜在國防、情報、公安上的應用
2.2.3知識圖譜在金融上的應用
2.2.4知識圖譜在電子商務中的應用
2.2.5知識圖譜在農業、醫學、法律等領域的應用
2.2.6知識圖譜在制造行業的應用
2.2.7知識圖譜在大數據融合中的應用
2.2.8知識圖譜在人機交互(智能問答)中的應用
三、知識表示與知識建模
3.1知識表示概念
3.2 知識表示方法
a.語義網絡 b.產生式規則 c.框架系統 d.描述邏輯 e.本體 f.RDF和RDFS
g.OWL和OWL2 Fragmentsh.SPARQL查詢語言
i.Json-LD、RDFa、HTML5 MicroData等新型知識表示
3.3典型知識庫項目的知識表示
3.4知識建模方法學
3.5知識表示和知識建模實踐
1.三國演義知識圖譜的表示和建模實踐案例
2.學術知識圖譜等
四、知識抽取與挖掘
4.1知識抽取基本問題
a.實體識別 b.關系抽取 c.事件抽取
4.2數據采集和獲取
4.3面向結構化數據的知識抽取
a.D2RQb.R2RML
4.4面向半結構化數據的知識抽取
a.基于正則表達式的方法b.基于包裝器的方法
4.5.面向非結構化數據的知識抽取
a.實體識別技術(基于規則、機器學習、深度學習、半監督學習、預訓練等方法)
b.關系抽取技術(基于模板、監督、遠程監督、深度學習等方法)
c.事件抽取技術(基于規則、深度學習、強化學習等方法)
4.6.知識挖掘
a.實體消歧b.實體鏈接c.類型推斷 d.知識表示學習
4.7知識抽取上機實踐
A.面向半結構化數據的三國演義知識抽取
B.面向文本的三國演義知識抽取
C.人物關系抽取
五、知識融合
5.1知識融合背景
5.2知識異構原因分析
5.3知識融合解決方案分析
5.4.本體對齊基本流程和常用方法
a.基于文本的匹配 b.基于圖結構的匹配 c.基于外部知識庫的匹配
e.不平衡本體匹配 d.跨語言本體匹配f.弱信息本體匹配
5.5實體匹配基本流程和常用方法
a.基于相似度的實例匹配b.基于規則或推理的實體匹配
c.基于機器學習的實例匹配 d.大規模知識圖譜的實例匹配
(1)基于分塊的實例匹配
(2)無需分塊的實例匹配
(3)大規模實例匹配的分布式處理
5.6 知識融合上機實踐
1.百科知識融合
2.OAEI知識融合任務
六、存儲與檢索
6.1.知識圖譜的存儲與檢索概述
6.2.知識圖譜的存儲
a.基于表結構的存儲b.基于圖結構的存儲
6.3.知識圖譜的檢索
a.關系數據庫查詢:SQL語言b數據庫查詢:SPARQL語言
6.4.上機實踐案例:利用GraphDB完成知識圖譜的存儲與檢索
七、知識推理
7.1.知識圖譜中的推理技術概述
7.2.歸納推理:學習推理規則
a.歸納邏輯程設計?b.關聯規則挖掘c.路徑排序算法
上機實踐案例:利用AMIE+算法完成Freebase數據上的關聯規則挖掘
7.3.演繹推理:推理具體事實
?a.馬爾可夫邏輯網 b.概率軟邏輯
7.4.基于分布式表示的推理
a.TransE模型及其變種b.RESCAL模型及其變種
c.(深度)神經網絡模型介紹d.表示學習模型訓練
7.5.上機實踐案例:利用分布式知識表示技術完成Freebase上的鏈接預測
八、語義搜索
8.1.語義搜索概述
8.2.搜索關鍵技術
a.索引技術:倒排索引
b.排序算法:BM25及其擴展
8.3.知識圖譜搜索
a.實體搜索
b.關聯搜索
8.4.知識可視化a.摘要技術
8.5.上機實踐案例:SPARQL搜索
九、知識問答
9.1.知識問答概述
9.2.知識問答基本流程
9.3.相關測試集:QALD、WebQuestions等
9.4.知識問答關鍵技術
a.基于模板的方法
b.語義解析
c.基于深度學習的方法
9.5.上機實踐案例:DeepQA、TemplateQA
審核編輯 黃昊宇
-
知識圖譜
+關注
關注
2文章
132瀏覽量
7725
發布評論請先 登錄
相關推薦
評論