色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個新任務:給定知識圖譜中的一條query path,生成對應的問題

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-10-10 10:29 ? 次閱讀

引言

EMNLP2020中,復旦大學數據智能與社會計算實驗室 (Fudan DISC) 提出了一篇基于事實的問題生成工作,論文題目為:PathQG: Neural Question Generation from Facts,被錄取為長文。

文章摘要

關于問題生成的當前研究通常將輸入文本作為序列直接編碼,而沒有明確建模其中的事實信息,這會導致生成的問題和文本不太相關或者信息量較少。在這篇論文中,我們考慮結合文本中的事實以幫助問題生成。我們基于輸入文本的事實信息構造了知識圖,并提出了一個新任務:給定知識圖中的一條query路徑生成問題。任務可以被分為兩個步驟,(1)對query表示的學習;(2)基于query的問題生成。我們首先將query表示學習定義為序列標記問題,以識別涉及的事實從而學習到一個query表示,之后使用基于RNN的生成器進行問題生成。我們以端到端的方式共同訓練這兩個模塊,并提出通過變分框架加強這兩個模塊之間的交互。我們基于SQuAD構造了實驗數據集,實驗結果表明我們的模型優于其他方法,并且當目標問題復雜時,性能提升更多。通過人工評估,也驗證了我們生成的問題的確和文本更相關且信息更豐富。

研究動機

本文關注基于文本的問題生成任務(Question Generation from Text):輸入一段文本,自動生成對應的問題。

當前端到端的問題生成研究,通常對輸入文本直接編碼并學習一個隱表示,而沒有對其中的語義信息進行明確建模,這會使得生成過程有較大不確定性,導致生成的問題包含和給定文本不相關的信息或者信息量較少,如下圖顯示,生成的問題Q2包含了不相關的信息“Everton Fc”,而Q1雖然正確但是缺少特定的信息描述,顯得比較簡略。

先對輸入文本中的事實(facts)進行建模可以減輕這些問題,并且針對文本中的多個事實,可以生成較為復雜(complex)的問題。我們通過對給定文本構建知識圖譜(Knowledge Graph,KG)來表示其中的事實,并提出一個新任務:給定知識圖譜中的一條query path來生成問題,其中query path是一條由多個事實三元組構成的序列,每個事實三元組包含兩個實體以及它們的關系。如上圖(b)顯示了一個KG以及其中的兩條query paths。

由于query path中并非所有事實都會在目標問題中被提及,我們首先需要學習一個query representation來表示query path中會被提及的事實信息,并基于此生成對應的問題,因此任務可以分成兩個步驟:(1)對query representation的學習;(2)基于query的問題生成。我們以端到端的方式共同訓練這兩個模塊,并提出通過變分框架加強這兩個模塊之間的交互。

我們使用了數據集SQuAD,并且為了驗證模型在復雜問題生成上的效果,基于SQuAD構造了一個復雜問題數據集,并分別進行了實驗。

模型

Path-based Question Generation

給定query path的問題生成任務包含兩個步驟,我們設計兩個模塊:Query Representation Learner和Query-based Question Generator分別進行任務中的兩個步驟。我們首先以端到端的框架PathQG共同訓練這兩個模塊,具體結構如下圖顯示。

1. Query Representation Learner

由于query path中的不同的實體和關系會對生成目標問題有不同的貢獻度,我們首先計算它們各自的貢獻權重,從而學到一個query representation來表示目標問題將涉及的事實信息。

貢獻權重計算:將query path看作是一條由實體和關系相間構成的序列,并將query path中各個成分的貢獻度計算看作是一個序列標記過程。并且對輸入文本進行編碼作為context,通過attention幫助序列標記的概率計算,最后將各個位置的sigmoid概率作為各自的貢獻權重。

Query表示學習:得到query path的各個成分的貢獻權重后,我們以加權的方式對query path編碼,學習到對應的query representationL??紤]到query path由實體和關系相間構成的特殊結構,我們使用循環跳躍網絡(recurrent skipping network, RSN)來對路徑序列進行編碼。

2. Query-based Question Generator

基于學到的query representationL,解碼生成對應的問題。將最后的query representation和context表示聯合作為解碼器的初始狀態,并分別對他們執行注意力機制,逐步生成問題。

Variational Path-based Question Generation

對query representation的學習可以看成是對query path的一個推斷過程,參考變分推斷的思想,我們將query representation的學習看作是推導query的先驗分布(prior query distribution),而基于query的問題生成是在計算目標問題的likelihood,我們又引入了一個額外的后驗query分布(posterior query distribution),通過將目標問題作為指導來幫助減少query representation學習的不確定性。并且通過訓練,使得query的先驗分布不斷靠近后驗分布,最終提升生成的問題質量。變分PathQG的結構如下圖。

實驗

我們在SQuAD數據集上進行了實驗,對每一條文本,通過場景圖解析器(scene garph parser)和詞性標注器(part-of-speech tagger)自動構建了知識圖譜,并且根據參考問題從知識圖譜中抽取出對應的query path。為了進一步驗證模型在復雜問題生成上的效果,我們還根據query path中事實三元組的個數從SQuAD中劃分了一個復雜問題數據集。在全數據集和復雜數據集上的實驗結果顯示我們的模型都優于其他模型。

除了自動評估,我們還通過Amazon Mechanical Turk (AMT)進行了人工評估,分別從問題的流利度、正確性(和給定文本和答案一致)、信息量對不同模型生成的問題進行了兩兩比較,結果顯示我們的模型也取得不錯效果。

我們還通過對不同模型生成的問題和給定文本之間的重疊率進行比較,來評估生成問題和給定文本的相關性。

最后還進行了一些案例分析,可以看出相對模型NQG+,我們生成的問題更加和文本相關和有信息量。在第一個樣例中,我們生成的問題包含有特定信息“plymouth”和“late 18th”而*NQG+沒有,而在第二個例子中NQG+*生成的問題包含不相關的“swazi economye”而我們生成的和給定文本更一致。

總結

這篇文章中,我們通過知識圖譜對文本中的事實建模用于問題生成,并提出一個新任務:給定知識圖譜中的一條query path,生成對應的問題。我們提出先學習一個query representation來表示問題中可能涉及的事實,再生成問題,將這兩個模塊聯合進行訓練并提出一個變分模型提升問題的生成。我們通過自動構建知識圖譜并抽取出對應的query path構建了我們的實驗數據集,結果驗證了我們模型的有效性。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼
    +關注

    關注

    6

    文章

    957

    瀏覽量

    54912
  • 生成器
    +關注

    關注

    7

    文章

    319

    瀏覽量

    21083
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24793

原文標題:【論文】PathQG: 基于事實的神經問題生成

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2025未來產業創新任務 | 清潔氫

    據悉,1月17日,工業和信息化部辦公廳發布《關于組織開展2025年未來產業創新任務揭榜掛帥工作的通知》(簡稱《通知》)?!锻ㄖ凤@示,揭榜任務內容面向量子科技、原子級制造、清潔氫3未來產業,布局
    的頭像 發表于 01-22 08:19 ?59次閱讀
    2025未來產業創<b class='flag-5'>新任務</b> | 清潔氫

    數據手冊些參數的數值有時畫一條橫線或者空著不填是什么意思?

    數據手冊些參數的數值有時畫一條橫線或者空著不填是什么意思? 如上表, tCS的最大值是15ns,最小值和典型值都是空著的,是不是最小值和典型值我可以隨便取(大于0小于15就行)?還是說只有最大值給出了,我只能取給出的最
    發表于 12-16 07:45

    三星自主研發知識圖譜技術,強化Galaxy AI用戶體驗與數據安全

    據外媒11月7日報道,三星電子全球AI中心總監Kim Dae-hyun近日透露,公司正致力于自主研發知識圖譜技術,旨在進步優化Galaxy AI的功能,提升其易用性,并加強用戶數據的隱私保護。
    的頭像 發表于 11-07 15:19 ?756次閱讀

    socket對應連接嗎

    在探討“socket對應連接”這命題時,我們首先需要明確socket的基本概念和它在網
    的頭像 發表于 08-16 10:55 ?558次閱讀

    請問LM311能準確的交截生成對應的PWM波形嗎?

    UC3825, TLV3501輸入正是100k的正弦波 輸入負是100kHz的鋸齒波 二者交截生成PWM波形 請問LM311能準確的交截生成對應的PWM波形嗎 之前使用UC3525里面自帶的比較器做的,LM311能達到這樣的速度嗎
    發表于 08-06 07:46

    革新未來智能版圖,神州數碼榮登IDC生成式AI圖譜

    的顯著位置,在GenAI應用行業板塊、GenAI平臺模型構建與編排板塊均榜上有名,標志著神州數碼不僅自身在生成式AI領域的技術創新和行業應用方面邁出了堅實的步,也為企業智能化轉型提供了一條
    的頭像 發表于 07-29 15:20 ?437次閱讀
    革新未來智能版圖,神州數碼榮登IDC<b class='flag-5'>生成</b>式AI<b class='flag-5'>圖譜</b>

    在No-OS SDK 1.4.0上,如何直接收UART0消息呢?

    我應該在 interupt 函數添加代碼還是在新任務添加代碼 誰能幫忙給出完整的可行例子?
    發表于 07-22 06:14

    三星電子將收購英國知識圖譜技術初創企業

    在人工智能技術日新月異的今天,三星電子公司再次展現了其前瞻性的戰略布局與技術創新實力。近日,三星正式宣布完成了對英國領先的人工智能(AI)與知識圖譜技術初創企業Oxford Semantic Technologies的收購,此舉標志著三星在提升設備端AI能力、深化個性化用戶體驗方面邁出了重要
    的頭像 發表于 07-18 14:46 ?564次閱讀

    遲滯比較器的輸出為一條直線的原因

    ,如果遲滯比較器的輸出為一條直線,這可能是由于多種原因造成的。 遲滯比較器的工作原理 在討論遲滯比較器輸出為一條直線的原因之前,我們首先需要了解其工作原理。遲滯比較器通常由運算放大
    的頭像 發表于 07-11 09:36 ?1007次閱讀

    知識圖譜與大模型之間的關系

    在人工智能的廣闊領域中,知識圖譜與大模型是兩至關重要的概念,它們各自擁有獨特的優勢和應用場景,同時又相互補充,共同推動著人工智能技術的發展。本文將從定義、特點、應用及相互關系等方面深入探討知識圖譜與大模型之間的關系。
    的頭像 發表于 07-10 11:39 ?1182次閱讀

    生成對抗網絡(GANs)的原理與應用案例

    生成對抗網絡(Generative Adversarial Networks,GANs)是種由蒙特利爾大學的Ian Goodfellow等人在2014年提出的深度學習算法。GANs通過構建兩
    的頭像 發表于 07-09 11:34 ?1253次閱讀

    如何手擼自有知識庫的RAG系統

    用于自然語言處理任務,如文本生成、問答系統等。 我們通過下幾個步驟來完成基于京東云官網文檔的RAG系統 數據收集 建立
    的頭像 發表于 06-17 14:59 ?643次閱讀

    請問UCOSIII如何切換到新任務?

    UCOS/III 是在PendSV中斷里切換任務的,最后BXLR(見紅色字體),LR是舊任務返回地址, 所以應該跳到舊任務繼續執行,為什么會跳轉到新任務了呢?希望高手能解惑。PendS
    發表于 05-09 06:35

    在使用spc5 stdio的時候生成對應的功能,main.c里面為什么沒有調用對應的接口?

    在使用spc5 stdio的時候生成對應的功能,main.c里面怎么沒有調用對應的接口; eg:這是怎么回事?
    發表于 03-26 07:00

    利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優于向量數據庫。知識圖譜提供更準確、多樣化、有趣、邏輯和致的信息,減少了LLM中出現幻覺的可能性。
    的頭像 發表于 02-22 14:13 ?1277次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index技術構建大模型驅動的RAG系統(下)
    主站蜘蛛池模板: 99久久夜色精品国产亚洲AV卜 | 一攻多受h嗯啊巨肉bl巨污 | 亚洲中文字幕一二三四区苍井空 | 亚洲伊人精品综合在合线 | 久久re6热在线视频精品66 | 午夜一区欧美二区高清三区 | 男人大臿蕉香蕉大视频 | 高h原耽肉汁动漫视频 | 人与禽交3d动漫羞羞动漫 | 九九热在线观看 | 儿子你得太大了慢点插 | 9277在线观看免费高清完整版 | 精品国产免费观看久久久 | 菠萝菠萝蜜在线观看视频 | 亚洲精品国产高清嫩草影院 | 国产成人综合95精品视频免费 | 国家产午夜精品无人区 | 男男免费看 | 老师你奶真大下面水真多 | 成片免费观看视频在线网 | 亚洲日本乱码中文论理在线电影 | 成人免费在线视频 | 琪琪色原网20岁以下热热色原网站 | 中文无码第3页不卡av | 色婷婷AV国产精品欧美毛片 | 甜性涩爱全集在线观看 | 且试天下芒果免费观看 | 人人啪日日观看在线 | 国内精品一级毛片免费看 | 香蕉免费高清完整 | 色中色论坛网站 | 国产福利高清在线视频 | 久久免费观看视频 | 久久www免费人成高清 | 男人到天堂a在538线 | 亚洲欧美强伦一区二区另类 | 中文字AV字幕在线观看 | 日本亚欧热亚洲乱色视频 | 日本妈妈在线观看中文字幕 | 伸进同桌奶罩里摸她胸作文 | 国产AV视频一区二区蜜桃 |