今天給大家分享的是是ACL 2022上與實體關系抽取相關的部門論文范讀筆記。其中有一些小喵自己也在學習,后續會推出精讀筆記。
1. DocRE
論文概括:具有自適應焦點損失和知識蒸餾的文檔級關系抽取
文檔級關系抽取要同時從多個句子中提取關系。針對這個任務,本文提出了一個半監督算法 DocRE。DocRE 共有三個新組件:
第一,用軸向注意力模塊學習實體對之間的依賴關系。
第二,提出了一個自適應的焦點損失來解決DocRE中類的不平衡問題。
最后,利用知識蒸餾來克服人工標注數據與遠程監督數據之間的差異。
現有問題:現存的方法關注實體對的句法特征,而忽略了實體對之間的交互作用;目前還沒有工作可以直接地解決類的不平衡問題。現存的工作僅僅關注閾值學習來平衡正例和負例,但正例內部的類不平衡問題并沒有得到解決;關于將遠程監督數據應用于DocRE任務的研究很少。
貢獻點:
軸向注意力:提升two-hop關系的推理能力;
自適應焦點損失:解決標簽分配不平衡的問題,長尾類在總的損失中占比較多;
知識蒸餾:克服標注數據和遠程監督數據之間的差異。
DocRE
2. PL-Marker
論文名稱:《Packed Levitated Marker for Entity and Relation Extraction》
論文鏈接:https://aclanthology.org/2022.acl-long.337.pdf
代碼地址:https://github.com/thunlp/PL-Marker
論文概括:打包懸浮標記用于實體和關系抽取
最近的命名實體識別和關系抽取工作專注于研究如何從預訓練模型中獲得更好的span表示。然而,許多工作忽略了span之間的相互關系。本文提出了一種基于懸浮標記的span表示方法,在編碼過程中通過特定策略打包標記來考慮span之間的相互關系。對于命名實體識別任務,提出了一種面向鄰居span的打包策略,以更好地建模實體邊界信息。對于關系抽取任務,設計了一種面向頭實體的打包策略,將每個頭實體以及可能的尾實體打包,以共同建模同頭實體的span對。
PL-Marker
3. CRL
論文名稱:《Consistent Representation Learning for Continual Relation Extraction》
論文鏈接:https://aclanthology.org/2022.findings-acl.268.pdf
代碼地址:https://github.com/thuiar/CRL
論文概括:一致表示學習用于連續關系抽取
通過對比學習和回放記憶時的知識蒸餾,提出一種新穎的一致性表示學習方法。使用基于記憶庫的監督對比學習來訓練每一個新的任務,以使模型高效學習特征表示。為了防止對老任務的遺忘,構造了記憶樣本的連續回放,同時讓模型保留在知識蒸餾中歷史任務之間的關系。
CRL
4. MCMN
論文名稱:《Pre-training to Match for Unified Low-shot Relation Extraction》
論文鏈接:https://aclanthology.org/2022.acl-long.397.pdf
代碼地址:https://github.com/fc-liu/MCMN
論文概括:預訓練用于匹配統一少樣本關系抽取
低樣本關系抽取旨在少樣本甚至零樣本場景下的關系抽取。由于低樣本關系抽取所包含任務形式多樣,傳統方法難以統一處理。本文針對這一問題,提出了一種統一的低樣本匹配網絡:
基于語義提示(prompt)范式,構造了從關系描述到句子實例的匹配網絡模型;
針對匹配網絡模型學習,設計了三元組-復述的預訓練方法,以增強模型對關系描述與實例之間語義匹配的泛化性。
在零樣本、小樣本以及帶負例的小樣本關系抽取評測基準上的實驗結果表明,該方法能有效提升低樣本場景下關系抽取的性能,并且具備了較好的任務自適應能力。
-
數據
+關注
關注
8文章
7048瀏覽量
89070 -
編碼
+關注
關注
6文章
944瀏覽量
54840 -
訓練模型
+關注
關注
1文章
36瀏覽量
3837
原文標題:4. MCMN
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論