資料介紹
隨著移動(dòng)互聯(lián)網(wǎng)的廣泛應(yīng)用,信息數(shù)量激增,用戶面臨信息過(guò)載問(wèn)題。受到移動(dòng)終端的屏幕大小和連接帶寬大小等限制,推送給用戶的新聞通常首先要做摘要處理。按照摘要產(chǎn)生方法的不同自動(dòng)摘要可以分為抽取式摘要(extractive)和理解式摘要(abstractive)。抽取式摘要直接從原文中抽取重要的句子作為摘要句,而理解式摘要?jiǎng)t通過(guò)對(duì)文章進(jìn)行句法、語(yǔ)義和篇章結(jié)構(gòu)的分析獲取文檔的意義,再通過(guò)自然語(yǔ)言生成得到滿足要求的摘要。
基于LDAl4J (Latent Dirichlet Allocation)的抽取式摘要是近期的研究熱點(diǎn)。Shafieic5]提出一種由詞、片段、主題、文檔四層結(jié)構(gòu)組成的Co-Clustering Model模型,該方法受限于摘要長(zhǎng)度,并不是所有從主題類中選出的句子都能作為摘要內(nèi)容,使得產(chǎn)生的摘要內(nèi)容代表性不強(qiáng)。Haghighi將句子、文檔和文檔集合統(tǒng)一納入到一個(gè)層次性LDA主題模型中,使用Gibbs抽樣獲得模型參數(shù),以KL-散度作為摘要評(píng)價(jià)模型選擇句子,使用貪心算法添加句子。Arora等使用LDA作為文檔的表示模型,提出了基于推論的、半生成性和全生成性的3種句子選擇形式。該方法僅僅通過(guò)計(jì)算句子的主題概率來(lái)選擇摘要句子,忽略了其他常用特征,使得選出的摘要質(zhì)量不高。
鑒于以上幾種方法的缺點(diǎn),本文提出一種基于LDA模型的句子主題特征,以句子作為處理單元,根據(jù)LDA模型中主題的概率分布和句子的概率分布計(jì)算文檔與句子的主題相似性,并融合句子在文檔中的位置和標(biāo)題相似性等基礎(chǔ)特征,形成組合特征共同評(píng)價(jià)句子的重要性,最后根據(jù)融合特征分值大小抽取句子生成摘要。
- 基于LSTM神經(jīng)網(wǎng)絡(luò)的評(píng)論句子依賴聯(lián)系分析 1次下載
- 融合內(nèi)容與多特征計(jì)算的個(gè)性化微博推薦模型 6次下載
- 一種用于釋義識(shí)別的句子相似度算法 8次下載
- 基于圖集成模型的自動(dòng)摘要生產(chǎn)方法 10次下載
- 基于雙向長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)的句子切分模型 14次下載
- 一種捕獲主題單詞信息的主題模型JEA-LDA 19次下載
- 基于主題模型和變分自編器的自適應(yīng)知識(shí)方法 5次下載
- 作者標(biāo)簽主題LAT模型在科技文獻(xiàn)中應(yīng)用 0次下載
- 基于LDA主題模型進(jìn)行數(shù)據(jù)源選擇方法 0次下載
- 基于ESCM的動(dòng)態(tài)主題情感混合模型 0次下載
- 一種融合圖像紋理結(jié)構(gòu)信息的LDA扣件檢測(cè)模型 0次下載
- 面向無(wú)指導(dǎo)情感分析的層次性生成模型 1次下載
- 基于概率主題模型的景點(diǎn)主題模型 3次下載
- 基于分層組合模式的句子組合模型 0次下載
- 一種基于主題模型的軟件缺陷預(yù)測(cè)技術(shù)研究 0次下載
- 機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程 524次閱讀
- lp模型的要素、組成部分及特征 1127次閱讀
- 通過(guò)強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 387次閱讀
- 任意模型都能蒸餾!華為諾亞提出異構(gòu)模型的知識(shí)蒸餾方法 1067次閱讀
- 基于LDA經(jīng)典的線性分類方法 872次閱讀
- 基于預(yù)訓(xùn)練模型和語(yǔ)言增強(qiáng)的零樣本視覺(jué)學(xué)習(xí) 585次閱讀
- 介紹幾篇EMNLP'22的語(yǔ)言模型訓(xùn)練方法優(yōu)化工作 1008次閱讀
- 如何通過(guò)多模態(tài)對(duì)比學(xué)習(xí)增強(qiáng)句子特征學(xué)習(xí) 1428次閱讀
- 腦機(jī)接口最新研究能將神經(jīng)信號(hào)直接映射為句子 3077次閱讀
- 無(wú)需翻譯的無(wú)監(jiān)督復(fù)述的新方法:允許從輸入句子生成多樣化、但語(yǔ)義上接近的句子 3492次閱讀
- 通過(guò)解碼大腦活動(dòng)提升語(yǔ)音的清晰度,使用深度學(xué)習(xí)方法直接從大腦信號(hào)中產(chǎn)生口語(yǔ)句子 3382次閱讀
- 機(jī)器學(xué)習(xí)的特征工程是將原始的輸入數(shù)據(jù)轉(zhuǎn)換成特征 4447次閱讀
- 用NLP技術(shù)分析了一位出名卻也具有爭(zhēng)議的嘻哈歌手——Drake創(chuàng)作的歌詞 4839次閱讀
- 深度學(xué)習(xí)模型介紹,Attention機(jī)制和其它改進(jìn) 1.8w次閱讀
- 機(jī)器學(xué)習(xí)特征選擇常用算法 8562次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
- 0.23 MB | 3次下載 | 免費(fèi)
- 8基于單片機(jī)的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論
查看更多