基于雙語LDA的跨語言文本相似度計算方法
大小:0.57 MB 人氣: 2017-11-21 需要積分:0
基于雙語主題模型思想分析雙語文本相似性,提出基于雙語LDA跨語言文本相似度計算方法。先利用雙語平行語料集訓練雙語LDA模型,再利用該模型預測新語料集主題分布,將新語料集的雙語文檔映射到同一個主題向量空間,結合主題分布使用余弦相似度方法計算新語料集雙語文檔的相似度,使用從類別間和類別內的主題分布離散度的角度改進的主題頻率逆文檔頻率方法計算特征主題權重。實驗表明,改進后的權重計算對于基于雙語LDA相似度算法的召回率有較大提高,算法對類別不受限且有較好的可靠性。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于雙語LDA的跨語言文本相似度計算方法下載
相關電子資料下載
- QCC5181QCC3086QCC3084QCC3083 USB Audio 96K/24bit LDAC 738
- QCC5181藍牙音頻發(fā)射LDAC APTX 549
- 華為5G移動核心網(wǎng)在GlobalData連續(xù)六年摘得桂冠 305
- 華為5G移動核心網(wǎng)在GlobalData連續(xù)六年排名第一 363
- QCC5181QCC3083QCC3084支持LDAC APTX LOSSLESS 3429
- 帶分區(qū)的大規(guī)模LDAP介紹 312
- 圖像相似度分析——相似度算法 1212
- SLDA副會長單位旭宇光電獲“國家知識產(chǎn)權示范企業(yè)” 786
- java 8的日期用法 285
- Java時間類轉換方案 326