基于相似度過(guò)濾的大數(shù)據(jù)保序匹配與檢索算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
伴隨大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)快速保序匹配與檢索成為眾多大數(shù)據(jù)應(yīng)用急需解決的關(guān)鍵問(wèn)題,通過(guò)抽象與歸約等措施,數(shù)據(jù)對(duì)象可抽象為具有若干屬性的點(diǎn)集或序列,從而將數(shù)據(jù)匹配問(wèn)題轉(zhuǎn)化為字符或數(shù)字序列匹配問(wèn)題。提出一種基于相似度過(guò)濾的數(shù)據(jù)保序匹配與檢索算法,算法分三步:(l)數(shù)據(jù)轉(zhuǎn)換,基于幅值變化趨勢(shì)將原始序列轉(zhuǎn)換為二進(jìn)制,對(duì)序列中任何一個(gè)字符,通過(guò)判斷包括其前后鄰居在內(nèi)的三個(gè)點(diǎn)的關(guān)系定義二進(jìn)制序列,準(zhǔn)確反映相鄰三點(diǎn)之間的凸增長(zhǎng)(降低)或凹增長(zhǎng)(降低)關(guān)系;(2)數(shù)據(jù)歸約,為方便候選序列與模式序列之間的相似度計(jì)算,運(yùn)用基于幅度變化比例的數(shù)據(jù)歸約方法,將候選序列與模式序列均歸約到固定區(qū)間;(3)相似度計(jì)算,為區(qū)分不同趨勢(shì)的凸增長(zhǎng)(降低)或凹增長(zhǎng)(降低)幅度,通過(guò)計(jì)算候選序列與模式序列對(duì)應(yīng)點(diǎn)之間的差值絕對(duì)值之和作為相似度判斷依據(jù),提出基于相似度過(guò)濾的快速匹配方法,尋找與模式序列變化趨勢(shì)一致的子序列集合,并按照相似度大小排序。理論分析與實(shí)驗(yàn)結(jié)果表明:(1)該算法具有亞線性時(shí)間復(fù)雜度;(2)該算法能有效解決Chhabra等人算法對(duì)數(shù)據(jù)震蕩幅度失控的問(wèn)題,同時(shí)解決數(shù)據(jù)序列與模式序列分段規(guī)律但整體不相似的閘題;(3)解決了Chhabra等人算法中對(duì)匹配序列排序造成的匹配結(jié)果疏漏問(wèn)題。該方法不僅能更準(zhǔn)確、更多地匹配出變化趨勢(shì)一致的子字符串,同時(shí)將多個(gè)候選子串根據(jù)與模式之間的相似度進(jìn)行排序,為進(jìn)一步的數(shù)據(jù)精確檢索提供判斷依據(jù)。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于相似度過(guò)濾的大數(shù)據(jù)保序匹配與檢索算法下載
相關(guān)電子資料下載
- 數(shù)據(jù)分析工具有哪幾種模式 83
- 中交興路入選2024北京“數(shù)據(jù)要素×”典型案例集 886
- 中國(guó)鐵塔與海康威視達(dá)成戰(zhàn)略合作 217
- 熱濕交換器過(guò)濾器壓降測(cè)試儀上海程斯與XX醫(yī)療達(dá)成合作上門培訓(xùn) 84
- spark運(yùn)行的基本流程 91
- 季豐電子與孤波科技攜手合作為車規(guī)量產(chǎn)提供大數(shù)據(jù)支持 740
- 智慧園區(qū)綜合安防系統(tǒng)解決方案 83
- 大數(shù)據(jù)采集系統(tǒng)分為幾類 269
- 如何在數(shù)字化時(shí)代實(shí)現(xiàn)精益生產(chǎn)的創(chuàng)新發(fā)展? 117
- 控制閥氣開(kāi)氣關(guān)的選擇原則 171