基于MapReduce數(shù)據(jù)流相似性搜索并行算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
設(shè)計(jì)時(shí)間序列數(shù)據(jù)在Hadoop分布式文件系統(tǒng)(HDFS)中的有效存儲(chǔ)方式,利用分布式緩存工具Distributed Cache將各子序列分發(fā)到Hadoop集群的計(jì)算節(jié)點(diǎn)上,將動(dòng)態(tài)時(shí)間彎曲距離矩陣劃分成多個(gè)子矩陣,采取并行迭代計(jì)算每條反對(duì)角線上子矩陣的方法,基于MapReduce編程模型,實(shí)現(xiàn)高效并行計(jì)算時(shí)間序列動(dòng)態(tài)彎曲距離,通過改進(jìn)剪裁冗余計(jì)算方法,設(shè)計(jì)實(shí)現(xiàn)一種數(shù)據(jù)流多模式相似性搜索并行算法。中國(guó)雪深長(zhǎng)時(shí)間序列數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,當(dāng)每條時(shí)間序列的長(zhǎng)度達(dá)到5000以上時(shí),并行計(jì)算動(dòng)態(tài)彎曲距離所需時(shí)間少于串行計(jì)算所需時(shí)間,當(dāng)每條時(shí)間序列的長(zhǎng)度達(dá)到9000以上時(shí),參與計(jì)算的集群節(jié)點(diǎn)越多,并行計(jì)算所需時(shí)間越少;當(dāng)模式長(zhǎng)度達(dá)到4000、參與計(jì)算的集群節(jié)點(diǎn)數(shù)達(dá)5個(gè)以上時(shí),從數(shù)據(jù)流中并行搜索出與模式匹配的相似子序列所需時(shí)間約為串行搜索所需時(shí)間的20%。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于MapReduce數(shù)據(jù)流相似性搜索并行算法下載
相關(guān)電子資料下載
- 倍加福打造工業(yè)4.0解決方案 實(shí)現(xiàn)無縫數(shù)據(jù)流通 3786
- 比無縫漫游更高級(jí)的無感漫游,你聽說過嗎? 234
- 2024年春節(jié)通信行業(yè)網(wǎng)絡(luò)運(yùn)行安全穩(wěn)定,移動(dòng)數(shù)據(jù)流量與漫游業(yè)務(wù)大幅增長(zhǎng) 363
- 8-1多路復(fù)用器有哪些應(yīng)用場(chǎng)景呢 627
- 實(shí)時(shí)交換機(jī)與非實(shí)時(shí)交換機(jī)的區(qū)別是什么? 1703
- 傳輸控制協(xié)議TCP特點(diǎn)及三次握手過程 845
- 可重構(gòu)數(shù)據(jù)流計(jì)算引領(lǐng)架構(gòu)創(chuàng)新 639
- labview編寫程序的一般步驟 1191
- 《愛立信移動(dòng)市場(chǎng)報(bào)告》:5G強(qiáng)勁成長(zhǎng)-全球移動(dòng)數(shù)據(jù)流量在未來六年增長(zhǎng)三倍 512
- 傳輸層的主要功能是什么 1802