數(shù)據(jù)流最初是通信領(lǐng)域使用的概念,代表傳輸中所使用的信息的數(shù)字編碼信號序列。然而,我們所提到的數(shù)據(jù)流概念與此不同。這個(gè)概念最初在1998年由Henzinger在文獻(xiàn)87中提出,他將數(shù)據(jù)流定義為“只能以事先規(guī)定好的順序被讀取一次的數(shù)據(jù)的一個(gè)序列”。
數(shù)據(jù)流應(yīng)用的產(chǎn)生的發(fā)展是以下兩個(gè)因素的結(jié)果:
細(xì)節(jié)數(shù)據(jù):
已經(jīng)能夠持續(xù)自動(dòng)產(chǎn)生大量的細(xì)節(jié)數(shù)據(jù)。這類數(shù)據(jù)最早出現(xiàn)于傳統(tǒng)的銀行和股票交易領(lǐng)域,后來則也出現(xiàn)在地質(zhì)測量、氣象、天文觀測等方面。尤其是互聯(lián)網(wǎng)(網(wǎng)絡(luò)流量監(jiān)控,點(diǎn)擊流)和無線通信網(wǎng)(通話記錄)的出現(xiàn),產(chǎn)生了大量的數(shù)據(jù)流類型的數(shù)據(jù)。我們注意到這類數(shù)據(jù)大都與地理信息有一定關(guān)聯(lián),這主要是因?yàn)榈乩硇畔⒌木S度較大,容易產(chǎn)生這類大量的細(xì)節(jié)數(shù)據(jù)。
復(fù)雜分析:
需要以近實(shí)時(shí)的方式對更新流進(jìn)行復(fù)雜分析。對以上領(lǐng)域的數(shù)據(jù)進(jìn)行復(fù)雜分析(如趨勢分析,預(yù)測)以前往往是(在數(shù)據(jù)倉庫中)脫機(jī)進(jìn)行的,然而一些新的應(yīng)用(尤其是在網(wǎng)絡(luò)安全和國家安全領(lǐng)域)對時(shí)間都非常敏感,如檢測互聯(lián)網(wǎng)上的極端事件、欺詐、入侵、異常,復(fù)雜人群監(jiān)控,趨勢監(jiān)控,探查性分析,和諧度分析等,都需要進(jìn)行聯(lián)機(jī)的分析。
在此之后,學(xué)術(shù)界基本認(rèn)可了這個(gè)定義,有的文章也在此基礎(chǔ)上對定義稍微進(jìn)行了修改。例如,S. Guha等認(rèn)為,數(shù)據(jù)流是“只能被讀取一次或少數(shù)幾次的點(diǎn)的有序序列”,這里放寬了前述定義中的“一遍”限制。
-
數(shù)據(jù)流
+關(guān)注
關(guān)注
0文章
121瀏覽量
14399
發(fā)布評論請先 登錄
相關(guān)推薦
評論