Kylin教程之Apache Kylin權(quán)威指南的詳細(xì)教材免費(fèi)下載
資料介紹
Apache Kylin是Hadoop大數(shù)據(jù)平臺(tái)上的一個(gè)開源OLAP引擎。它采用多維立方體預(yù)計(jì)算技術(shù),可以將大數(shù)據(jù)的SQL查詢速度提升到亞秒級(jí)別。相對(duì)于之前的分鐘乃至小時(shí)級(jí)別的查詢速度,亞秒級(jí)別速度是百倍到千倍的提升,該引擎為超大規(guī)模數(shù)據(jù)集上的交互式大數(shù)據(jù)分析打開了大門。
Apache Kylin也是中國(guó)人主導(dǎo)的、唯一的Apache頂級(jí)開源項(xiàng)目,在開源社區(qū)有世界級(jí)的影響力。
今天,大數(shù)據(jù)領(lǐng)域的發(fā)展如火如荼,各種新技術(shù)層出不窮,整個(gè)生態(tài)欣欣向榮。作為大數(shù)據(jù)領(lǐng)域最重要的技術(shù)——Apache Hadoop,從誕生至今已有10周年。它最初只是致力于簡(jiǎn)單的分布式存儲(chǔ),然后在其之上實(shí)現(xiàn)大規(guī)模并行計(jì)算,到如今它已在實(shí)時(shí)分析、多維分析、交互式分析、機(jī)器學(xué)習(xí)甚至人工智能等方面都有著長(zhǎng)足的發(fā)展。
2013年年初,eBay內(nèi)部使用的傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)及商業(yè)智能平臺(tái)應(yīng)用碰到了瓶頸,即傳統(tǒng)的架構(gòu)只支持垂直擴(kuò)展,通過(guò)在一臺(tái)機(jī)器上增加CPU和內(nèi)存等資源來(lái)提升數(shù)據(jù)處理能力,相對(duì)于數(shù)據(jù)指數(shù)級(jí)的增長(zhǎng),單機(jī)擴(kuò)展很快就達(dá)到了極限。另一方面,Hadoop大數(shù)據(jù)平臺(tái)雖然能存儲(chǔ)和批量處理大規(guī)模數(shù)據(jù),但與BI平臺(tái)的連接技術(shù)依然不成熟,無(wú)法提供高效的交互式查詢。于是尋找更好的方案便成為了當(dāng)務(wù)之急。正好在2013年年中的時(shí)候eBay公司啟動(dòng)了一個(gè)大數(shù)據(jù)項(xiàng)目,其中的一塊內(nèi)容就是BI on Hadoop的預(yù)研。當(dāng)時(shí)eBay中國(guó)卓越中心組建了一支很小的團(tuán)隊(duì),他們?cè)诜治龊蜏y(cè)試了多種開源和商業(yè)解決方案之后,發(fā)現(xiàn)沒(méi)有一種方案能夠完全滿足當(dāng)時(shí)的需求,即在超大規(guī)模數(shù)據(jù)集上提供秒級(jí)的查詢性能,并能基于Hadoop與BI平臺(tái)無(wú)縫整合等。在研究了多種可能性之后,最終eBay 的Apache Kylin核心團(tuán)隊(duì)決定自己實(shí)現(xiàn)一套OLAP on Hadoop的解決方案,以彌補(bǔ)業(yè)界的這個(gè)空白。與此同時(shí),eBay公司也非常鼓勵(lì)開源各個(gè)項(xiàng)目,回饋社區(qū),eBay的Apache Kylin核心團(tuán)隊(duì)在向負(fù)責(zé)整個(gè)技術(shù)平臺(tái)的高級(jí)副總裁做匯報(bào)的時(shí)候,得到的一個(gè)反饋就是“要從第一天就做好開源的準(zhǔn)備”。
Kylin的使命是超高速的大數(shù)據(jù)OLAP(Online Analytical Processing),也就是要讓大數(shù)據(jù)分析像使用數(shù)據(jù)庫(kù)一樣簡(jiǎn)單迅速,用戶的查詢請(qǐng)求可以在秒內(nèi)返回,交互式數(shù)據(jù)分析將以前所未有的速度釋放大數(shù)據(jù)里潛藏的知識(shí)和信息,讓我們?cè)诿鎸?duì)未來(lái)的挑戰(zhàn)時(shí)占得先機(jī)。
為什么要使用Apache Kylin
自從10年前Hadoop誕生以來(lái),大數(shù)據(jù)的存儲(chǔ)和批處理問(wèn)題均得到了妥善解決,而如何高速地分析數(shù)據(jù)也就成為了下一個(gè)挑戰(zhàn)。于是各式各樣的“SQLon Hadoop”技術(shù)應(yīng)運(yùn)而生,其中以Hive為代表,Impala、Presto、 Phoenix、Drill、SparkSQL等緊隨其后。它們的主要技術(shù)是“大規(guī)模并行處理”(Massive Parallel Processing,MPP)和“列式存儲(chǔ)”(Columnar Storage)。大規(guī)模并行處理可以調(diào)動(dòng)多臺(tái)機(jī)器一起進(jìn)行并行計(jì)算,用線性增加的資源來(lái)?yè)Q取計(jì)算時(shí)間的線性下降。列式存儲(chǔ)則將記錄按列存放,這樣做不僅可以在訪問(wèn)時(shí)只讀取需要的列,還可以利用存儲(chǔ)設(shè)備擅長(zhǎng)連續(xù)讀取的特點(diǎn),大大提高讀取的速率。這兩項(xiàng)關(guān)鍵技術(shù)使得Hadoop上的SQL查詢速度從小時(shí)提高到了分鐘。
然而分鐘級(jí)別的查詢響應(yīng)仍然離交互式分析的現(xiàn)實(shí)需求還很遠(yuǎn)。分析師敲入查詢指令,按下回車,還需要去倒杯咖啡,靜靜地等待查詢結(jié)果。得到結(jié)果之后才能根據(jù)情況調(diào)整查詢,再做下一輪分析。如此反復(fù),一個(gè)具體的場(chǎng)景分析常常需要幾小時(shí)甚至幾天才能完成,效率低下。
這是因?yàn)榇笠?guī)模并行處理和列式存儲(chǔ)雖然提高了計(jì)算和存儲(chǔ)的速度,但并沒(méi)有改變查詢問(wèn)題本身的時(shí)間復(fù)雜度,也沒(méi)有改變查詢時(shí)間與數(shù)據(jù)量成線性增長(zhǎng)的關(guān)系這一事實(shí)。假設(shè)查詢1億條記錄耗時(shí)1分鐘,那么查詢10億條記錄就需10分鐘,100億條記錄就至少需要1小時(shí)40分鐘。當(dāng)然,可以用很多的優(yōu)化技術(shù)縮短查詢的時(shí)間,比如更快的存儲(chǔ)、更高效的壓縮算法,等等,但總體來(lái)說(shuō),查詢性能與數(shù)據(jù)量呈線性相關(guān)這一點(diǎn)是無(wú)法改變的。雖然大規(guī)模并行處理允許十倍或百倍地?cái)U(kuò)張計(jì)算集群,以期望保持分鐘級(jí)別的查詢速度,但購(gòu)買和部署十倍或百倍的計(jì)算集群又怎能輕易做到,更何況還有高昂的硬件運(yùn)維成本。
另外,對(duì)于分析師來(lái)說(shuō),完備的、經(jīng)過(guò)驗(yàn)證的數(shù)據(jù)模型比分析性能更加重要,直接訪問(wèn)紛繁復(fù)雜的原始數(shù)據(jù)并進(jìn)行相關(guān)分析其實(shí)并不是很友好的體驗(yàn),特別是在超大規(guī)模的數(shù)據(jù)集上,分析師將更多的精力花在了等待查詢結(jié)果上,而不是在更加重要的建立領(lǐng)域模型上。
- 運(yùn)算放大器權(quán)威指南電子版下載 0次下載
- ESP32開發(fā)指南的詳細(xì)教程免費(fèi)下載 623次下載
- LabVIEW入門教程之計(jì)算機(jī)虛擬儀器圖形編程的LabVIEW實(shí)驗(yàn)教材免費(fèi)下載 4次下載
- Protel DXP電路設(shè)計(jì)教程之電路原理圖設(shè)計(jì)基礎(chǔ)免費(fèi)下載 0次下載
- Protel DXP使用教程之層次電路原理圖設(shè)計(jì)教程免費(fèi)下載 0次下載
- DSP設(shè)計(jì)與應(yīng)用教程之TMS320C54XDSP指令系統(tǒng)的詳細(xì)資料免費(fèi)下載 8次下載
- FPGA視頻教程之仿真基礎(chǔ)的詳細(xì)資料免費(fèi)下載 4次下載
- AIR202Luat系列教程之下載調(diào)試工具LuaTools的使用指南資料免費(fèi)下載 14次下載
- C語(yǔ)言入門教程之C語(yǔ)言程序設(shè)計(jì)現(xiàn)代方法教材免費(fèi)下載 44次下載
- LabVIEW教程之《我和LabVIEW》電子教材編寫的詳細(xì)示例免費(fèi)下載 95次下載
- matlab培訓(xùn)教程之從基礎(chǔ)到實(shí)踐的詳細(xì)教材免費(fèi)下載 0次下載
- Django教程之Django的使用心得詳細(xì)資料免費(fèi)下載 11次下載
- C語(yǔ)言教程之數(shù)組講解的詳細(xì)資料免費(fèi)下載 19次下載
- Protues教程之我的Protues資料庫(kù)免費(fèi)下載 168次下載
- AVR匯編例程之AVR斷電保護(hù)程序詳細(xì)資料免費(fèi)下載 17次下載
- Apache Doris聚合函數(shù)源碼解析 1076次閱讀
- 什么是Apache日志?Apache日志分析工具介紹 877次閱讀
- Apache Pulsar的特性 739次閱讀
- 濾波器設(shè)計(jì)指南 2414次閱讀
- Apache安全加固 隱藏Apache banner信息 1429次閱讀
- Apache NimBLE v1.5版本的BLE HCI層設(shè)計(jì) 1918次閱讀
- 低壓配電柜的基礎(chǔ)知識(shí)詳細(xì)介紹 3989次閱讀
- 使用51單片機(jī)讀寫AT29C040的C語(yǔ)言程序免費(fèi)下載 4814次閱讀
- HD44780讀寫單片機(jī)C51程序免費(fèi)下載 4387次閱讀
- PCB設(shè)計(jì)之五個(gè)EMI設(shè)計(jì)指南 3605次閱讀
- 米爾科技ARM Cortex-M3教程指南 2873次閱讀
- Apache Ignite上的TensorFlow!分布式內(nèi)存數(shù)據(jù)源 3753次閱讀
- PPT教程之伺服電機(jī)及其驅(qū)動(dòng)技術(shù)的詳細(xì)資料講解 8037次閱讀
- 一文讀懂Nginx、Apache工作原理 2505次閱讀
- 關(guān)于Apache的安全配置問(wèn)題 3802次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論
查看更多