色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

姚小熊27 ? 來源:網(wǎng)絡(luò)整理 ? 2018-02-11 10:08 ? 次閱讀

數(shù)據(jù)倉庫簡介

數(shù)據(jù)倉庫,英文名稱為DataWarehouse,可簡寫為DW或DWH。數(shù)據(jù)倉庫,是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進、監(jiān)視時間、成本、質(zhì)量以及控制。

數(shù)據(jù)倉庫的用途

1.整合公司所有業(yè)務(wù)數(shù)據(jù),建立統(tǒng)一的數(shù)據(jù)中心

2.產(chǎn)生業(yè)務(wù)報表,用于作出決策

3.為網(wǎng)站運營提供運營上的數(shù)據(jù)支持

4.可以作為各個業(yè)務(wù)的數(shù)據(jù)源,形成業(yè)務(wù)數(shù)據(jù)互相反饋的良性循環(huán)

5.分析用戶行為數(shù)據(jù),通過數(shù)據(jù)挖掘來降低投入成本,提高投入效果

6.開發(fā)數(shù)據(jù)產(chǎn)品,直接或間接地為公司盈利

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

數(shù)據(jù)倉庫分層的原因

1通過數(shù)據(jù)預(yù)處理提高效率,因為預(yù)處理,所以會存在冗余數(shù)據(jù)

2如果不分層而業(yè)務(wù)系統(tǒng)的業(yè)務(wù)規(guī)則發(fā)生變化,就會影響整個數(shù)據(jù)清洗過程,工作量巨大

3通過分層管理來實現(xiàn)分步完成工作,這樣每一層的處理邏輯就簡單了

標(biāo)準(zhǔn)的數(shù)據(jù)倉庫分層:ods(臨時存儲層),pdw(數(shù)據(jù)倉庫層),mid(數(shù)據(jù)集市層),app(應(yīng)用層)

ods:歷史存儲層,它和源系統(tǒng)數(shù)據(jù)是同構(gòu)的,而且這一層數(shù)據(jù)粒度是最細的,這層的表分為兩種,一種是存儲當(dāng)前需要加載的數(shù)據(jù),一種是用于存儲處理完后的數(shù)據(jù)。

pdw:數(shù)據(jù)倉庫層,它的數(shù)據(jù)是干凈的數(shù)據(jù),是一致的準(zhǔn)確的,也就是清洗后的數(shù)據(jù),它的數(shù)據(jù)一般都遵循數(shù)據(jù)庫第三范式,數(shù)據(jù)粒度和ods的粒度相同,它會保存bi系統(tǒng)中所有歷史數(shù)據(jù)

mid:數(shù)據(jù)集市層,它是面向主題組織數(shù)據(jù)的,通常是星狀和雪花狀數(shù)據(jù),從數(shù)據(jù)粒度將,它是輕度匯總級別的數(shù)據(jù),已經(jīng)不存在明細的數(shù)據(jù)了,從廣度來說,它包含了所有業(yè)務(wù)數(shù)量。從分析角度講,大概就是近幾年

app:應(yīng)用層,數(shù)據(jù)粒度高度匯總,倒不一定涵蓋所有業(yè)務(wù)數(shù)據(jù),只是mid層數(shù)據(jù)的一個子集。

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

數(shù)據(jù)倉庫的架構(gòu)圖介紹

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

1、數(shù)據(jù)采集

數(shù)據(jù)采集層的任務(wù)就是把數(shù)據(jù)從各種數(shù)據(jù)源中采集和存儲到數(shù)據(jù)存儲上,期間有可能會做一些ETL操作。

數(shù)據(jù)源種類可以有多種:

日志:所占份額最大,存儲在備份服務(wù)器上

業(yè)務(wù)數(shù)據(jù)庫:如Mysql、Oracle

來自HTTP/FTP的數(shù)據(jù):合作伙伴提供的接口

其他數(shù)據(jù)源:如Excel等需要手工錄入的數(shù)據(jù)

2、數(shù)據(jù)存儲與分析

HDFS是大數(shù)據(jù)環(huán)境下數(shù)據(jù)倉庫/數(shù)據(jù)平臺最完美的數(shù)據(jù)存儲解決方案。

離線數(shù)據(jù)分析與計算,也就是對實時性要求不高的部分,Hive是不錯的選擇。

使用Hadoop框架自然而然也提供了MapReduce接口,如果真的很樂意開發(fā)Java,或者對SQL不熟,那么也可以使用MapReduce來做分析與計算。

Spark性能比MapReduce好很多,同時使用SparkSQL操作Hive。

3、數(shù)據(jù)共享

前面使用Hive、MR、Spark、SparkSQL分析和計算的結(jié)果,還是在HDFS上,但大多業(yè)務(wù)和應(yīng)用不可能直接從HDFS上獲取數(shù)據(jù),那么就需要一個數(shù)據(jù)共享的地方,使得各業(yè)務(wù)和產(chǎn)品能方便的獲取數(shù)據(jù)。

這里的數(shù)據(jù)共享,其實指的是前面數(shù)據(jù)分析與計算后的結(jié)果存放的地方,其實就是關(guān)系型數(shù)據(jù)庫和NOSQL數(shù)據(jù)庫。

4、數(shù)據(jù)應(yīng)用

報表:報表所使用的數(shù)據(jù),一般也是已經(jīng)統(tǒng)計匯總好的,存放于數(shù)據(jù)共享層。

接口:接口的數(shù)據(jù)都是直接查詢數(shù)據(jù)共享層即可得到。

即席查詢:即席查詢通常是現(xiàn)有的報表和數(shù)據(jù)共享層的數(shù)據(jù)并不能滿足需求,需要從數(shù)據(jù)存儲層直接查詢。一般都是通過直接操作SQL得到。

理想的數(shù)據(jù)倉庫架構(gòu)

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

增加了以下內(nèi)容:

數(shù)據(jù)采集:采用Flume收集日志,采用Sqoop將RDBMS以及NoSQL中的數(shù)據(jù)同步到HDFS上

消息系統(tǒng):可以加入Kafka防止數(shù)據(jù)丟失

實時計算:實時計算使用SparkStreaming消費Kafka中收集的日志數(shù)據(jù),實時計算結(jié)果大多保存在Redis中

機器學(xué)習(xí):使用了SparkMLlib提供的機器學(xué)習(xí)算法

多維分析OLAP:使用Kylin作為OLAP引擎

數(shù)據(jù)可視化:提供可視化前端頁面,方便運營等非開發(fā)人員直接查詢

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 2人收藏
  • jf_627822311

評論

相關(guān)推薦

基于阿里云數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設(shè)思路

摘要:數(shù)加大數(shù)據(jù)直播系列課程主要以基于阿里云數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設(shè)思路為主題分享阿里巴巴的大數(shù)據(jù)是怎么演變以及怎樣利用大數(shù)
發(fā)表于 03-15 12:43

應(yīng)用部署架構(gòu)圖

筆者一個項目中用到的架構(gòu)圖,Linux+Tomcat應(yīng)用服務(wù)器兩臺,MSSQL2012數(shù)據(jù)庫服務(wù)器3臺做成了故障轉(zhuǎn)移集群。
發(fā)表于 07-15 06:58

上海邏迅丨節(jié)能降耗 系統(tǒng)架構(gòu)圖

上海邏迅丨節(jié)能降耗 系統(tǒng)架構(gòu)圖
發(fā)表于 10-09 13:58

RT-Thread 架構(gòu)圖

RT-Thread 架構(gòu)圖:RT-Thread開發(fā)指南開源地址內(nèi)核層:RT-Thread 內(nèi)核,是 RT-Thread 的核心部分,包括了內(nèi)核系統(tǒng)中對象的實現(xiàn),例如多線程及其調(diào)度、信號量、郵箱
發(fā)表于 12-16 08:15

PCIE基本概念與拓撲架構(gòu)圖

1 PCIE基本概念1.1 PCIE拓撲架構(gòu)圖1.2 PCIE Switch內(nèi)部結(jié)構(gòu)圖1.3 PCIE協(xié)議結(jié)構(gòu)圖2 PCIE枚舉原理2.1 Type0&Type1配置頭空間2.2 拓撲示例
發(fā)表于 02-16 06:08

電信數(shù)據(jù)倉庫設(shè)計

本文針對佳木斯電信的業(yè)務(wù)需求,設(shè)計了佳木斯電信數(shù)據(jù)倉庫的總體架構(gòu),并以營業(yè)受理情況主題為例介紹了佳木斯電信數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計過程。
發(fā)表于 12-18 17:01 ?14次下載

電腦主板架構(gòu)圖

主板架構(gòu)圖1(早期主板)
發(fā)表于 05-31 14:15 ?1.1w次閱讀
電腦主板<b class='flag-5'>架構(gòu)圖</b>

主板架構(gòu)圖1(早期主板)

主板架構(gòu)圖1(早期主板)
發(fā)表于 05-21 11:02 ?1717次閱讀
主板<b class='flag-5'>架構(gòu)圖</b>1(早期主板)

主板架構(gòu)圖2(P2.P3.P4主板)

主板架構(gòu)圖2(P2.P3.P4主板)
發(fā)表于 05-21 11:03 ?1549次閱讀
主板<b class='flag-5'>架構(gòu)圖</b>2(P2.P3.P4主板)

深圳市圣奇仕科技有限公司組織架構(gòu)圖

深圳市圣奇仕科技有限公司組織架構(gòu)圖
發(fā)表于 11-04 15:53 ?1529次閱讀

什么是paas平臺_paas邏輯架構(gòu)圖

本文開始介紹了什么是PAAS平臺和PAAS的特點,其次分析了PAAS平臺的發(fā)展前景,最后介紹了詳細的介紹paas邏輯架構(gòu)圖
的頭像 發(fā)表于 01-30 18:00 ?3w次閱讀
什么是paas平臺_paas邏輯<b class='flag-5'>架構(gòu)圖</b>

數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫的特點_數(shù)據(jù)倉庫數(shù)據(jù)庫區(qū)別

本文開始介紹數(shù)據(jù)倉庫是什么,其次詳細介紹數(shù)據(jù)倉庫的特點、數(shù)據(jù)倉庫的基本架構(gòu)
的頭像 發(fā)表于 02-11 10:42 ?2.6w次閱讀
<b class='flag-5'>數(shù)據(jù)倉庫</b>是什么_<b class='flag-5'>數(shù)據(jù)倉庫</b>的特點_<b class='flag-5'>數(shù)據(jù)倉庫</b>與<b class='flag-5'>數(shù)據(jù)</b>庫區(qū)別

如何畫架構(gòu)圖

維基百科、百度百科其實都沒有關(guān)于它的直接定義。不過我們可以進行拆分理解:架構(gòu)圖=架構(gòu)+圖這樣問題就轉(zhuǎn)化成,什么是架構(gòu),以及什么是圖?關(guān)于架構(gòu),百度百科上是這樣定義的
的頭像 發(fā)表于 01-13 14:38 ?1623次閱讀

如何畫技術(shù)架構(gòu)圖

在我們做系統(tǒng)架構(gòu)設(shè)計時,如何快速的向外界傳達我們的設(shè)計思路。4+1試圖適合我們厘清思路、表達自己的想法。在我們匯報,爭取領(lǐng)導(dǎo)層的認同支持更適合用架構(gòu)圖來表述我們的觀點。架構(gòu)圖包括總體架構(gòu)
的頭像 發(fā)表于 02-06 17:39 ?3427次閱讀

校園智慧燈桿大樣圖_基礎(chǔ)CAD圖紙_系統(tǒng)架構(gòu)圖下載

校園智慧燈桿大樣圖_基礎(chǔ)CAD圖紙_系統(tǒng)架構(gòu)圖_下載
發(fā)表于 08-02 16:11 ?3次下載
主站蜘蛛池模板: 成年人免费观看的视频 | 国拍在线精品视频免费观看 | 日日碰狠狠躁久久躁77777 | 无人区乱码区1卡2卡三卡在线 | 国产99青草全福视在线 | 国产精品久久久久久免费播放 | 我强进了老师身体在线观看 | 成人国产亚洲精品A区天堂蜜臀 | 一级性生活毛片 | 午夜国产视频 | 久久AV国产麻豆HD真实乱 | 伦理片秋霞免费影院 | 2020最新国产自产精品 | 无码人妻精品一区二区蜜桃色欲 | 双性人皇上被c到哭 | 22eee在线播放成人免费视频 | 国产精品久久久久久久久久影院 | 6080YYY午夜理论片在线观看 | 精品九九视频 | 国内精品伊人久久久久 | 欧美人与动交zOZ0 | 麻豆婷婷狠狠色18禁久久 | 国产亚洲精品久久久久久久软件 | 东北小伙FREECHINESE野外 东北嫖妓对白粗口 | 黄网址在线观看 | 91欧美秘密入口 | 亚洲国产中文字幕在线视频 | 好男人在线观看视频观看高清视频免费 | 成人在线高清不卡免费视频 | 青青国产在线观看视频 | 51精品国产AV无码久久久密桃 | 美女脱18以下禁止看免费 | 69SEX久久精品国产麻豆 | 亚洲欧美综合中文字幕 | 榴莲推广APP网站入口下载安装 | 国产中的精品AV一区二区 | 一个人的免费完整在线观看HD | 日本阿v直播在线 | 免费人成在线观看网站视频 | 好紧好湿太硬了我太爽了小说 | 毛片免费在线播放 |

電子發(fā)燒友

中國電子工程師最喜歡的網(wǎng)站

  • 2931785位工程師會員交流學(xué)習(xí)
  • 獲取您個性化的科技前沿技術(shù)信息
  • 參加活動獲取豐厚的禮品