資料介紹
1 Hadoop發展現狀
Apache Nutch 是 Hadoop 的源頭,該項目始于 2002年, 是Apache Lucene的子項目之一。 至 2004年,Google在OSDI上公開發表了題為 “MapReduce: simplified data processing on large clusters”的論文,受到啟發的 Doug C 等人 開 始 實 現 MapReduce 計 算 框 架 并 與 NDFS (Nutch distributed file system) 結合支持 Nutch 的主要算法 。 至2006 年逐漸成為一套完整而獨立的軟件 ,起名為 Hadoop。2008 年初,Hadoop 成為 Apache 的頂級項目,應用到除Yahoo! 以外的很多互聯網公司。
Hadoop 技術已經在互聯網領域得以廣泛的應用 , 同時也得到研究界的普遍關注。 如 Yahoo! 使用 4 000 節點的機群運行 Hadoop, 支持廣告系統和 Web 搜索的研究;Facebook 使用 1 000 節點的機群運行 Hadoop,存儲日志數據,支持其上的數據分析和機器學習;IBM 的藍云產品也直接將 Hadoop 軟件集成到自己本身的云計算平臺上;百度用 Hadoop 處理每周 200 TB 的數據,進行搜索日志分析和網頁數據挖掘工作; 中移動研究院基于 Hadoop 開發了“大云 ”(big cloud)系統 ,不但用于相關數據分析,還對外提供服務;淘寶的 Hadoop 系統用于存儲并處理的交易相關數據。 國內的高校和科研院所基于 Hadoop 在數據存儲、資源管理、作業調度、性能優化、系統高可用性和安全性方面進行研究, 相關研究成果多以開源形式貢獻給 Hadoop 社區。Cloudera 公司推出了首個 Hadoop 商業版本,一個能夠存儲千兆位容量信息的服務器產品。公司發言人表示“hadoop 應用于 Google、Yahoo、Facebook 等公司 , 已經是一個成功的產品,發布該產品的商業版本,幾乎是理所當然的事情 ”。 Cloudera 的 Hadoop 是 免 費 的 , 并 將 分 配 在Apache 2 軟件許可下 。
2 淘寶網-集群存儲架構
淘寶網部署了一個1.5PB的華為賽門鐵克Oceanspace N8000 Cluster NAS存儲系統,以及一個包含賽門鐵克FileStore軟件的解決方案,該集群NAS存儲系統方案能夠對備份和恢復、動態存儲分層(DST)和數據快照進行整合管理。第二臺華為賽門鐵克Oceanspace N8000部署在一個“active-active”系統中,從而讓淘寶網的服務器能夠訪問復制的常用數據庫,以便進行故障切換。
該團隊還部署了Veritas NetBackup,以進行集中的數據保護。通過將NetBackup與N8000和FileStore相集成,可以實現更快速、更便捷的備份。
組合的解決方案具有高度可伸縮性,這是部署過程中的主要考慮因素之一。馮江解釋說:“對于淘寶網來說,很難制定一個超過一年的完善計劃,因為業務發展的速度太快了。因此集中管理和出色的可伸縮性對我們來說至關重要。內置了賽門鐵克FileStore的華為賽門鐵克N8000可以擴展到15PB,完全能夠滿足淘寶網一段時間內的需求。”
賽門鐵克FileStore中的一項重要功能是動態存儲分層 (DST),動態存儲分層能夠將數據動態移動到不同的存儲層,以快速響應淘寶網不斷變化的業務需求。經常使用的數據可以存儲在第一層存儲上,而不常用的數據則可以駐留在第二層或第三層存儲上。
- 大數據海量數據處理方法總結 13次下載
- FPGA的RAM存儲資源詳細資料說明 10次下載
- 西門子PLC教程之數據塊中的數據存儲詳細資料說明 27次下載
- 西門子PLC教程之模擬量處理的詳細資料說明 32次下載
- 存儲器及接口設計的詳細資料說明 17次下載
- 數字信號處理的詳細的詳細資料說明 0次下載
- MSSQL數據庫服務器的命令查看存儲過程詳細資料說明 10次下載
- ARM處理器的工作模式詳細資料說明 10次下載
- 進行51單片機存儲器擴展的詳細資料說明
- 51單片機的物理存儲地址的詳細資料說明
- 使用Proteus進行一個仿真實例的詳細資料說明
- 圖像處理教程之圖像復原的詳細資料說明 7次下載
- 圖像處理教程之圖像運算的詳細資料說明 12次下載
- Java程序設計教程之異常處理的詳細資料說明 13次下載
- EEPROM存儲器數據的詳細資料說明 10次下載
- FPGA在數據處理中的應用實例 483次閱讀
- PLC的數據處理能力都和哪些因素相關? 970次閱讀
- MATLAB文件讀寫和數據處理的詳細解釋 3044次閱讀
- 融合互通,浪潮分布式融合存儲AS13000加速海量數據處理 727次閱讀
- 數據處理的基本問題 1085次閱讀
- 組合式存儲的詳細資料說明 1105次閱讀
- 應對海量圖片存儲的分布式存儲解決方案 3824次閱讀
- 如何進行PLC控制程序的設計詳細資料PPT說明 6010次閱讀
- 云存儲是金融行業應對海量信息的關鍵 1131次閱讀
- 基于流式計算的DPI數據處理方案 5054次閱讀
- 深入解析大數據處理基本步驟 4201次閱讀
- 淺析大數據處理的關鍵技術及應用 8515次閱讀
- PLC常用基本環節梯形圖和詳細文字說明詳細資料概述 1w次閱讀
- 破解元數據存儲與管理難題,是浪潮軟件定義存儲馳騁海量數據時代的關鍵 5817次閱讀
- 基于單片機的高精度海量數據采集與存儲系統 3157次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 92次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7藍牙設備在嵌入式領域的廣泛應用
- 0.63 MB | 3次下載 | 免費
- 89天練會電子電路識圖
- 5.91 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多