資料介紹
軟件簡介
seatunnel 是一個(gè)非常易用的支持海量數(shù)據(jù)實(shí)時(shí)同步的超高性能分布式數(shù)據(jù)集成平臺,每天可以穩(wěn)定高效同步數(shù)百億數(shù)據(jù),已在近百家公司生產(chǎn)上使用。
為什么我們需要 seatunnel
seatunnel 盡所能為您解決海量數(shù)據(jù)同步中可能遇到的問題:
- 數(shù)據(jù)丟失與重復(fù)
- 任務(wù)堆積與延遲
- 吞吐量低
- 應(yīng)用到生產(chǎn)環(huán)境周期長
- 缺少應(yīng)用運(yùn)行狀態(tài)監(jiān)控
seatunnel 使用場景
- 海量數(shù)據(jù)同步
- 海量數(shù)據(jù)集成
- 海量數(shù)據(jù)的 ETL
- 海量數(shù)據(jù)聚合
- 多源數(shù)據(jù)處理
seatunnel 的特性
- 簡單易用,靈活配置,無需開發(fā)
- 實(shí)時(shí)流式處理
- 離線多源數(shù)據(jù)分析
- 高性能、海量數(shù)據(jù)處理能力
- 模塊化和插件化,易于擴(kuò)展
- 支持利用 SQL 做數(shù)據(jù)處理和聚合
- 支持 Spark Structured Streaming
- 支持 Spark 2.x
seatunnel 的工作流程
Input[數(shù)據(jù)源輸入] -> Filter[數(shù)據(jù)處理] -> Output[結(jié)果輸出]
多個(gè) Filter 構(gòu)建了數(shù)據(jù)處理的 Pipeline,滿足各種各樣的數(shù)據(jù)處理需求,如果您熟悉 SQL,也可以直接通過 SQL 構(gòu)建數(shù)據(jù)處理的 Pipeline,簡單高效。目前 seatunnel 支持的Filter列表, 仍然在不斷擴(kuò)充中。您也可以開發(fā)自己的數(shù)據(jù)處理插件,整個(gè)系統(tǒng)是易于擴(kuò)展的。
seatunnel 支持的插件
- Input plugin
Fake, File, Hdfs, Kafka, S3, Socket, 自行開發(fā)的 Input plugin
- Filter plugin
Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自行開發(fā)的Filter plugin
- Output plugin
Elasticsearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout, 自行開發(fā)的 Output plugin
環(huán)境依賴
-
java 運(yùn)行環(huán)境,java >= 8
-
如果您要在集群環(huán)境中運(yùn)行 seatunnel,那么需要以下 Spark 集群環(huán)境的任意一種:
- Spark on Yarn
- Spark Standalone
如果您的數(shù)據(jù)量較小或者只是做功能驗(yàn)證,也可以僅使用?local
?模式啟動(dòng),無需集群環(huán)境,seatunnel 支持單機(jī)運(yùn)行。 注: seatunnel 2.0 支持 Spark 和 Flink 上運(yùn)行
下載
可以直接運(yùn)行的軟件包下載地址:https://github.com/InterestingLab/seatunnel/releases
快速入門
快速入門:https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/quick-start
關(guān)于 seatunnel 的詳細(xì)文檔
生產(chǎn)應(yīng)用案例
-
微博, 增值業(yè)務(wù)部數(shù)據(jù)平臺 微博某業(yè)務(wù)有數(shù)百個(gè)實(shí)時(shí)流式計(jì)算任務(wù)使用內(nèi)部定制版 seatunnel,以及其子項(xiàng)目Guardian做 seatunnel On Yarn 的任務(wù)監(jiān)控。
-
新浪, 大數(shù)據(jù)運(yùn)維分析平臺 新浪運(yùn)維數(shù)據(jù)分析平臺使用 seatunnel 為新浪新聞,CDN 等服務(wù)做運(yùn)維大數(shù)據(jù)的實(shí)時(shí)和離線分析,并寫入 Clickhouse。
-
搜狗,搜狗奇點(diǎn)系統(tǒng) 搜狗奇點(diǎn)系統(tǒng)使用 seatunnel 作為 ETL 工具, 幫助建立實(shí)時(shí)數(shù)倉體系
-
趣頭條,趣頭條數(shù)據(jù)中心 趣頭條數(shù)據(jù)中心,使用 seatunnel 支撐 mysql to hive 的離線 ETL 任務(wù)、實(shí)時(shí) hive to clickhouse 的 backfill 技術(shù)支撐,很好的 cover 離線、實(shí)時(shí)大部分任務(wù)場景。
-
永輝超市子公司-永輝云創(chuàng),會(huì)員電商數(shù)據(jù)分析平臺 seatunnel 為永輝云創(chuàng)旗下新零售品牌永輝生活提供電商用戶行為數(shù)據(jù)實(shí)時(shí)流式與離線 SQL 計(jì)算。
-
水滴籌, 數(shù)據(jù)平臺 水滴籌在 Yarn 上使用 seatunnel 做實(shí)時(shí)流式以及定時(shí)的離線批處理,每天處理 3~4T 的數(shù)據(jù)量,最終將數(shù)據(jù)寫入 Clickhouse。
更多案例參見:?https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/case_study/
貢獻(xiàn)觀點(diǎn)和代碼
提交問題和建議:https://github.com/InterestingLab/seatunnel/issues
貢獻(xiàn)代碼:https://github.com/InterestingLab/seatunnel/pulls
開發(fā)者
- 基于DSP的航空發(fā)動(dòng)機(jī)分布式總線設(shè)計(jì)方案 14次下載
- 虛擬化模型驅(qū)動(dòng)的分布式數(shù)據(jù)湖架構(gòu)設(shè)計(jì) 5次下載
- Ceph分布式存儲系統(tǒng)性能優(yōu)化研究綜述 5次下載
- 基于分布式數(shù)據(jù)Cache的實(shí)時(shí)動(dòng)態(tài)遷移機(jī)制 20次下載
- 區(qū)塊鏈中的分布式數(shù)據(jù)庫管理系統(tǒng)相關(guān)研究 8次下載
- 基于分布式文件系統(tǒng)元數(shù)據(jù)操作優(yōu)化 0次下載
- 一種面向高性能計(jì)算的分布式對象存儲系統(tǒng) 0次下載
- 分布式數(shù)據(jù)流上的高性能分發(fā)策略 0次下載
- 基于高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng) 1次下載
- 分布式云管理協(xié)同平臺研究 6次下載
- Windows平臺的分布式實(shí)時(shí)仿真系統(tǒng) 10次下載
- 基于Windows平臺的分布式實(shí)時(shí)仿真系統(tǒng)
- 無線分布式集成監(jiān)測網(wǎng)絡(luò)系統(tǒng)及應(yīng)用
- 分布式制造資源集成系統(tǒng)軟件平臺研究
- 無線分布式集成監(jiān)測網(wǎng)絡(luò)系統(tǒng)及應(yīng)用
- Java手寫分布式鎖的實(shí)現(xiàn) 612次閱讀
- tldb提供分布式鎖使用方法 923次閱讀
- 數(shù)據(jù)庫如何實(shí)現(xiàn)分布式鎖 5128次閱讀
- 深入理解redis分布式鎖 988次閱讀
- Apache Pulsar的特性 738次閱讀
- 分布式存儲架構(gòu)面臨的挑戰(zhàn) 1513次閱讀
- 如何使用分布式存儲系統(tǒng)促進(jìn)AI模型訓(xùn)練 608次閱讀
- 鴻蒙分布式相機(jī)“踩坑”分享 1911次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應(yīng)用 8837次閱讀
- 分布式控制系統(tǒng)的介紹 5532次閱讀
- 分布式工業(yè)物聯(lián)網(wǎng)云平臺是怎樣的 1743次閱讀
- Redis 分布式鎖的正確實(shí)現(xiàn)方式 3615次閱讀
- Apache Ignite上的TensorFlow!分布式內(nèi)存數(shù)據(jù)源 3750次閱讀
- 淺談分布式塊存儲的元數(shù)據(jù)服務(wù)設(shè)計(jì) 4951次閱讀
- 深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng) 1861次閱讀
下載排行
本周
- 1華為硬件工程師手冊目前最全版本
- 1.02 MB | 7次下載 | 2 積分
- 2STM32單片機(jī)無人機(jī)設(shè)計(jì)
- 8.81 MB | 2次下載 | 免費(fèi)
- 3TTL通往RS232神奇之黑盒(一)(可下載)
- 515.72 KB | 2次下載 | 免費(fèi)
- 4TP4336 線性充電,同步升壓1A 同步移動(dòng)電源解決方案
- 764.17 KB | 1次下載 | 免費(fèi)
- 5直流有刷電機(jī)驅(qū)動(dòng)PCB設(shè)計(jì)注意事項(xiàng)講解(可下載)
- 1.01 MB | 1次下載 | 免費(fèi)
- 6晶體諧振器的工作原理
- 736.44 KB | 1次下載 | 免費(fèi)
- 7LLC的死區(qū)時(shí)間對DS波形的影響(可下載)
- 675.86 KB | 1次下載 | 免費(fèi)
- 8電子產(chǎn)品設(shè)計(jì)與調(diào)試
- 14.66 MB | 次下載 | 8 積分
本月
- 1STM32CubeMX用于STM32配置和初始化C代碼生成
- 21.90 MB | 631次下載 | 免費(fèi)
- 2STM32開發(fā)板教程之STM32開發(fā)指南免費(fèi)下載
- 24.88 MB | 176次下載 | 3 積分
- 3EN60335-1安規(guī)標(biāo)準(zhǔn) 中文版本
- 1.86 MB | 53次下載 | 1 積分
- 4OAH0428最新規(guī)格書(中文)
- 2.52 MB | 28次下載 | 10 積分
- 5UHV系列雷電沖擊電壓發(fā)生器試驗(yàn)裝置詳細(xì)說明使用
- 1.07 MB | 17次下載 | 免費(fèi)
- 6介紹一些常用的電子元器件
- 3.20 MB | 8次下載 | 免費(fèi)
- 7麻將機(jī)升降電路
- 0.12 MB | 7次下載 | 1 積分
- 8華為硬件工程師手冊目前最全版本
- 1.02 MB | 7次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935124次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191371次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論