色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

突破傳統監測模式:業務狀態監控HM的新思路

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-08-29 14:36 ? 次閱讀

一、傳統監控系統的盲區,如何打造業務狀態監控。

在系統架構設計中非常重要的一環是要做數據監控和數據最終一致性,關于一致性的補償,已經由算法部的大佬總結過就不在贅述。這里主要講如何去補償?補償的方案哪些?這就引出來數據監控系統了。有小伙伴會問了,為什么業務狀態監控系統可以做補償?別急,往下看。

傳統監控系統分為兩種,系統監控和業務監控。系統監控有并發量監控、異常監控、調用鏈監控、端口監控、zabbix 監控、http監控等。業務監控是指用以監控業務數據是否正常,用戶需要進行業務埋點進行數據采集。業務監控底層常規依賴日志上報系統,接入業務監控之前先申請接入日志上報系統。如圖1

wKgaombQFu2AGACSAAClJRtmW5Y931.png

(圖1)

從業務監控時序圖中看到一般分為五步:

1.數據埋點,業務端埋點后上報的日志,也可以是mysql。日志文件最后通過flume或者bin log上報。

2.數據收集,通常都通過kafka做數據采集。

3.數據清洗,一般都是在ods層用spark-streaming進行分流,清洗。

4.數據存儲,數據分流后會存儲到dw層,最后落到各種庫里面。

5.數據展示,開源的很多,用的多還是grafana,還有數據大屏等。

看到這里大家有沒有感覺到一絲困惑?有沒有感覺跟鏈路追蹤傻傻分不清楚?業務監控和鏈路追蹤的區別就成了侵入式埋點上報和無侵入式agent抓取上報。這仿佛沒了靈魂,于是我去問了下AI,AI給出的答案是“業務監控則是一種用于監測業務指標和關鍵業務流程的技術,目的在于實現對業務運營狀況的實時了解和快速響應”。

二、新型業務監控,hunter-monitor的誕生。

站在巨人的肩膀上開始俯視全局,發現真實的需求:

1.報警能力,圍繞業務,運營場景。設置各種預警的閾值。達到閾值后要及時發出響應。

2.數據計算和數據統計能力,根據埋點計算整條鏈路上,每個節點的異常數據。幫做統計和輸出。

3.觸達能力,內部聊天工具,郵件,必要時電話,短信,微信都要跟上。

4.數據歸檔能力,數據歸檔是為了兜底,做最終一致性。是為了異常時做數據比對。

5.數據自理能力,在AI時代,必須要有自動消化處理的能力。

6.報警規則能力,“樹”的應用,要把整個系統鏈路串聯起來的能力。

?

我們是京東保險平臺研發部,承接商城的端延保訂單的流量。流量全是交易數據。交易數據是不允許丟失。因此我們孕育出自己的業務監控系統“監控獵手 (hunter-monitor)” 簡稱hm。hm已經實現了以上6種能力。在出現問題時,會第一時間通知業務和產品。還提供了異常數據統計、節點數據計算、回溯、補償等能力。業務或產研發需要時,可以在平臺上做數據對比。還具備了延展能力,如可以對接jsf接口。來實現自動補償能力。

hm業務狀態監控的核心能力是:數據串聯和數據計算。是可以把業務整條鏈路在系統中的埋點,已線性串聯起來。并展示出每個節點的異常狀態數據。最終消化掉異常數據。

三、三連問:誰適合接入?如何使用?有接入的實例么?

1、誰適合接入

接入保險SaaS工作臺的系統都可以接入業務狀態監控。沒介入的呢?只需要在保險SaaS工作臺中,創建租戶便可以使用hm業務狀態監控。

2、如何使用

2.1 監控接入

接入hm只要簡單的三步即可,創建規則,創建報警規則,業務接入埋點。創建方式和常規的業務監控系統一樣。

2.2 數據處理

異常數據最終需要處理掉。在監控列表中可以一鍵處理異常數據

2.3 定制化

我們支持觸達內容定制化,異常數據處理方式定制化,異常數據統計定制化。可以調用業務系統jsf接口完成自動處理,也可以根據需求出異常數據報告,更可以深度幫助業務方定制系統鏈路中的異常處理。hm已應用到延保交易全鏈路系統,履約平臺,業財一體平臺和保險abTest等系統。我們來看幾個延保業務的接入的場景。

?

3、實戰!延保業務接入場景

3.1 大屏展示:

每周都會公示出上一周延保業務出現的問題,并通過內部通訊工具和郵件發送給業務方負責人,支持異常投保單的下載。業務收到郵件后會按照郵件中的攻略去操作,完成正確的投保。截止目前幫助業務側完成40萬+的異常投保單的重新投保。幫助業務降低了客訴率,也幫助保司拿到保費。(圖2)

wKgZombQFvCADW5rAAD2xexVkp8119.png

(圖2)

3.2 自動補單:

延保的業務上游大多來自商城,業務會在系統里處理訂單分發到下游,由于量大,操作門檻高,總會出現異常的情況,比如漏配某個參數,導致交易失敗或者用戶不能正常履約。以前都是到客戶履約的時候或者下游交易發起結算失敗時,才能發現的問題。在hm中配置了監控后,發現異常情況會調用補單的jsf接口,觸發自動補單。以前出現問題最長要已天為單位才能解決,現在分鐘級解決問題。起到了降本增效的效果。

3.3 數據歸檔:

hm給延保上游和下游交易提供數據了永久歸檔能力,如發現各種異常類的情況,可以從hm系統里面導出數據來作數據比對。如果是金額類的還可以自動接入到對賬系統。在線上查看對賬結果,導出對賬差異數據(圖3)。同時會發送異常數據郵件,通知對應的產品和業務(圖4)。

wKgaombQFvGAQB5KAAI2uso_8R4788.png

(圖3)

wKgZombQFvKABSB9AAHsDY1-Z6k083.png

?

(圖4)

?

四、HM的內核,技術架構和實現方案

如果實在是沒辦法接入,只能自研怎么辦?沒關系,我把技術方法列出來。給大家提供解決方案的思路。

1.技術架構

hm架構上化繁為簡,單刀直入。從最核心的業務數據下手,在業務應用中埋點,通過樹型節點nodeId串起整條鏈路。埋點數據統一進數倉清洗后。由調度中心定時觸發去做數據計算和數據統計,展示到前端。我們先來看一張架構圖。圖5

wKgaombQFvOAdMoxAADSrlmWukw827.png

(圖5)

2.核心技術

2.1 規則引擎

規則引擎是指埋點的規則。規則引擎參考了Jaeger源碼,用來生成我們的規則編碼nodeId。(圖6)構建成hm的規則樹。最終緩存到工作業務臺展示(圖7)。

wKgZombQFvSAR4I0AAEYqIGlndQ883.png

(圖6)

wKgaombQFvWAURO8AALBOgR7xWY901.png

(圖7)

2.2 報警引擎

報警引擎是指配置報警的一系列的規則,數據計算的規則,觸達的方式。創建好規則后,要對每一個規則進行詳細的報警配置,包括觸發報警的類型,報警規則,操作閾值,處理方式等。(圖8)報警類型指觸達方式,繼承了保險SaaS-msg的能力,支持郵件、內部聊天工具、微信、電話等觸達方式。任務系統使用Easy-Job來動態管理任務。處理方式可以對接業務方Jsf 來完成閉環,也可以設置成歸檔,以便后續的有導出或對數的需求。

wKgZombQFvaAT-fqAAOo09ArsSk602.png

(圖8)

2.3 數據埋點

在保險工作臺配置好埋點規則和報警規則后,就可以在業務方去埋點,區別于鏈路追蹤或傳統的基于Agent系統,它們都是無侵入埋點系統。hm則屬于強侵入式埋點系統,在這里我們定制了一套埋點規范,“必須啟用異步線程,進行發送MQ或者調用API接口”。埋點支持兩種方式,一種是send msg to topic,mq支持jmq2/jmq4。另一種就是通過調用API去初始化hunter-expoxt的實體類。由hm來發送消息。

2.4 數據清洗

hm的主要職責在業務數據的歸納、分揀。除了埋點接入外還支持,mq、數據庫等數據源的接入。所有的數據統一有集團的DP(DataPilot )平臺的DataBus系統的DTS完成,統一進數倉的FDM/BDM層。再由集團的調度中心Buffalo(EMR),配置的spark任務執行數據分揀。最終數據進入doris/hive/es中存儲。

2.5 數據計算

hm只記錄異常數據,發力在異常數據的統計和計算上。在配置好規則節點和系統埋點后,hm會去計算每個節點的異常數據。根據報警規則來進行處理,或通知業務和產研,或調用業務系統的jsf接口去做異常數據的自動處理,又或者根據規則自行處理數據。

2.6 數據統計

hm每周會出數據統計報表發送給業務和產研。報表中會體現他負責的業務線下所有系統的異常數據,包括處理過的異常數據和未處理的異常數據,A業務線和B業務線異常對比數據,業務系統與業務系統的異常對比數據等??梢愿鶕I務需求定制報表。幫助業務和產研更好掌握系統的最新狀況。

2.7 任務中心

任務中心是指xxljob任務指調度中心,它和報警規則強綁定的。調度任務分為兩類,一類是業務類任務,是動態去創建的任務,按照設置的corn執行。另一類是平臺任務。用于維護業務類任務的,比如定期去刪除沒有異常的任務等。(圖9)

wKgaombQFveAGsT_AAIihU7wFo0432.png

(圖9)

2.8 觸達展示

觸達方式支持了保險工作臺、內部聊天工具、郵件、企業微信、電話語音等。根據業務方需求來選擇。

2.9 處理方式

如果觸達3次還沒有做異常的處理數據,會進行自動升級,在下次觸達時會抄給本部門的上一級。異常數據需要在hm列表頁里做數據狀態變更。

2.10 開源能力:jaeger

hm底層參考了jaeger-core,重寫了jaegerSpan和jaegerTracer類。并把jaeger-core和opentracing-api重新打包-形成自己的jar(hunter-api)

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 監測
    +關注

    關注

    2

    文章

    3819

    瀏覽量

    45210
  • 狀態監控
    +關注

    關注

    0

    文章

    15

    瀏覽量

    10859
收藏 0人收藏

    評論

    相關推薦

    智能電網第6期 毫秒級時延如何實現?電力設備狀態實時監控優化

    隨著新型電力系統建設加速推進,電力設備狀態監控對通信時延的要求已提升至毫秒級。在變電站自動化、輸電線路監測等場景中,傳統通信方案面臨嚴峻挑戰: ? 時延瓶頸:保護控制類
    的頭像 發表于 04-25 09:40 ?46次閱讀
    智能電網第6期 毫秒級時延如何實現?電力設備<b class='flag-5'>狀態</b>實時<b class='flag-5'>監控</b>優化

    如何實施狀態監測

    隨著工業生產使用更多、更復雜的機器,狀態監測的可靠性變得越來越重要。狀態監測為有效的預測性維護鋪平了道路。通過這種方式,制造過程可以在實現高性能的同時降低生產設備的整體成本,并且可以減
    的頭像 發表于 04-17 11:35 ?264次閱讀

    必知!電力系統遠程監控設計新思路,開啟智能電網新時代

    安科瑞電氣銷售徐悅18702111076 隨著電力系統規模的擴大和運行復雜度的增加,傳統監控方式已無法滿足對電力系統實時性和安全性的需求。本文探討了電力系統遠程監控技術的現狀、面臨的挑戰及其未來
    的頭像 發表于 04-15 15:53 ?201次閱讀
    必知!電力系統遠程<b class='flag-5'>監控</b>設計<b class='flag-5'>新思路</b>,開啟智能電網新時代

    海外設備如何實現遠程監控智慧運維

    設備的遠程監控和智慧運維,成為企業提升競爭力的重要課題。 一、傳統運維模式的痛點與挑戰 1.設備分布廣,難以實時監控:海外設備可能分布在不同國家和地區,總部運維人員無法快速掌握設備
    的頭像 發表于 02-28 15:25 ?188次閱讀
    海外設備如何實現遠程<b class='flag-5'>監控</b>智慧運維

    電纜隧道運行狀態在線監測系統的安裝與配置指南

    TLKS-PMG-CTM電纜隧道運行狀態在線監測系統。該系統集成了多種先進的監測技術,能夠實時、全面地監控電纜隧道內部環境,及時發現并預警潛在的安全隱患,為電纜隧道的運維管理提供有力支
    的頭像 發表于 11-28 11:16 ?563次閱讀
    電纜隧道運行<b class='flag-5'>狀態</b>在線<b class='flag-5'>監測</b>系統的安裝與配置指南

    轉動設備狀態監測應用方案(聲發射監測應用)

    轉動設備狀態監測應用方案
    的頭像 發表于 11-23 17:17 ?583次閱讀
    轉動設備<b class='flag-5'>狀態</b><b class='flag-5'>監測</b>應用方案(聲發射<b class='flag-5'>監測</b>應用)

    ipc與傳統監控技術的比較

    IPC(Internet Protocol Camera)監控技術與傳統監控技術在多個方面存在顯著差異。以下是對兩者的詳細比較: 一、技術基礎與傳輸方式 IPC監控技術 技術基礎 :I
    的頭像 發表于 11-15 14:23 ?843次閱讀

    數字化與傳統業務模式的區別

    隨著科技的飛速發展,數字化已經成為現代企業不可或缺的一部分。數字化不僅僅是一種技術手段,更是一種全新的業務模式和思維方式。它正在改變企業的運營方式、客戶互動以及產品和服務的交付。 一、業務
    的頭像 發表于 10-27 17:32 ?889次閱讀

    在MATLAB中開發狀態監控算法

    狀態監控是采集和分析設備傳感器數據的過程,目的是評估設備在運行期間的健康狀態。準確識別設備的當前健康狀態對于開發預測性維護和基于狀態的維護計
    的頭像 發表于 10-24 13:51 ?579次閱讀
    在MATLAB中開發<b class='flag-5'>狀態</b><b class='flag-5'>監控</b>算法

    監控平臺設計思路

    電子發燒友網站提供《監控平臺設計思路.pptx》資料免費下載
    發表于 10-09 11:18 ?0次下載

    監控室離崗智能監測攝像頭

    監控室離崗智能監測攝像頭是一種應用于監控室的智能設備,旨在監測監控室內工作人員的狀態,及時警示相
    的頭像 發表于 08-07 10:39 ?610次閱讀
    <b class='flag-5'>監控</b>室離崗智能<b class='flag-5'>監測</b>攝像頭

    動環監控系統解決方案

    在當今信息化高速發展的時代,機房作為企業IT架構的核心,承載著數據存儲、處理與傳輸的重要任務。隨著業務規模的不斷擴大,傳統機房運維模式面臨著諸多挑戰,如效率低下、能耗高、故障響應慢等。因此,改造機房
    的頭像 發表于 07-11 16:02 ?514次閱讀

    電氣設備狀態監測與故障診斷

    引言 電氣設備是現代工業生產和生活中不可或缺的重要組成部分。隨著科技的發展,電氣設備的類型和應用范圍不斷擴大,其性能和可靠性也日益受到重視。為了確保電氣設備的安全、穩定和高效運行,狀態監測與故障診斷
    的頭像 發表于 06-06 09:42 ?3235次閱讀

    AD7616的16路采樣通道,如何實現對通道狀態的實時自檢,監測通道狀態是否正常?

    AD7616的16路采樣通道,如何實現對通道狀態的實時自檢,監測通道狀態是否正常? 1)手冊中通信自測功能是不是實現這個功能的?如果是,這個只是實現數字部分正不正常檢測,還是實現ADC整個模擬采集+數字轉換通道是否正常的
    發表于 05-27 08:07

    云知聲攜手耘途教育成立云知學院福建分院,探索智慧教育新思路

    近日,云知聲與耘途教育聯合成立云知學院福建分院,深入探索智慧教育新模式、新思路。
    的頭像 發表于 05-11 15:52 ?733次閱讀
    云知聲攜手耘途教育成立云知學院福建分院,探索智慧教育<b class='flag-5'>新思路</b>

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品
    主站蜘蛛池模板: 九九精品在线播放 | 果冻传媒在线完整免费播放 | 老师机影院 | 免费视频国产在线观看网站 | 麻豆成人久久精品二区三区网站 | 永久免费精品影视网站 | 妓女嫖客叫床粗话对白 | 成人毛片一区二区三区 | 手机看片国产免费久久网 | 2021精品乱码多人收藏 | 伊人不卡久久大香线蕉综合影院 | 国产精品爽爽久久久久久蜜桃 | 国产免费看片 | 顶级欧美不卡一区二区三区 | 亚洲黄色录像片 | 外女思春台湾三级 | 久9青青cao精品视频在线 | 日本免费一区二区三区四区五六区 | 国产精品国产三级国产AV麻豆 | 抽插的日日液液H | 探花口爆颜射乳交日韩 | 调教椅上的调教SM总裁被调教 | 好爽胸大好深好多水 | 丝瓜涩涩屋黄瓜香蕉丝瓜 | 久久视频这里只精品99re8久 | 99视频在线免费看 | 亚洲精品另类有吗中文字幕 | 老年日本老年daddy | 日本电影免费久久精品 | 国产在线精彩视频 | 啊…嗯啊好深男男高h文 | 日韩免费视频一区 | 美女扣逼软件 | 一区二区三区国产亚洲网站 | 处xxxx.88| 久久婷婷五月综合色精品首页 | 国产亚洲免费观看 | 抽插妇女疯狂视频 | 艳照门在线播放 | 国产成人啪精品视频免费网 | 日韩熟女精品一区二区三区 |