色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個線上服務OOM的問題分享

jf_ro2CN3Fa ? 來源:蘇三說技術 ? 作者:蘇三呀 ? 2022-10-24 10:47 ? 次閱讀

前言

前一段時間,公司同事的一個線上服務OOM的問題,我覺得挺有意思的,在這里跟大家一起分享一下。

我當時其實也參與了一部分問題的定位。

基于 Spring Boot + MyBatis Plus + Vue & Element 實現的后臺管理系統 + 用戶小程序,支持 RBAC 動態權限、多租戶、數據權限、工作流、三方登錄、支付、短信、商城等功能

項目地址:https://gitee.com/zhijiantianya/ruoyi-vue-pro

視頻教程:https://doc.iocoder.cn/video/

1 案發現場

他們有個mq消費者服務,在某一天下午,出現OOM了,導致服務直接掛掉。

當時我們收到了很多內存的報警郵件。

發現問題之后,運維第一時間,幫他們dump了當時的內存快照,以便于開發人員好定位問題。

之后,運維重啟了該服務,系統暫時恢復了正常。

大家都知道,如果出現了線上OOM問題,為了不影響用戶的正常使用,最快的解決辦法就是重啟服務。

但重啟服務治標不治本,只能臨時解決一下問題,如果不找到真正的原因,難免下次在某個不經意的時間點,又會出現OOM問題。

所以,有必要定位一下具體原因。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實現的后臺管理系統 + 用戶小程序,支持 RBAC 動態權限、多租戶、數據權限、工作流、三方登錄、支付、短信、商城等功能

項目地址:https://gitee.com/zhijiantianya/yudao-cloud

視頻教程:https://doc.iocoder.cn/video/

2 初步定位問題

當時運維dump下來的內存快照文件有3G多,太大了,由于公司內網限制,沒辦法及時給到開發這邊。

沒辦法,只能先從日志文件下手了。

在查日志之前,我們先查看了prometheus上的服務監控。查到了當時那個mq消費者服務的內存使用情況,該服務的內存使用率一直都比較平穩,從2022-09-26 1429開始,出現了一個明顯的內存飆升情況。

根據以往經驗總結出來的,在追查日志時,時間點是一個非常重要的過濾條件。

所以,我們當時重點排查了2022-09-26 1429前后5秒鐘的日志。

由于這個服務,并發量不大,在那段時間的日志量并不多。

所以,我們很快就鎖定了excel文件導入導出功能。

該功能的流程圖如下:

f973d034-5341-11ed-a3b6-dac502259ad0.png

用戶通過瀏覽器上傳excel,調用文件上傳接口

該接口會上傳excel到文件服務器。然后將文件url,通過mq消息,發送到mq服務器。

mq消費者消費mq消息,從文件服務器中獲取excel數據,做業務處理,然后把結果寫入新的excel中。

mq消費者將新excel文件上傳到文件服務器,然后發websocket消息通知用戶。

用戶收到通知結果,然后可以下載新的excel。

經過日志分析,時間點剛好吻合,從excel文件導入之后,mq消費者服務的內存使用率一下子飆升。

3. 打不開dump文件

從上面分析我們得出初步的結論,線上mq消費者服務的OOM問題,是由于excel導入導出導致的。

于是,我們查看了相關excel文件導入導出代碼,并沒有發現明顯的異常。

為了找到根本原因,我們不得不把內存快照解析出來。

此時,運維把內存快照已經想辦法發給了相關的開發人員(我的同事)。

那位同事用電腦上安裝的內存分析工具:MAT(Memory Analyzer Tool),準備打開那個內存快照文件。

但由于該文件太大,占了3G多的內存,直接打開失敗了。

f97f01b6-5341-11ed-a3b6-dac502259ad0.png

MemoryAnalyzer.ini文件默認支持打開的內存文件是1G,后來它將參數-xmx修改為4096m。

修改之后,文件可以打開了,但打開的內容卻有問題。

猛然發現,原來是JDK版本不匹配導致的。

他用的MAT工具是基于SunJDK,而我們生成環境用的OpenJDK,二者有些差異。

SunJDK采用JRL協議發布,而OpenJDK則采用GPL V2協議發布。兩個協議雖然都是開放源代碼的,但是在使用上的不同,GPL V2允許在商業上使用,而JRL只允許個人研究使用。

所以需要下載一個基于OpenJDK版本的MAT內存分析工具。

4. 進一步分析

剛好,另一個同事的電腦上下載過OpenJDK版本的MAT內存分析工具。

把文件發給他幫忙分析了一下。

f9992820-5341-11ed-a3b6-dac502259ad0.png

最后發現org.apache.poi.xssf.usermodel.XSSFSheet類的對象占用的內存是最多的。

f9bca20a-5341-11ed-a3b6-dac502259ad0.png

目前excel的導入導出功能,大部分是基于apache的POI技術,而POI給我們提供了WorkBook接口。

常用的WorkBook接口實現有三種:

HSSFWorkbook:它是早期使用最多的工具,支持Excel2003以前的版本,Excel的擴展名是.xls。只能導出65535條數據,如果超過最大記錄條數會報錯,但不會出現內存溢出。

XSSFWorkbook:它可以操作Excel2003-Excel2007之間的版本,Excel的擴展名是.xlsx。最多可以導出104w條數據,會創建大量的對象存放到內存中,可能會導致內存溢出。

SXSSFWorkbook:它可以操作Excel2007之后的所有版本,Excel的擴展名是.xlsx。SXSSFWorkbook是streaming版本的XSSFWorkbook,它只會保存最新的rows在內存里供查看,以前的rows都會被寫入到硬盤里。用磁盤空間換內存空間,不會導致內存溢出。

看到了這個類,可以驗證之前我們通過日志分析問題,得出excel導入導出功能引起OOM的結論,是正確的。

那個引起OOM問題的功能,剛好使用了XSSFWorkbook處理excel,一次性創建了大量的對象。

關鍵代碼如下:

XSSFWorkbookwb=newXSSFWorkbook(newFileInputStream(file));
XSSFSheetsheet=wb.getSheetAt(0);

我們通過MAT內存分析工具,已經確定OOM問題的原因了。接下來,最關鍵的一點是:如何解決這個問題呢?

5. 如何解決問題?

根據我們上面的分析,既然XSSFWorkbook在導入導出大excel文件時,會導致內存溢出。那么,我們改成SXSSFWorkbook不就行了?

關鍵代碼改動如下:

XSSFWorkbookwb=newXSSFWorkbook(newFileInputStream(file));
SXSSFWorkbookswb=newSXSSFWorkbook(wb,100);
SXSSFSheetsheet=(SXSSFSheet)swb.createSheet("sheet1");

使用SXSSFWorkbook將XSSFWorkbook封裝了一層,其中100表示excel一次讀入內存的最大記錄條數,excel中其余的數據將會生成臨時文件保存到磁盤上。這個參數,可以根據實際需要調整。

還有一點非常重要:

sheet.flushRows();

需要在程序的結尾處加上上面的這段代碼,不然生成的臨時文件是空的。

這樣調整之后,問題被暫時解決了。

此外,順便說一句,在使用WorkBook接口的相關實現類時,用完之后,要記得調用close方法及時關閉喔,不然也可能會出現OOM問題。

6. 后續思考

其實,當時我建議過使用阿里開源的EasyExcel解決OOM的問題。

但同事說,excel中有很多樣式,在導出的新excel中要保留之前的樣式,同時增加一列,返回導入的結果。

如果使用EasyExcel不太好處理,使用原始的Workbook更好處理一些。

但是使用mq異步導入excel文件這套方案,如果并發量大的話,任然可能會出現OOM問題,有安全隱患。

因此,有必要調整一下mq消費者。

后來,mq消費者的線程池,設置成4個線程消費,避免消費者同時處理過多的消息,讀取大量的excel,導致內存占用過多的問題。當然線程個數參數,可以根據實際情況調整。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    12

    文章

    9237

    瀏覽量

    85664
  • URL
    URL
    +關注

    關注

    0

    文章

    139

    瀏覽量

    15376
  • mat
    mat
    +關注

    關注

    0

    文章

    8

    瀏覽量

    9451

原文標題:線上踩坑記:項目中一次OOM的分析定位排查過程!

文章出處:【微信號:芋道源碼,微信公眾號:芋道源碼】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ESP8266從Littlefs加載文件時它崩潰了的原因?

    在我的 ESP8266 中獲得了帶有大量 javascript 的網絡服務器的程序。 當我嘗試從 Littlefs 加載文件時它崩潰了。這可能不是原因,但是,我遇到了內存不足的 OOM
    發表于 05-10 09:24

    linux內核oom機制分析

    Linux 內核有機制叫OOM killer(Out-Of-Memory killer),該機制會監控那些占用內存過大,尤其是瞬間很快消耗大量內存的進程,為了防止內存耗盡而內核會把該進程殺掉。典型
    發表于 11-13 17:01 ?1335次閱讀
    linux內核<b class='flag-5'>oom</b>機制分析

    運營商應如何打造“看到即買到”的線上服務

    為了打造“看到即買到”的線上服務能力,運營商需要找到并開放更多的線上入口,從過去的一對一點式服務升級為點對面的融合
    發表于 10-10 09:04 ?2005次閱讀

    一個線上虛擬展館多少錢?

    展館也由此火爆了起來,許多展館紛紛推出線上游覽服務,運用5G、3D、VR/AR、AI等多種先進技術,結合圖像、視頻、語音,以第/第三視角規劃動線導覽,讓客戶身臨其境體驗虛擬展館,提升獲客效率。
    的頭像 發表于 10-25 14:24 ?1141次閱讀
    做<b class='flag-5'>一個</b><b class='flag-5'>線上</b>虛擬展館多少錢?

    OOM Killer機制學習

    當系統內存不足以分配時,Linux內核會使用OOM Killer(Out-Of-Memory Killer)機制釋放內存,該機制通過系列比較選擇出最適合的進程并將其kill掉,從而達到保障系統穩定運行的目的。那么在內核中,
    的頭像 發表于 12-19 16:17 ?1281次閱讀

    什么是OOM機制?怎么防止進程因為OOM機制而被殺掉?

    有時候我們會發現系統中某個進程會突然掛掉,通過查看系統日志發現是由于 OOM機制 導致進程被殺掉。
    的頭像 發表于 02-06 11:45 ?2881次閱讀

    圖解析K8S OOM和CPU節流

    使用 Kubernetes 時,內存不足 (OOM) 錯誤和 CPU 節流是云應用程序中資源處理的主要難題。
    的頭像 發表于 02-15 17:17 ?1357次閱讀

    什么是OOM機制?怎么防止進程因為OOM機制而被殺掉?

    有時候我們會發現系統中某個進程會突然掛掉,通過查看系統日志發現是由于 OOM機制 導致進程被殺掉。
    的頭像 發表于 06-21 08:59 ?8240次閱讀
    什么是<b class='flag-5'>OOM</b>機制?怎么防止進程因為<b class='flag-5'>OOM</b>機制而被殺掉?

    OOM會導致JVM虛擬機退出嗎

    OutOfMemoryError (OOM)。 這種錯誤是 Error 的子類,通常表示某種無法恢復的問題。 回到主題,先說下結論: OutOfMemoryError 本身不會直接導致JVM退出,但由于其
    的頭像 發表于 09-30 10:14 ?809次閱讀

    如何部署MQTT服務

    1. 選擇哪種MQTT實現方案 根據前面的介紹,可以知道,要想使用MQTT,必須要有服務端。這個服務端既可以自己部署,也可以使用公有云
    的頭像 發表于 11-09 15:29 ?1125次閱讀

    jvm哪些區域會發生oom

    of Memory,OOM),本文將詳細介紹 JVM 內容可能發生 OOM 的區域。OOM 是指應用程序在申請分配內存時,沒有足夠的內存供其使用,導致程序無法正常執行。 堆(Heap)區域: 堆是 JVM 中最大的
    的頭像 發表于 12-05 11:51 ?1425次閱讀

    Java oom異常的原因分析

    據,而棧內存用于存儲方法調用和局部變量。 當程序需要使用更多內存時,會向操作系統請求更多的內存空間。如果操作系統無法分配足夠的內存空間,就會導致OOM異常的發生。 導致OOM異常的原因有多種,下面將詳細介紹些常見的原因。 內存
    的頭像 發表于 12-05 13:43 ?802次閱讀

    oom異常的原因和解決方法

    OOM異常的原因 OOM異常的出現通常是由于以下幾個原因造成的: 1.1 內存泄漏 內存泄漏是指資源在使用完畢后沒有被正確釋放或回收,從而導致內存不斷占用的現象。常見的內存泄漏問題包括對象未被
    的頭像 發表于 12-05 13:45 ?6594次閱讀

    Java怎么排查oom異常

    Java中的OOM(Out of Memory)異常是指當Java虛擬機的堆內存不足以容納新的對象時拋出的異常。OOM異常是種常見的運行時異常,經常出現在長時間運行的Java應用程序或處理大數
    的頭像 發表于 12-05 13:47 ?1264次閱讀

    1.2MB數據如何吃掉10GB內存

    特殊請求引發服務器內存用量暴漲進而導致進程 OOM 的慘案。
    的頭像 發表于 11-04 15:53 ?331次閱讀
    1.2MB數據如何吃掉10GB內存
    主站蜘蛛池模板: 印度最猛性ⅹxxxxx| 国产一卡在线观看完整版| 芭乐草莓樱桃丝瓜18岁大全| 大学生宿舍飞机china free| 国产乱国产乱老熟300部视频| 久久精品日本免费线| 欧美最猛12teevideos| 亚洲 欧美 日韩 卡通 另类| 最近中文字幕免费高清MV视频6| 波多野结衣教师系列6| 好男人在线视频 | 国产AV精品一区二区三区漫画| 国产在线精品亚洲第1页| 男女高潮又爽又黄又无遮挡 | 欧美成人性色生活18黑人| 无限资源好看片2019免费观看| 在线日本v二区不卡| 国产成人片视频一区二区青青| 快穿之诱受双性被灌满h| 十分钟免费观看高清视频大全| 在线广播收听| 国产精品久久久精品日日| 麻豆最新免费版| 香蕉久久夜色精品国产小说| 99国产强伦姧在线看RAPE| 国产日韩久久久精品影院首页| 欧美精品v欧洲高清| 亚洲欧美综合中文| 第四色播日韩AV第一页| 两个女人互添下身高潮自视频| 午夜日本大胆裸艺术| 99在线免费视频| 久久www成人看片| 無码一区中文字幕少妇熟女H | 影音先锋av色咪影院| 大胸女晃奶动态图| 美女夫妻内射潮视频| 亚洲乱码一区二区三区香蕉| 俄罗斯xxxxxbbbbb| 男人私gay挠脚心vk视频| 亚洲日韩国产成网站在线|