色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么有時進程莫名奇妙就沒有了?

Linux閱碼場 ? 來源:卯時卯刻 ? 作者:KINGYT ? 2021-05-24 17:25 ? 次閱讀

先來看段代碼:

566b5b06-bc29-11eb-bf61-12bb97331649.png

這段代碼非常簡單,就是先用mmap的方式,為該進程分配10GiB的虛擬內存,然后再用page寫的方式,讓操作系統為這10GiB虛擬內存,分配對應的物理內存,最后sleep,等待我們測試。

運行下。

沒啥問題,和我們預期的一樣,正常執行。

打開另一個終端,執行以下命令,看下它的內存占用:

56883a6e-bc29-11eb-bf61-12bb97331649.png

上圖中的VSZ指的是虛擬內存,RSS指的是物理內存,單位都是KiB,所以該進程虛擬內存和物理內存的使用,都約等于10GiB,沒問題。

我們再開個終端,再執行下這個程序。

第二次執行這個程序也沒問題,但奇怪的是,此時第一次執行的那個程序卻被kill掉了。

這是為什么呢?

上面我們說到,該程序的邏輯是分配10GiB的物理內存,所以運行兩次,也就是要分配20GiB的物理內存。

但在我們的測試機器上,物理內存一共才16GiB,所以,運行兩個這樣的進程肯定是不行的。

在第二次執行該程序,且向操作系統申請物理內存時,操作系統會發現,物理內存已經沒有了。

此時,為了防止整個系統crash掉,linux內核會觸發 OOM/Out of Memory killing 機制,即按照一定的規則選擇一個進程,將其kill掉,以便回收物理內存,以此來保證機器整體的穩定運行。

同時,該kill事件,也會被記錄到內核日志中,且可通過dmesg命令等方式查看。

比如上面第一個進程被kill掉的事件記錄如下:

56e61c06-bc29-11eb-bf61-12bb97331649.png

看上面紅色字體行,該行是說,進程14134因為out of memory被linux內核kill掉了,該進程正是上面我們第一次執行的那個程序。

linux內核的oom killing機制,其實是一種棄車保帥的做法,因為如果我們不kill掉某進程,來釋放物理內存的話,那很有可能會導致后續系統級別的crash,兩害相權取其輕,操作系統只能這樣處理,歸根結底,是我們對進程使用物理內存的規劃不足,才導致了這種情況。

那為什么不在第二次執行該程序時,在調用mmap分配虛擬內存時就直接報錯,返回無法分配內存呢?

這是因為,經過多年觀察,linux內核的開發人員發現,絕大部分程序在分配了很大的虛擬內存之后,在大部分時間里,并不會一直使用這么多的物理內存。

所以,為了更合理更高效的利用物理內存資源,linux內核允許虛擬內存的overcommit,即,例如在上面執行mmap分配虛擬內存時,linux內核并不會嚴格檢查,所有運行中的進程分配的虛擬內存加起來,是否超過了整個物理內存大小。

這也就解釋了為什么上面第二次運行該程序時,mmap是沒有報錯的。

但是,雖然mmap的虛擬內存分配成功了,但當真正使用該內存時,比如上面的寫內存,此時要分配物理內存,則是有可能失敗的,因為虛擬內存的overcommit,很可能導致后續的物理內存不足。

如果真的發生了這種情況,就會觸發linux內核的oom killing機制,即linux內核中的oom killer會按一定的規則,選一個進程,將其kill掉,這個上面我們已經演示過了。

那為什么不kill掉第二個進程,而是kill掉第一個呢?

這個和linux內核中oom killer的選擇策略有關,我們直接看源碼:

5716408e-bc29-11eb-bf61-12bb97331649.png

當進程請求操作系統為其分配物理內存時,如果此時物理內存已經沒有了,則會觸發上圖中的out_of_memory函數。

該函數中,會使用select_bad_process選擇要被kill掉的進程,然后使用oom_kill_process將其kill掉,來釋放物理內存。

在看select_bad_process之前,我們先看下oom_kill_process:

5745f928-bc29-11eb-bf61-12bb97331649.png

該函數調用了__oom_kill_process:

575389b2-bc29-11eb-bf61-12bb97331649.png

在上面的函數中,通過向victim進程發送SIGKILL這個signal(我們平時使用的kill -9命令,就是用的這個signal),將其kill掉,然后該kill事件,會被記錄到內核日志中。

注意,這里記錄的日志格式,正好和我們上面用dmesg輸出的,14134進程被kill掉事件日志格式完全一樣。

kill掉進程的過程就是這樣,我們再來看下select_bad_process函數是如何選擇要被kill掉進程的:

576449b4-bc29-11eb-bf61-12bb97331649.png

在該函數中,會遍歷系統中的所有進程,然后使用oom_evaluate_task這個函數,對各個進程進行評估:

57b3a3ba-bc29-11eb-bf61-12bb97331649.png

oom_evaluate_task函數中,會使用oom_badness,計算某進程badness的點數,點數越高,越容易被kill掉。

如果badness的點數是LONG_MIN這個特殊值,則直接跳過該進程,即該進程不會成為被kill掉的對象,如果badness點數小于之前選擇進程的badness點數,同樣也跳過該進程,即被kill掉的進程badness點數要是最大的。

遍歷中選擇的進程,及其badness的點數,會被賦值到oc->chosen和oc->chosen_points里,oc->chosen最終指向的進程,就是上面oom_kill_process里kill掉的進程。

我們再來看下badness點數是如何計算的:

57d364c0-bc29-11eb-bf61-12bb97331649.png

該函數主體邏輯分成兩部分,一部分是,在某些情況下,該進程的badness點數直接返回LONG_MIN,即不會被kill掉。

這些情況包括,oom_score_adj的值為OOM_SCORE_ADJ_MIN,即-1000,或者該進程已經在被kill的過程中了,或者該進程在vfork過程中。

該函數邏輯的另外一部分就是計算進程的badness點數,其大致計算規則為:

points = 該進程占用的物理內存總數 +總物理內存 * oom_score_adj值的千分比。

oom_score_adj的值,是進程獨有的,是可以通過寫 /proc/[pid]/oom_score_adj 的方式調整的,取值范圍為 -1000 到 1000。

該值越大,進程總的badness點數就會越大,進程也就越容易被kill掉。

該值越小,進程總的badness點數就會越小,該進程也就越不容易被kill掉。

上面我們還提到oom_score_adj有一個特殊值為OOM_SCORE_ADJ_MIN,即-1000,表示該進程不能被kill掉。

各進程的oom_score_adj的值默認為0。

綜上可知,linux內核中oom killer選擇被kill進程的方式,就是看各進程badness點數的大小。

默認情況下,因為各進程的oom_score_adj的值都為0,所以進程占用的物理內存越大,其badness點數也就越大,其也就越容易被kill掉。

這也就解釋了,為什么上面在第二次執行那個程序時,被kill掉的是第一次執行的那個進程,而不是第二次執行的進程,因為第一次執行的那個進程,占用的物理內存更大。

其實,調整linux內核中oom killer行為的方式有很多,不止修改oom_score_adj值這一種方法。

比如,通過修改 /proc/sys/vm/panic_on_oom 的值,可以讓整個系統在物理內存不夠時,直接panic,而不是選擇性的kill掉某個進程。

比如,通過修改 /proc/sys/vm/overcommit_memory 的值,可以使上面第二次執行的測試程序,在使用mmap分配虛擬內存時,就直接報錯,說內存不夠。

比如,通過修改/proc/[pid]/oom_adj 值的方式,同樣可以達到修改/proc/[pid]/oom_score_adj 的目的,不過這個在內核2.6.36版本之后已經不推薦使用。

oom killer行為調整的相關參數,其具體詳解可以看proc的man文檔:

https://man.archlinux.org/man/proc.5

聊了這么多,那理解linux內核的oom killer機制,對于我們實際應用有哪些幫助呢?

我們假設以下場景:

假如,我們有一臺機器,上面跑著一個非常重要的服務,比如數據庫,或者某個應用進程等。

它非常耗內存,但是正常情況下,它使用的物理內存肯定不會高于實際總物理內存大小。

有一天我們需要在這臺機器上執行一項任務,如果這個任務也比較耗內存,那很可能在執行這項任務時,整臺機器的物理內存就完全不夠用了,此時,就會觸發linux內核的oom killing機制。

又因為在不調整oom_score_adj值的情況下,linux內核中的oom killer默認kill掉的,就是占用物理內存最多的那個進程,一般來說,就是我們數據庫進程,或其他應用進程,假設這個進程又是線上的一個重要服務,那它被kill掉了,你想一下這會是多么嚴重的一個事故。

那怎么避免呢?

此時,我們就可以使用上面提到的,用于調整進程badness點數的,oom_score_adj 這個參數。

比如,我們可以通過 echo -1000 > /proc/[pid]/oom_score_adj 命令,將oom_score_adj的值設置為-1000,即該進程不能被kill掉。

又比如,還是通過上面的echo命令,將oom_score_adj的值修改為一個較小的值,來降低它被kill掉的概率。

但是,這些方法其實都不是完美的解決方式。

雖然該機器上的這個重要服務不被kill掉了,但操作系統為了保證整個系統不crash,還是會kill掉其他各種進程。

如果那些進程不重要還好,萬一重要的話,還是會相當嚴重的。

甚至,如果操作系統找不到可以kill掉的進程,那整個系統就會crash,這個就更嚴重了。

所以,最好的方式,還是人為去避免物理內存不足的情況,在機器上跑各種程序時,要提前對整個物理內存的使用,有個規劃和預判,最好是能預留出一些內存,以防各種誤操作。

好了,該篇文章就講這些內容,如果以后你發現你的進程,莫名奇妙就沒有了,可以通過dmesg等方式看下內核日志,確定下你的進程是否被oom kill掉了。

原文標題:為什么我的進程被kill掉了

文章出處:【微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4818

    瀏覽量

    68874
  • 進程
    +關注

    關注

    0

    文章

    204

    瀏覽量

    13973

原文標題:為什么我的進程被kill掉了

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    在程序運行時會偶爾出現ads1247寄存器數據莫名其妙丟失的現象,為什么?

    最近遇到一個莫名其妙的問題,我的ads1247可以正常工作,得到的轉化溫度也是正常的,但是在程序運行時會偶爾出現ads1247寄存器數據莫名其妙丟失的現象,很讓人費解,不知道各位有沒有遇到過
    發表于 01-06 07:49

    ADS1247上電初始化時,有時會失敗,為什么?

    我在使用ADS1247的時候發現幾個問題: 1.上電初始化時,有時會失敗,即內部基準沒有建立! 2.AD采樣過程中會發生數據莫名其妙變為0的情況,之后數據就不會再發生變化了!
    發表于 12-30 08:24

    使用TVP5158對640x480的逐行視頻進行解碼時,運行一段時間后就沒有時鐘信號,為什么?

    在使用TVP5158對640x480的逐行視頻進行解碼時,運行一段時間后(時間長短不一,在1-7小時之間)就沒有時鐘信號,這時讀到TVP5158里的寄存器的值顯示有視頻數據,這會是什么原因導致的?
    發表于 12-18 07:55

    用PCM1870采樣電話中的聲音,采得的數據有時沒有的,為什么?

    我用PCM1870(16位音頻AD)采樣電話中的聲音,但采得的數據有時沒有的,是0,就丟數據,但我用示波器看輸入的信號,信號確實是輸入了的,但輸出就是沒有啊???
    發表于 11-08 06:43

    一文搞懂Linux進程的睡眠和喚醒

    的代碼和數據,進而去執行這個進程。下面列舉了一些進程狀態: 注意:沒有+時,默認是后臺進程 進程調度(
    發表于 11-04 15:15

    Python中多線程和多進程的區別

    Python作為一種高級編程語言,提供多種并發編程的方式,其中多線程與多進程是最常見的兩種方式之一。在本文中,我們將探討Python中多線程與多進程的概念、區別以及如何使用線程池與進程
    的頭像 發表于 10-23 11:48 ?455次閱讀
    Python中多線程和多<b class='flag-5'>進程</b>的區別

    【軟件干貨】Android應用進程如何保活?

    在Android應用程序中,為了保證應用的正常運行和穩定性,有時需要對應用進程進行保活。以下是一些實現進程保活的方法:
    的頭像 發表于 10-15 17:05 ?533次閱讀
    【軟件干貨】Android應用<b class='flag-5'>進程</b>如何保活?

    TPA3221功放工作后莫名其妙就燒掉了,為什么?

    各位大神好,現在這個功放工作后莫名其妙就燒掉了,有時候工作中又無故不工作(需要重新復位)。內部LDO正常,MUTE正常工作有5V,不正常的時候2V左右。輸出正常1/2VCC,不正常時有時候4V,
    發表于 10-11 06:09

    pads打印彩色貼片圖時,為什么有時有顏色選擇,有時沒有顏色選擇?

    pads打印彩色貼片圖時,這個位置,為什么有時有顏色選擇,有時沒有顏色選擇?
    發表于 09-13 14:48

    PGA2310沒有程控時,輸入信號100mV,11腳輸出2.4V,有時沒有信號輸出有時只能輸出幾百毫伏的原因?

    沒有程控時,輸入信號100mV,11腳輸出2.4V,但有時沒有信號輸出,有時只能輸出幾百毫伏,請問高手。
    發表于 08-30 08:16

    探秘LED顯示屏背后的秘密:數字信號與數字電路的奇妙世界

    探秘LED顯示屏背后的秘密:數字信號與數字電路的奇妙世界
    的頭像 發表于 08-02 02:36 ?447次閱讀

    測試STM8的UART的時候,STM8S003好像燒不進程,為什么?

    小弟剛學STM8,遇到個問題,望不吝賜教我剛剛在測試STM8的UART的時候,發現我所使用的STM8S003好像燒不進程,就是進入debug界面的時候的程序更新,然后也跳出busy那個對話框
    發表于 05-11 08:18

    IAR for stm8編譯很慢很慢有時候就無響應是怎么回事?

    小弟第一次用這個編譯器,IAR for stm8編譯很慢很慢有時候就無響應,有遇到過得嗎?
    發表于 05-08 06:00

    使用STM32F401的單片機移植ucosii操作系統后,在循環中調用sprintf函數時莫名卡死的原因?

    使用STM32F401的單片機移植ucosii操作系統后。在編寫任務函數時,在循環中調用sprintf函數時莫名卡死的原因?
    發表于 04-02 06:12

    在進行ad9626的配置后,測試DCO并沒有時鐘的輸出的原因?

    在進行ad9626的配置后,測試DCO并沒有時鐘的輸出,然后進行寄存器ID數據的讀出,讀出了ID地址的數據,然后再次進行了配置寄存器,DCO還是沒有時鐘的輸出。
    發表于 02-27 07:25
    主站蜘蛛池模板: 国产亚洲视频精彩在线播放| 91桃色污无限免费看| 天天操天天干天天爽| 亚洲日韩乱码人人爽人人澡人| 国产亚洲精品久久久久苍井松| 久久re热在线视频精69| 人人在线碰碰视频免费| 妖精视频一区二区免费| 富婆夜店找黑人猛男BD在线| 久久亚洲AV成人无码动态图| 久草在在线免视频在线观看| 秋霞电影院午夜伦高清| 亚洲中文字幕欧美自拍一区| 公么我好爽再深一点| 免费成年人在线视频| 欧美午夜福利主线路| 亚洲一区免费香蕉在线| 国产精品xxxav免费视频| 好男人社区| 快播h动漫网| 亚洲AV无码一区二区色情蜜芽 | 飘雪韩国在线观看免费高清完整版| 香蕉久久夜色精品国产小优| 一二三四在线观看高清电视剧 | 一道本无吗d d在线播放| 国产精品亚洲污污网站入口 | 九九精品国产亚洲A片无码| 神马电影院午 夜理论| G0GO人体大尺香蕉| 麻豆无人区乱码| 姉调无修版ova国语版| 久久国产精品免费网站| 亚洲日本在线不卡二区 | 高肉黄暴NP文公交车| 日本wwwhdsex69| 超级碰碰青草久热国产| 韩国精品韩国专区久久| 午夜男女爽爽羞羞影院在线观看| 调教美丽的白丝袜麻麻视频| 秋霞影院福利电影| 岛国大片在线播放高清|