在進(jìn)行產(chǎn)品開(kāi)發(fā)或者軟件設(shè)計(jì)時(shí),有沒(méi)有遇到過(guò)下面的這種情況:
程序本來(lái)運(yùn)行的好好的,莫名其妙的就出現(xiàn)了bug,但是還找不到出現(xiàn)bug的規(guī)律?
已經(jīng)驗(yàn)證好的產(chǎn)品,到客戶(hù)那里突然出現(xiàn)了問(wèn)題?
出現(xiàn)的bug總是莫名其妙,找不到規(guī)律,感覺(jué)像“幽靈”一般的存在?
增加了一行無(wú)關(guān)的代碼,程序就不能運(yùn)行了?
其實(shí),有的時(shí)候,問(wèn)題原因會(huì)以一種微妙的方式影響代碼的存在,今天我們重點(diǎn)講解一下難以發(fā)現(xiàn)的、容易導(dǎo)致軟件問(wèn)題的5種情況,以及所對(duì)應(yīng)的應(yīng)對(duì)措施。
01
堆棧溢出
肯定很多程序員都非常了解“堆棧溢出”這種情況。堆棧溢出可能會(huì)對(duì)數(shù)據(jù)或者指令造成破壞,從而影響程序的正確運(yùn)行。 并且,發(fā)生堆棧溢出這種錯(cuò)誤,在嵌入式設(shè)備程序中造成的影響比計(jì)算機(jī)中更大。通常有以下幾種原因:
1、嵌入式系統(tǒng)通常使用較少的RAM
2、通常沒(méi)有可依賴(lài)的虛擬內(nèi)存(因?yàn)闆](méi)有磁盤(pán))
3、基于RTOS任務(wù)的固件設(shè)計(jì)使用多個(gè)堆棧(每個(gè)任務(wù)一個(gè)),每個(gè)堆棧的大小必須足夠大,以確保不受唯一最壞情況堆棧深度的影響
4、中斷處理程序可能會(huì)嘗試使用這些堆棧 在進(jìn)行相關(guān)測(cè)試的時(shí)候,有的時(shí)候堆棧溢出這種錯(cuò)誤我們并不能測(cè)試出來(lái),這就造成了:經(jīng)過(guò)測(cè)試驗(yàn)證的程序,到客戶(hù)處突然運(yùn)行異常了。
為了避免發(fā)生堆棧溢出這種錯(cuò)誤,我們可以通過(guò)自上而下的代碼控制流分析方法,來(lái)證明代碼是否會(huì)出現(xiàn)堆棧溢出錯(cuò)誤。
避免措施:
1、確定好自己程序定義的堆棧的全部空間地址;
2、在臨近堆棧的位置,定義固定地址的數(shù)組或者數(shù)據(jù);
3、在程序中實(shí)時(shí)檢查數(shù)組或者數(shù)據(jù)的值,若發(fā)現(xiàn)數(shù)據(jù)改變,證明發(fā)生了堆棧溢出,增加特殊的處理姿勢(shì):如讓設(shè)備進(jìn)入到特定的安全模式,或者輸出當(dāng)前的PC地址等。
02
競(jìng)爭(zhēng)條件
在程序運(yùn)行過(guò)程中,大量的、無(wú)序的任務(wù)一直在運(yùn)行,但是資源是有限的,兩個(gè)不同的任務(wù)之間可能就存在競(jìng)爭(zhēng)資源的情況,由于兩個(gè)或者多個(gè)進(jìn)程競(jìng)爭(zhēng)使用不能被同時(shí)訪問(wèn)的資源,使得這些進(jìn)程有可能因?yàn)闀r(shí)間上推進(jìn)的先后原因而出現(xiàn)問(wèn)題,這叫做競(jìng)爭(zhēng)條件。
條件競(jìng)爭(zhēng)就是兩個(gè)或者多個(gè)進(jìn)程或者線程同時(shí)處理一個(gè)資源(如全局變量、文件等)產(chǎn)生非預(yù)想的執(zhí)行效果,從而產(chǎn)生程序執(zhí)行流的改變,從而達(dá)到攻擊的目的。
防止條件競(jìng)爭(zhēng)的方法如下:
1、采用某種保護(hù)機(jī)制來(lái)保護(hù)數(shù)據(jù)(如互斥體),確保只有進(jìn)行修改的線程才能看到不變量被破壞時(shí)的中間狀態(tài);
2、使用無(wú)鎖編程;
3、使用事務(wù)來(lái)處理更新,將數(shù)據(jù)和讀取都存儲(chǔ)到事務(wù)日志中,然后將之前的操作合并為一步,再進(jìn)行提交。當(dāng)數(shù)據(jù)被另一個(gè)線程修改后,或處理已經(jīng)重啟的情況下,提交就會(huì)無(wú)法進(jìn)行。
03
不可重入函數(shù)
首先需要區(qū)分什么是可重入什么是不可重入函數(shù)?
可重入函數(shù):可重入函數(shù)可以由多個(gè)任務(wù)并發(fā)使用,而不必?fù)?dān)心數(shù)據(jù)錯(cuò)誤
不可重入函數(shù):不能由超過(guò)一個(gè)任務(wù)所共享,除非能確保函數(shù)的互斥(或者使用信號(hào)量,或者在代碼的關(guān)鍵部分禁用中斷)
一些常見(jiàn)的不可重入函數(shù)的情形:
函數(shù)中使用了靜態(tài)變量,無(wú)論是全局變量還是局部靜態(tài)變量
函數(shù)返回靜態(tài)變量
函數(shù)中調(diào)用了不可重入函數(shù)
函數(shù)體內(nèi)使用了靜態(tài)的數(shù)據(jù)結(jié)構(gòu)
函數(shù)體內(nèi)調(diào)用了malloc()或者free()函數(shù)
函數(shù)體內(nèi)調(diào)用了其他標(biāo)準(zhǔn)I/O函數(shù)
函數(shù)是singleton中的成員函數(shù)而且使用了不使用線程獨(dú)立存儲(chǔ)的成員變量
總得來(lái)說(shuō),如果一個(gè)函數(shù)在重入條件下使用了未受保護(hù)的共享資源,那么他就是不可重入的。
例如兩個(gè)函數(shù)func1和func2都是不可重入函數(shù):對(duì)多線程條件下,操作系統(tǒng)會(huì)在func1還沒(méi)有執(zhí)行完的情況下,切換到另一個(gè)線程中,那個(gè)線程可能再次調(diào)用func1,這樣狀態(tài)就錯(cuò)了。
避免措施:
在每個(gè)庫(kù)或驅(qū)動(dòng)程序模塊中創(chuàng)建并隱藏一個(gè)本質(zhì)上不可重入的互斥鎖。將此互斥鎖的獲取作為操作整個(gè)模塊中使用的任何持久數(shù)據(jù)或共享寄存器的先決條件。
04
優(yōu)先級(jí)翻轉(zhuǎn)
優(yōu)先級(jí)翻轉(zhuǎn)是當(dāng)一個(gè)高優(yōu)先級(jí)任務(wù)通過(guò)信號(hào)量機(jī)制訪問(wèn)共享資源時(shí),該信號(hào)量已被一低優(yōu)先級(jí)任務(wù)占有,因此造成高優(yōu)先級(jí)任務(wù)被許多具有較低優(yōu)先級(jí)任務(wù)阻塞,實(shí)時(shí)性難以得到保證。
比較經(jīng)典的由于優(yōu)先級(jí)翻轉(zhuǎn)造成的事故就是當(dāng)年的火星探路者號(hào),就由于,此處所說(shuō)的,優(yōu)先級(jí)反轉(zhuǎn),而導(dǎo)致了內(nèi)部執(zhí)行邏輯出錯(cuò)的bug。
在1997年7月4號(hào)發(fā)射后,在開(kāi)始搜集氣象數(shù)據(jù)之后沒(méi)幾天,系統(tǒng)(無(wú)故)重啟了。后來(lái),當(dāng)然,被相關(guān)技術(shù)人員找到問(wèn)題根源,就是,這個(gè)優(yōu)先級(jí)反轉(zhuǎn)所導(dǎo)致的,然后修復(fù)了此bug。
解決措施:
1、優(yōu)先級(jí)天花板
優(yōu)先級(jí)天花板是當(dāng)線程申請(qǐng)某資源時(shí),把該線程的優(yōu)先級(jí)提升到可訪問(wèn)這個(gè)資源的所有線程中的最高優(yōu)先級(jí),這個(gè)優(yōu)先級(jí)稱(chēng)為該資源的優(yōu)先級(jí)天花板。這種方法簡(jiǎn)單易行,不必進(jìn)行復(fù)雜的判斷,不管線程是否阻塞了高優(yōu)先級(jí)線程的運(yùn)行, 只要線程訪問(wèn)共享資源都會(huì)提升線程的優(yōu)先級(jí)。
2、優(yōu)先級(jí)繼承
優(yōu)先級(jí)繼承是當(dāng)線程A申請(qǐng)共享資源Source時(shí),如果共享資源Source正在被線程C使用,通過(guò)比較線程C與自身的優(yōu)先級(jí),如發(fā)現(xiàn)線程C的優(yōu)先級(jí)小于自身的優(yōu)先級(jí), 則將線程C的優(yōu)先級(jí)提升到自身的優(yōu)先級(jí),線程C釋放資源Source后,再恢復(fù)線程C的原優(yōu)先級(jí)。這種方法只在占有資源的低優(yōu)先級(jí)線程阻塞了高優(yōu)先級(jí)線程時(shí)才動(dòng)態(tài)的改變線程的優(yōu)先級(jí)。
05
內(nèi)存泄漏
內(nèi)存泄漏(Memory Leak)是指程序中已動(dòng)態(tài)分配的堆內(nèi)存由于某種原因程序未釋放或無(wú)法釋放,造成系統(tǒng)內(nèi)存的浪費(fèi),導(dǎo)致程序運(yùn)行速度減慢甚至系統(tǒng)崩潰等嚴(yán)重后果。
解決措施: 當(dāng)申請(qǐng)了動(dòng)態(tài)區(qū)域,用完的時(shí)候一定要記得釋放(free),如果沒(méi)有釋放,那么這塊內(nèi)存區(qū)域就將處于不可用狀態(tài)(就像占著茅坑不拉屎一樣),程序大了或運(yùn)行久了就極有可能會(huì)導(dǎo)致內(nèi)存的泄露(重啟一下就能解決90%的問(wèn)題根源),同時(shí)我們?cè)卺尫诺臅r(shí)候也要注意釋放的內(nèi)存只能釋放一次,不要重復(fù)的釋放,有的時(shí)候代碼量會(huì)比較大,所以有可能會(huì)在不止一處地方進(jìn)行了代碼的釋放操作。因?yàn)槲覀儍?nèi)存釋放了一次后,該內(nèi)存區(qū)域就有可能用來(lái)做別的事了,如果這時(shí)候我們又再釋放一遍就很有可能會(huì)出現(xiàn)問(wèn)題了。釋放完之后最好把指針指向空地址,避免下次再使用指針的時(shí)候出現(xiàn)地址的錯(cuò)誤。
審核編輯:劉清
-
RAM
+關(guān)注
關(guān)注
8文章
1369瀏覽量
114765 -
中斷處理
+關(guān)注
關(guān)注
0文章
94瀏覽量
10986 -
RTOS
+關(guān)注
關(guān)注
22文章
817瀏覽量
119715 -
堆棧溢出
+關(guān)注
關(guān)注
0文章
9瀏覽量
7921
原文標(biāo)題:不要以為莫名其妙的bug是玄學(xué)!介紹5個(gè)引起程序隱藏bug的原因以及預(yù)防措施。
文章出處:【微信號(hào):精通單片機(jī)與嵌入式,微信公眾號(hào):精通單片機(jī)與嵌入式】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論