Python 開發者們在使用標準庫和通用框架時,都以為自己的程序具有可靠的安全性。然而,在 Python 中,就像在任何其它編程語言中一樣,有一些特性可能會被開發者們誤解或誤用。通常而言,只有極少的微妙之處或細節會使開發者們疏忽大意,從而在代碼中引入嚴重的安全漏洞。
在這篇博文中,我們將分享在實際 Python 項目中遇到的 10 個安全陷阱。我們選擇了一些在技術圈中不太為人所知的陷阱。通過介紹每個問題及其造成的影響,我們希望提高人們對這些問題的感知,并提高大家的安全意識。如果你正在使用這些特性,請一定要排查你的 Python 代碼!
1.被優化掉的斷言
Python 支持以優化的方式執行代碼。這使代碼運行得更快,內存用得更少。當程序被大規模使用,或者可用的資源很少時,這種方法尤其有效。一些預打包的 Python 程序提供了優化的字節碼。
然而,當代碼被優化時,所有的 assert 語句都會被忽略。開發者有時會使用它們來判斷代碼中的某些條件。例如,如果使用斷言來作身份驗證檢查,則可能導致安全繞過。
defsuperuser_action(request,user):
assertuser.is_super_user
#executeactionassuperuser
在這個例子中,第 2 行中的 assert 語句將被忽略,導致非超級用戶也可以運行到下一行代碼。不推薦使用 assert 語句進行安全相關的檢查,但我們確實在實際的項目中看到過它們。
2. MakeDirs 權限
os.makdirs
函數可以在操作系統中創建一個或多個文件夾。它的第二個參數 mode 用于指定創建的文件夾的默認權限。在下面代碼的第 2 行中,文件夾 A/B/C 是用 rwx------ (0o700) 權限創建的。這意味著只有當前用戶(所有者)擁有這些文件夾的讀、寫和執行權限。
definit_directories(request):
os.makedirs("A/B/C",mode=0o700)
returnHttpResponse("Done!")
在 Python < 3.6 版本中,創建出的文件夾 A、B 和 C 的權限都是 700。但是,在 Python > 3.6 版本中,只有最后一個文件夾 C 的權限為 700,其它文件夾 A 和 B 的權限為默認的 755。
因此,在 Python > 3.6 中,os.makdirs
函數等價于 Linux 的這條命令:mkdir -m 700 -p A/B/C
。有些開發者沒有意識到版本之間的差異,這已經在 Django 中造成了一個權限越級漏洞(cve - 2022 -24583),無獨有偶,這在 WordPress 中也造成了一個加固繞過問題。
3.絕對路徑拼接
os.path.join(path, *paths)
函數用于將多個文件路徑連接成一個組合的路徑。第一個參數通常包含了基礎路徑,而之后的每個參數都被當做組件拼接到基礎路徑后。
然而,這個函數有一個少有人知的特性。如果拼接的某個路徑以 / 開頭,那么包括基礎路徑在內的所有前綴路徑都將被刪除,該路徑將被視為絕對路徑。下面的示例揭示了開發者可能遇到的這個陷阱。
defread_file(request):
filename=request.POST['filename']
file_path=os.path.join("var","lib",filename)
iffile_path.find(".")!=-1:
returnHttpResponse("Failed!")
withopen(file_path)asf:
returnHttpResponse(f.read(),content_type='text/plain')
在第 3 行中,我們使用 os.path.join 函數將用戶輸入的文件名構造出目標路徑。在第 4 行中,檢查生成的路徑是否包含”.“,防止出現路徑遍歷漏洞。
但是,如果攻擊者傳入的文件名參數為”/a/b/c.txt“,那么第 3 行得到的變量 file_path 會是一個絕對路徑(/a/b/c.txt)。即 os.path.join 會忽略掉”var/lib“部分,攻擊者可以不使用“.”字符就讀取到任何文件。盡管 os.path.join 的文檔中描述了這種行為,但這還是導致了許多漏洞(Cuckoo Sandbox Evasion, CVE-2020-35736)。
4. 任意的臨時文件
tempfile.NamedTemporaryFile
函數用于創建具有特定名稱的臨時文件。但是,prefix(前綴)和 suffix(后綴)參數很容易受到路徑遍歷攻擊(Issue 35278)。如果攻擊者控制了這些參數之一,他就可以在文件系統中的任意位置創建出一個臨時文件。下面的示例揭示了開發者可能遇到的一個陷阱。
def touch_tmp_file(request):
id = request.GET['id']
tmp_file = tempfile.NamedTemporaryFile(prefix=id)
return HttpResponse(f"tmp file: {tmp_file} created!", content_type='text/plain')
在第 3 行中,用戶輸入的 id 被當作臨時文件的前綴。如果攻擊者傳入的 id 參數是“/../var/www/test”,則會創建出這樣的臨時文件:/var/www/test_zdllj17。粗看起來,這可能是無害的,但它會為攻擊者創造出挖掘更復雜的漏洞的基礎。
5.擴展的 Zip Slip
在 Web 應用中,通常需要解壓上傳后的壓縮文件。在 Python 中,很多人都知道 TarFile.extractall 與 TarFile.extract 函數容易受到 Zip Slip 攻擊。攻擊者通過篡改壓縮包中的文件名,使其包含路徑遍歷(../)字符,從而發起攻擊。
這就是為什么壓縮文件應該始終被視為不受信來源的原因。zipfile.extractall 與 zipfile.extract 函數可以對 zip 內容進行清洗,從而防止這類路徑遍歷漏洞。
但是,這并不意味著在 ZipFile 庫中不會出現路徑遍歷漏洞。下面是一段解壓縮文件的代碼。
def extract_html(request):
filename = request.FILES['filename']
zf = zipfile.ZipFile(filename.temporary_file_path(), "r")
for entry in zf.namelist():
if entry.endswith(".html"):
file_content = zf.read(entry)
with open(entry, "wb") as fp:
fp.write(file_content)
zf.close()
return HttpResponse("HTML files extracted!")
第 3 行代碼根據用戶上傳文件的臨時路徑,創建出一個 ZipFile 處理器。第 4 - 8 行代碼將所有以“.html”結尾的壓縮項提取出來。第 4 行中的 zf.namelist 函數會取到 zip 內壓縮項的名稱。注意,只有 zipfile.extract 與 zipfile.extractall 函數會對壓縮項進行清洗,其它任何函數都不會。
在這種情況下,攻擊者可以創建一個文件名,例如“../../../var/www/html”,內容隨意填。該惡意文件的內容會在第 6 行被讀取,并在第 7-8 行寫入被攻擊者控制的路徑。因此,攻擊者可以在整個服務器上創建任意的 HTML 文件。
如上所述,壓縮包中的文件應該被看作是不受信任的。如果你不使用 zipfile.extractall 或者 zipfile.extract,你就必須對 zip 內文件的名稱進行“消毒”,例如使用 os.path.basename。否則,它可能導致嚴重的安全漏洞,就像在 NLTK Downloader (CVE-2019-14751)中發現的那樣。
審核編輯:湯梓紅
-
程序
+關注
關注
117文章
3795瀏覽量
81303 -
代碼
+關注
關注
30文章
4823瀏覽量
68904 -
python
+關注
關注
56文章
4807瀏覽量
84957
發布評論請先 登錄
相關推薦
評論