亚洲综合视频在线,亚洲第成色999久久网站,又黑又粗又硬欧美视频在线观看

6. 不完整的正則表達式匹配

正則表達式（regex）是大多數 Web 程序不可或缺的一部分。我們經常能看到它被自定義的 Web 應用防火墻（WAF，Web Application Firewalls）用來作輸入驗證，例如檢測惡意字符串。在 Python 中，re.match 和 re.search 之間有著細微的區別，我們將在下面的代碼片段中演示。

def is_sql_injection(request):
    pattern = re.compile(r".*(union)|(select).*")
    name_to_test = request.GET['name']
    if re.search(pattern, name_to_test):
        return True
    return False

在第 2 行中，我們定義了一個匹配 union 或者 select 的模式，以檢測可能的 SQL 注入。這是一個糟糕的寫法，因為你可以輕易地繞過這些黑名單，但我們已經在線上的程序中見過它。在第 4 行中，函數 re.match 使用前面定義好的模式，檢查第 3 行中的用戶輸入內容是否包含這些惡意的值。

然而，與 re.search 函數不同的是，re.match 函數不匹配新行。例如，如果攻擊者提交了值 aaaaaa \n union select，這個輸入就匹配不上正則表達式。因此，檢查可以被繞過，失去保護作用。

總而言之，我們不建議使用正則表達式黑名單進行任何安全檢查。

7. Unicode 清洗器繞過

Unicode 支持用多種形式來表示字符，并將這些字符映射到碼點。在 Unicode 標準中，不同的 Unicode 字符有四種歸一化方案。程序可以使用這些歸一化方法，以獨立于人類語言的標準方式來存儲數據，例如用戶名。

然而，攻擊者可以利用這些歸一化，這已經導致了 Python 的 urllib 出現漏洞（CVE-2019-9636）。下面的代碼片段演示了一個基于 NFKC 歸一化的跨站點腳本漏洞（XSS,Cross-Site Scripting）。

import unicodedata
from django.shortcuts import render
from django.utils.html import escape

def render_input(request):
    user_input = escape(request.GET['p'])
    normalized_user_input = unicodedata.normalize("NFKC", user_input)
    context = {'my_input': normalized_user_input}
    return render(request, 'test.html', context)

在第 6 行中，用戶輸入的內容被 Django 的 escape 函數處理了，以防止 XSS 漏洞。在第 7 行中，經過清洗的輸入被 NFKC 算法歸一化，以便在第 8-9 行中通過 test.html 模板正確地渲染。

templates/test.html

{{ my_input | safe}}

在模板 test.html 中，第 4 行的變量 my_input 被標記為安全的，因為開發人員預期有特殊字符，并且認為該變量已經被 escape 函數清洗了。通過標記關鍵字 safe, Django 不會再次對變量進行清洗。

但是，由于第 7 行（view.py）的歸一化，字符“%EF%B9%A4”會被轉換為“<”，“%EF%B9%A5”被轉換為“>”。這導致攻擊者可以注入任意的 HTML 標記，進而觸發 XSS 漏洞。為了防止這個漏洞，就應該在把用戶輸入做完歸一化之后，再進行清洗。

8. Unicode 編碼碰撞

前文說過，Unicode 字符會被映射成碼點。然而，有許多不同的人類語言，Unicode 試圖將它們統一起來。這就意味著不同的字符很有可能擁有相同的“layout”。例如，小寫的土耳其語 ?（沒有點）的字符是英語中大寫的 I。在拉丁字母中，字符 i 也是用大寫的 I 表示。在 Unicode 標準中，這兩個不同的字符都以大寫形式映射到同一個碼點。

這種行為是可以被利用的，實際上已經在 Django 中導致了一個嚴重的漏洞（CVE-2019-19844）。下面的代碼是一個重置密碼的示例。

from django.core.mail import send_mail
from django.http import HttpResponse
from vuln.models import User

def reset_pw(request):
    email = request.GET['email']
    result = User.objects.filter(email__exact=email.upper()).first()
    if not result:
        return HttpResponse("User not found!")
    send_mail('Reset Password','Your new pw: 123456.', 'from@example.com', [email], fail_silently=False)
    return HttpResponse("Password reset email send!")

第 6 行代碼獲取了用戶輸入的 email，第 7-9 行代碼檢查這個 email 值，查找是否存在具有該 email 的用戶。如果用戶存在，則第 10 行代碼依據第 6 行中輸入的 email 地址，給用戶發送郵件。需要指出的是，第 7-9 行中對郵件地址的檢查是不區分大小寫的，使用了 upper 函數。

至于攻擊，我們假設數據庫中存在一個郵箱地址為 foo@mix.com 的用戶。那么，攻擊者可以簡單地傳入 foo@m?x.com 作為第 6 行中的 email，其中 i 被替換為土耳其語 ?。第 7 行代碼將郵箱轉換成大寫，結果是 FOO@MIX.COM。這意味著找到了一個用戶，因此會發送一封重置密碼的郵件。

然而，郵件被發送到第 6 行未轉換的郵件地址，也就是包含了土耳其語的 ?。換句話說，其他用戶的密碼被發送到了攻擊者控制的郵件地址。為了防止這個漏洞，可以將第 10 行替換成使用數據庫中的用戶郵箱。即使發生編碼沖突，攻擊者在這種情況下也得不到任何好處。

9. IP 地址歸一化

在 Python < 3.8 中，IP 地址會被 ipaddress 庫歸一化，因此前綴的零會被刪除。這種行為乍一看可能是無害的，但它已經在 Django 中導致了一個高嚴重性的漏洞（CVE-2021-33571）。攻擊者可以利用歸一化繞過校驗程序，發起服務端請求偽造攻擊（SSRF，Server-Side Request Forgery）。

下面的代碼展示了如何繞過這樣的校驗器。

import requests
import ipaddress

def send_request(request):
    ip = request.GET['ip']
    try:
        if ip in ["127.0.0.1", "0.0.0.0"]:
            return HttpResponse("Not allowed!")
        ip = str(ipaddress.IPv4Address(ip))
    except ipaddress.AddressValueError:
        return HttpResponse("Error at validation!")
    requests.get('https://' + ip)
    return HttpResponse("Request send!")

第 5 行代碼獲取用戶傳入的一個 IP 地址，第 7 行代碼使用一個黑名單來檢查該 IP 是否為本地地址，以防止可能的 SSRF 漏洞。這份黑名單并不完整，僅作為示例。

第 9 行代碼檢查該 IP 是否為 IPv4 地址，同時將 IP 歸一化。在完成驗證后，第 12 行代碼會對該 IP 發起實際的請求。

但是，攻擊者可以傳入 127.0.001 這樣的 IP 地址，在第 7 行的黑名單列表中找不到。然后，第 9 行代碼使用 ipaddress.IPv4Address 將 IP 歸一化為 127.0.0.1。因此，攻擊者就能夠繞過 SSRF 校驗器，并向本地網絡地址發送請求。

10. URL 查詢參數解析

在 Python < 3.7 中，urllib.parse.parse_qsl 函數允許使用“;”和“&”字符作為 URL 的查詢變量的分隔符。有趣的是“;”字符不能被其它語言識別為分隔符。

在下面的例子中，我們將展示為什么這種行為會導致漏洞。假設我們正在運行一個基礎設施，其中前端是一個 PHP 程序，后端則是一個 Python 程序。

攻擊者向 PHP 前端發送以下的 GET 請求:

GET https://victim.com/?a=1;b=2

PHP 前端只識別出一個查詢參數“a”，其內容為“1;b=2”。PHP 不把“;”字符作為查詢參數的分隔符。現在，前端會將攻擊者的請求直接轉發給內部的 Python 程序:

GET https://internal.backend/?a=1;b=2

如果使用了 urllib.parse.parse_qsl，Python 程序會處理成兩個查詢參數，即“a=1”和“b=2”。這種查詢參數解析的差異可能會導致致命的安全漏洞，比如 Django 中的 Web 緩存投毒漏洞（CVE-2021-23336）。

總結

我們介紹了 10 個 Python 安全陷阱，我們認為開發者不太了解它們。每個細微的陷阱都很容易被忽視，并在過去導致了線上程序的安全漏洞。

正如前文所述，安全陷阱可能出現在各種操作中，從處理文件、目錄、壓縮文件、URL、IP 到簡單的字符串。一種常見的情況是庫函數的使用，這些函數可能有意想不到的行為。這提醒我們一定要升級到最新版本，并仔細閱讀文檔。在 SonarSource 中，我們正在研究這些缺陷，以便將來不斷改進我們的代碼分析器。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

程序

程序

+關注

關注
117

文章
3791

瀏覽量
81156
代碼

代碼

+關注

關注
30

文章
4801

瀏覽量
68735
python

python

+關注

關注
56

文章
4799

瀏覽量
84810

Python中dict支持多個key的方法

? 在Python中，字典（dict）是一種非常強大的數據結構，它允許我們通過鍵（key）來存儲和檢索值（value）。有時候，我們可能想要根據多個鍵來檢索或操作字典中的數據。雖然Python

發表于 11-29 15:59 ?185次閱讀

邏輯異或運算符在Python中的用法

，Python中的 ^ 符號實際上是一個按位異或運算符，用于對整數的二進制表示進行異或操作。盡管如此，我們仍然可以通過一些方法來實現邏輯異或的功能，即當兩

發表于 11-19 09:46 ?225次閱讀

C++新手容易犯的十個編程錯誤

簡單的總結一下?C++ 新手容易犯的一些編程錯誤，給新人們提供一個參考。 1 有些關鍵字在 cpp 文件中多寫了對于 C++ 類，一些關鍵字只要寫在 .h 中就好，cpp 中就不用再加上了，比如

發表于 11-15 12:42 ?409次閱讀

對比Python與Java編程語言

使得編寫代碼更加靈活，但也可能導致運行時錯誤。 Java 語法相對冗長，需要顯式聲明變量類型，增加了代碼的可讀性和安全性。靜態類型系統在編譯時進行類型檢查，減少了運行時錯誤。二、性能 Python 解釋型語言，運行速度通常比

發表于 11-15 09:31 ?349次閱讀

Python中多線程和多進程的區別

Python作為一種高級編程語言，提供了多種并發編程的方式，其中多線程與多進程是最常見的兩種方式之一。在本文中，我們將探討Python中多線程與多進程的概念、區別以及如何使用線程池與進程池來提高并發執行效率。

發表于 10-23 11:48 ?416次閱讀

怎么導出python邊緣計算中的APP？

怎么導出python邊緣計算中的APP，想進行修改又找不到源碼

發表于 07-25 06:13

Python在AI中的應用實例

Python在人工智能（AI）領域的應用極為廣泛且深入，從基礎的數據處理、模型訓練到高級的應用部署，Python都扮演著至關重要的角色。以下將詳細探討Python在AI中的幾個關鍵應用

發表于 07-19 17:16 ?1170次閱讀

如何在Python中開發人工智能

在Python中開發人工智能（AI）是一個廣泛而深入的主題，它涵蓋了從基礎的數據處理到復雜的機器學習、深度學習以及自然語言處理等多個領域。

發表于 07-15 15:01 ?2243次閱讀

python訓練出的模型怎么調用

在Python中，訓練出的模型可以通過多種方式進行調用。 1. 模型保存與加載在Python中，訓練好的模型需要被保存，以便在其他程序或會話中使用。以下是一些常用的模型保存和加載方法

發表于 07-11 10:15 ?2048次閱讀

用pycharm進行python爬蟲的步驟

以下是使用PyCharm進行Python爬蟲的步驟：安裝PyCharm和Python 首先，您需要安裝PyCharm和Python。PyCharm是一個流行的

發表于 07-11 10:11 ?888次閱讀

二進制處理中的一些技巧

在二進制和十進制的處理中，有時候一些小技巧是很有用的。 1、把十進制數轉換成二進制數（1）在MATLAB中有一

發表于 07-05 11:51 ?596次閱讀

具有十個解碼輸出的十進位計數器/除法器數據表

電子發燒友網站提供《具有十個解碼輸出的十進位計數器/除法器數據表.pdf》資料免費下載

發表于 05-17 10:47 ?0次下載

如何使用linux下gdb來調試python程序

如何使用linux下gdb來調試python程序? 在Linux下，可以使用GDB（GNU調試器）來調試Python程序。GDB是一個強大的調試工具，可以幫助開發者診斷和修復程序中的錯

發表于 01-31 10:41 ?2662次閱讀

python中open函數的用法詳解

python中open函數的用法詳解 Python中的open()函數用于打開文件。它接受文件名和模式作為參數，并返回一個文件對象。文件對象

發表于 01-30 15:31 ?2165次閱讀

PLC故障？十個解決方案！

PLC，可編程邏輯控制器，是工業自動化領域中的核心組件。

發表于 01-10 18:26 ?1657次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Python中的十個安全陷阱(二)

6. 不完整的正則表達式匹配

7. Unicode 清洗器繞過

8. Unicode 編碼碰撞

9. IP 地址歸一化

10. URL 查詢參數解析

總結

評論

Python中dict支持多個key的方法

邏輯異或運算符在Python中的用法

C++新手容易犯的十個編程錯誤

對比Python與Java編程語言

Python中多線程和多進程的區別

怎么導出python邊緣計算中的APP？

Python在AI中的應用實例

如何在Python中開發人工智能

python訓練出的模型怎么調用

用pycharm進行python爬蟲的步驟

二進制處理中的一些技巧

具有十個解碼輸出的十進位計數器/除法器數據表

如何使用linux下gdb來調試python程序

python中open函數的用法詳解

PLC故障？十個解決方案！