用Python寫的程序,確實在性能上會比其他語言差一些,這是因為Python為了最大化 開發效率 ,犧牲了一定的 運行效率 。開發效率和運行效率往往是魚與熊掌不可兼得的關系。
不過,程序性能較差有很多原因,并不能全把鍋甩到Python身上,我們應該首先從自己的代碼上找原因,找原因最快的方法就是算出自己寫的語句或函數的 執行時間 。這時候,很多人都會選擇用以下的形式打印出語句的執行時間:
這是一種比較低效的做法,如果你有上萬條語句要測試,想用這個方法來找到瓶頸簡直是大海撈針。幸好,得益于Python強大的社區功能,我們有很多關于效率的模塊可以使用,今天要介紹的是 line_profiler , 它可以算出函數里每條語句的占用時間。
我們將使用上次電影人臉識別中的代碼進行講解:Python 識別電影中的人臉,不過要注意,這篇推送里的函數少傳遞了幾個參數,正確參數請點擊該推送下方的閱讀原文進行查看哦。
1.準備
Python環境當然是必備的,如果你還沒有安裝Python,可以看這篇文章:超詳細Python安裝指南。
打開cmd/terminal輸入以下命令安裝line_profile:
pip install line_profiler
windows機器如果出現 Microsoft Visual C++ 14.0 is required 這樣的錯誤,請前往微軟官網,下載vs2015勾選"適用于visual C++2015的公共工具" 進行安裝。
如果出現:ModuleNotFoundError: No module named 'skbuild'
的情況,請輸入以下命令安裝scikit-build:
pip install scikit-build
實在還是安裝不上的話 ,可以下載anaconda,輸入以下命令安裝:
conda install -c anaconda line_profiler
2.使用
使用方式非常簡單,比如原來我們在讀取人臉的代碼中,主函數是這樣的:
我們要測的是read_pic_save_face函數中所有語句的執行時間,只需要這樣調用line_profiler:
這樣就可以獲得該函數所有語句的執行時間報表。當然,它還有許多其他的調用方法,具體可以看line_profiler說明文檔: *
https://github.com/rkern/line_profiler*
3.閱讀報告
line_profiler報告包括幾個部分:
Line: 語句位于第幾行 **
Hits: 該行被執行的次數
Time: 該語句運行的總時間
Per Hit: 該語句運行一次的平均耗時
% Time: 該語句占總時間的比重**
可以看到,我們的這份代碼主要是在face_cascade.detectMultiScale 耗時最久,這是opencv的分類器執行效率問題。知道了是這里的效率問題,優化就有一個目標了。
這一部分的優化,我們可以從硬件方面入手,讓OpenCV在GPU上運行算法,這樣做性能將遠超在CPU上運行的性能,這是絕招。其次就是利用多線程計算(沒試過,不確定是否有用,或許下次可以試一下)。
-
模塊
+關注
關注
7文章
2730瀏覽量
47659 -
程序
+關注
關注
117文章
3795瀏覽量
81290 -
代碼
+關注
關注
30文章
4821瀏覽量
68892 -
python
+關注
關注
56文章
4807瀏覽量
84942
發布評論請先 登錄
相關推薦
評論