文章作者:英特爾邊緣計算創新大使戰鵬州
01. 簡介
本文章將介紹使用 OpenVINO2023.0 C++ API 開發YOLOv8-Seg 實例分割(Instance Segmentation)模型的 AI 推理程序。本文 C++ 范例程序的開發環境是 Windows + Visual Studio Community 2022。
請讀者先配置基于 Visual Studio 的 OpenVINO C++ 開發環境。
請克隆本文的代碼倉:
git clone
https://gitee.com/ppov-nuc/yolov8_openvino_cpp.git
02. 導出YOLOv8-Seg OpenVINO IR 模型
YOLOv8 是 Ultralytics 公司基于 YOLO 框架,發布的一款面向物體檢測與跟蹤、實例分割、圖像分類和姿態估計任務的 SOTA 模型工具套件。
首先用命令:
pip install -r requirements.txt
安裝 ultralytics 和 openvino-dev 。
然后使用命令:
yolo export model=yolov8n-seg.pt format=openvino half=True
向右滑動查看完整代碼
導出 FP16 精度的 OpenVINO IR 模型,如下圖所示。
接著使用命令:
benchmark_app -m yolov8n-seg.xml -d GPU.1
向右滑動查看完整代碼
獲得 yolov8n-seg.xml 模型在 A770m 獨立顯卡上的異步推理計算性能,如下圖所示。
03.使用 OpenVINO C++ API
編寫 YOLOv8-Seg 實例分割模型推理程序
使用 OpenVINO C++ API 編寫 YOLOv8-Seg 實例分割模型推理程序主要有5個典型步驟:
1采集圖像&圖像解碼
2圖像數據預處理
3AI 推理計算(基于 OpenVINO C++ API )
4對推理結果進行后處理
5將處理后的結果可視化
YOLOv8-Seg 實例分割模型推理程序的圖像數據預處理和AI推理計算的實現方式跟 YOLOv8 目標檢測模型推理程序的實現方式幾乎一模一樣,可以直接復用。
3.1圖像數據預處理
使用 Netron 打開 yolov8n-seg.onnx ,如下圖所示,可以看到:
輸入節點的名字:“ images ”;數據:float32[1,3,640,640]
輸出節點1的名字:“ output0 ”;數據:float32[1,116,8400]。其中116的前84個字段跟 YOLOv8 目標檢測模型輸出定義完全一致,即cx,cy,w,h 和80類的分數;后32個字段為掩膜置信度,用于計算掩膜數據。
輸出節點2的名字:“ output1 ”;數據:float32[1,32,160,160]。output0 后32個字段與 output1 的數據做矩陣乘法后得到的結果,即為對應目標的掩膜數據
圖像數據預處理的目標就是將任意尺寸的圖像數據轉變為形狀為[1,3,640,640],精度為 FP32 的張量。YOLOv8-Seg 模型的輸入尺寸為正方形,為了解決將任意尺寸數據放縮為正方形帶來的圖像失真問題,在圖像放縮前,采用 letterbox 算法先保持圖像的長寬比,如下圖所示,然后再使用 cv::blobFromImage 函數對圖像進行放縮。
圖像數據預處理的范例程序如下所示:
Mat letterbox(const Mat& source) { int col = source.cols; int row = source.rows; int _max = MAX(col, row); Mat result = Mat::zeros(_max, _max, CV_8UC3); source.copyTo(result(Rect(0, 0, col, row))); return result; } Mat img = cv::imread("bus.jpg"); Mat letterbox_img = letterbox(img); Mat blob = blobFromImage(letterbox_img, 1.0/255.0, Size(640,640), Scalar(), true);
向右滑動查看完整代碼
3.2AI同步推理計算
用 OpenVINO C++ API 實現同步推理計算,主要有七步:
1實例化 Core 對象:ov::Core core;
2編譯并載入模型:core.compile_model();
3創建推理請求:infer_request = compiled_model.create_infer_request();
4讀取圖像數據并完成預處理;
5將輸入數據傳入模型:infer_request.set_input_tensor(input_tensor);
6啟動推理計算:infer_request.infer();
7獲得推理結果:output0= infer_request.get_output_tensor(0) ;
output1= infer_request.get_output_tensor(1) ;
范例代碼如下所示:
// -------- Step 1. Initialize OpenVINO Runtime Core -------- ov::Core core; // -------- Step 2. Compile the Model -------- auto compiled_model = core.compile_model("yolov8n-seg.xml", "CPU"); // -------- Step 3. Create an Inference Request -------- ov::InferRequest infer_request = compiled_model.create_infer_request(); // -------- Step 4.Read a picture file and do the preprocess -------- Mat img = cv::imread("bus.jpg"); // Preprocess the image Mat letterbox_img = letterbox(img); float scale = letterbox_img.size[0] / 640.0; Mat blob = blobFromImage(letterbox_img, 1.0 / 255.0, Size(640, 640), Scalar(), true); // -------- Step 5. Feed the blob into the input node of the Model ------- // Get input port for model with one input auto input_port = compiled_model.input(); // Create tensor from external memory ov::Tensor input_tensor(input_port.get_element_type(), input_port.get_shape(), blob.ptr(0)); // Set input tensor for model with one input infer_request.set_input_tensor(input_tensor); // -------- Step 6. Start inference -------- infer_request.infer(); // -------- Step 7. Get the inference result -------- auto output0 = infer_request.get_output_tensor(0); //output0 auto output1 = infer_request.get_output_tensor(1); //otuput1
向右滑動查看完整代碼
3.3推理結果后處理
實例分割推理程序的后處理是從結果中拆解出預測別類(class_id),類別分數(class_score),類別邊界框(box)和類別掩膜(mask),范例代碼如下所示:
// -------- Step 8. Postprocess the result -------- Mat output_buffer(output0_shape[1], output0_shape[2], CV_32F, output0.data()); Mat proto(32, 25600, CV_32F, output1.data ()); //[32,25600] transpose(output_buffer, output_buffer); //[8400,116] float score_threshold = 0.25; float nms_threshold = 0.5; std::vector class_ids; std::vector class_scores; std::vector boxes; std::vector mask_confs; // Figure out the bbox, class_id and class_score for (int i = 0; i < output_buffer.rows; i++) { ? ? ? ?Mat classes_scores = output_buffer.row(i).colRange(4, 84); ? ? ? ?Point class_id; ? ? ? ?double maxClassScore; ? ? ? ?minMaxLoc(classes_scores, 0, &maxClassScore, 0, &class_id); ? ? ? ?if (maxClassScore > score_threshold) { class_scores.push_back(maxClassScore); class_ids.push_back(class_id.x); float cx = output_buffer.at (i, 0); float cy = output_buffer.at (i, 1); float w = output_buffer.at (i, 2); float h = output_buffer.at (i, 3); int left = int((cx - 0.5 * w) * scale); int top = int((cy - 0.5 * h) * scale); int width = int(w * scale); int height = int(h * scale); cv::Mat mask_conf = output_buffer.row(i).colRange(84, 116); mask_confs.push_back(mask_conf); boxes.push_back(Rect(left, top, width, height)); } } //NMS std::vector indices; NMSBoxes(boxes, class_scores, score_threshold, nms_threshold, indices);
向右滑動查看完整代碼
完整范例參考參見:yolov8_seg_ov_infer.cpp ,運行結果如下圖所示:
04 結論
OpenVINOC++ API 簡單清晰,易學易用。本文用不到100行(不含可視化檢測結果) C++ 代碼就實現了基于 OpenVINO 的 YOLOv8-Seg 實例分割模型推理程序,在英特爾 獨立顯卡 A770m 上獲得了較好的推理計算性能。
審核編輯:湯梓紅
-
英特爾
+關注
關注
61文章
10002瀏覽量
172115 -
WINDOWS
+關注
關注
4文章
3556瀏覽量
89081 -
API
+關注
關注
2文章
1509瀏覽量
62255 -
程序
+關注
關注
117文章
3794瀏覽量
81270 -
C++
+關注
關注
22文章
2114瀏覽量
73773
原文標題:用OpenVINO? C++ API編寫YOLOv8-Seg實例分割模型推理程序 | 開發者實戰
文章出處:【微信號:英特爾物聯網,微信公眾號:英特爾物聯網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論