北京譯圖智訊是一家 OCR 識別軟件廠商,致力于為客戶構建一站式 OCR 識別解決方案,專注于計算機視覺、圖像識別、深度學習等 AI 技術的研發,助力企業實現數字化轉型,降本增效。
圖像處理和 OCR 識別是運算密集型技術,對算力要求較高,借助于NVIDIA A100 Tensor Core GPU及A10 Tensor Core GPU,譯圖智訊構建了更加高效的硬件訓練平臺,縮短了 OCR 模型訓練、預測的處理周期,進一步提升了 OCR 識別速度與精度。
OCR 過程包括圖像分類、目標檢測、圖像分割、OCR 識別、NLP 提取等模型訓練任務,其中每一個模型都需要對大量樣本進行標注訓練,所需數據量龐大且復雜,整個建模過程對服務器算力、GPU 顯存都提出了更高的要求。
譯圖智訊以往訓練服務器采用的是 CPU + NVIDIA T4 GPU 多卡的硬件方案,其運行速度遠遠跟不上復雜模型建設的需求,實際運算性能大打折扣。NVIDIA A100 及 A10 GPU 配備了具有更高精度的第三代 Tensor Core 核心,可實現成千上萬個 GPU 集群的高效擴展。A10 相較于 T4,可提供高達 2.5 倍的虛擬工作站性能及推理性能,結合 A100 跨工作負載的高強計算力,相比上一個平臺,譯圖智訊實現了最高 20 倍的 AI 性能,以及 3 倍的 AI 訓練速度,可快速完成數據建模。
借助 NVIDIA A100,滿足了需要更大顯存的訓練任務。以 OCR 文本識別訓練為例,需要對數千萬的圖像數據進行訓練,采用基于 T4 構建的服務器時,訓練周期需要 7 天,依托 A100,訓練周期可縮減至 3-4 天,極大地提升了模型和產品的迭代周期;同樣在模型預測階段,以調用頻次最高的身份證識別為例,在以 T4 構建的服務器中,OCR 識別一次需要 300ms,1 秒鐘可識別 3 張身份證,依托 NVIDIA A100 服務器,每一次可以縮短至 100-200ms 左右,1 秒鐘可識別 5-6 張身份證,單位時間處理時間顯著降低,并發能力增加,給產品研發速度帶來質的提速。
通過 NVIDIA A100 及 A10 強大的算力服務器支持,能夠并行運行多個計算機視覺算法架構,在節省運行顯存開銷的同時,帶來了更快的神經網絡訓練及推理效率,顯著加速了 OCR 識別中對圖像數據處理的時間。
譯圖智訊產品總監劉偉表示“模型訓練在 NVIDIA GPU 上的運行速度更快,極大優化了圖像處理流程,使研發人員能夠更高效地投身到圖像標注、訓練、分析、文字識別的過程中。隨著 OCR 識別技術的應用越來越廣泛,譯圖智訊將更高效地利用 AI,借助NVIDIA GPU AI計算平臺,提升 OCR 識別的速度與精度,使 OCR 在各個場景都達到毫秒級的運行速度,專注更智能、高效、安全穩定的 OCR 整體識別解決方案,助力 OCR 識別技術創新,加速社會信息化進程。”
本案例中,NVIDIA 優選級合作伙伴北京安聯通助力譯圖智訊部署了高效 AI 計算處理平臺,同時幫助譯圖網絡數據中心的設備進行升級改造,部分網絡設備換成全新的 NVIDIA 網絡產品,使網絡傳輸速度比原來的提高數 10 倍,給客戶體驗感更好,識別速度更快。
-
NVIDIA
+關注
關注
14文章
5075瀏覽量
103529 -
gpu
+關注
關注
28文章
4768瀏覽量
129217 -
OCR
+關注
關注
0文章
146瀏覽量
16403
原文標題:NVIDIA GPU 顯著提速 OCR 識別模型訓練
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論