2024年7月8日-10日,由機器視覺產業聯盟(CMVU)主辦,慕尼黑展覽(上海)有限公司承辦的VisionChina2024(上海)機器視覺展暨機器視覺技術及工業應用研討會在上海新國際博覽中心完美收官。阿丘科技也以其前沿的AI技術實踐,為觀眾帶來一場AI+工業的視覺盛宴。
在工業應用研討會現場,阿丘科技研發副總裁鐘克洪圍繞“工業視覺進入AI-Native大時代”主題,發表精彩演講,解析工業視覺產品新范式,下文為其演講內容整理。
大家好,我是阿丘科技研發負責人鐘克洪。
去年我在VisionChina北京和大家分享了工業AI視覺演進的一些理解和觀點《工業視覺AI進化論》。一年來,AI在制造業的概念認知加速普及。各行業終端廠商高管積極探索導入AI的路徑,視覺廠商也都紛紛包裝上AI的人設。
但AI技術架構的視覺產品大多固守在原有視覺產品的認知框架內,AI技術更多只是作為一個關鍵功能組件,AI對于工業問題的解決并沒有質的飛躍。我認為AI技術架構的產品一定要能夠直擊工業痛點,可這樣的產品到底應該長什么樣子?一定是AI-Native。
這個就是我想和大家分享的主題——《工業視覺進入AI-Native大時代》,也是阿丘科技一年來的一些思考和探索。
今天我分享的內容主要分為三個部分,分別是工業視覺需要解的問題、AI-Native提供了全新的解題框架,以及對產品發展的一些趨勢觀點。
一、工業視覺挑戰
整個制造業目前關注的核心,我從四個維度概括就是:提質、增效、降本、擴柔。一言概之,即“提升規模效應、提高生產柔性”。
前面三個維度相信大家平時思考的比較多,但是“擴柔”這一部分,實際上可能是當前各個制造企業考慮的必選項。特別是在傳統制造業中,“小單快反”成為當下制造業的主流,柔性化生產已經成為常規動作。
那么,目前整個工業視覺行業的挑戰有哪些呢?
隨著AI技術的導入,確實對檢測能力的魯棒性有非常大程度的提升。但是整個視覺系統的泛化能力,我認為并沒有本質的改變,甚至直接導致整個產品的適配性非常差。一旦更換新的場景,就還要另外進行模型訓練,即便是在同一個場景下,如果遇到整個產品換型,所消耗的周期也非常長,簡而言之就是“切拉換型周期長、場景遷移能力弱。”
而且,整個視覺系統的TCO仍然過高。目前,大部分的視覺系統其實都還是定制的,在評估、開發、部署、維護層面都要消耗很多人力,這是導致高成本重要原因。俗話說“羊毛出在羊身上”,視覺系統的成本變高之后,終端客戶對其的普及度就會變得很低。
二、AI-Native工業視覺產品新范式
現在,我們從AI原生的視角,來探究一下前面提出的問題。
首先,什么是AI原生?我們可以從AI和視覺系統結合形態的角度,來解讀AI-Native。
當前大部分AI視覺系統都只是把AI作為組件,我們阿丘科技的AIDI、Cognex VisionPro Deep Learning等構建的視覺系統即屬于該類,這也是當前AI和視覺系統的主要結合方式。
另一種方式是對現有的視覺系統進行優化,比如阿丘科技的PCB ARS(AI Review System)即是對現有視覺系統進行優化,降低人工復判成本,同時進行缺陷分類、根因分析、過程控制,從而提高或保持良率。
這兩種方式本質上仍屬于Vision + AI范疇,AI只是視覺系統的核心組件或對現有視覺系統的優化,而并沒有基于AI對視覺系統進行重構,所以視覺系統只是“量”的變化,盡管這個“量”變幅度有些大。
而所謂AI-Native,是將視覺系統的所有組件都AI化,即從基于規則的傳統視覺系統躍遷為基于Learning的視覺系統,它完全基于數據驅動,并且從方案設計、部署、維護等貫穿全流程。
了解了AI-Native的大體情況之后,接下來我要介紹一下AI-Native重構工業視覺的底層邏輯。
AI技術是從圖像分析的局部模塊切入,也是當前主流AI和視覺系統結合方式。圖像分析端到端AI化,這也是我們AIDI 3.0系列的底層設計邏輯。
目前,主流的成像系統都是基于規則的,而基于學習的成像系統已經初現端倪,即基于物理光學+計算成像,同時將場景自動學習成為成像關鍵的維度參數,這將革命性提高成像系統場景適應性。
我們應當明白,工業視覺檢測的本質,是把控產品在生產過程的一些關鍵度量,基于這些度量進行根因分析、過程控制,形成閉環,提高良率,這也是制造業企業的本質訴求。
所以,基于AI原生的工業視覺底層邏輯,應當是從“成像”,到“圖像分析”再到“工藝優化”的完整鏈條,并在其底層有共同的AI-Core做支撐,后面再基于數據驅動做優化,對不同場景進行適配,以上是我認為的AI-Native產品的架構邏輯。
至此,視覺系統的產品新范式,將從“基于規則”迭代至“基于學習”。01
當前產品,“規則”范式
指我們針對特定的場景,甚至是特定的產品型號,來做打光實驗,來設計算法方案,來做調差及一些核心策略。在此規則模式下,人力占比較高,本質上是將人員對產品的理解跟洞察,轉換成產品中的設計。
但其實,人類對于經驗的歸納和總結能力是非常有限的,這就造成產品的成功與否大部分基于人員的經驗,而經驗沉淀的豐富程度則可以決定產品的價值。
同時,這也導致這些“基于規則”的產品的泛化性較差,且我們還需要針對不同的場景分別做光學評估、方案設計、部署、維護等,使得TCO過高。
02
AI-Native產品:“學習”范式
AI-Native產品則是基于“學習”的概念,學得越多,模型能力越強,更便于后期基于數據來進行規模化。產品的主體是算法,這個算法不僅僅是我們前面理解的圖像分析的算法,還包括成像,以及后面整個工藝優化,是一個完整的端到端的AI算法。
所以,此時我們的產品價值主要由模型的能力來決定,而產品迭代也將立足于有價值的數據之上。這類體系下的產品不但具有較強的泛化能力,同時也會使TCO發生革命性地降低,AI視覺應用也將爆發。
三、發展趨勢
我們參考自動駕駛的框架,嘗試構建工業視覺AI-Native成熟度模型,其中,該模型包含兩個關鍵的維度:AI化程度、人工干預程度。
如圖所示,我們當前的狀態,基本位于“1”與“2”之間,約為1.5。這意味著,AI已經作為主題滲透在行業之中,不管是終端客戶,還是視覺廠商,大家都會把AI作為基本的考核要素,即AI作為視覺系統核心組件的觀點已經不可逆轉。
那為什么還沒有達到”2“?
簡而言之是當前的視覺系統產品大多沒有統一的Core AI基礎設施。那么后面我們的工業視覺產品一定會走到“5“的狀態嗎?這個問題目前無法確定,但我認為,未來我們至少應該會走到”3“的位置,即全部核心組件AI化,整體架構基于Core AI基礎設施,將全部功能組件AI化。
基于AI原生的大趨勢,我也將阿丘科技對未來3-5年工業AI的一些趨勢觀點與大家分享。
第一,模型性能。雖然當前的模型泛化能力偏弱,但整個垂直行業的模型化已經紛紛開始落地。
比如阿丘科技,我們目前已經構建出一套基于PCB行業的通用大模型,提升了PCB行業的工業視覺檢測效率,縮短了交付周期,通過流程優化,提高了數據處理速度及模型穩定性。我認為,在未來2-3年,基礎模型/通用模型將會迎來較大的突破,更多行業的垂直大模型即將涌現。
第二,計算成像。當前主流成像方案還是基于規則的,定制性偏強。未來,基于AI的計算成像將重塑成像解決方案及產品。這需要視覺系統各Component專業鏈條上廠商共創,并且也會涌現一批新的成像產品廠商,來解決我們共同的現狀問題。
第三,TCO。當前視覺系統的設計、部署、維護成本過高,幾乎每一個關鍵環節都依賴于人員經驗,未來,當端到端全部AI化之后,真正實現全鏈路AI和數據驅動時,將革命性地降低TCO,我預計可能在未來5年后,將會出現這一“殺手級“的產品。
第四,全新AI-Native產品形態探索。全新的AI-Native產品形態,將驅動新的技術和行業生態蓬勃發展,未來5-10年,行業生態即將更換一個新模樣,同時廠商也會逐步經歷一個新陳代謝、優勝劣汰的過程。
-
機器視覺
+關注
關注
162文章
4405瀏覽量
120574 -
AI
+關注
關注
87文章
31490瀏覽量
269899 -
工業視覺
+關注
關注
0文章
72瀏覽量
7161
發布評論請先 登錄
相關推薦
評論