現在投身于計算機視覺是否明智?
周圍很多大佬都去深造或者工作做CV相關方向。然而看到一種言論,說現在學CV無異于48年加入國民黨,求問此話怎講。
PS 本人本科畢業正要工作,有圖像處理算法崗位offer。水平很菜,對計算機視覺方向很有興趣(也許是跟風,且自動駕駛等等領域的確很容易讓人產生興趣)。
假設僥幸拿到CV相關offer(或者machine learning/deep learning崗位)那么是否應該果斷加入。(因為圖像處理算法可能相對傳統一些)
作者:匿名用戶
https://www.zhihu.com/question/317440183/answer/683203621
有多少人工就有多少AI,我相信各位真正的從業者是最清楚這點不過的,論文滿分的模型現實情況下基本沒法直接跑模型了事,必需跟隨大量的數據和集成工作。目前AI飽和主要在于產業市場還沒有起來,但是一旦其需求大起來,對應的人才要求也會變多。至于未來市場怎樣,就不是我等工程師能預測的了。但按照《人類簡史》中的說法,現代社會經濟建立于對未來的信用上,現代經濟要繼續發展,必須有新的技術可以推動生產,至于這個技術是物聯網,5G,AI,AR,基因工程中的一個還是多個,也不好說
以下是原答案
有一段時間在一家創業公司做CV,當時碰壁很多,人臉市場由巨頭把持,基本不太可能與其競爭,我們當時打算做遙感AI,農業AI,后來發現處于數據精度問題,基本無法落地,后來整個組不得不轉型做大數據外包。當時我的想法是,CV真的是泡沫。
后來到了國內某設備商做算法,發現CV可以用的地方不要太多了,降噪,定位,超分……CV從來不是單單指人臉這一塊,哪一塊都可以做,而它們又有相通之處,可以入的方向還是很多的。
之前和某些明星公司也有接觸,可以說,實在的落地效果和競賽榜單有天囊之別,在榜上刷的接近完美的指標,落地下來不足50%也是常有的事情,外界環境稍微差一點,算法效果非常恐怖,更別說性能……實際上算法領域如何在工程界落地,還有很長的路要走。實際調優的過程,的確和經驗積累有關。有的時候因為算法流程的設計,有經驗的工程師能夠很快發現哪個流程有問題需要改進,這些慕課上是不會告訴你的。個人認為,CV本質上考察的是對系統的了解程度,對數據的了解程度,從來不是某個特定的算法。
如果能做到對系統了然于心,對性能優化(這也是必須根據設備考慮的問題)有深入了解,這樣的人才是真的很缺。
作者:CPAPCF
www.zhihu.com/question/317440183/answer/794570674
說48年加入國民黨只因把cv限制在了2D分類/檢測/跟蹤任務里。這些傳統任務確實早在16年甚至更早就接近problem solved,任務明確數據標準方法成熟。現在刷榜也只有微小提升。畫地為牢當然沒搞。
且不說什么concept extraction/self-awareness/vision+language那套純煉丹的玄學意識流,vision的共同問題是什么?是從圖像分析信息,那能從圖像里分析光照/材質/光源位置性質嗎?能從圖像里分析物理系統做受力分析判斷受力點支撐面嗎?能從圖像分析物體運動狀態嗎?能從圖像分析物體內部結構預測應力形變嗎?
再從方法來說,純煉丹就一定最好嗎?vision傳統的geometry理論和物理基礎規則為什么要棄之不顧拿去讓煉丹從頭approximate?
然后從輸入的角度看,雙目做過嗎?多目會有提升嗎?單目能做嗎(btw, 單目+純煉丹是邪路)?別的sensor呢?比如MRI掃描信號?電子顯微鏡掃描信號?雷達?雷達陣列?聲納?
我只是舉了一些非常片面的例子,但哪怕把上面這些暴力排列組合一下這都多少可能性了?
宏觀來說,vision在工業上的應用絕不會停止也從沒有停止。舉個例子,我們今天能在超市里買到的整齊又便宜的紅蘋果和盒裝雞蛋,哪怕薯片,更不用說pcb和芯片制造,都是靠70-80年代開發的vision系統,才得以實現大規模流水線生產,然后降低成本和普及。vision內部流派可能會起起伏伏,跟不上市場需求的會很快暴死。但只要有外部市場demand,只要有資本家拿錢提出問題,就總有人能為錢做出解決方法,vision就絕不可能停止發展。ps,煉丹可能會死但vision絕不會死 :
作者:Encoder
https://www.zhihu.com/question/317440183/answer/684387715
視覺是人類最重要的感覺,人類認識外界信息的80%來自視覺,視覺的認知機制也最復雜。因此,計算機視覺(computer vision),也就是利用各種成像系統代替人類的視覺器官作為輸入手段,通過分析圖像生成關于成像物體和場景的描述,使得計算機像人那樣觀察和理解世界,以具有自主適應環境的能力,始終是人工智能的一個重要組成部分。
計算機視覺已經走過了半個世紀的風風雨雨,從借用信號處理的概念、將圖象視作“二維信號”而進行分析,到逐步發展出一套包含預處理、特征提取、目標追蹤、三維重建等等方向在內的完整的領域,再到機器學習、深度學習方法的廣泛運用,可以說,無論是過去、現在還是未來,計算機視覺領域都有大量的工作可以做,有大量的難題需要突破,也有大量的激動人心的寶藏、尚待我們去發掘。刷臉支付、無人駕駛、無人機航拍、手術機器人等等我們耳熟能詳的應用,都與計算機視覺息息相關。
計算機視覺發展史
Faster R-CNN 用于目標檢測,see https://arxiv.org/pdf/1506.01497.pdf
是否投身于計算機視覺的科研和工作,當然首先有賴于自己的興趣。另一方面,“全民AI”“全民CS”甚至“全民CV”的確是造成了計算機視覺方向人才供過于求的情形,大量的學生和從業者的涌入,很有可能會造成內卷的情況;人才飽和、甚至所謂的“泡沫破滅”也并不是不會發生。然而從普遍意義上說,在人工智能時代的浪潮中,作為計算機相關專業的學生,無論是選擇繼續科研還是進入工業界,計算機視覺都仍然是一個既有廣泛的應用前景(錢景),又容易激發興趣、引人入勝的方向。
題主的擔心其實也有道理,因為,盡管智能化這個大的趨勢是不會變的,但是在這個大趨勢的過程中,起伏依然是不可預知的,甚至也是不可避免的。經濟學告訴我們,過度擴張就會帶來收縮,過熱就可能在未來遇冷,這是行業本身調節的結果,也是行業健康發展的保證。越是站在浪潮之巔,越要保持冷靜清醒。作為CV領域的研究者和從業者,我們要準備好應對未來幾年可能出現的轉冷局面,應對可能出現的CV行業人才飽和、就業困難的窘境。我想主要的還是要做好以下幾點。
第一,傳統算法不可偏廢。
舉幾個例子:
盡管基于深度學習的特征提取方法取得了很大的成功,但傳統的特征提取算法,例如Harris角點,SIFT, SURF等等,仍是需要認真學習的。
圖像預處理的方法,包括圖像的濾波、分裂、歸并、分割以及形態學處理等等,也可以與深度學習方法相結合,例如dilated CNN就可以看做形態學操作與CNN的結合。
SVM, KNN等等經典的機器學習算法在CV中的應用也不可忽視。
傳統的計算機視覺和機器學習算法依然在很多場景下有用武之地,這些算法不僅在工程上有穩健的性能,而且相比于深度學習算法,在數學上也有更清晰的解釋。因此,深入理解這些經典算法的思想,對于我們改進既有算法和提出新算法,也是很有啟發性的。
第二,重視數學、重視編程。
我們需要有一批不滿足于import cv2, import torch, import torchvision,不滿足于機械調參,不滿足于堆砌網絡結構的研究者,能夠提出一套嚴密的指導性的理論,改善目前深度學習中以試湊調參為主來達到目標的訓練方式。我們需要思考能否在底層實現上做出改進或提出新的算法,而非簡單地將既有算法排列組合。在數學和編程方面的積累,盡管需要下苦功夫,也不一定能夠立竿見影,但是最終一定會惠及你未來的發展,無論在科研還是工作上,都能讓你行穩致遠。
第三、推動CV真正落地。
許多行業都積累了大量的圖像信息,需要借由計算機來輔助甚至部分代替人腦對圖像進行處理和解釋,都有用計算機代替人去“看”的剛需。從圖像預處理、圖像特征提取及分割,到物體的幾何模型與圖像特性表達,再到對物體和周圍環境的理解,都有廣泛的應用場景。我們要避免空對空的灌水,要讓CV更好地從實驗室走入千家萬戶,真正應用于實際的生產生活的場景之中,真正拉動經濟社會各個部門、各個方面的發展,真正成為我們每個人生活中不可或缺的一部分。
總之,投身于計算機視覺不失為明智之選,面對競爭的關鍵不在于躑躅猶疑,而在于增強自身的競爭力。計算機視覺的舞臺足夠廣闊,將計算機視覺的理論與應用相對接、算法與工程相融合、精確與快速相平衡、簡潔與清晰相印證、優美與實用相增益,始終激勵著一批又一批有熱情、有韌勁、有定力、有決心、有才華的研究者,扎扎實實地做出成果,特別是讓計算機視覺更好地與各行各業相結合,真正助力經濟社會發展,也使得我們的生活更加便捷。
作者:JohnMason
https://www.zhihu.com/question/317440183/answer/688971077
不邀自來。
計算機視覺方面的現狀:工程師很多,研究人才稀缺
這可能是現在計算機方面的整體情況,大部分領域都是這樣,研究人才稀缺。
那么造成這種情況的原因是因為:
1、相對其他行業來講資薪較高。
2、熱度高,人氣盛。
3、入門相對其他方面來講較容易。
如果拿到CV相關的offer,可以考慮按照這樣的方式來:
1、學習有關類的編程(python、Cpp)。
2、大概有一定的基礎后可以開始考慮框架(TensorFlow、Keras、Caffe、PyTroch等),具體的框架可以自己進行比較。
3、學習關于《機器學習》、《深度學習》的知識。
4、可以嘗試做一些簡單的項目。
5、確定方向,閱讀該方面的論文,實現該論文的網絡結構。
但是,入門相對來說比較簡單,而且工程師的人才過剩。缺少的是相關的研究人才。如果想要進入研究方面,需要一定的數學知識和邏輯基礎。在數學和邏輯之上要多閱讀論文,講最新論文中的結構復現,理解其中的原理。
-
計算機視覺
+關注
關注
8文章
1700瀏覽量
46121
原文標題:現在投身于計算機視覺是否明智?
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論