本人從研究生開始學習語音頻信號處理到工作中實際的工程實踐 , 至今已經七年多了 , 這跟 ” 七年之癢 ” 真的沒有關系 , 主要是一方面最近比較空閑 , 有時間做些總結和規劃 , 另一方面也是為準備從事這個職業或者正在從事這個職業的新手們提供一點參考 , 當然一家之言 , 歡迎大家交流討論 , 尤其希望那些資深人士不吝指點 。
1 、涉及的方向
1 )語音、音頻編解碼算法
已經成熟地商業化、產品化,壓縮碼率和音質總是一對冤家,只有一些特殊的存儲和通信應用會要求低碼率,更多的是追求高品質的音質,例如高清音質。
2 )語音識別算法
做過一年半,初步了解識別率受多種因素影響,技術本身還需要在抗干擾等方面進一步發展,目前只有一些特殊場合的應用產品化,作為人機交互的大規模應用還有一段路要走。
3 )語音合成算法
這個沒有接觸核心技術,不妄加評論,反正據說科大訊飛在這個方向非常強。
4 )語音增強算法
這個沒有接觸核心技術,感覺回聲消除、降噪處理等還是很有用處。
5 )語音信號分析
主要一些特殊應用需求,如智能玩具、軍工等。
6 )音頻特征提取和檢索
音樂哼唱和音樂檢索,以及音頻的特殊應用。
7 )音效處理算法
在 MP3 上非常普遍的音效處理算法,當然也有立體聲環繞和多聲道處理算法。
2 、涉及的行業
這個行業需要這個職業的一般,尤其是做多媒體芯片的,往往需要為芯片提供高品質的音視頻算法 。 在低功耗、資源少的情況下保證音視頻的最佳化應用。
2 )計算機軟硬件
這個行業里,可以做標準算法的研發,也可以做應用程序,或者是第三方軟件開發。
3 )通信行業
這個行業應該不多,一般音頻編解碼屬于信源編碼,而通信行業涉及的技術比較多,從天線的發送接收,基帶芯片的解碼,語音編解碼,上下信道的控制等系統。
3 、涉及的職業
1 )做標準、第三方算法研發
做音頻算法的國際標準,如 ITU G.7xx 、寬帶語音編碼,或者第三方語音算法的研發,如語音識別、語音合成等。往往這樣的職位需要碩士以上學歷,對數字信號處理理論要求較高。
2 )做移植、優化
在芯片公司為產品做音頻算法的移植和優化,需要對芯片指令和算法本身有較強的理解。做嵌入式產品,就意味著在低成本、低功耗、資源少的情況下要具有足夠的耐心去一點點優化算法,我曾經對 AMR-NB 中的碼書搜索部分、 LSF 矢量量化部分進行至少 5 遍的代碼優化,漸漸將所用的指令數減到最小化。每一遍過后都覺得沒有再優化的地方了,然后靜下心再分析算法原理、分析代碼執行和指令特點,就有了新的發現。以至于后來流傳著“優化無極限”,當然優化工作很可能是用較少的時間就優化了總量的 80% ,但剩下的 20% 需要付出更多的時間,全憑項目的需求來權衡了,積累一定的經驗很重要。
3 )做產品應用
做一般多媒體軟件的應用開發,涉及語音頻本身的理論較少,更多的是計算機技術。
4 、優缺點
做語音頻算法職業的缺點是 ” 少 ”, 相關的公司少,專業對口的職業少,做這個職業的人也少 , 發展機會少一點,當然這個“少”也是不同時期,不同職業之間的相對比較而言的。優點自然是競爭壓力相對小些,工作相對穩定。
5 、三點總結
我一路走來,犯了許多錯誤,但是塞翁失馬,焉知非福?
1) 雜而不專
“專”是指專注在一個方向上的技術和業務積累。
我剛開始的時候,一段時間看看語音頻編解碼,一段時間看看靜態圖像處理技術,一邊研究計算機網絡技術,一邊了解一下視頻壓縮算法,今天搞搞寫寫 Window 程序,明天去焊焊電路。典型的學的雜,但是哪個都淺嘗輒止,最后想想哪個都拿不出手,感覺就是樣樣行,樣樣都很膚淺。
2) 專而不精
“精”是指在一個方向上達到精通的水平(技術方面)和高效的業務能力(項目管理方面)。
工作了一段時間,比較清楚自己的興趣和特長,于是靜下心盡量把范圍縮小,主要集中在語音頻編解碼上,但是有時還要根據實際項目需求去做其它方向的。另外,如果項目時程緊張的話,技術方面如果不經過深加工,積累的經驗還是很少。我目前正處于這個階段,需要堅實的理論基礎以便深入算法(算法層面)和不斷的總結項目經驗教訓(工程實現方面)來提高自己。
3) 精而不廣
“廣”是指見識要廣,具有行業思維、市場化的眼光。
身處在這個賴以謀生的行業,自然要關心一下它的動態發展,我們在技術上要深挖一口井,但眼界上卻不要做一個井底之蛙!
最后,談一下工作態度,我自認為資質平庸,還是踏踏實實做事,認認真真做人。不要盲目和別人攀比,產生不良的心態,影響日常的工作和生活。對于那些比我強的人,我是這樣看的:客觀上,他們一定有我們不具有的能力,這里的能力是指綜合評價得到的,包括智商(學習能力、技術深度廣度、創新思維等)、情商(人脈關系、成長環境、習慣等);主觀上,每個人都有自己的人生軌跡,苦辣酸甜只有自己知道,平衡好自己生活的各個方面才是最好的。
-
算法工程師
+關注
關注
2文章
30瀏覽量
6136
發布評論請先 登錄
相關推薦
評論