隨著科學技術的發展,人工智能已經逐漸滲透到各個行業,這是一個相當有前景的專業領域。
其中,算法工程師這一職位更是非常火爆,在急缺大量人才的同時,也吸引了眾多求職者,那么,初學者該如何學好算法呢?
算法工程師的具體分支:
其次,算法工程師的必備技能:
▲至少熟悉一門編程語言 C/C++/java/python/R;
▲功底;熟練運用各種常用算法和數據結構,有獨立的實現能力;
▲熟悉數據挖掘算法;
▲熟悉機器學習相關知識理論。
▲加分項:具有較為豐富的項目實踐經驗。
好奇的你看到這里,肯定帶著大大的疑問:是不是要直接學習這些算法呢?
萬丈高樓平地起,任何高深的算法都要從基礎算法學起,不可能一口吃個胖子。
所以,初入門的你學習算法還是要從基礎開始:
▲首先學習一門語言。
例如 C/C++/Java/python,初學者學 C++比較普遍。
▲學數據結構。
數據結構書有很多,但是有些教材晦澀難懂,建議看圖解多,通俗易懂的書,推薦《趣學數據結構》。
▲學算法。
不要直接看《算法導論》,大量證明會讓你崩潰。推薦《趣學算法》,有問題分析,完美圖解,偽碼詳解,實戰演練,適合初學者快速掌握經典算法。
接下來,讓我們跟隨《趣學數據結構》《趣學算法》作者陳小玉老師的視角,找到學習算法與數據結構的竅門!
01
為什么要學數據結構?
招聘和數據不得不說的故事
如果你關注招聘試題,就會發現越是大公司,問的問題越基礎,有的甚至問你什么是棧和隊列,反而一些小公司會關心你做過什么系統,關注點不同。
大公司更注重基礎扎實,發展潛力,而小公司希望你立刻、馬上為他干活,通常是沒什么技術含量的活。小公司喜歡細而長的竹子,大公司更喜歡碗口粗的竹筍。
我曾經推薦一個學生到某知名公司,沒多久,學生給我說了應聘的事情:“我介紹我開發了企業管理系統、在線商城系統等等,沒想到他問我使用了什么數據結構和算法,我懂很多技術,那么多功能我都實現了,他不問,卻問我使用了什么數據結構和算法,你說搞笑不?數據結構、算法我早就忘了,我會開發軟件還不行嗎?”
人力資源總監也反饋過來意見:“很搞笑,這個學生做了不少系統,卻說根本沒用到數據結構和算法。”
既然雙方都覺得這是一個件搞笑事,我們就攤開來看,數據結構到底是什么東西。
撥云見日,看清數據結構
遇到一個實際問題,需要解決兩個事情:
(1) 如何將數據存儲在計算機中;
(2) 用什么方法策略解決問題。
前者是數據結構,后者是算法。
只有數據結構沒有算法,相當于只把數據存儲到計算機中而沒有有效的方法去處理,就像一幢只有框架的爛尾樓;若只有算法,沒有數據結構,就像沙漠里的海市蜃樓,只不過是空中樓閣罷了。
數據是一切能輸入到計算機的信息總和,結構是指數據之間的關系,數據結構就是將數據及其之間的關系有效地存儲在計算機中。算法是指對特定問題求解步驟的一種描述,說白了就是解決問題的方法策略。
數據結構和算法不依賴于語言,什么語言無所謂。但是如果上機實現的話,就要使用計算機語言。
遇到一個實際問題,充分利用所學的數據結構,將數據及其之間的關系有效地存儲在計算機中,然后選擇合適的算法策略,并用程序高效實現,這就是N.Wirth 教授所說的:
數據結構+ 算法=程序。
計算機專業本科生都開設數據結構課程,它是計算機學科知識結構的核心和技術體系的基石。
研究生考試也是必考科目,隨著科學技術的飛速發展,數據結構的基礎性地位不僅沒有動搖,反而由于近年來算法工程師的高薪火爆,而得到了業內空前的重視。
很多人覺得基本的數據結構及操作已經在高級語言(如 C++、JAVA 語言中)中封裝,棧、隊列、排序、優先隊列等都可以直接調用庫函數,學會怎么調用就好了,干嘛要重復造輪子?
02
學習數據結構有什么用處?
學習數據有效存儲的方法
很多學生在學習數據結構時,問我要不要把單鏈表插入刪除代碼背下來?要不合上書就不會寫了。我非常詫異,為什么要背?理工科技術知識很少需要記憶的,是用的,用的!學習知識不是死記硬背,更重要的是學習處理問題的方法。
同一個問題,如何有效地存儲數據,不同的數據結構產生什么樣的算法復雜性,有沒有更好的存儲方法提高算法的效率?
例如,用順序表查找需要O(n)的時間復雜度,用平衡樹查找需要 O(logn)的時間復雜度。這是什么概念呢?就像你有 10 個億,一覺醒來,兜里只剩下 30 塊!
處理具有復雜關系的數據
現實中很多具有復雜關系的數據,無法通過簡單的庫函數調用實現。專業認證中特別強調培養學生解決復雜工程問題的能力,什么是復雜工程問題?
就是需要綜合運用多個知識技術解決的問題。如同現在很多芯片高度集成,完全不需要芯片內部如何,直接使用就行了。
但是,如果在現實中遇到一個復雜問題,一個芯片只能完成其中一個功能,難道要連接十幾塊芯片來解決這一個問題?
你在搞圣誕樹嘛?一個樹枝掛個小禮物,叮叮當當的亂響。這顯然是不合適的,我們需要的是完成該復雜問題的一個芯片,因此需要運用所學的數據結構知識,高效處理具有復雜關系的數據。
通過學習數據結構,更加準確、深刻地理解不同數據結構之間的共性和聯系,學會選擇和改進數據結構,高效地設計并實現各種算法,這才是數據結構的精髓。
03
數據結構為什么那么難?
網絡上太多的同學吐槽被虐,如滔滔江水連綿不絕,數據結構太難了!真的很難嗎?其實數據結構只是講了三種:線性結構、樹、圖。到底難在哪里呢?通過調查了解大概有四個原因:
▲無法接受的描述方式
數據結構的描述大多是抽象的形式,我們使用自然語言表達習慣了,不容易接受數據結構的抽象表示。
不止一個學生問我,書上的“ElemType”到底是什么類型?運行時怎么提示錯誤。它的意思就是“元素類型”,只是這樣的描述,你需要什么類型就寫什么類型,例如 int。這樣的表達方式讓不少人崩潰。
▲不知道什么用處
盡管很多人學習數據結構,有的人是應付考試,有的人考研需要,有的人參加算法競賽需要,而很多人不太清楚學習數據結構有什么用處,迷迷糊糊看書、做題、考試。
▲體會不到其中的妙處
由于教材、教師等等各種因素影響,很多學生沒有體會到數據結構處理數據的妙處,經常為學不會而焦頭爛額,無法體會其中樂趣,有趣是才有意思,興趣是最大的驅動力。一旦體會到其中的奧妙,就會有停不下來的感覺。
有讀者給我留言,老師看了你的書根本停不下來。其實,我寫書的時候也停不下來,神同步。
▲語言基礎不好
我一直強調先看圖解,理清思路,再上機。還是有很多同學已經理解了思路后,因為缺少 main 函數,輸入輸出格式不對,缺少括號等等各種語言問題卡殼,而這一切統統戴給了“數據結構太難了”這個大帽子。
04
數據結構學習秘籍
在講學習秘籍之前,首先了解一下數據結構學習的三種境界:
▲會數據結構的基本操作
這是最基礎的要求,學會各種數據結構的基本操作,取值、查找、插入、刪除等。先看圖解,理解各種數據結構的定義,操作方法,然后看代碼,嘗試自己動手上機運行,逐漸掌握基本操作。
初學時,要想理解數據結構,一定要學會畫圖,通過畫圖形象表達,更能體會其中的數據結構關系。因此,初學階段學習利器:畫圖,理解,畫圖。
▲會利用數據結構,解決實際問題
在掌握了書上的基本操作之后,就可以嘗試利用數據結構解決一些實際問題了,先學經典應用問題的解決方法,體會數據結構的使用方法,然后再做題,獨立設計數據結構解決問題。
要想熟練應用就必須做大量的題,從做題中體會其中的方法。最好進行專項練習,比如線性表問題,二叉樹問題,圖問題,該階段學習利器:做題,反思,做題。
▲熟練使用和改進數據結構,優化算法
這是最高境界了,也是學習數據結構的精髓所在,單獨學習數據結構是無法達到這種境界的。它需要在學習算法的過程中慢慢修煉。
在學習算法的同時,逐步熟練應用、改進,慢慢體會不同數據結構和算法策略的算法復雜性,最終學會利用數據結構改進和優化算法。
該階段已經在數據結構之上,通過在測試系統上刷各種算法題,體會利用數據結構改進優化算法。該階段學習利器:刷題,總結,刷題。
刷題網站
打比賽:HDU、POJ、Vjudge、Code Forces
找工作:LeetCode
05
算法為什么那么難
很多人感嘆:算法為什么 那么難!首先,算法本身具有一定的復雜性,還有一個原因:講的太爛!算法的教與學有兩個困難:
▲我們學習了那些經典的算法,在驚嘆它們奇思妙想的同時,難免疑慮重重:這么牛,怎么想到的?對學生來說,這可能是最費解、也最讓人窩火的地方。高手講,學算法要學它的來龍去脈,包括種種證明。
但這對菜鳥來說,簡直比登天還難,很可能花費很多時間也無法搞清楚。這條路對大多數人來說,是行不通的,那怎么辦呢?下功夫去記憶書上的算法?記住這些算法的效率?看似學會了,其實兩手空空。遇到一個新問題,仍然無從下手。
可這偏偏又是極重要的,無論作研究還是實際工作,一個計算機專業人士最重要的能力,就是解決問題——解決那些不斷從實際應用中冒出來的新問題。
▲算法作為一門學問,有兩條幾乎平行的線索。一個是數據結構(數據對象):數、矩陣、集合、串、排列、圖、表達式、分布等等。另一個是算法策略:貪心、分治、動態規劃、線性規劃、搜索等等。
這兩條線索是相互獨立的:同一個數據對象上有不同的問題,例如單源最短路徑和最優二叉樹,就可以用到不同的算法策略,如貪心和動態規劃;而同一個算法策略,例如排序和整數乘法,也會用到不同的數據結構。它們之間是多對多的關系。
兩條線索交織在一起,該如何表述?
我們早已習慣《數據結構》中講數據結構,《算法設計與分析》里面講算法策略。各說各的,講算法設計時就假設你已經對數據結構了如指掌,還沒有哪一本算法書很好的解決這兩個困難,傳統的算法書,大多注重內容的收錄,但卻忽視思維過程的展示,因此我們學習了經典的算法,卻費解于算法設計的過程。
遇到一個實際問題,通過問題分析,選擇使用什么樣的算法策略,基于這種算法策略選擇什么樣的數據結構,有時算法策略和數據結構的選擇并不是唯一的,不同的算法策略和數據結構設計的算法,其復雜性是不同的。
而很多書就是灌輸式的講一個實例,一下子就選擇了一個認定是最優的算法策略,告訴你就這樣干,不談數據結構,然后分析算法復雜性,就結束了。
原則上講算法策略就講算法策略,不依賴任何程序設計語言和數據結構,但對很多學生來講,尤其是語言沒學好,數據結構也不熟練的同學,只講算法策略,如同空中樓閣。自己用算法解決實際問題,一頭霧水。
《趣學算法》,從問題出發,根據實際問題進行分析,選擇合適的算法策略,并分析為什么采用這種算法策略,然后選擇什么數據結構,不同的數據結構復雜性會有什么區別,巧妙地將數據結構和算法策略擰成了一條線。
通過大量實例,充分展現算法設計的思維過程,讓學生充分體會遇到一個問題,如何分析,使用什么算法策略,采用什么數據結構,算法的復雜性如何?是否有優化的可能?
西方教育旨在激發學生對世界的好奇心,而在這里,我們培養的是讓學生懷著一顆好奇心,思考問題、解決問題的能力。更重要的是——體會學習的樂趣,發現算法的美!
06
算法學習秘籍
知識在于積累,學習需要耐力。學習就像挖金礦,或許一開始毫無頭緒,一頭霧水,但轉個角度,換換工具,時間久了總會找到一個縫隙。成功就是你比別人多走了一段路,或許恰恰是那么一小步。
▲第一個建議:多角度,對比學習
學習算法,可以先閱讀一本簡單的入門書,然后綜合幾本書橫向多角度看,例如學習動態規劃,拿幾本算法書,把動態規劃這章找出來,比較學習,多角度對比分析更清晰,或許你會恍然大悟,噢,原來如此簡單。
或許有同學說我哪有那么多錢買那么多書,只要你想學習,沒有什么可以阻擋!你可以圖書館借,也可以聯系你的老師,每學期上課前,我都會告訴學生,如果你想學習卻沒錢買書,我可以提供幫助。想一想,你真的沒有辦法?
▲第二個建議:大視野,不求甚解
經常有學生為了一個公式推導,或幾句代碼拋錨,甚至停滯數日,然后淹沒在無盡的挫敗感中,把自己弄得垂頭喪氣。公式可以不懂,代碼可以不會。你不必投入大量精力試圖推導書上的每一個公式,也不必探究語法或技術細節。
學算法就是學算法本身,首先是算法思想,解題思路,然后是算法實現,算法思想的背后可能有高深的數學模型,復雜的公式推導,你理解了當然玄妙,不懂就拉倒。
算法實現可以用任何語言,所以不必糾結是 C,C++,Java,Python,更不必管嚴格的語法規則,除非你要上機調試。
建議還是先領會算法,寫偽代碼,在大腦中調試吧,如果沒有良好的編程經驗,一開始就上機或許更讓你崩潰。遇到不懂的部分,瀏覽一下或跳過去,讀完了還不明白再翻翻別的書,
總有一天,你會發現,“暮然回首,那人卻在燈火闌珊處”。
▲第三個建議:多交流,見賢思齊
與同學,朋友,教師或其他編程愛好者們一起學習和討論問題,是取得進步最有效的辦法,也是分享知識和快樂的途徑。
加入論壇,加入交流群,會了解其它人在做什么,怎么做,遇到問題可以請教高手,帶來醍醐灌頂的喜悅;也可以應助菜鳥,使你暗自得意,信心倍增。論壇和群也會分享大量的學習資料和視頻,還有不定期的培訓講座,讀書交流會,你會發現,不是你一個人在戰斗!
▲第四個建議:勤實戰,越挫越勇
實踐是檢驗一切真理的標準。古人云:“學以致用”,“師夷長技以制夷”。請不要急切期盼“實際的”例子,更不要看不起小實例,“不積跬步,無以至千里”。
大規模的成功商業案例所采用的算法,人工情感,無人駕駛,不是我們目前要解決的問題。
看清楚腳下的路,比仰望天空更實際,多做一些實戰練習,更好地體會算法的本質,在錯誤中不斷成長,越挫越勇,終究會成參天大樹。
▲第五個建議:看電影,洞察未來
不管是講《人工智能》,還是《算法分析》,我都會建議同學們去看一看科幻電影,如《人工智能》、《記憶裂痕》、《絕密飛行》、《未來戰士》、《她》等等。奇妙的是,這些科幻的東西,正在一步步的實現,靠的是什么?
人工智能。計算機的終極是人工智能,人工智能的核心是算法。未來的戰爭是科技的戰爭,先進的科技需要人工智能。我們的國家還有很多技術落后,未來需要你。
“一心兩本”學習法:
一顆好奇心,兩個記錄本。懷著一顆好奇心去學習,才能不斷的解決問題,獲得滿足感,體會算法的美。
很多科學大牛的秘訣就是永遠保持一顆好奇心;一個記錄本用來記錄學習重點難點,隨時的突發奇想;一個記錄本做日記或周記,記錄一天或一周來學了什么,有什么經驗教訓,需要注意什么,計劃下一天或下一周做什么。
不停的總結反思過去,計劃未來,這樣每天都有事做,心中滿滿的能量。一個人經常上課睡覺,因為他心中無事可做;一個人經常失眠,因為他心里事兒太多!
-
算法
+關注
關注
23文章
4627瀏覽量
93166 -
數據結構
+關注
關注
3文章
573瀏覽量
40190
原文標題:別頭疼了,你要的算法和數據結構的學習路線來了!
文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論