最近小編學習了很久的機器學習算法,也正在積極的準備找一些機器學習項目來練練手,對于編程工程能力不突出的小編來說,選擇困難癥犯了。
每次想要真正開始擼項目的時候,到底使用怎樣的工具去實現呢?是遵循網上強人的說法”不自己實現的算法都沒有靈魂”,還是說秉持選擇現有工具開發模型的一貫作風呢?
在目前階段比較好的方式還是去選用已有的工具或者框架來協助開發。成熟的框架在算法優化和全面上普遍都比個人開發要好,并且使用現有框架和工具能夠大大提高開發的效率,如果童鞋們還是想要了解算法開發和實現步驟,可以通過查看源碼及官方文檔進行了解。
小編今天就給有機器學習開發需求,并對開發的工具有選擇困難癥的童鞋來推薦一些開源的框架。(小聲說,很多網上的工具推薦都是好幾個工具并列,這根本沒辦法治愈選擇困難癥好嘛!并且推薦的一些工具需要掌握的程度也沒有做一些介紹,都去詳細了解也會浪費一些時間好嘛!)
數據處理、分析工具
SQL語言(重要指數)
SQL語言作為一種通用的數據庫查詢語言,它的作用和強大自不用小編過多吹捧,不夸張的說,熟練掌握SQL語言在變化比閃電還快的互聯網行業5年內不愁找不到工作。SQL語言不僅在關系型數據庫中應用成熟,并且在許多大數據場景中應用也非常廣泛,如:Hive、SparkSQL、Kafka、Flink等。
Pandas(重要指數)
Pandas作為Python數據處理、分析三架馬車(與Numpy和Scipy)之首,地位擺在那,自然功能也相應的非常突出。它提供了各種高級的工具用于進行數據分析。Pandas有許多內置的方法用于分組統計、合并數據、數據篩選、以及時間序列操作。所有的這些操作都有出色的性能表現。因此,使用Pandas通常用于數據挖掘任務。
Numpy(重要指數)
Numpy是公認的最受歡迎的Python數據分析、機器學習庫之一,數組接口是Numpy最佳及最重要的功能。這個接口可以用于把圖像、音頻、以及其他二進制流數據表示為多維實數數組。Numpy同時也是許多高級類庫的底層庫。
Scipy(重要指數)
Scipy也是一個常用的Python數據分析庫,SciPy庫包含了優化器、線性代數、積分、插值、快速傅立葉變換、信號和圖像處理、統計等子模塊。
總結一下,如果童鞋熟練使用python并手上有一個機器學習的活
學習優先度:pandas》numpy》scipy》SQL
建議掌握程度:
pandas熟練掌握(因為它真的是你以后用得最多的東西)
numpy掌握少數內容(numpy數組和一些創建矩陣、隨機數的一些方法),numpy通常適合被大神用來手寫算法,童鞋們初級階段暫可不必了解太深
scipy不太需要特殊掌握(用得著的時候臨時去找api即可,比如一些微積分、傅里葉變換、圖像處理的問題不太好處理,去找找scipy里的方法吧)
SQL熟練掌握(不解釋了,但是在僅熟練Python并需要立即上手完成機器學習和數據挖掘任務時,掌握SQL可以延后,但需要熟練掌握!)
機器學習、深度學習
Sklearn(重要指數)
Sklearn被認為是最優秀的機器學習庫甚至沒有之一,是一個基于Numpy與SciPy的Python庫。它包含了大量用于實現傳統機器學習和數據挖掘任務的算法,比如數據降維、分類、回歸、聚類、以及模型選擇等。
TensorFlow(重要指數)
如果你正在使用Python來從事機器學習項目,那么你一定聽說過它,最新版本2.0集合了pytorch的優點,支持動態運算圖。也集成了keras,能夠以最簡便的方式搭建模型,可以說現在的Tensorflow在機器學習、深度學習領域簡直無所不能。
Pytorch(重要指數)
優秀的深度學習框架。
Keras(重要指數-)
優秀的深度學習腳手架,可以讓深度學習像搭積木那樣搭建起來。
Theano(重要指數-)
優秀的深度學習框架。
總結一下,從小編對框架的描述篇幅可以看得出來:
學習優先度:Tensorflow 》》 sklearn 》 pytorch(未包含的建議先不學)
建議掌握程度:
Tensorflow熟練掌握(這是日后用得非常多的框架,學習起來有一定難度,但真的常用)
Sklearn掌握少數內容(sklearn需要熟練掌握其建模流程和規則,因為sklearn實在太規范了,它的學習較簡單,但是真的經常會使用到,所以把sklearn當成權威字典隨時去查,是小編比較建議的使用方式)
Pytorch可不掌握(框架精通一種即可,尤其tf2.0在支持動態圖以后,pytorch的優勢也沒那么大了)
Keras 可不掌握(tf2.0已經集成了keras,掌握tf2.0直接可以使用)
Theano 可不掌握
整體而言總結一下,需要花時間多學習的工具有:pandas、tensorflow、SQL語言,SQL語言可以等有時間之后再集中學習,不需要花太多時間去學習。把工具當字典的有:sklearn、numpy、scipy,sklearn,需要掌握一些傳統機器學習建模流程和規則可以去github上找一些示例看,總體而言使用較簡單。其他的工具可以先放一放。小編說的夠清楚啦,關上你的手機,趕緊開始學習起來吧。
-
數據處理
+關注
關注
0文章
613瀏覽量
28604 -
機器學習
+關注
關注
66文章
8438瀏覽量
132928
發布評論請先 登錄
相關推薦
評論