深度學習的發展促進了相關應用的涌現。但是,深度學習模型往往具有非常大的參數搜索空間,為了保證模型的效果,經常需要機器學習專家耗費大量的時間構建深度學習模型。
為了降低深度學習模型的設計成本和難度、提高模型構建效率,學界提出了一個新的概念: Automated Machine Learning(AutoML)。目前 AutoML 這一概念并無統一定義,主要理念是:通過使用 AutoML 方法,用戶只需向模型輸入數據,之后模型會自動完成架構選擇和參數訓練。
2018年初, Google 發布的深度學習模型自動構建工具—— Cloud AutoML ,引發了針對 AutoML 更為廣泛的討論。本文中,營長將為大家推薦 GitHub 上一項針對 AutoML 的資源整理項目。項目作者對 AutoML 和傳統深度學習的特點進行了對比,并提供了關于 AutoML 的完整資源列表,包括論文、教程、教材、模型及項目、 PPT 等。
地址:
https://github.com/hibayesian/awesome-automl-papers
整體介紹
在傳統深度學習的模型構建中,主要包含以下步驟:數據處理、特征工程、模型架構選擇、超參數優化、模型后處理、結果分析。這些步驟往往會耗費大量人力和時間。在 AutoML 中,則可以對大部分步驟進行自動處理。在該項目中,作者對相關的 AutoML 類別進行了總結,包括:
自動數據清洗(Automated Data Clean, Auto Clean)
自動特征工程(Automated Feature Enginnering, Auto FE)
超參數優化(Hyperparameter Optimization, HPO)
元學習(Meta-Learning)
神經網絡架構搜索(Neural Architecture Search, NAS)
此外,細心的項目作者還提供了一個詳細的結構圖,以及部分現有模型的實現情況分析表。有興趣的讀者可以找到該項目地址以查看更多詳細內容。
論文
在這一部分,該項目針對于上述幾個 AutoML 類別提供了涉及 AutoML 的完整論文列表。
自動特征工程
模型架構搜索
超參數優化
混合模型
教程
這一部分,作者提供了關于貝葉斯優化和元學習的兩個教程,內容如下:
博客
書籍
項目
這一部分提供了一些相關模型和項目的官網或開源代碼鏈接:
PPT
最后是三個相關的 PPT 資源:
以上就是此次分享內容,希望對大家有所幫助!
-
機器學習
+關注
關注
66文章
8438瀏覽量
132938 -
深度學習
+關注
關注
73文章
5512瀏覽量
121418 -
GitHub
+關注
關注
3文章
473瀏覽量
16530
原文標題:非常全面的AutoML資源,看這個就夠了!
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論