在過去的幾年里,機(jī)器學(xué)習(xí)為各行各業(yè)開創(chuàng)了新紀(jì)元,誕生了許多成功的案例: Facebook 的面部識(shí)別,Netflix 的智能電影推薦系統(tǒng),PrimaAI 的圖像風(fēng)格轉(zhuǎn)換,Siri 的語音識(shí)別,Google Allo 的自然語言處理,及其他很多開發(fā)中的項(xiàng)目。
除了這些案例以外,GitHub 上有大量托管的開源機(jī)器學(xué)習(xí)項(xiàng)目。我們挑選了最受大家歡迎的項(xiàng)目,這些項(xiàng)目涵蓋 CV、NLP 及語音三大領(lǐng)域的 25 個(gè)開源項(xiàng)目,包括:如何讓機(jī)器學(xué)習(xí)創(chuàng)作音樂、歌曲;如何為草圖、灰度圖像上色;圖片風(fēng)格轉(zhuǎn)換;語音風(fēng)格遷移;在 IOS 或 Android 上進(jìn)行面部檢測(cè)與情感分類;提供游戲研究平臺(tái);最先進(jìn)的物體檢測(cè)算法的實(shí)現(xiàn);無人機(jī)與汽車的模擬器;損毀圖像的恢復(fù)工具、人體關(guān)鍵點(diǎn)檢測(cè)等內(nèi)容。希望大家能從中學(xué)到新的知識(shí)并得到啟發(fā)。
TensorFlow 是一個(gè)用于研究和生產(chǎn)的開源機(jī)器學(xué)習(xí)庫。 TensorFlow 為初學(xué)者和專家提供了各種API,以便對(duì)桌面、移動(dòng)終端、Web和云進(jìn)行開發(fā)。
TensorFlow 由 Google Brain 團(tuán)隊(duì)開發(fā),最初僅供 Google 內(nèi)部使用。2015年11月 9 日,TensorFlow 在 Apache 2.0 開源許可下發(fā)布。最新版本的 TensorFlow 支持 Keras,它是一種用 Python 編寫的高級(jí)神經(jīng)網(wǎng)絡(luò) API,能夠在 TensorFlow, CNTK 或 Theano 之上運(yùn)行。Keras 也包含 Javascript 和 Swift 的接口。
▌Scikit-learn
Scikit-learn 是基于 NumPy、SciPy 和 Matplotlib 的一款簡單有效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具。 由于其簡單和便捷的功能,它常與 TensorFlow 一起使用。
▌MXNet
除了 TensorFlow 、Keras 和 Scikit-learn 之外,Apache 的 MXNet 也是一款深度學(xué)習(xí)的框架工具。 它專為提高效率和靈活性而設(shè)計(jì),允許混合使用符號(hào)和命令式編程,以最大限度地提高效率和生產(chǎn)力。
▌PyTorch
PyTorch 絕對(duì)是這個(gè)列表里一定要提到的一款應(yīng)用,它在機(jī)器學(xué)習(xí)愛好者里享有很高的知名度。 PyTorch 基于 Torch ,并由 Facebook 作為其機(jī)器學(xué)習(xí)的框架發(fā)布。 PyTorch 是一個(gè) Python 包,它提供兩個(gè)高級(jí)功能:由強(qiáng) GPU 支持的加速張量計(jì)算(如 NumPy ),其深度神經(jīng)網(wǎng)絡(luò)是建立在基于磁盤的 autograd 包上。
(來源:https://twitter.com/pytorch/status/966324198758006784)
▌magenta
Magenta 目前還在研究過程中,它致力于探索如何讓機(jī)器學(xué)習(xí)參與藝術(shù)和音樂的創(chuàng)作。 它主要涉及創(chuàng)新開發(fā)深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的算法以用于生成歌曲、圖像、繪圖和其他素材。 同時(shí),Magenta 也是對(duì)于如何構(gòu)建智能工具和界面的探索,它允許藝術(shù)家和音樂家使用這些模型擴(kuò)展(而不是取代!)他們的創(chuàng)作路徑。
它主要的庫適配于 python ,除此之外也有 Javascript 的版本 — magenta.js 。 在藝術(shù)創(chuàng)作里,大部分人可能從未想過高級(jí)機(jī)器學(xué)習(xí)可以使用在這個(gè)領(lǐng)域,但 Megenta 向人們完美地展示了應(yīng)用的可能性。點(diǎn)擊這里觀看這些令人驚嘆的聲音和繪圖生成器的演示吧。
▌style2paints
該項(xiàng)目旨在為線稿著色。 AI 可以根據(jù)既定的顏色樣式在草圖上繪制、或在草圖上創(chuàng)建繪制自己的顏色風(fēng)格、亦或者將現(xiàn)有的風(fēng)格轉(zhuǎn)換至另一種風(fēng)格。
有一些值得一看的新的功能,例如色彩錨和圖像過渡。
▌Image-to-image translation in PyTorch
該項(xiàng)目有兩個(gè)組成部分,CycleGAN 和 pix2pix 。基于 PyTorch ,它們可以實(shí)現(xiàn)用于未配對(duì)和成對(duì)的圖像到圖像轉(zhuǎn)換。 乍看之下,它仿佛只是一種相當(dāng)普通的風(fēng)格轉(zhuǎn)移解決方案,事實(shí)上,它跟其他應(yīng)用不一樣。比如它能將圖片里普通的馬轉(zhuǎn)換為斑馬或從實(shí)景照片轉(zhuǎn)換為莫奈風(fēng)格的畫作。并且它的處理速度快到足以在實(shí)時(shí)視頻上應(yīng)用。
▌Deep voice conversion
列表上已經(jīng)羅列了一些用于圖像和視頻的風(fēng)格轉(zhuǎn)換工具了,但是語音呢? 深度語音轉(zhuǎn)換便是此功能的完美示例。
如果你可以模仿名人的聲音或擁有著歌手一樣歌喉,你會(huì)怎么干點(diǎn)什么? 深度語音轉(zhuǎn)換的目的是將任意人的聲音轉(zhuǎn)換為特定的目標(biāo)聲音,也就是所謂的語音風(fēng)格轉(zhuǎn)移。項(xiàng)目開始時(shí),我們目標(biāo)將任意人的聲音轉(zhuǎn)換為著名的英國女演員 Kate Winslet 的聲音。 我們使用了一個(gè)深度神經(jīng)網(wǎng)絡(luò)和由 Kate Winslet 朗讀的2小時(shí)有聲讀物作為數(shù)據(jù)集來實(shí)現(xiàn)這一目標(biāo)。
▌StarGAN in PyTorch
StarGAN 是這篇文章中提到的一個(gè) PyTorch 應(yīng)用:Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation。它可以將源圖像轉(zhuǎn)換成不同的發(fā)型、皮膚類型、年齡、性別和不同的情緒。
▌Face detection
面部檢測(cè)聽起來不太吸引人,因?yàn)槲覀兛梢栽?iOS 和 Android 上使用 Core ML 或 ML Kit 輕松地完成這項(xiàng)工作。 但是隨著深入了解,你會(huì)發(fā)現(xiàn)它不僅可以檢測(cè)面部,還可以檢測(cè)情緒和性別。
使用 Keras CNN 模型和 OpenCV 在 fer2013 / IMDB 數(shù)據(jù)集的進(jìn)行實(shí)時(shí)人臉檢測(cè)和情感/性別分類。
▌Deep universal probabilistic programming
Uber AI Labs 構(gòu)建了這個(gè)深度概率編程庫,用于簡化其運(yùn)輸服務(wù)的預(yù)測(cè)和優(yōu)化收益。 任何處理概率建模的人都會(huì)對(duì)這個(gè)庫感興趣。
機(jī)遇無處不在,從匹配乘客和駕駛員,建議最佳路線,找到最明智的搭配組合,甚至創(chuàng)造下一代智能車輛。 為了解決這些挑戰(zhàn),我們將最先進(jìn)的人工智能(AI)技術(shù)與數(shù)據(jù)科學(xué)家、工程師和其他用戶的豐富專業(yè)知識(shí)相結(jié)合。 我們正在探索一種工具優(yōu)先的方法,使我們和其他人能夠制作下一代AI解決方案。
▌ParlAI
作為 Facebook 研究項(xiàng)目的一部分,ParlAI 是一個(gè)用于在各種公開可用的對(duì)話數(shù)據(jù)集上訓(xùn)練和評(píng)估 AI 模型的框架。 ParlAI 是一個(gè)在為研究人員提供訪問許多流行數(shù)據(jù)集的權(quán)限的同時(shí),也可以共享和測(cè)試對(duì)話模型的統(tǒng)一框架。
▌Facets
Facets 一種可視化機(jī)器學(xué)習(xí)數(shù)據(jù)集的工具。
可視化由 Polymer Web 組件實(shí)現(xiàn),由 Typescript 代碼支持,可以輕松嵌入到 Jupyter 筆記本或網(wǎng)頁中。
可視化的關(guān)鍵是跨多個(gè)數(shù)據(jù)集的異常檢測(cè)和分布比較。 有趣的值(例如,大量的缺失數(shù)據(jù),或跨多個(gè)數(shù)據(jù)集非常不同的特征分布)以紅色突出顯示。
▌ELF with AlphaGoZero
ELF 是 AlphaGoZero / AlphaZero 實(shí)現(xiàn)的游戲研究平臺(tái)。 ELF 為游戲研究提供端到端解決方案。 它包括微型實(shí)時(shí)戰(zhàn)略游戲環(huán)境,并發(fā)模擬,數(shù)千臺(tái)機(jī)器的分布式培訓(xùn),直觀的 API ,基于 Web 的可視化以及由 PyTorch 提供支持的強(qiáng)化學(xué)習(xí)框架。
▌Detectron
Detectron 是 Facebook AI Research 的軟件系統(tǒng),它實(shí)現(xiàn)了最先進(jìn)的物體檢測(cè)算法,包括 Mask R-CNN 。 它是用 Python 編寫的,由 Caffe2 深度學(xué)習(xí)框架提供支持。
▌Fast Style Transfer
使用 TensorFlow CNN 實(shí)現(xiàn),這可能是圖像樣式傳輸?shù)淖罴咽纠唬櫭剂x,它的完成速度非常快。 該項(xiàng)目基于 Gatys 的藝術(shù)風(fēng)格的神經(jīng)算法, Johnson 對(duì)實(shí)時(shí)樣式轉(zhuǎn)換和超分辨率的感知損失以及 Ulyanov 的實(shí)例規(guī)范化的組合 。
▌Face recognition
此工具提供簡單的面部識(shí)別 API 。 它可以找到面部特征,并猜出照片中的人物。
使用 dlib 最先進(jìn)的面部識(shí)別功能構(gòu)建而成,并通過深度學(xué)習(xí)構(gòu)建。 該模型在 Wild 標(biāo)記的 Labeled Faces 中具有 99.38% 的準(zhǔn)確度。
這還提供了一個(gè)簡單的 face_recognition 命令行工具,可以讓您從命令行對(duì)圖像文件夾進(jìn)行人臉識(shí)別!
▌Deep photo style transfer
另一個(gè)十分好用的圖片風(fēng)格轉(zhuǎn)換工具。 這篇文章里包含本應(yīng)用的代碼和研究論文: Deep Photo Style Transfer 。 它提供了簡單的API來合并樣式和源圖像。 令人印象深刻的圖像樣式轉(zhuǎn)移工具。
▌Fast Text
FastText 是一個(gè)有效學(xué)習(xí)單詞意思和句子分類的庫。
為了更好地了解這個(gè)項(xiàng)目,請(qǐng)轉(zhuǎn)到他們的文本分類教程,該教程展示了如何在監(jiān)督學(xué)習(xí)中使用該庫。 文本分類的目標(biāo)是將文檔(例如電子郵件,帖子,文本消息,產(chǎn)品評(píng)論等)分配給一個(gè)或多個(gè)類別。
▌AirSim
AirSim 是一款基于 Unreal Engine 的無人機(jī),汽車的模擬器。 它是開源的,跨平臺(tái)的,它支持硬件在環(huán),并支持市面上流行的飛行控制器(如 PX4 )用于物理和視覺逼真的模擬。 這是一個(gè) Unreal 插件,可以簡單地插入到你想要的任何 Unreal 的環(huán)境中。
▌Image restoration
機(jī)器學(xué)習(xí)可以做的比我們想象的要多。 Deep Image Prior 是基于神經(jīng)網(wǎng)絡(luò)的修復(fù)圖像工具 – 并不是機(jī)器學(xué)習(xí)。
此工具可以恢復(fù)帶有劃痕、壞點(diǎn)和/或不需要的文本標(biāo)記的損壞圖像。
▌Open Pose
Open Pose 代表了第一個(gè)在單個(gè)圖像上聯(lián)合檢測(cè)人體、手、面部和足部關(guān)鍵點(diǎn)(總共 135 個(gè)關(guān)鍵點(diǎn))的實(shí)時(shí)多人系統(tǒng)。
▌PirateAT
PirateAI 在模擬環(huán)境(島嶼)中訓(xùn)練自主代理(海盜)。 這個(gè)倉庫運(yùn)行一個(gè)訓(xùn)練管道,在游戲(尋找寶藏)和模型訓(xùn)練課程( Keras + hyperopt )之間交替。
▌EmojiIntelligence
與此列表中的許多項(xiàng)目相比,這個(gè)項(xiàng)目相當(dāng)簡單,但它是學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)如何工作的良好起點(diǎn)。 項(xiàng)目實(shí)現(xiàn)是在沒有任何庫的純 Swift 中,并且很容易模仿。
▌Deep Exemplar-Based Colorization
它是第一個(gè)使用深度學(xué)習(xí)的基于樣本的局部著色工具。 給定參考的彩色圖像后,我們的卷積神經(jīng)網(wǎng)絡(luò)直接將灰度圖像映射到輸出彩色圖像。 這是基于 Deep Exemplar-based Colorization 論文的實(shí)現(xiàn)。
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121391 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60583 -
自然語言處理
+關(guān)注
關(guān)注
1文章
619瀏覽量
13611
原文標(biāo)題:GitHub上25個(gè)最受歡迎的開源機(jī)器學(xué)習(xí)庫
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論