色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Kaggle創始人Goldbloom:我們是這樣做數據科學競賽的

電子工程師 ? 來源:lq ? 2019-01-23 15:16 ? 次閱讀

不管是初學者還是大魔王,只要浸潤過數據科學和機器學習界,那么對于Kaggle一定不陌生。各路英豪在這個平臺上實戰練習、膜拜大神、打怪升級,用某個媒體人的一句話,“簡而言之,Kaggle 是玩數據、機器學習的開發者們展示功力、揚名立萬的江湖。”

為什么有這么多的數據科學家會在Kaggle花這么多的時間?kaggle最著名的就是競賽了,那么具體的競賽怎么做呢?

1 月 19 日,作為Kaggle的由聯合創始人、首席執行官Anthony Goldbloom在“全球新興科技峰會”中,回答了這兩個問題。

以下Anthony Goldbloom的最新演講,文摘菌做了有刪改的整理~

Kaggle聚集了大量的機器學習的專家以及大數據的專家最,截止到目前為止,差不多是有250萬人了,在演講的最開始,首先介紹一下我們在kaggle的工作。然后給大家說一下我們在kaggle學到的一些經驗。

具體的競賽怎么做

在Kaggle里面,我們做好幾項不同的工作,分別是:競賽、電腦的數據環境以及數據組的共享空間。

我們具體的競賽怎么做呢?首先就是有公司會在我們的網站上面提出一個問題,解決這個問題會有獎金。

有一些獎金還是非常高的。例如上圖,第一個是美國國土安全部,他們希望用算法能夠幫助識別是否有人攜帶了武器,或者是攜帶其他的一些禁帶品,他們希望這個算法更加的精準一些。這非常重要,因為過篩率如果太低,就意味著效率會變的非常的低。所以,他們是希望能夠增加效率。

第二個是Zillow,Zillow其實就是在它的網站上面可以輸入自己地址,然后根據房子里面有多少的臥室,多大的房間,有多少個浴室等估算房子價值。

Zillow那個競賽,一開始他們可能和實際的房價是差了20%,然后呢,他們慢慢的調了一下算法,越來越接近正常價格。

更好的算法能夠幫助他們找到正常的價格。為了解決這個問題,他們愿意提供超過100萬美元做獎金。

其他的競賽項目,獎金就沒有這么多了,但是大家可以看得出來,越來越多的公司非常重視AI以及這樣的算法。

還有衛星圖像的競賽,還有關于森林大火或者是森林減少率的圖像分析的大賽。

所以說,在kaggle里有各種各樣的問題,包括不同的行業、不同的方面,這里面非常有意思的一點,就是所有的問題,都可以用差不多的方法來進行解決。當我們有兩個數據集的時候,一個是訓練集,一個是測試集,兩者是完全不同的。訓練集可以看到結果,測試集看不到結果。

測試組將采用類似的數據,這樣的測試組可以幫助我們看一下算法是不是能夠達到我們的預期值。對比不同的算法結果,我們也會把不同結果的對比進行公開。

對比提升算法準確率

所以說大家可以看到,大家如果能夠把自己的結果進行對比的話,會有更多的激勵,會把自己的算法調整的更好。

之前給大家說到的Zillow,一開始的準確率還差15%,最后準確率只差了5%。是不是5%就沒有辦法突破了,或者我們需要調整一些技術來彌補這5%。然后公司就會推出相關的競賽,找到到底是什么原因,有沒有辦法突破最后的界限。

現在很多的公司也非常看重AI,一方面幫助他們解決問題,另一方面幫助他們找到人才。我們每半年都會有競賽,我們和airbnb、Facebook聯合組織相關的競賽,幫他們找到相關的人才。

所以說,分享和學習是非常重要的,比如說你在競賽里面的排名是15名。通過公開你可以知道第一名到底怎么做的以及第一名用采用的技術。有了這些,你在下次競賽的時候就可以學習第一名所使用的技術了。

因為這里面有很多不同的人,這些人有可能是讀AI的博士,或者有其他的一些業余選手。但不管是什么人,他都可以在這上面展示自己。

現在中國已經在社區里面規模排到第三了,第一是美國,第二大是印度。我們可以看到,有很多非常出色的競爭者都來自于中國。

Kaggle競賽解決實際問題

為什么人們會競賽,為什么公司會在kaggle網站上面放一些問題?

首先,競賽非常重要,雖然說所有的網站都是深度學習,深度學習其實是在整個AI當中所使用的是比較小的數據組。

但對于這些問題來講,那些小的數據組能解決的問題,傳統的工具也可以幫助我們解決。但不管怎樣,我們一開始必須要從不同的方面進行數據的探索,比如說我們會用數據繪制圖標,所以說我們可以非常深入的了解數據。

在競賽里面,人們第二步就是假設,數據之間的假設,例如在預測車銷量的競賽中,最主要的是用算法預測哪一個車可能會賣的更好。

其中有一個非常重要的因素是顏色,我們有兩類:常規顏色以及非常規顏色。非常規顏色的車會比較好賣,因為根據這個假設買二手車的人可能會更喜歡一些比較另類的車,并且更愛保養。

通過這樣的一種算法,我們也會進行頭腦風暴,可以幫助我們更好的搜集不同方式或者不同方向的數據。

另外,我們進行調參,我們在進行數據的設計之后,再次把數據放在一個數據庫當中,再進行分類、調參和模型融合。

其實,技術也是非常重要的,所謂的深度學習,也是競賽者經常使用的技術。例如在圖像的識別當中,經常使用的卷積神經網絡技術,比如說衛星圖像還有醫學圖像、自動駕駛也經常使用。

遷移學習解決小樣本問題

即便說是數據庫比較小的,但是我們做的還是非常的好,就是因為我們有所謂的遷移學習,也就是說我們可以把一系列的學習成果轉移到其他更大范圍的規模上。

這個學習的結果得到了轉移之后,我們在進行一些調參,即便是有一些比較小的原始的數據組,比如說對于醫學的圖像,最后這個建立的模型也還是非常準確的,也可以幫助我們進行更好的應用。

另外,我們發現深度學習在其他的領域也做的更好,比如說現在我們的神經網絡做的非常得的好,比如利用卷積神經網絡分析醫療圖像,我們也是讓競賽者推斷這個圖片,去推斷這個人是不是有癲癇或者是有相關的一些病癥。

另外還有就是文本,因為文本有序列,一個字之后又是一個字,所以說這也可通過神經網絡進行分析,所以說,我們在很多的問題解決方面,要判斷有哪些技術是可以應用的,哪些技術是比較擅長的。

Kaggle競賽中最重要的特征

特征一:我們發現我們的這些競賽者都是非常有創造性的一群主體,競賽中有一些問題是需要對特征進行相關的工程設計,所以說,在我們進行神經學習的時候,需要一些小辦法來尋求幫助,判斷看這個方法是不是管用,這個方法是不是能夠提高效率,從而能夠幫助我們把整體的效率提升。

特征二:我們競賽者都是非常的重視如何對自己的模型進行測試的,大家建模之后會進行測試,然后在進行調參,進行改進......

在模型訓練完成之后,進入測試階段,做法是把用過的數據全部“扔掉”。然后用新的數據進行檢驗,也就是說我們要保證我們的算法不單單只是在原始數據上面可以做出準確的預測,而且在全新的數據面也可以做同樣的結果。所以說,我們在進行模型的測試的時候,整體的過程是非常嚴苛的。

特征三:大家的編程能力非常棒。版本的控制是非常重要的,其實對版本的控制就能夠意味著我們可以知道哪些版本更高效,哪些不能夠奏效,其實在軟件的這個領域當中,很多的數據科學家以及機器學習的專家都會使用各種辦法來進行管理,所以說他們就會知道自己在代碼在每個版本之間會有不同。

而且這也是非常重要的一個信息,讓他們知道到底哪個版本是能夠非常好的運作,哪些不太好。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40532
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132912
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121405

原文標題:Kaggle創始人Goldbloom:我們是這樣做數據科學競賽的

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    新思科技創始人榮獲2024年羅伯特-諾伊斯獎

    作為半導體行業公認的行業領導者和遠見卓識者,新思科技創始人兼執行主席Aart de Geus博士被授予半導體行業最高榮譽羅伯特-諾伊斯獎(Robert N. Noyce Award)。
    的頭像 發表于 11-27 11:43 ?301次閱讀

    貿澤電子對FIRST創始人兼發明家Dean Kamen進行視頻專訪

    ? (For Inspiration and Recognition of Science and Technology) 創始人Dean Kamen的視頻專訪。這家非營利機構致力于通過機器實踐項目,推動
    發表于 09-12 17:44 ?200次閱讀

    新思科技創始人Aart de Geus博士獲半導體行業最高榮譽羅伯特-諾伊斯獎

    華盛頓州, 2024 年 8 月 12 日 – 近日,新思科技(Synopsys, Inc.,納斯達克股票代碼:SNPS)創始人兼執行主席Aart de Geus博士獲得2024年半導體行業最高榮譽
    發表于 08-12 13:38 ?423次閱讀

    得翼通信創始人及CEO:外掛RPU,捅破射頻天花板

    2024上海世界移動通信大會期間,得翼通信以射頻領域新銳之姿,正式發布了全球首款RPU(Radio Processing Unit)射頻增強處理器和解決方案。得翼通信的創始人兼CEO王子明博士在接受
    發表于 07-19 13:38 ?297次閱讀
    得翼通信<b class='flag-5'>創始人</b>及CEO:外掛RPU,捅破射頻天花板

    2023年度國家自然科學獎 | 熱烈祝賀晟鵬創始人成會明院士

    6月24日,全國科技大會、國家科學技術獎勵大會、兩院院士大會在人民大會堂隆重舉行。廣東晟鵬材料技術有限公司(廣東晟鵬科技有限公司)創始人成會明院士團隊的項目“新型二維材料的創造、制備與物性研究”榮獲
    的頭像 發表于 06-30 08:10 ?879次閱讀
    2023年度國家自然<b class='flag-5'>科學</b>獎 | 熱烈祝賀晟鵬<b class='flag-5'>創始人</b>成會明院士

    ASML創始人逝世...

    當地時間6月11日,光刻機巨頭ASML在 領英 平臺發文悼念公司創始人之一Wim Troost(維姆·特羅斯)離世。 據百能云芯電.子元器.件商.城了解,ASML公司表示,“Wim Troost去世
    的頭像 發表于 06-14 16:43 ?904次閱讀

    ASML創始人離世!

    創始人之一,在1987年至1990年期間擔任首席執行官,當時ASML正在努力爭取第一個客戶。 退休后,Wim 仍是 ASML 和高科技行業的真正大使。他激勵了許多后輩。我們感謝 Wim 對 ASML
    的頭像 發表于 06-13 09:10 ?310次閱讀

    亞馬遜創始人重回世界首富

    近日,亞馬遜創始人杰夫·貝索斯在全球富豪500強排名中再次登頂,成功取代法國奢侈品巨頭LVMH的老板伯納德·阿爾諾,重新奪回首富的寶座。
    的頭像 發表于 06-12 17:24 ?767次閱讀

    新火種AI|重磅突發!OpenAI聯合創始人官宣離職,GPT-4負責人將接任職位

    作者:小巖 編輯:彩云? 萬萬沒想到,OpenAI聯合創始人,首席科學家Ilya Sutskever在網上銷聲匿跡幾個月后的首次回歸,竟然是官宣了自己的離職消息。 5月15日,Ilya
    的頭像 發表于 05-16 09:44 ?435次閱讀
    新火種AI|重磅突發!OpenAI聯合<b class='flag-5'>創始人</b>官宣離職,GPT-4負責人將接任職位

    OpenAI聯合創始人Ilya Sutskever宣布離職

    近日,OpenAI的聯合創始人Ilya Sutskever在社交平臺上宣布,他將離開這家引領人工智能革命的公司。Ilya在推文中回顧了OpenAI的輝煌發展歷程,并稱之為一個“奇跡”。
    的頭像 發表于 05-16 09:26 ?525次閱讀

    FTX創始人被判25年監禁,律師團隊將上訴

    3月29日,據報道,FTX數字貨幣交易平臺于2022年末在美申請破產保護。其聯合創始人同時也是當時CEO的Sam Bankman-Fried(SBF)離職后,在巴哈馬被逮捕,并被遞解至美國等待審判。
    的頭像 發表于 03-29 09:52 ?457次閱讀

    一加創始人內部講話曝光 劉作虎稱AI手機不是噱頭

    一加創始人內部講話曝光 劉作虎稱AI手機不是噱頭 AI已經在改革千行萬業,我們看到一加創始人內部講話曝光中就提到AI手機;一加創始人劉作虎在內部講話中表示,AI手機不是噱頭,而是行業大
    的頭像 發表于 03-12 15:39 ?958次閱讀

    馬斯克:AI發展速度前所未見 但馬斯克起訴OpenAI及其創始人

    能比其進步更快。現在人工智能技術的能力似乎每隔半年就能增長十倍之多;盡管馬斯克認為人工智能不太可能永遠以這樣的速度增長。 馬斯克起訴OpenAI及其創始人 馬斯克在舊金山高等法院對OpenAI及其創始人山姆·奧特曼、格里高利·布
    的頭像 發表于 03-02 15:29 ?1271次閱讀

    軟銀集團創始人孫正義計劃投1000億美元建AI芯片公司對抗英偉達?

    根據外媒報道,軟銀集團創始人孫正義計劃籌集1000億美元,成立一家名為Project Izanagi的人工智能處理器公司。
    的頭像 發表于 02-25 15:36 ?739次閱讀
    軟銀集團<b class='flag-5'>創始人</b>孫正義計劃投1000億美元建AI芯片公司對抗英偉達?

    軟銀集團創始人孫正義計劃籌集千億美元成立AI芯片公司

    日本科技投資巨頭軟銀集團的創始人孫正義正籌劃一項雄心勃勃的計劃。據知情人士透露,他正在尋求籌集高達1000億美元的資金,以成立一家規模龐大的AI芯片公司。
    的頭像 發表于 02-20 13:40 ?804次閱讀
    主站蜘蛛池模板: 国产精品看高国产精品不卡| xxx88中国| 敌伦小芳的第一次| 奇虎成人网| 2020国产成人精品免费视频| 久久AV亚洲精品一区无码网| 亚洲日本激情| 挤奶门事件完整照片| 亚洲欧美国产综合在线| 黑人巨大交牲老太| 亚洲精品乱码久久久久久直播| 国产学生在线播放精品视频| 黄色毛片a| 超碰97 总站 中文字幕| 中国人泡妞www免费| 亚洲精品午夜久久久伊人| 人人澡人人擦人人免费| 恋夜直播午夜秀场最新| 国内精品伊人久久久影院| 好姑娘BD高清在线观看免费| 国产高清在线a视频大全| 超碰99热在线精品视频| 99久久精品费精品国产| 99re久久精品在线播放| 99久久99久久久精品齐齐鬼色| 69日本xxⅹxxxxx18| 伊人精品久久久大香线蕉99| 一本道久在线综合色色| 影音先锋av男人资源| 中文字幕在线免费视频| 99re在这里只有精品| 大香网伊人久久综合观看| 在线电影一区二区| 亚洲色偷偷偷网站色偷一区人人藻 | 久久免费看视频| 思思99精品国产自在现线| 公主纯肉高H文| 亚洲色播永久网址大全| 免费在线观看的毛片| 国产电影一区二区三区| 亚洲欧美日韩精品自拍|