色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習項目難管理的原因是什么

汽車玩家 ? 來源: AI公園 ? 作者:Lukas Biewald ? 2020-04-19 11:32 ? 次閱讀

我看到過很多公司嘗試使用機器學習 —— 有些大獲成功,有些慘敗。一個不變的事實是,機器學習團隊很難設定目標和期望。這是為什么呢?

機器學習項目難管理的原因是什么

1. 很難預先分辨出什么是難的,什么是容易的

是在國際象棋中擊敗卡斯帕羅夫更困難,還是撿起棋子并移動棋子更困難?計算機在二十多年前打敗了國際象棋世界冠軍,但是可靠地抓取和舉起物體仍然是一個未解決的研究問題。人類不擅長評估什么對人工智能來說是困難的,什么是容易的。即使在一個領域中,性能也可能有很大差異。預測情緒的準確性有多高?在影評中,有大量的文本和作者很容易搞清楚他們的想法,現(xiàn)在能期待的準確率是90-95%。在推特上,兩個人在80%的情況下對一條推文的觀點是一致的。在推文中,只要是關于航空公司的,那么總是把這條推文的情緒預測成負面的,就可以達到95%以上的準確率。

度量標準也可能在項目的早期提升很多,然后突然碰壁。我曾經舉辦過一場Kaggle競賽,全世界成千上萬的人競相為我的數據建模。在第一周,準確率從35%上升到65%,但在接下來的幾個月里,準確率從未超過68%。68%的準確率顯然是數據對于最先進的機器學習技術的限制。那些在Kaggle競賽中競爭的人非常努力地獲得了68%的正確率,我確信這是一個巨大的成就。但在大多數情況下,65%和68%是完全無法區(qū)分的。如果這是一個內部項目,我肯定會對結果感到失望。

我的朋友Pete Skomoroch最近告訴我,作為一名研究機器學習的數據科學家,在工程部門工作是多么令人沮喪。工程項目通常會向前推進,但機器學習項目可能會完全停滯。花一周時間對數據進行建模,結果可能(甚至很常見)沒有任何改進。

機器學習項目難管理的原因是什么

2. 機器學習很容易以意想不到的方式失敗.

機器學習通常工作得很好,只要你有大量的訓練數據以及你在生產中運行的數據看起來很像你的訓練數據。人類非常善于從訓練數據中歸納歸納,因此我們對此有著可怕的直覺。我做了一個小機器人,帶著攝像機和一個視覺模型,這個模型是根據從網上獲取的成百萬的ImageNet圖像制作的。我對我的機器人相機上的圖像進行了預處理,使其看起來像來自網絡的圖像,但準確性比我預期的要差得多。為什么?網絡上的圖片往往會針對目標物體進行構圖,但是我的機器人不一定會像人類攝影師那樣直視一個物體。人類甚至可能都沒有注意到這種差異,但使用現(xiàn)代深度學習網絡的時候就會非常痛苦。有很多方法可以處理這種現(xiàn)象,但我之所以注意到它,只是因為它的性能下降非常嚴重,我花了很多時間調試它。

更厲害的是,導致性能下降的細微差異很難被發(fā)現(xiàn)。接受《紐約時報》訓練的語言模型不能很好地概括社交媒體文本。我們可以預料到。但很顯然,從2017年開始接受文本訓練的模型,在2018年寫的文本中表現(xiàn)不佳。上游分布隨時間以多種方式變化。當對手適應了欺詐模型所做的事情時,欺詐模型就會完全崩潰。

3. 機器學習需要大量相關的訓練數據.

每個人都知道這一點,但這是一個巨大的障礙。如果你能夠收集并標記大量的訓練數據,計算機視覺可以做很多驚人的事情。對于某些用例,數據是某些業(yè)務流程的副產品。這就是機器學習真正發(fā)揮作用的地方。對于許多其他用例來說,收集訓練數據是非常昂貴和具有挑戰(zhàn)性的。許多醫(yī)療用例對于機器學習來說似乎是完美的 —— 使用許多微弱的信號和清晰的結果來做出關鍵的決策 —— 但是數據由于重要的隱私問題而被鎖定,或者一開始就沒有被統(tǒng)一的進行收集。

許多公司不知道從哪里開始投資收集訓練數據。這是一項重要的工作,很難預先預測該模型將如何工作。

解決這些問題的最佳實踐是什么?

1. 多注意你的訓練數據.

看看這個算法對它所訓練的數據進行錯誤分類的情況。這樣的錯誤幾乎總是標注錯誤或者一些邊界樣本。不管怎樣,你都想了解他們。讓每個構建模型的人都查看一下訓練數據并自己標注一些訓練數據。對于許多用例來說,一個模型不太可能比兩個獨立的人達成一致的效果更好。

2. 先做端到端的工作,然后一次改進一件事.

從可能有效的最簡單的事情開始,然后部署它。你會從中學到很多。過程中任何階段的額外復雜性都會改進研究論文中的模型,但很少會改進現(xiàn)實世界中的模型。每一個額外的復雜性都需要驗證。

將一些東西交到最終用戶手中,可以幫助你盡早了解模型可能工作得有多好,并且它可能會帶來一些關鍵問題,比如模型正在優(yōu)化的內容與最終用戶想要的內容之間的分歧。它還可能使你重新評估你正在收集的訓練數據的類型。最好能盡快發(fā)現(xiàn)這些問題。

3. 尋找優(yōu)雅的方法來處理不可避免的算法失敗的情況.

幾乎所有的機器學習模型在相當長的時間內都會失敗,如何處理這一問題絕對是至關重要的。模型通常有一個可以使用的可靠的置信度評分。使用批處理過程,你可以構建包含人在里面的循環(huán)系統(tǒng),將低可信度的預測發(fā)送給操作員,使系統(tǒng)能夠可靠地端到端工作,并收集高質量的訓練數據。對于其他用例,你可以使用一種標記潛在錯誤的方式,或者對最終用戶來說不那么惱人的方式,來呈現(xiàn)低可信度的預測。

下面是一個沒有被妥善處理的失敗例子。微軟沒有預料到他們的Tay機器人能多快從推特上的噴子那里學會不良行為。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28632

    瀏覽量

    208008
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132938
收藏 人收藏

    評論

    相關推薦

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?486次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設計目標是提高機器學習算法的運行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?570次閱讀

    AI項目管理平臺怎么用

    AI項目管理平臺是一種集成了項目管理工具、AI開發(fā)環(huán)境和數據分析能力的綜合性平臺。接下來,AI部落小編為您梳理AI項目
    的頭像 發(fā)表于 11-13 09:38 ?262次閱讀

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止一個。削減成本通常被認為是主要原因——但盡管通過云遷移降低成本無疑是一種誘人的可能性,但創(chuàng)新潛力才是更大的獎勵。云計算通過支持企業(yè)創(chuàng)新而產生的價值是僅僅通過 降低 IT 成本所能實現(xiàn)的價值
    的頭像 發(fā)表于 09-14 17:38 ?318次閱讀

    請問為什么vca810會產生諧波,原因是啥?

    vca810做的壓控放大,產生了諧波,使得波形發(fā)生了失真,請問為什么vca810會產生諧波,原因是啥。
    發(fā)表于 08-28 07:00

    OPA828ID發(fā)燙的原因是什么?

    你好,下面是我的DAC部分電路圖,運放用的是OPA828ID,封裝SOIC-8,±15V供電,現(xiàn)在一上電就發(fā)燙,用紅外成像儀顯示能達到67℃,網上查詢了解到,運放發(fā)熱的主要原因是自激振蕩和負載過大(電流過大),但電路功能目前正常,且工作電流最大6m 請問此電路中運放發(fā)燙的原因
    發(fā)表于 08-09 08:10

    XTR105不能正常工作的原因是什么?

    XTR105不能正常工作的原因是什么?
    發(fā)表于 08-08 08:23

    求助,PD信號源沒有發(fā)送ACCEPT信息的原因是什么?

    ;quot;" 。 "" 如果是,那么"accept" 丟失的原因是什么?
    發(fā)表于 07-04 06:17

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發(fā)表于 07-01 11:40 ?1510次閱讀

    CYUSB4357-BZXC速度降低的可能原因是什么?

    設備管理器下檢測為超高速集線器。 配置:上游配置為 PD 控制器下的 Sink 設備,下游配置為源設備。 速度降低的可能原因是什么?
    發(fā)表于 05-31 07:16

    CYUSB4357-BZXC:USB3在下游端口無法工作的原因是什么?

    設備管理器下檢測為超高速集線器。 配置:上游配置為 PD 控制器下的 Sink 設備,下游配置為源設備。 速度降低的可能原因是什么?
    發(fā)表于 05-29 07:58

    請問PSoC? Creator IDE可以支持IMAGIMOB機器學習嗎?

    我的項目使用 POSC62 MCU 進行開發(fā),由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 來進行項目開發(fā)。 但現(xiàn)在,由于需要擴展,我不得不使用機器
    發(fā)表于 05-20 08:06

    電源軌難管理?試試這些新型的負載開關IC!

    本文將討論負載開關的作用,其基本功能、附加功能以及高級特性,正是這些功能使得它們不僅僅相對簡單,而且可對電源軌進行電子開/關控制。
    的頭像 發(fā)表于 05-16 09:39 ?828次閱讀
    電源軌<b class='flag-5'>難管理</b>?試試這些新型的負載開關IC!

    新能源汽車為什么需要熱管理?

    新能源汽車需要熱管理原因是多方面的,涉及到車輛的性能、安全性、耐用性和乘客的舒適度。
    的頭像 發(fā)表于 04-26 15:11 ?2334次閱讀

    多單元電池難管理?推薦你試試這幾個器件!

    充電電池正越來越多地用于更高的電壓和更大的功率,其應用包括電動汽車 (EV) 和混合動力汽車 (HEV)、電動工具、草坪清理設備和不間斷電源。
    的頭像 發(fā)表于 04-18 09:53 ?2.9w次閱讀
    多單元電池<b class='flag-5'>難管理</b>?推薦你試試這幾個器件!
    主站蜘蛛池模板: 一区二区视频在线观看高清视频在线 | 国产在线精品视亚洲不卡 | 无码任你躁久久久久久老妇双奶 | 亚洲精品AV无码永久无码 | 国产精品久久久久影院 | RUN AWAY无删减全集动漫 | 欧美wwwvideos在线观看 | 国产传媒在线观看 | 蜜桃婷婷狠狠久久综合9色 蜜桃视频一区二区 | 国内一级一级毛片a免费 | 伊人狠狠丁香婷婷综合尤物 | 亚洲精品国产乱码AV在线观看 | 亚洲精品色情婷婷在线播放 | 一本之道高清www在线观看 | 久久看片网| 色女仆影院| 在线 | 果冻国产传媒61国产免费 | 免费果冻传媒2021在线看 | 国产在线精品亚洲另类 | 偷拍亚洲制服另类无码专区 | 国产精品青青草原app大全 | 久久99精国产一区二区三区四区 | 影音先锋av丝袜天堂 | 伊人不卡久久大香线蕉综合影院 | 国产中文在线观看 | 狼群影院视频在线观看WWW | yellow免费观看直播 | 久久精品影视 | 日韩欧美群交P内射捆绑 | 第七色男人天堂 | 三级黄毛片 | 强壮的公次次弄得我高潮韩国电影 | 久久这里的只有是精品23 | 99热久久这里只有精品 | 亚洲精品www久久久久久久软件 | 午夜福利不卡片在线播放免费 | 青青久久精品 | 亚洲熟女片嫩草影院 | 免费麻豆国产黄网站在线观看 | 调教玩弄奶头乳夹开乳震动器 | 国产精品人妻无码久久久2022 |