色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習模型部署到ML項目的過程

汽車玩家 ? 來源:AI公園 ? 作者:Rahul Agarwal ? 2020-05-04 11:56 ? 次閱讀

導讀

為什么我們的機器學習項目會失敗?

創造一個大的機器學習系統是一門藝術。

在構建一個大的機器學習系統時,有很多事情需要考慮。但作為數據科學家,我們常常只擔心項目的某些部分。

但是我們是否考慮過一旦我們擁有了模型,我們將如何部署它們?

我見過許多 ML 項目,其中許多項目注定要失敗,因為它們從一開始就沒有一個固定的生產計劃。

這篇文章是關于一個成功的 ML 項目的過程需求 —— 一個進入生產的項目。

1. 在開始的時候建立基線

你并不需要用模型來獲得基線結果。

假設我們將使用 RMSE 作為我們的時間序列模型的評估指標。我們在測試集上對模型進行了評估,RMSE 為 3.64。

3.64 是個好 RMSE 嗎?我們怎么知道?我們需要一個基線 RMSE。

這可能來自當前使用的用于相同任務的模型。或者使用一些非常簡單的啟發式。對于時間序列模型,需要打敗的基線是最后一天的預測。即,預測前一天的數字。

如果是圖像分類任務,取 1000 個有標簽的樣本。而人類的準確性可以作為你的基線。如果一個人不能在任務中獲得 70%的預測精度,那么如果你的模型達到類似的水平,你總是可以考慮將流程自動化。

學習:在你創建模型之前,試著了解你將要得到的結果。設定一些不切實際的期望只會讓你和你的客戶失望。

2. 持續集成是前進的方向

你現在已經創建了你的模型。它在本地測試數據集上的性能比基線/當前模型要好。我們應該繼續前進嗎?

我們有兩個選擇:

進一步改進我們的模型,這是一個無止境的循環。

在生產環境中測試我們的模型,得到更多關于可能出錯的信息,然后使用持續集成來改進我們的模型。

我支持第二種方法。Andrew Ng 在 Coursera 上的第三門課,“Deep Learning Specialization”中的“Structuring Machine learning”中說:

“不要一開始就試圖設計和構建完美的系統。相反,應該快速地建立和訓練一個基本的系統 —— 也許只需要幾天的時間。即使基本的系統遠遠不是你能建立的“最好”的系統,檢查基本的系統是有價值的:你會很快找到一些線索,告訴你在哪些方面最值得投入你的時間。

完成比完美更好。

學習:如果你的新模型比當前生產中的模型更好,或者你的新模型比基線更好,那么等待投入生產是沒有意義的。

3. 你的模型可能會進入生產

你的模型是否優于基線?它在本地測試數據集上表現得更好,但是它真的能在整體上工作得很好嗎?

為了測試你的模型優于現有模型的假設的有效性,你可以設置一個A/B 測試。一些用戶(測試組)看到來自你的模型的預測,而一些用戶(控制組)看到來自前一個模型的預測。

事實上,這是部署模型的正確方式。你可能會發現你的模型并沒有看起來那么好。

錯了并不是真的錯,錯的是沒有預料到我們可能會錯。

很難指出你的模型在生產環境中表現不佳的真正原因,但一些原因可能是:

你可能會看到實時的數據與訓練數據有很大的不同。

或者你沒有正確地完成預處理 pipeline。

或者你沒有正確地衡量 performance。

或者你的實現中有一個 bug。

學習:不要全面投入生產。A/B 測試永遠是前進的好方法。準備一些可以依靠的東西(可能是一個更老的模型)。總有一些東西會出問題,這是你無法預料的。

4. 你的模型可能不會投入生產中

我創建了這個令人印象深刻的 ML 模型,它提供了 90%的準確性,但它需要大約 10 秒鐘來獲取預測。

**這樣可接受嗎?**對于某些用例可能是,但實際上不是。

在過去,有許多 Kaggle 競賽的獲勝者最終創造了非常大的模型集成,占據了排行榜的榜首。下面是一個例子模型,它曾在 Kaggle 上贏得 Otto 分類挑戰:

在Level1上用了33個模型和8種特征工程

另一個例子是 Netflix 百萬美元推薦引擎挑戰。由于涉及的工程成本,Netflix 團隊最終沒有使用獲獎解決方案。

那么,如何讓你的模型在機器上既準確又簡單呢?

機器學習模型部署到ML項目的過程

Teacher — Student模型

這就引出了 Teacher-Student 模型或“知識蒸餾”的概念。在知識蒸餾中,我們在一個更大的已經訓練好的教師模型上訓練一個更小的學生模型。

這里我們使用來自教師模型的軟標簽/概率,并將其作為學生模型的訓練數據。

關鍵是,老師輸出類別概率 —— “軟標簽”而不是“硬標簽”。例如,一個水果分類器可能會說“Apple 0.9, Pear 0.1”而不是“Apple 1.0, Pear 0.0”。為什么要這樣呢?因為這些“軟標簽”比原來的標簽信息更豐富——告訴學生,是的,這個蘋果確實有點像梨。學生模型通常可以非常接近教師水平的表現,即使參數少了 1-2 個數量級!

學習:有時,我們的預測時間很有限,所以我們想要一個更輕的模型。我們可以嘗試構建更簡單的模型,或者嘗試對這樣的用例使用知識蒸餾。

5. 周期性的維護和反饋

世界不是恒定的,你的模型權重也不是恒定的

我們周圍的世界正在迅速變化,兩個月前可能適用的東西現在可能已經不適用了。在某種程度上,我們建立的模型是對世界的反映,如果世界在變化,我們的模型應該能夠反映這種變化。

機器學習模型部署到ML項目的過程

模型性能通常隨時間而下降。

由于這個原因,我們必須在一開始就考慮將我們的模型升級作為維護的一部分

維護周期的頻率完全取決于你試圖解決的業務問題。在一個廣告預測系統中,用戶往往變化無常,購買模式不斷出現,需要相當高的頻率。而在評論情緒分析系統中,由于語言本身的結構變化不是很大,所以頻率不需要那么高。

機器學習模型部署到ML項目的過程

我還必須要承認反饋回路在機器學習系統中的重要性。假設你用貓狗分類器預測了一個的圖像是狗,但是概率很低。我們能從這些低置信度的例子中學到什么嗎?你可以將其發送到手動檢查,以檢查它是否可以用于重新訓練模型。通過這種方式,我們可以在它不確定的樣本上訓練分類器。

學習:在考慮生產時,提出使用反饋來維護和改進模型的計劃。

總結

在考慮將模型投入生產之前,我發現這些事情是很重要的。

雖然這并不是你需要考慮的事情和可能出錯的事情的詳盡列表,但它無疑可以作為你下次創建機器學習系統時的思想食糧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132928
收藏 人收藏

    評論

    相關推薦

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    將自然語言理解與運動規劃融為一體。這種端端的方法使機器人能夠直接從人類指令生成動作序列,大幅簡化了控制流程。該項目的工作流程包含設計并封裝一個人機器人函數庫、編寫清晰地描述提示詞、在
    發表于 12-24 15:03

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    可能在訓練數據上表現良好,但在遇到未曾見過的數據(例如不同環境、光照條件、角度等)時性能可能會下降。 對異常值敏感:如果訓練集中包含異常值或者噪聲數據,這可能導致模型學習不正確的模式,從而影響其
    發表于 12-19 14:33

    構建云原生機器學習平臺流程

    構建云原生機器學習平臺是一個復雜而系統的過程,涉及數據收集、處理、特征提取、模型訓練、評估、部署和監控等多個環節。
    的頭像 發表于 12-14 10:34 ?167次閱讀

    AI模型部署邊緣設備的奇妙之旅:如何實現手寫數字識別

    新的數據樣本,另一個是判別器用來判斷這些樣本的真實性。兩者相互競爭,共同進化,最終實現高質量的數據合成。 2.4 模型優化技術 在將深度學習模型部署
    發表于 12-06 17:20

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?1098次閱讀

    AI大模型與傳統機器學習的區別

    多個神經網絡層組成,每個層都包含大量的神經元和權重參數。 傳統機器學習模型規模相對較小,參數數量通常只有幾千幾百萬個,模型結構相對簡單
    的頭像 發表于 10-23 15:01 ?932次閱讀

    構建語音控制機器人 - 線性模型機器學習

    2024-07-31 |Annabel Ng 在該項目的[上一篇博客文章]中,我介紹了運行機器人電機、處理音頻信號和調節電壓所需的電路的基礎知識。然而,機器人還沒有完全完成!盡管機器
    的頭像 發表于 10-02 16:31 ?252次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    深度學習模型量化方法

    深度學習模型量化是一種重要的模型輕量化技術,旨在通過減少網絡參數的比特寬度來減小模型大小和加速推理過程,同時盡量保持
    的頭像 發表于 07-15 11:01 ?537次閱讀
    深度<b class='flag-5'>學習</b><b class='flag-5'>模型</b>量化方法

    PyTorch神經網絡模型構建過程

    PyTorch,作為一個廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發者構建、訓練和部署神經網絡模型。在神經網絡模型中,輸出層是尤為關鍵的部分,它負責將
    的頭像 發表于 07-10 14:57 ?539次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度學習模型,本質上是通過優化算法調整
    的頭像 發表于 07-01 16:13 ?1446次閱讀

    鴻蒙實戰開發-本地部署、SmartPerf 編譯部署指導文檔

    install 在項目目錄下運行命令: npm run build 編譯成功后會有main 可執行文件生成。 項目部署 直接運行 ./main 可執行程序,完成項目的部署
    發表于 05-09 14:23

    深入探討機器學習的可視化技術

    機器學習可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學習模型、數據及其關系的
    發表于 04-25 11:17 ?460次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視化技術

    基于 Renesas 的 RA8M1 實現 AI 和 ML 部署

    作者:Kenton Williston 人工智能 (AI)、機器學習 (ML) 和其他計算密集型工作負載在物聯網?(IoT) 網絡邊緣的興起,給微控制器 (MCU) 帶來了額外的處理負載。處理這些
    的頭像 發表于 04-23 15:04 ?1281次閱讀
    基于 Renesas 的 RA8M1 實現 AI 和 <b class='flag-5'>ML</b> <b class='flag-5'>部署</b>

    機器學習ML)推理主要計算之存內計算芯片

    機器學習ML)應用已經在汽車、醫療保健、金融和技術等各個領域變得無處不在。這導致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
    發表于 04-07 10:48 ?1309次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>(<b class='flag-5'>ML</b>)推理主要計算之存內計算芯片

    使用CUBEAI部署tflite模型STM32F0中,模型創建失敗怎么解決?

    看到CUBE_AI已經支持STM32F0系列芯片,就想拿來入門嵌入式AI。 生成的模型很小,是可以部署F0上的,但是一直無法創建成功。 查閱CUBE AI文檔說在調用create
    發表于 03-15 08:10
    主站蜘蛛池模板: 国产亚洲精品久久孕妇呦呦你懂 | 色综合久久中文色婷婷 | 欧美雌雄双性人交xxxx | 被窝国产理论一二三影院 | 超碰在线97av视频免费 | 亚洲一区自拍高清亚洲精品 | 国产成人精品男人的天堂网站 | 亚洲欧美自拍清纯中文字幕 | 欧美精品一区二区三区视频 | 激情内射亚洲一区二区三区 | 中文人妻熟妇精品乱又伧 | 97视频久久 | 看看妇女的B免费看 | 中国拍三a级的明星女 | qvod 韩国| 极品少妇伦理一区二区 | 中文字幕不卡一区二区三区 | 亚洲精品国产拍在线观看 | 同房交换4p好爽 | 老子午夜伦不卡电影院 | beeg日本老妇人 | G国产精品无马 | 少妇系列之白嫩人妻 | 国产在线aaa片一区二区99 | 乱码午夜-极品国产内射 | jizzjizz中国大学生 | 亚洲 欧美无码原创区 | 亚洲欧美强伦一区二区另类 | 噜噜噜在线AV免费观看看 | 在线亚洲色拍偷拍在线视频 | 日本久久精品视频 | 國產日韓亞洲精品AV | 国产人妻精品午夜福利免费不卡 | 国色天香视频在线社区 | 亚洲狠狠97婷婷综合久久久久 | 亚洲伊人色 | 富婆大保健嗷嗷叫普通话对白 | 99精品AV无码一区二区 | 精品国产乱码久久久久久口爆 | 蝴蝶中文娱乐 | 99久久精品费精品国产一区二 |