色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探究機器學習 (ML) 模型的性能

Tensorflowers ? 來源:TensorFlow ? 作者:Lora Aroyo 和 Pravee ? 2021-04-13 14:37 ? 次閱讀

機器學習 (ML) 模型的性能既取決于學習算法,也取決于用于訓練和評估的數據。算法的作用已經得到充分研究,也是眾多挑戰(如 SQuAD、GLUE、ImageNet 等)的焦點。此外,數據也已經過改進,包括一系列應對 ML 評估問題的研討會。相比之下,專注于 - 用于評估 ML 模型的數據的研究和挑戰并不常見。

此外,許多評估數據集包含容易評估的項目,例如帶有易于識別的主題的照片,因此錯過了真實世界環境的自然歧義。評估中缺少模糊的真實世界樣本,削弱了可靠地測試機器學習性能的能力,這使 ML 模型容易形成“弱點”,即模型難以或無法準確評估的樣本的類別,因為評估集中缺少這一類樣本。

SQuAD

https://rajpurkar.github.io/SQuAD-explorer/

GLUE

https://gluebenchmark.com/leaderboard

ImageNet

https://kobiso.github.io/Computer-Vision-Leaderboard/imagenet

為了解決識別 ML 模型中這些弱點的問題,我們最近在 HCOMP 2020 上發起了眾包機器學習不良測試集 (CATS4ML) 數據挑戰賽(面向全球研究人員和開發者開放至 2021 年 4 月 30 日)。挑戰的目標是提高 ML 評估集的標準,并盡可能多地找到使算法處理起來會有困惑或其他問題的樣本。CATS4ML 依靠人們的能力和直覺來發現機器學習具有信心但實際上卻分類錯誤的新數據樣本。

眾包機器學習不良測試集

https://cats4ml.humancomputation.com/

什么是 ML 的“弱點”?

弱點有兩類:已知的未知(Known Unknowns)未知的未知(Unknown Unknowns)。已知的未知是指模型對正確分類沒有把握的樣本。研究界在被稱為主動學習的領域研究這一問題,并發現了解決方法,用很籠統的話來說就是,在不確定的樣本上向人們交互式地征集新的標簽。例如,如果模型不確定一張照片的主題是否是貓,會要求人員進行驗證;但如果系統確定,則不會要求人員驗證。雖然這方面還有改進的空間,但令人欣慰的是,模型的置信度與其性能相關,也就是說,人們可以看到模型不知道的東西。

主動學習

http://digital.library.wisc.edu/1793/60660

另一方面,未知的未知是指模型對其答案充滿信心,但實際上是錯誤的樣本。主動發現未知的未知的研究(例如,Attenberg 2015 和 Crawford 2019)已經幫助發現了大量的非預期機器行為。與這類發現未知的未知方法相比,生成對抗網絡 (GAN) 以計算機光學錯覺的形式為圖像識別模型生成未知的未知,導致深度學習模型犯下人類無法感知的錯誤。雖然 GAN 在有意操縱的情況下會發現模型漏洞,但真實世界樣本可以更好地突出模型在日常性能中的失敗。這些真實世界樣本是 CATS4ML 感興趣的未知的未知 - 挑戰的目的是收集人類可以可靠地解釋但許多 ML 模型會自信地不同意的未經操作的樣本。

Attenberg 2015

https://dl.acm.org/doi/10.1145/2700832

Crawford 2019

https://excavating.ai

示例說明由對抗噪聲引起的計算機視覺錯覺如何幫助發現 ML 模型的機器操作未知的未知(基于 Brown 2018)

Brown 2018

https://ai.googleblog.com/2018/09/introducing-unrestricted-adversarial.html

CATS4ML 數據挑戰賽第一版:

Open Images 數據集

CATS4ML 數據挑戰賽側重于視覺識別,使用Open Images 數據集的圖像和標簽。挑戰賽的目標圖像選自 Open Images 數據集,以及來自同一數據集的一組 24 個目標標簽。挑戰賽的參與者被邀請發明新的創造性方法探索這個現有的公開可用數據集,并以預先選擇的目標標簽列表為中心,為 ML 模型發現未知的未知樣本。

CATS4ML 數據挑戰賽

https://cats4ml.humancomputation.com/

CATS4ML 是對 FAIR 最近推出的 DynaBench 動態數據收集研究平臺的補充。DynaBench 使用 ML 模型在人類參與下解決靜態基準問題,而 CATS4ML 則專注于通過鼓勵探索現有 ML 基準有無可能屬于未知的未知不利樣本改善 ML 評估數據集。結果將有助于檢測和避免未來的錯誤,也將對模型的可解釋性提供見解。

FAIR

https://ai.facebook.com/tools/dynabench/

DynaBench

https://dynabench.org/

CATS4ML 旨在由此通過提供數據集資源來提高人們對這個問題的認識,開發者可以利用這些資源發現算法弱點。這也將讓研究人員了解如何為機器學習創建更平衡、更多樣化、更具有社會意識的基準數據集。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7134

    瀏覽量

    89391
  • GLUE
    +關注

    關注

    0

    文章

    5

    瀏覽量

    7368
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132928

原文標題:探索機器學習中的未解之謎

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優化手術路徑規劃。工業場景中,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智能通過在線
    發表于 12-24 15:03

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一個核心領域,它使計算機能夠從數據中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為
    的頭像 發表于 12-05 15:21 ?624次閱讀

    ASR和機器學習的關系

    自動語音識別(ASR)技術的發展一直是人工智能領域的一個重要分支,它使得機器能夠理解和處理人類語言。隨著機器學習ML)技術的迅猛發展,ASR系統的
    的頭像 發表于 11-18 15:16 ?382次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?1098次閱讀

    AI大模型與傳統機器學習的區別

    AI大模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參
    的頭像 發表于 10-23 15:01 ?932次閱讀

    為AI、ML和數字孿生模型建立可信數據

    在當今數據驅動的世界中,人工智能(AI)、機器學習ML)和數字孿生技術正在深刻改變行業、流程和企業運營環境。每天產生的超過3.28億TB數據已成為新“石油”——為下一代數字系統提供所需的能源。
    的頭像 發表于 09-30 10:23 ?315次閱讀

    AI引擎機器學習陣列指南

    云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數據科學家以及軟硬件開發者均可充分利用高計算密度的優勢來加速提升任何應用的性能。AI 引擎機器學習擁有先進的張量計算能力,非常適合用于高度優化的 AI 和
    的頭像 發表于 09-18 09:16 ?445次閱讀
    AI引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    如何訓練一個有效的eIQ基本分類模型

    處理單元(NPU),用于機器學習(ML)加速。相比單獨的CPU核,eIQ Neutron NPU能夠提供高達42倍的機器學習推理
    的頭像 發表于 08-01 09:29 ?1958次閱讀
    如何訓練一個有效的eIQ基本分類<b class='flag-5'>模型</b>

    如何理解機器學習中的訓練集、驗證集和測試集

    理解機器學習中的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習
    的頭像 發表于 07-10 15:45 ?4581次閱讀

    Al大模型機器

    和迭代來不斷改進自身性能。它們可以從用戶交互中學習并根據反饋進行調整,以提高對話質量和準確性。可定制性與整合性: AI大模型機器人可以根據特定需求進行定制和整合,以滿足不同場景和應用的
    發表于 07-05 08:52

    人工智能、機器學習和深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning,
    的頭像 發表于 07-03 18:22 ?1389次閱讀

    深入探討機器學習的可視化技術

    機器學習可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學習模型、數據及其關系的過程。
    發表于 04-25 11:17 ?460次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視化技術

    機器學習ML)推理主要計算之存內計算芯片

    機器學習ML)應用已經在汽車、醫療保健、金融和技術等各個領域變得無處不在。這導致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
    發表于 04-07 10:48 ?1309次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>(<b class='flag-5'>ML</b>)推理主要計算之存內計算芯片

    Achronix新推出一款用于AI/ML計算或者大模型的B200芯片

    近日舉辦的GTC大會把人工智能/機器學習(AI/ML)領域中的算力比拼又帶到了一個新的高度,這不只是說明了通用圖形處理器(GPGPU)時代的來臨
    的頭像 發表于 03-28 15:48 ?876次閱讀
    Achronix新推出一款用于AI/<b class='flag-5'>ML</b>計算或者大<b class='flag-5'>模型</b>的B200芯片

    使用ml configurator進行tflite網絡模型的轉換不成功怎么解決?

    使用ml configurator進行tflite網絡模型的轉換不成功,提示錯誤,請幫忙協助謝謝 [ERROR] Failed to run QEMU
    發表于 01-31 06:56
    主站蜘蛛池模板: 亚洲高清毛片一区二区 | 在线观看国产亚洲 | 胖老太与人牲交BBWBBW高潮 | 亚洲精品中文字幕在线 | 97人妻精品全国免费视频 | 高清 仑乱 一级 a | 久久久精品成人免费看 | 在线亚洲精品国产一区麻豆 | 天堂tv免费tv在线tv香蕉 | MMM日本兽交| 国产在线综合色视频 | 60岁老年熟妇在线无码 | 一攻多受h嗯啊巨肉bl巨污 | 牛牛在线(正)精品视频 | 国产99网站 | 色偷偷7777www | 国产 亚洲 中文在线 字幕 | 欧美日韩精品不卡在线观看 | 久久精品无码成人国产毛 | 韩国演艺圈qvod | 视频一区二区中文字幕 | 黑人BBCVIDEOS极品| 欧美18精品久久久无码午夜福利 | 91精品国产品国语在线不卡 | 中文字幕永久在线 | 国产日韩亚洲专区无码 | 最近中文字幕2019免费版 | 一区一区三区产品 | 国产学生无码中文视频一区 | 成人永久免费视频网站在线观看 | 99国产精品久久 | 国产国产乱老熟女视频网站97 | 擦擦擦在线视频观看 | 被黑人做的白浆直流 | 国产线精品视频在线观看 | 小箩莉奶水四溅小说 | 亚洲乱码高清午夜理论电影 | jyzzjyzzz视频国产在线观看 | 久久这里有精品 | 91福利潘春春在线观看 | 少妇两个奶头喷出奶水了怎么办 |