色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI助力初創(chuàng)企業(yè):運用機器學習解決問題

星星科技指導員 ? 來源:mouser ? 作者:mouser ? 2023-05-16 10:46 ? 次閱讀

簡介

初創(chuàng)企業(yè)將一些最具創(chuàng)新性的產品和服務推向市場,但通常要少量工具、手動操作以及不斷拓展專業(yè)知識的人員。人工智能 (AI),尤其是機器學習 (ML) 和深度學習 (DL),正在通過自動化流程和減少工作量,助力初創(chuàng)企業(yè)解決這些難題及其他問題。在這類初創(chuàng)企業(yè)當中,AI不是產品的一部分,它的實施最終是為了幫助初創(chuàng)企業(yè)解決業(yè)務問題、改進流程和提升企業(yè)的潛在價值。

有時,自動化可以建立在以人為主導的流程的專業(yè)知識之上手動執(zhí)行。但是,當可用數(shù)據(jù)的數(shù)量、復雜性或可變性使得這種方法捉襟見肘時,機器學習可以帶來真正的實惠。本文旨在深度剖析如何確定AI輸入和輸出、使用數(shù)據(jù)集、探索數(shù)據(jù)可能性以及最終確定AI模型(圖1)。

pYYBAGRi7h2AQaWLAAEcMo-EiUU214.png

圖1:這些步驟強調運用機器學習解決初創(chuàng)企業(yè)常見問題的過程。(圖源:作者)

第1步:識別輸入、輸出和指標

該過程的第一步是確定算法的輸入和輸出,以及選擇正確的指標衡量其性能。這些決策應該受到業(yè)務目標和技術限制的影響。例如,數(shù)據(jù)的可用性和數(shù)量以及隱私要求會影響數(shù)據(jù)輸入,文件格式的一致性和存儲數(shù)據(jù)的需求也會帶來影響。

在大多數(shù)情況下,數(shù)據(jù)輸入淺顯易懂,例如文本、圖像或數(shù)字值,在使用前只需進行少量的預處理。然而,可能需要對結果數(shù)據(jù)進行預處理,以產生單個值來標記每個輸入數(shù)據(jù)點。例如,一家企業(yè)可能希望對通過電子郵件收到的客戶服務投訴進行分類,或者可能希望根據(jù)買家購物車中的商品推薦其他商品。無論哪種情況,結果數(shù)據(jù)都需要進行調整,以標記這些電子郵件投訴的緊急程度,或者識別與產品圖像匹配的產品代碼。

可以基于數(shù)據(jù)特定結果達到一定準確性的重要性,來選擇衡量模型成功與否的正確指標(圖2)。盡管追求高精度似乎合乎邏輯,卻并非金標準。例如,在欺詐檢測中,識別潛在的欺詐比正確預測出每個事件更為重要。根據(jù)經驗,如果選擇的指標有利于提升一類鮮少發(fā)生事件的準確性,許多非事件也可能會標記出來。在這種情況下,為避免損害檢測欺詐性交易的能力,人機協(xié)同 (HitL) 最終敲定結果可能會有所幫助。

在選擇指標時,值得調查其他人做了什么和推薦什么,以及開始數(shù)據(jù)聚合和清洗過程。在某些情況下,數(shù)據(jù)尚未處于您需要的狀態(tài),或者可以調整數(shù)據(jù)收集,使之更加“適合AI”。

第二步:數(shù)據(jù)準備工作

通常,AI模型期望數(shù)據(jù)始終處于特定格式。這一步需要清洗和轉換數(shù)據(jù),以滿足AI模型和目標所需的標準,整個過程無比費時,且異常復雜。通常會請一名數(shù)據(jù)工程師,處理基礎架構、存儲空間和用于數(shù)據(jù)提取的管道。

首先,每個輸入都需要一個您想要預測的對應標簽或目標。例如,如果有100張狗的圖像,則需要將每張圖像標識為一條狗。這可以通過簡單的方法來實現(xiàn),例如,使用CSV文件或將它們存儲在稱為“狗”的單獨文件夾中。幾乎所有的分類算法都認為預測目標也是數(shù)值,二進制或離散類別。“是或否”是二進制類別的示例,而對象預測中的許多類(例如,狗、貓或鳥)則是離散類別的示例。預測值而不是類別(稱為回歸),必須將目標標準化為0或1。復雜的AI方法也需要同樣復雜的類別,但是無論如何,所有內容都必須保持一致,且研究相應的數(shù)據(jù)結構非常重要。

此外,數(shù)據(jù)點也需要進行標準化。對于圖像,這意味著它們至少大小相同,且不會大到無法用AI模型處理。對于文本,這可能意味著縮短或填充短語,使它們具有相同的長度,也可能意味著短語標記化,即,用數(shù)字替換每個單詞。在此階段,考慮分類和數(shù)據(jù)的各種選項以確保在最初選擇的輸入和輸出未能產生有意義的結果或證明噪聲太大的情況下,可以其他方式使用數(shù)據(jù)。

最后,應該清洗數(shù)據(jù)集,以確保數(shù)據(jù)正確、一致和可用。這可能包括識別和糾正數(shù)據(jù)集的損壞、不完整、重復或不相關的部分。數(shù)據(jù)清洗通常比開發(fā)新算法要花費更多的時間,因此,請記住80-20規(guī)則:80%的數(shù)據(jù)需要20%的工作量。在項目的初始階段,應當使數(shù)據(jù)易于處理,而不必擔心需要強大的系統(tǒng)清洗每一條數(shù)據(jù)。

第3步:瀏覽數(shù)據(jù)并確認選擇

探索性數(shù)據(jù)分析 (EDA) 旨在識別底層模式,發(fā)現(xiàn)異常并檢查數(shù)據(jù)集中的假設。EDA可以作為數(shù)據(jù)準備工作的一部分完成;但是,其通常伴隨著數(shù)據(jù)清洗。EDA中最重要的任務包括分析

數(shù)據(jù)缺失,這可能影響模型的性能。根據(jù)必填字段中缺失的百分比,可能丟棄這些數(shù)據(jù)點,執(zhí)行值的插值,或者在沒有足夠有用的信息時放棄使用該信息。

異常數(shù)據(jù):區(qū)分異常數(shù)據(jù)是噪聲還是您想要捕捉的實際事件至關重要。例如,將過高或過低的錯誤值與數(shù)據(jù)看起來也頗為相似的罕見值(如欺詐或機器故障)進行比較。

數(shù)據(jù)標簽噪聲:標簽噪聲來自錯誤標記的數(shù)據(jù)點,會妨礙AI學習數(shù)據(jù)和目標之間適當相關性的能力。

根據(jù)數(shù)據(jù)量的不同,或能糾正這些錯誤,但有時可能需要選擇不同的選項作為預測目標。

第4步:研究算法并準備資源

接下來,需要研究AI本身。始終對可能適合該任務的可用算法進行初步調查(圖3)。借助大量資源,包括預先訓練好的模型和詳細說明特定任務算法的研究文章,可以充分利用現(xiàn)有的資源,而不必重復別人的勞動、做無用功。

poYBAGRi7iGAc2HJAAG52T__hxY874.png

圖3: 不同機器學習目標的算法/方法類型的可視化指南。(圖源:Toward Data Science)

此外,根據(jù)每一類可用的數(shù)據(jù)量,決定需要機器學習 (ML) 算法還是深度學習 (DL) 算法。通常,深度學習效果最好是每個類標簽有5,000多個示例。如果每個類的例子較少,該模型可能只會學習您的訓練數(shù)據(jù),而無法根據(jù)新的真實世界信息正確預測結果。在DL出現(xiàn)之前,ML已使用了很長時間,且在較小的數(shù)據(jù)集上產生了非常好的結果;但是,數(shù)據(jù)點需要更多的人工工作,這個過程通常稱為特征工程。

根據(jù)數(shù)據(jù)集和每個數(shù)據(jù)點的大小(請記住,即使是300 × 300像素的圖像也需要花費很長時間進行訓練!),您應該投資提升一些算力:通過現(xiàn)有平臺或添置內部圖形處理器 (GPU)。通常,對于初次接觸的項目,建議使用前者,因為如果項目行不通,您還可以終止訪問。鑒于Amazon Web Services (AWS)、Google Cloud Platform (GCP) 和Microsoft Azure等平臺上可用的AI服務的成熟性和完整性,在沒有專門的“AI人員”甚至沒有任何編碼的情況下,也可以渡過這一階段。它們對特定任務所產生的效果,將影響您決定是否為項目聘請外援。

第5步:基準測試、迭代和最終確定模型

無論采用何種機器學習類型(輸入型還是學習型),Model Zoo、Tensorflow Hub,Google Cloud Platform或AWS等網站都可能有經過預先訓練的解決方案,并已經學會了根據(jù)數(shù)據(jù)進行一些預測。重要的是,還可以通過微調執(zhí)行類似的任務(稱為轉移學習)重用這些模型,例如,使用經過訓練的模型預測圖像中的對象,以便在給定較少數(shù)據(jù)的情況下只預測家具的類型,即使它在第一輪訓練中沒有看到這些物品。轉移學習是一種非常常見的方法,可以在利用他人工作的同時獲得巨大的效益,而不需要如此豐富的數(shù)據(jù)。通常,使用這些解決方案需要掌握Python的基本編程技能,但也需要其他技能。

您還可以在數(shù)據(jù)特征的子集上使用更簡單的機器學習算法,作為確定數(shù)據(jù)中信號的粗略方法。一旦確定了開箱即用方法的工作效果,就可以開始迭代過程。具體是要改進嘗試的模型還是嘗試定制模型,取決于初創(chuàng)企業(yè)要求的閾值,以確保此任務的準確性。

第六步:準備交工!

典型的AI項目流程到此結束。簡而言之,就是您需要選擇輸入、輸出和性能指標,然后按順序獲取數(shù)據(jù)并完成探索性數(shù)據(jù)分析,繼而確認您在第一步中的選擇。 之后,開始模型開發(fā)和迭代階段。 一旦對模型性能感到滿意,且其得到了所需的結果,初創(chuàng)企業(yè)就可以開始付諸生產,享受這種新發(fā)現(xiàn)的自動化功能所帶來的利好。

生產本身就是一個過程,也需要多個步驟和流程。您需要確定如何彌合模型性能和所需精度之間的差異,如數(shù)據(jù)部分所述。其他考慮因素包括加強數(shù)據(jù)清洗軟件,決定數(shù)據(jù)集和模型的版本控制過程或工具。敬請關注第2部分,深度探秘在生產中交付AI所需的一切!

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47442

    瀏覽量

    238990
  • 機器學習
    +關注

    關注

    66

    文章

    8425

    瀏覽量

    132773
  • 深度學習
    +關注

    關注

    73

    文章

    5507

    瀏覽量

    121298
收藏 人收藏

    評論

    相關推薦

    1億美元!高通宣布設立人工智能投資基金投資AI初創(chuàng)企業(yè)

    以及跨越不同垂直行業(yè)的AI機器學習平臺的初創(chuàng)企業(yè),重點關注自動駕駛汽車、機器人、計算機視覺以及
    發(fā)表于 11-30 09:07 ?2029次閱讀

    RISC-V如何支持不同的AI機器學習框架和庫?

    RISC-V如何支持不同的AI機器學習框架和庫?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    AI芯片公司該如何在激烈的競爭中生存?

    機器學習芯片市場規(guī)模約24億美元,預計到2025年這一市場規(guī)模將達到約378億美元,復合年增長率(CAGR)為40.8%。高速增長且短期內規(guī)模將達百億美元的AI芯片市場不僅驅動著傳統(tǒng)芯片公司戰(zhàn)略和技術
    發(fā)表于 09-16 10:36

    關在釘釘和企業(yè)微信上使用AI視頻面試——AI得賢招聘官操作說明

    基于RPA和多模態(tài)人工智能算法設計的全自動AI視頻面試系統(tǒng):AI得賢招聘官已于2月17日正式登陸釘釘和企業(yè)微信平臺。 AI得賢招聘官的釘釘和企業(yè)
    發(fā)表于 03-07 19:30

    AI概論: <TensorFlow + Excel>可操作教案(Part-C:AI(機器)是如何學習呢?)

    任務十四:從您孰悉的出發(fā)任務十五:認識AI術語-- 權重(Weight)任務十六:簡單的權重運算-- 兩兩相乘&求和任務十七:訓練(機器學習)-- AI開始任務十八:創(chuàng)作您的
    發(fā)表于 12-02 14:12

    華秋第八屆硬創(chuàng)大賽攜手NVIDIA初創(chuàng)加速計劃,賦能企業(yè)發(fā)展

    a.AI技術問題解決快速通道,b. 免費線上+線下AI技術產品培訓;3. 市場宣傳 a. NVIDIA開發(fā)者大會(GTC)免費展位,演講,參觀,海報等機會;b.免費參加NVIDIA初創(chuàng)企業(yè)
    發(fā)表于 07-11 11:28

    亞馬遜AWS云上AI創(chuàng)新獲獎:AI機器學習助力企業(yè)開展創(chuàng)新

    如果在業(yè)界談起AI人工智能和機器學習技術的發(fā)展歷程,有一家云計算服務商的名字是絕對繞不開的,那就是亞馬遜AWS。
    發(fā)表于 10-01 11:04 ?2359次閱讀

    AWS 加入NVIDIA初創(chuàng)加速計劃,助力初創(chuàng)企業(yè)創(chuàng)新發(fā)展

    NVIDIA正在攜手AWS,為行業(yè)中最熱門、最具創(chuàng)新意識的AI初創(chuàng)企業(yè)提供技術、培訓和支持,助力他們進行創(chuàng)新和發(fā)展。
    的頭像 發(fā)表于 04-03 09:05 ?2530次閱讀

    小i機器人怎樣助力企業(yè)發(fā)展

    小i的AI能力可以以免費的形式助力國內智能機器企業(yè)發(fā)展,對國內機器企業(yè)而言,是非常具有吸引力
    發(fā)表于 06-28 10:29 ?548次閱讀

    AI機器學習如何來遏制流行病

    組織已迅速運用AI機器學習知識來遏制這種流行病。
    發(fā)表于 05-31 10:24 ?589次閱讀

    AI+機器學習:推動AI應用產業(yè)化,加快機器學習步伐

    毫不客氣地說,人工智能(AI)和機器學習(ML)已然“滲透”到了各行各業(yè),企業(yè)們期待通過機器學習
    的頭像 發(fā)表于 07-03 11:45 ?2850次閱讀

    NVIDIA聯(lián)合GE醫(yī)療及Nuance成立初創(chuàng)加速企業(yè)聯(lián)盟,共同幫助醫(yī)學影像AI初創(chuàng)企業(yè)加速發(fā)展

    NVIDIA 初創(chuàng)加速計劃是NVIDIA為90個國家/地區(qū)的6,500多家AI和數(shù)據(jù)科學初創(chuàng)企業(yè)所提供的一項加速器計劃。
    發(fā)表于 12-03 09:08 ?953次閱讀

    英偉達初創(chuàng)加速計劃全球成員破8,000,助力塑造全球AI初創(chuàng)企業(yè)生態(tài)格局

    英偉達初創(chuàng)加速計劃數(shù)據(jù)顯示,美國在AI初創(chuàng)企業(yè)的數(shù)量(占近27%)和獲得的資金數(shù)額(累計資金超過270億美元)方面均處于世界領先地位。
    發(fā)表于 08-03 17:47 ?1342次閱讀
    英偉達<b class='flag-5'>初創(chuàng)</b>加速計劃全球成員破8,000,<b class='flag-5'>助力</b>塑造全球<b class='flag-5'>AI</b><b class='flag-5'>初創(chuàng)</b><b class='flag-5'>企業(yè)</b>生態(tài)格局

    初創(chuàng)企業(yè)如何使用NVIDIA AI提升教育質量

    SimInsights 和 Photomath 展示了初創(chuàng)企業(yè)如何使用 NVIDIA AI 提升教育質量。
    的頭像 發(fā)表于 10-17 12:06 ?773次閱讀

    NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

    NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具,以此來優(yōu)化和提升心理健康服務水平,為人們的心理健康保駕護航。
    的頭像 發(fā)表于 11-19 16:03 ?229次閱讀
    主站蜘蛛池模板: 成 人 免费 黄 色 网站无毒下载| 无套内射无矿码免费看黄| 最近日本免费观看MV免费| 欧美熟妇互舔20p| 国语自产偷成人精品视频| 99热这里只有精品88| 亚洲国产精品VA在线看黑人| 男生插曲女生身全过程| 黑人性xxx| 福利啪啪吧| 99免费视频观看| 亚洲一区国产| 桃花在线观看播放| 欧美夜夜噜2017最新| 久啪久久全部视频在线| 国厂精品114福利电影| 耽美肉文 高h失禁| 99视频免费播放| 一个人看的www视频动漫版| 99热在线精品免费全部my| 亚洲 自拍 欧洲 视频二区| 欧美性受xxxx狂喷水| 久青草国产97香蕉在线视频| 国产一区二区高清| 国产WW久久久久久久久久| 99免费精品| 2019午夜福利757视频第12集| 免费成人小视频| 精品亚洲麻豆1区2区3区| 国产人妖一区二区| 国产福利视频一区二区| 成人在线免费看片| fryee性欧美18 19| 98久久无码一区人妻A片蜜| 真人女人无遮挡内谢免费视频%| 亚洲精品中文字幕在线| 亚洲AV国产精品无码精| 亚洲AV无码乱码国产麻豆P| 学生精品国产在线视频| 乌克兰黄色录像| 无码国产精品高潮久久9|