中国xxxx,亚洲国产第一区二区香蕉日日,视频免费在线

電子發燒友網報道（文/李彎彎）在深度學習中，經常聽到一個詞“模型訓練”，但是模型是什么？又是怎么訓練的？在人工智能中，面對大量的數據，要在雜亂無章的內容中，準確、容易地識別，輸出需要的圖像/語音，并不容易。因此算法顯得尤為重要。算法也就是模型。

算法的內容，除了核心識別引擎，也包括各種配置參數，如：語音智能識別的比特率、采樣率、音色、音調、音高、音頻、抑揚頓挫、方言、噪音等。成熟的識別引擎，核心內容一般不會經常變化。為實現“識別成功”這一目標，就只能對配置參數做調整。

對不同輸入，我們會配置不同參數值，最后在結果統計取一個各方比較均衡、識別率較高的一組參數值，這組參數值，就是訓練后得到的結果，這就是訓練的過程，也叫模型訓練。

如何訓練一個AI模型？

訓練模型需要用到AI框架，比如MindSp ore。具體如何訓練一個AI模型呢？昇思MindSpore此前發布一個詳細的案例，訓練的模型是用來對手寫數字圖片進行分類的LeNet5模型。MindSpore是華為推出全場景AI計算框架，2020年3月28日宣布MindSpore正式開源。首先是安裝MindSpore，MindSpore提供給用戶使用的是Python 接口。安裝的時候，選擇合適的版本、硬件平臺、操作系統、編程語言、安裝方式。其次是定義模型，安裝好之后，就可以導入MindSpore提供的算子（卷積、全連接、池化等函數）來構建模型了。構建一個AI模型就像建一個房子，MindSpore提供的算子就像是磚塊、窗戶、地板等基本組件。接下來是導入訓練數據集，什么是訓練數據集呢，剛剛定義好的模型是不能對圖片進行正確分類的，要通過訓練過程來調整模型的參數矩陣的值。訓練過程就需要用到訓練樣本，也就是打上了正確標簽的圖片。這就好比教小孩兒認識動物，需要拿幾張圖片給他們看，告訴他們這是什么，教了幾遍之后，小孩兒就能認識了。那么這里訓練LeNet5模型就需要用到MNIST數據集。這個數據集由兩部分組成：訓練集（6萬張圖片）和測試集（1萬張圖片），都是0~9的黑白手寫數字圖片。訓練集是用來訓練AI模型的，測試集是用來測試訓練后的模型分類準確率的。再接下來就是訓練模型，訓練數據集和模型定義完成后，就可以開始訓練模型了。在訓練之前，還需要從MindSpore導入兩個函數：損失函數，就是衡量預測結果和真實標簽之間的差距的函數；優化器，用來求解損失函數關于模型參數的更新梯度的。準備好之后，開始訓練，把前面定義好的模型、損失函數、優化器封裝成一個Model，使用model.train接口就可以訓練LeNet5模型了。最后就是測試訓練后的模型準確率。

訓練AI模型花費大當然，模型訓練需要強大的算力支撐，尤其是參數量大的模型，花費極大。比如OpenAI的語言模型GPT-3，這是一個大型的、數學模擬的神經網絡，從網絡上抓取大量文本進行訓練后，GPT-3可以以驚人的連貫性預測哪些詞應該填在其他詞前后，生成流暢的文本。據估計，訓練GPT-3的成本接近500萬美元。一些小企業想要訓練一個參數較大的算法，往往比較苦難。健康IT公司Optum的一位領導此前表示，他們團隊使用語言模型來分析通話記錄，識別哪些患者風險較高，哪些應該及早推薦轉診。只是訓練一個GPT-3大小千分之一的語言模型，也會很快耗盡團隊的預算。另外一家從事搜索業務的創業公司Glean，一直很想使用最新的AI算法來改進公司的產品。 Glean提供Gmail、Slack和Salesforce等應用程序進行搜索的工具，用于解析語言的新AI技術，可以幫助公司的客戶更快地發掘正確的文件或對話。但是訓練這樣一個尖端的人工智能算法需要花費數百萬美元。Glean只好使用更小、能力更弱的AI模型，然而這些模型無法從文本中提取出盡可能多的含義。

小結過去十幾年，AI取得了一些列舉世矚目的成績，包括在游戲中擊敗人類，讓汽車可以行駛在城市的街道上，AI自己編寫連貫的文字，做出可以媲美畫家的畫作。這都得益于數據量的不斷積累，算法的不斷優化，以及可以支撐算法訓練的算力的不斷強化。然而，在發展的過程中同樣還存在一些問題。比如對于小企業來說，訓練高級AI算法成本高，這就會使得AI的全面應用受到阻礙等問題。當然AI整體呈現出快速發展的趨勢，業界也在不斷探索有利于AI發展的方式，比如大模型的出現，本身也是為了解決通用性的問題，比如說模型簡化，減少模型訓練所需要算力等。

聲明：本文由電子發燒友原創，轉載請注明以上來源。如需入群交流，請添加微信elecfans999，投稿爆料采訪需求，請發郵箱huangjingjing@elecfans.com。 更多熱點文章閱讀

原文標題：AI模型是如何訓練的？訓練一個模型花費多大？

文章出處：【微信公眾號：電子發燒友網】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31490

瀏覽量
269915
人工智能

人工智能

+關注

關注
1794

文章
47642

瀏覽量
239682

原文標題：AI模型是如何訓練的？訓練一個模型花費多大？

文章出處：【微信號：elecfans，微信公眾號：電子發燒友網】歡迎添加關注！文章轉載請注明出處。

GPU是如何訓練AI大模型的

在AI模型的訓練過程中，大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來，AI部落小編帶您了解GPU是如何

發表于 12-19 17:54 ?203次閱讀

什么是大模型、大模型是怎么訓練出來的及大模型作用

，基礎模型。 ? 大模型是一個簡稱，完整的叫法，應該是“人工智能預訓練大模型”。預

發表于 11-25 09:29 ?2328次閱讀

什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么<b class='flag-5'>訓練</b>出來的及大<b class='flag-5'>模型</b>作用

從零開始訓練一個大語言模型需要投資多少錢？

一，前言 ? 在AI領域，訓練一個大型語言模型（LLM）是一

發表于 11-08 14:15 ?292次閱讀

如何訓練自己的LLM模型

訓練自己的大型語言模型（LLM）是一個復雜且資源密集的過程，涉及到大量的數據、計算資源和專業知識。以下是訓練LLM

發表于 11-08 09:30 ?736次閱讀

為什么ai模型訓練要用gpu

GPU憑借其強大的并行處理能力和高效的內存系統，已成為AI模型訓練不可或缺的重要工具。

發表于 10-24 09:39 ?379次閱讀

AI大模型的訓練數據來源分析

AI大模型的訓練數據來源廣泛且多元化，這些數據源對于構建和優化AI模型至關重要。以下是對AI大

發表于 10-23 15:32 ?970次閱讀

如何訓練自己的AI大模型

訓練自己的AI大模型是一個復雜且耗時的過程，涉及多個關鍵步驟。以下是一

發表于 10-23 15:07 ?2532次閱讀

如何訓練ai大模型

訓練AI大模型是一個復雜且耗時的過程，涉及多個關鍵步驟和細致的考量。一、數據準備 1. 數據收

發表于 10-17 18:17 ?1314次閱讀

ai模型訓練需要什么配置

AI模型訓練是一個復雜且資源密集的過程，它依賴于高性能的硬件配置來確保訓練的效率和效果。

發表于 10-17 18:10 ?1706次閱讀

ai大模型訓練方法有哪些？

AI大模型訓練方法是一個復雜且不斷發展的領域。以下是ai大模

發表于 07-16 10:11 ?1703次閱讀

大語言模型的預訓練

隨著人工智能技術的飛速發展，自然語言處理（NLP）作為人工智能領域的一個重要分支，取得了顯著的進步。其中，大語言模型（Large Language Model, LLM）憑借其強大的語言理解和生成

發表于 07-11 10:11 ?513次閱讀

人臉識別模型訓練流程

人臉識別模型訓練流程是計算機視覺領域中的一項重要技術。本文將詳細介紹人臉識別模型的訓練流程，包括數據準備、

發表于 07-04 09:19 ?1080次閱讀

人臉識別模型訓練是什么意思

人臉識別模型訓練是指通過大量的人臉數據，使用機器學習或深度學習算法，訓練出一個能夠識別和分類人臉的模型

發表于 07-04 09:16 ?708次閱讀

深度學習模型訓練過程詳解

深度學習模型訓練是一個復雜且關鍵的過程，它涉及大量的數據、計算資源和精心設計的算法。訓練一

發表于 07-01 16:13 ?1449次閱讀

【大語言模型：原理與工程實踐】大語言模型的預訓練

訓練數據時，數量、質量和多樣性三者缺一不可。數據的多樣性對于大語言模型至關重要，這主要體現在數據的類別和來源兩個方面。豐富的數據類別能夠提供多樣的語言表達特征，如官方知識型數據、口

發表于 05-07 17:10

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

AI模型是如何訓練的？訓練一個模型花費多大？

評論

GPU是如何訓練AI大模型的

什么是大模型、大模型是怎么訓練出來的及大模型作用

從零開始訓練一個大語言模型需要投資多少錢？

如何訓練自己的LLM模型

為什么ai模型訓練要用gpu

AI大模型的訓練數據來源分析

如何訓練自己的AI大模型

如何訓練ai大模型

ai模型訓練需要什么配置

ai大模型訓練方法有哪些？

大語言模型的預訓練

人臉識別模型訓練流程

人臉識別模型訓練是什么意思

深度學習模型訓練過程詳解

【大語言模型：原理與工程實踐】大語言模型的預訓練