人工智能行業(yè)所圍繞的是一個(gè)受技術(shù)進(jìn)步、社會(huì)需求和監(jiān)管政策影響的動(dòng)態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)方面的技術(shù)進(jìn)步,加速了人工智能的發(fā)展和應(yīng)用。包括醫(yī)療保健、金融和制造業(yè)在內(nèi)的各個(gè)行業(yè)對(duì)自動(dòng)化、個(gè)性化和效率的社會(huì)需求,又進(jìn)一步推動(dòng)了人工智能技術(shù)的集成。此外,不斷發(fā)展的監(jiān)管體系,則強(qiáng)調(diào)了合乎倫理道德的人工智能、數(shù)據(jù)隱私和算法透明度的重要性,進(jìn)而指導(dǎo)人工智能系統(tǒng)的負(fù)責(zé)任開(kāi)發(fā)和應(yīng)用。人工智能行業(yè)將訓(xùn)練和推理過(guò)程結(jié)合起來(lái),有效地創(chuàng)建和部署人工智能解決方案。推理和訓(xùn)練都是人工智能整個(gè)生命周期的組成部分,其意義取決于具體的環(huán)境和應(yīng)用。對(duì)于通過(guò)學(xué)習(xí)模式和從數(shù)據(jù)中提取見(jiàn)解來(lái)開(kāi)發(fā)和優(yōu)化模型而言,雖然訓(xùn)練極為重要,但推理在利用這些訓(xùn)練模型進(jìn)行實(shí)時(shí)預(yù)測(cè)和決策方面,卻發(fā)揮著極為重要的作用。人工智能推理(占當(dāng)今人工智能任務(wù)的80%以上)的重要性越來(lái)越大,在于它在推動(dòng)數(shù)據(jù)驅(qū)動(dòng)的決策、個(gè)性化用戶體驗(yàn)和不同行業(yè)的運(yùn)營(yíng)效率方面發(fā)揮著關(guān)鍵作用。
高效的人工智能推理實(shí)現(xiàn),則面臨著數(shù)據(jù)可用性、計(jì)算資源、算法復(fù)雜性、可解釋性和法規(guī)符合性方面的挑戰(zhàn)。而在控制成本的同時(shí),適應(yīng)動(dòng)態(tài)環(huán)境和管理可擴(kuò)展性,還又帶來(lái)額外的挑戰(zhàn)。克服這些挑戰(zhàn)需要全面的戰(zhàn)略,包括穩(wěn)健的數(shù)據(jù)管理實(shí)踐、硬件功能的進(jìn)步和算法的改進(jìn)。開(kāi)發(fā)可解釋的人工智能模型,并遵守道德和監(jiān)管準(zhǔn)則,對(duì)于建立用戶信任和確保合規(guī)性至關(guān)重要。此外,通過(guò)高效的運(yùn)營(yíng)實(shí)踐與技術(shù)創(chuàng)新來(lái)平衡資源分配與成本管理,對(duì)于在不同行業(yè)部門實(shí)現(xiàn)可持續(xù)有效的人工智能推理解決方案也極為重要。
人工智能推理的關(guān)鍵作用
通過(guò)自動(dòng)化任務(wù)、增強(qiáng)預(yù)測(cè)性維護(hù)和啟用高級(jí)分析,人工智能推理優(yōu)化了流程,減少了錯(cuò)誤,改善了資源分配。對(duì)于自然語(yǔ)言處理,人工智能推理提供了動(dòng)力,改善了人與機(jī)器之間的溝通與理解。而在制造業(yè)領(lǐng)域,其影響包括預(yù)測(cè)性維護(hù)、質(zhì)量控制和供應(yīng)鏈管理、提高效率、減少浪費(fèi)和提高產(chǎn)品質(zhì)量,對(duì)行業(yè)運(yùn)營(yíng)具有變革性影響。
可持續(xù)人工智能推理的行業(yè)挑戰(zhàn)
人工智能推理面臨著高能耗、密集的計(jì)算需求和實(shí)時(shí)處理限制等挑戰(zhàn),導(dǎo)致運(yùn)營(yíng)成本增加,還加劇了對(duì)環(huán)境的影響。人工智能總功耗的60%以上來(lái)自推理,隨著推理需求的增加,導(dǎo)致數(shù)據(jù)中心容量在兩年內(nèi)增加了2.5倍(GAFA數(shù)據(jù))。對(duì)于服務(wù)器來(lái)說(shuō),密集計(jì)算過(guò)程中產(chǎn)生熱量,還需要復(fù)雜的冷卻系統(tǒng),這又進(jìn)一步增加了人工智能過(guò)程的總體能耗。此外,在服務(wù)器、高級(jí)駕駛員輔助系統(tǒng)(ADAS)或制造應(yīng)用中,必須在滿足高效實(shí)時(shí)處理需求與低延遲要求之間取得平衡,這也是一個(gè)重大挑戰(zhàn),需要先進(jìn)的硬件設(shè)計(jì)和優(yōu)化的計(jì)算策略。在不影響準(zhǔn)確性的情況下,優(yōu)先考慮可再生能源和環(huán)保舉措的節(jié)能解決方案,對(duì)于減輕環(huán)境影響而言,是非常重要的。
由于人工智能算法的復(fù)雜性和特殊性,利用CPU或GPU的經(jīng)典人工智能推理硬件設(shè)計(jì),在實(shí)現(xiàn)能效方面面臨限制,導(dǎo)致高功耗(服務(wù)器每個(gè)多核單元功耗高達(dá)數(shù)百瓦)。處理單元與存儲(chǔ)器之間低效的數(shù)據(jù)移動(dòng),進(jìn)一步影響了能源效率和吞吐量。例如,相對(duì)于訪問(wèn)本地寄存器,訪問(wèn)外部DRAM會(huì)消耗200倍的能量。最終,由于更高的計(jì)算需求,到2025年,利用CPU和GPU的下一代服務(wù)器,可能會(huì)消耗高達(dá)上千瓦的功率。而在資源受限、電池供電的設(shè)備上部署人工智能推理更具挑戰(zhàn)性,因?yàn)樽罡咝У幕贑PU和GPU的低功耗設(shè)計(jì)(10毫瓦到幾瓦)受到吞吐量的極大限制,從而限制了人工智能的復(fù)雜性和最終的用戶體驗(yàn)。平衡能源效率與性能/精度要求,在設(shè)計(jì)過(guò)程中需要仔細(xì)權(quán)衡,并采用全面的優(yōu)化策略。對(duì)復(fù)雜人工智能工作負(fù)載的硬件支持不足,可能會(huì)阻礙其能效和性能。
尋找節(jié)能解決方案
行業(yè)對(duì)節(jié)能人工智能推理解決方案的需求不斷增長(zhǎng),這是由可持續(xù)發(fā)展目標(biāo)、成本降低目標(biāo)和新用途共同驅(qū)動(dòng)的。企業(yè)尋求可擴(kuò)展和高性能解決方案,來(lái)管理復(fù)雜的人工智能工作負(fù)載,而不會(huì)產(chǎn)生過(guò)高的能源成本。另一方面,節(jié)能的人工智能推理,使得移動(dòng)設(shè)備或資源受限的設(shè)備能夠在不快速消耗電量的情況下執(zhí)行復(fù)雜任務(wù),同時(shí)減少對(duì)云處理的依賴,最大限度地減少數(shù)據(jù)傳輸和延遲問(wèn)題。通過(guò)高級(jí)新功能,如實(shí)時(shí)語(yǔ)言翻譯、個(gè)性化推薦和準(zhǔn)確的圖像識(shí)別,有助于增強(qiáng)用戶體驗(yàn),提高用戶參與度和滿意度。
人工智能推理領(lǐng)域里的創(chuàng)新貢獻(xiàn)
為了克服CPU和GPU的限制,為人工智能推理工作負(fù)載專門設(shè)計(jì)了創(chuàng)新型硬件加速器,實(shí)現(xiàn)高效和優(yōu)化的處理,同時(shí)最大限度地減少能耗。人工智能應(yīng)用中,此類加速器通過(guò)采用專用運(yùn)算符(池化、激活功能、規(guī)范化等)來(lái)實(shí)現(xiàn)優(yōu)化的數(shù)據(jù)流。數(shù)據(jù)流引擎是矩陣乘法單元,這是一個(gè)大型處理元件陣列,能夠有效地處理大型矩陣向量乘法、卷積和許多更復(fù)雜運(yùn)算。大多數(shù)神經(jīng)網(wǎng)絡(luò)都是基于矩陣乘法運(yùn)算的。為了進(jìn)一步優(yōu)化能源效率,人工智能加速器已經(jīng)實(shí)現(xiàn)了一些新技術(shù),如近內(nèi)存計(jì)算。近內(nèi)存計(jì)算將處理單元集成在內(nèi)存子系統(tǒng)中,從而實(shí)現(xiàn)更快的近內(nèi)存數(shù)據(jù)處理,從而減少與數(shù)據(jù)傳輸相關(guān)的能耗。最近,又出現(xiàn)了采用“非標(biāo)準(zhǔn)”技術(shù)的一些新解決方案,如存內(nèi)計(jì)算或尖峰神經(jīng)網(wǎng)絡(luò)(SNN)。要實(shí)現(xiàn)高效能人工智能推理,這些都是最具吸引力的解決方案。
存內(nèi)計(jì)算直接在內(nèi)存中進(jìn)行電路級(jí)計(jì)算,免去了數(shù)據(jù)傳輸,提高了處理速度。處理可以以模擬或數(shù)字方式進(jìn)行,可利用不同的存儲(chǔ)技術(shù),如SRAM、閃存或新的NVM(RRAM、MRAM、PCRAM、FeFET等)。這種方案特別有利于涉及大型數(shù)據(jù)集的復(fù)雜人工智能任務(wù)。SNN還代表了人工智能推理的一種創(chuàng)新解決方案:它們通常由通過(guò)尖峰進(jìn)行通信的互連節(jié)點(diǎn)組成,能夠模擬復(fù)雜的時(shí)間過(guò)程和基于事件的計(jì)算,這對(duì)于處理時(shí)間敏感數(shù)據(jù)或模擬人腦行為等任務(wù)很有用。
塑造人工智能推理的未來(lái)
利用近內(nèi)存/存內(nèi)計(jì)算或SNN的人工智能加速器對(duì)人工智能行業(yè)產(chǎn)生了重大影響,包括提高能源效率、提高處理速度和先進(jìn)的模式識(shí)別能力。這些加速器推動(dòng)硬件設(shè)計(jì)的優(yōu)化,從而為特定的人工智能工作負(fù)載創(chuàng)建專門的架構(gòu)。此外,它們還促進(jìn)了邊緣計(jì)算的進(jìn)步,促進(jìn)了直接在邊緣設(shè)備上進(jìn)行高效的人工智能處理,并減少了延遲。這些技術(shù)的變革潛力,凸顯了其在從醫(yī)療保健、制造業(yè)、汽車到消費(fèi)電子等不同行業(yè)的革命性變革中的關(guān)鍵作用。高能效人工智能推理在醫(yī)療保健和汽車行業(yè)的集成產(chǎn)生了變革性的影響。在醫(yī)療保健領(lǐng)域,通過(guò)快速數(shù)據(jù)分析促進(jìn)了更快的診斷和個(gè)性化的患者護(hù)理,從而改善了治療效果和量身定制的醫(yī)療干預(yù)措施。此外,它還賦能開(kāi)發(fā)遠(yuǎn)程患者監(jiān)測(cè)系統(tǒng),確保對(duì)慢性病患者進(jìn)行持續(xù)的健康跟蹤和積極干預(yù)。還有,在藥物研發(fā)領(lǐng)域,高效人工智能推理加快了潛在候選藥物的識(shí)別,加速了藥物研發(fā)過(guò)程,促進(jìn)了醫(yī)療和療法的創(chuàng)新。
在汽車行業(yè),節(jié)能的人工智能推理在提升安全功能和自動(dòng)駕駛能力方面也發(fā)揮著至關(guān)重要的作用。它為車輛提供ADAS和實(shí)時(shí)碰撞檢測(cè)功能,增強(qiáng)整體道路安全。此外,它有助于自動(dòng)駕駛技術(shù)的發(fā)展,使車輛能夠根據(jù)實(shí)時(shí)數(shù)據(jù)分析做出明智決策,從而改進(jìn)導(dǎo)航系統(tǒng)和自動(dòng)駕駛功能。此外,基于人工智能推理的預(yù)測(cè)性維護(hù)解決方案,能夠早期檢測(cè)潛在的車輛問(wèn)題、優(yōu)化性能、減少停機(jī)時(shí)間并延長(zhǎng)車輛壽命。
結(jié)論行業(yè)對(duì)節(jié)能人工智能推理解決方案的主要需求,是由促進(jìn)可持續(xù)運(yùn)營(yíng)、優(yōu)化資源利用和延長(zhǎng)設(shè)備電池壽命的需求驅(qū)動(dòng)的。這些解決方案在促進(jìn)環(huán)保實(shí)踐、降低運(yùn)營(yíng)成本和增強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì)方面發(fā)揮著關(guān)鍵作用。節(jié)能人工智能推理解決方案中,通過(guò)促進(jìn)邊緣計(jì)算應(yīng)用,并最大限度地減少能源消耗,使企業(yè)能夠提高盈利能力、簡(jiǎn)化流程、并確保移動(dòng)和物聯(lián)網(wǎng)設(shè)備功能的不間斷。要滿足這些需求,就必須開(kāi)發(fā)大量基于智能近內(nèi)存/存內(nèi)計(jì)算技術(shù)的節(jié)能算法,并優(yōu)化硬件架構(gòu)。許多新公司帶著創(chuàng)新的計(jì)算解決方案進(jìn)入市場(chǎng),并承諾在從傳感器到數(shù)據(jù)中心的任何地方運(yùn)行人工智能,以提供全新的用戶體驗(yàn)。
(原文刊登于EE Times歐洲版,參考鏈接:Revolutionizing AI Inference: Unveiling the Future of Neural Processing,由Franklin Zhao編譯。)
-
人工智能
+關(guān)注
關(guān)注
1793文章
47590瀏覽量
239486 -
adas
+關(guān)注
關(guān)注
309文章
2191瀏覽量
208768 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8435瀏覽量
132885
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論