我們很高興地宣布,我們的AutoML服務(wù)器應(yīng)用程序Analytics Studio將很快在開(kāi)源許可下提供。我們還將推出一個(gè)新的開(kāi)源項(xiàng)目網(wǎng)站,以聯(lián)合一個(gè)致力于為 tinyML 模型開(kāi)發(fā)創(chuàng)建全面的、與硬件無(wú)關(guān)的解決方案的開(kāi)發(fā)人員社區(qū)。此次發(fā)布計(jì)劃于初夏進(jìn)行,我們正準(zhǔn)備在您的支持下取得成功。
Analytics Studio作為專(zhuān)有應(yīng)用程序和云 SaaS服務(wù)經(jīng)過(guò)多年的發(fā)展,支持來(lái)自多個(gè)硬件供應(yīng)商的各種端側(cè)芯片。SensiML的Analytics Studio專(zhuān)注于時(shí)間序列傳感器,可以快速創(chuàng)建適用于各種應(yīng)用的獨(dú)立C代碼,例如:
1)聲學(xué)事件檢測(cè)
2)手勢(shì)和人類(lèi)活動(dòng)識(shí)別
3)異常檢測(cè)
4)關(guān)鍵字發(fā)現(xiàn)
5)振動(dòng)分類(lèi)
通過(guò)此次發(fā)布,我們將在開(kāi)源許可選項(xiàng)下提供Analytics Studio的核心引擎,用戶(hù)可以自由下載并實(shí)施我們提供的核心技術(shù)的私人服務(wù)器實(shí)施,并將繼續(xù)提供在SensiML的托管和支持的SaaS云服務(wù)中服務(wù)。
為什么SensiML開(kāi)源其核心軟件?
幾年前,當(dāng)SensiML首次推出我們的開(kāi)源計(jì)劃時(shí),我們主要專(zhuān)注于為我們的傳感器數(shù)據(jù)接口協(xié)議和由此產(chǎn)生的物聯(lián)網(wǎng)邊緣推理模型提供更高的透明度。在聽(tīng)到客戶(hù)對(duì)維護(hù)和支持他們沒(méi)有完全掌握的算法產(chǎn)品表示擔(dān)憂后,我們得出結(jié)論,這是朝著更好的模型透明度和可解釋性邁出的必要一步。因此,解決AI/ML的“黑匣子”問(wèn)題是我們開(kāi)源的首要目標(biāo),并導(dǎo)致我們的SensiML嵌入式SDK和數(shù)據(jù)協(xié)議以完整的源代碼形式發(fā)布并提供給任何人,同時(shí)將我們的開(kāi)發(fā)工具本身作為專(zhuān)有軟件進(jìn)行維護(hù)。
今天,我們看到了更多的TinyML生態(tài)系統(tǒng)挑戰(zhàn)和相應(yīng)的開(kāi)源機(jī)會(huì),這激發(fā)了我們擴(kuò)展開(kāi)源計(jì)劃,以包括我們的核心AutoML引擎 Analytics Studio。我們開(kāi)始相信,一個(gè)充滿活力的開(kāi)源軟件工具社區(qū)的存在對(duì)于推動(dòng)TinyML生態(tài)系統(tǒng)向前發(fā)展至關(guān)重要,因此,提供SensiML久經(jīng)考驗(yàn)的代碼庫(kù),作為協(xié)作開(kāi)源創(chuàng)新的第一個(gè)基礎(chǔ),這一點(diǎn)我們處于領(lǐng)導(dǎo)地位。
根據(jù)Linux基金會(huì)進(jìn)行的2023年OSS調(diào)查,人工智能/機(jī)器學(xué)習(xí)被全球 IT 經(jīng)理列為對(duì)其行業(yè)未來(lái)最有價(jià)值的開(kāi)源技術(shù)。
當(dāng)人們考察領(lǐng)先的開(kāi)源 AI/ML 項(xiàng)目和技術(shù)時(shí),大部分是框架、庫(kù)和模型定義格式(例如 TensorFlow、PyTorch、Scikit-learn、OpenCV 和 ONNX 等),但不是完整的端到端工具鏈,更不用說(shuō)那些專(zhuān)注于 AI/ML 和嵌入式物聯(lián)網(wǎng)推理代碼優(yōu)化的交叉復(fù)雜性的工具鏈了。SensiML認(rèn)為,這是一個(gè)關(guān)鍵的差距,也是一個(gè)機(jī)會(huì),可以幫助幫助那些沒(méi)有精通數(shù)據(jù)科學(xué)的開(kāi)發(fā)人員- 采用簡(jiǎn)化復(fù)雜步驟。
出于幾個(gè)常見(jiàn)原因,許多IT經(jīng)理選擇開(kāi)源軟件而不是專(zhuān)有選項(xiàng)。這些原因也促使我們決定將 Analytics Studio 開(kāi)源:
1)創(chuàng)新和敏捷性
2)避免供應(yīng)商鎖定
3)社區(qū)和支持識(shí)
4)質(zhì)量和安全性
5)人才吸引和留住
6)戰(zhàn)略?xún)?yōu)勢(shì)
將開(kāi)源優(yōu)勢(shì)與TinyML生態(tài)系統(tǒng)聯(lián)系起來(lái)
為了將這些好處與TinyML生態(tài)系統(tǒng)面臨的特定挑戰(zhàn)聯(lián)系起來(lái),讓我們更深入地研究其中的幾個(gè),并與當(dāng)前TinyML采用者面臨的問(wèn)題聯(lián)系起來(lái)。
挑戰(zhàn)1 – TinyML傳感器應(yīng)用程序特有的數(shù)據(jù)集瓶頸:使用深度學(xué)習(xí)技術(shù)創(chuàng)建準(zhǔn)確的預(yù)測(cè)模型依賴(lài)于足夠的模型訓(xùn)練數(shù)據(jù)的可用性,以涵蓋實(shí)際使用中可以預(yù)期的來(lái)源和范圍。因此,這種訓(xùn)練數(shù)據(jù)集需求可能相當(dāng)大。眾所周知的極端情況是大語(yǔ)言模型 (LLM),它具有數(shù)萬(wàn)億個(gè)模型參數(shù)、數(shù)十萬(wàn)個(gè) GPU 訓(xùn)練小時(shí),以及接近 Internet 上可用的人類(lèi)文本總數(shù)的訓(xùn)練數(shù)據(jù)集。
TinyML模型涉及的訓(xùn)練數(shù)據(jù)集要小得多,但傳感器衍生輸入數(shù)據(jù)的性質(zhì)使得數(shù)據(jù)集挑戰(zhàn)可以說(shuō)是一個(gè)比LLM更棘手的問(wèn)題。雖然 LLM 的規(guī)模非常大,但它們至少受益于人類(lèi)語(yǔ)言文本的可擴(kuò)展數(shù)據(jù)源,這些數(shù)據(jù)源是通過(guò)從互聯(lián)網(wǎng)上自動(dòng)抓取文本、文檔和 Wiki 頁(yè)面而獲得的。對(duì)于傳感器應(yīng)用,通常沒(méi)有這種等效的易于擴(kuò)展的數(shù)據(jù)源。
想象一下,根據(jù)實(shí)際用例要求,在網(wǎng)絡(luò)上抓取足夠的原始傳感器數(shù)據(jù),以預(yù)測(cè)特定電機(jī)負(fù)載的大框架直流電機(jī)故障狀態(tài),以及從與位置相關(guān)的振動(dòng)傳感器輸入和麥克風(fēng)中獲取足夠的原始傳感器數(shù)據(jù)。幾乎可以肯定的是,如果不求助于設(shè)計(jì)自己的實(shí)驗(yàn),您將無(wú)法找到適合給定應(yīng)用程序需求的數(shù)據(jù)。
這個(gè)數(shù)據(jù)集瓶頸問(wèn)題涵蓋了TinyML領(lǐng)域的大多數(shù)用例。它要求開(kāi)發(fā)人員投入大量時(shí)間、精力和成本來(lái)收集特定于其所需用例的經(jīng)驗(yàn)數(shù)據(jù)。他們必須以足夠的數(shù)量和足夠多樣化的條件進(jìn)行訓(xùn)練,以便針對(duì)實(shí)際使用中可能預(yù)期的所有條件有效地訓(xùn)練模型。在我們的電機(jī)示例中,大型跨國(guó)電機(jī)制造商可能擁有或有能力產(chǎn)生足夠的數(shù)據(jù)來(lái)開(kāi)發(fā)穩(wěn)健的模型,但缺乏此類(lèi)資源的小型公司和創(chuàng)業(yè)者僅限于更簡(jiǎn)單的模型。其結(jié)果是限制了用戶(hù)對(duì)TinyML的采用,因?yàn)闉樵S多此類(lèi)應(yīng)用程序獲取訓(xùn)練/測(cè)試數(shù)據(jù)的采用門(mén)檻很高。
開(kāi)源TinyML工具如何提供幫助:目前對(duì)減少訓(xùn)練數(shù)據(jù)集瓶頸的積極研究顯示出前景,包括遷移學(xué)習(xí)、數(shù)據(jù)增強(qiáng)、從模擬和 對(duì)抗生成網(wǎng)絡(luò)GAN 生成合成數(shù)據(jù)、半監(jiān)督學(xué)習(xí)和模型壓縮等技術(shù)。這些方法正在迅速發(fā)展,在TinyML中包含的許多用例中,有效的方法各不相同。例如,用于圖像識(shí)別的數(shù)據(jù)增強(qiáng)通常涉及旋轉(zhuǎn)、平移、縮放或色移,而音頻數(shù)據(jù)將涉及一組完全不同的音高、音色、節(jié)奏和噪聲疊加的轉(zhuǎn)換。面對(duì)快速變化的方法和途徑的步伐,這些方法和途徑因應(yīng)用而異,因此對(duì)基于開(kāi)源社區(qū)的協(xié)作的需求至關(guān)重要。開(kāi)源開(kāi)發(fā)模型為問(wèn)題帶來(lái)了規(guī)模和洞察力的多樣性,這是封閉的開(kāi)發(fā)團(tuán)隊(duì)無(wú)法比擬的。通過(guò)為社區(qū)貢獻(xiàn)和改進(jìn)開(kāi)放一個(gè)通用的TinyML開(kāi)發(fā)平臺(tái),SensiML相信生態(tài)系統(tǒng)可以從克服數(shù)據(jù)集瓶頸的集體努力中更快地受益。
挑戰(zhàn)2 – TinyML軟件工具碎片化和鎖定:在過(guò)去幾年中,我們目睹了許多AutoML開(kāi)發(fā)工具競(jìng)爭(zhēng)對(duì)手被硬件供應(yīng)商收購(gòu),這些供應(yīng)商試圖通過(guò)強(qiáng)制ML開(kāi)發(fā)工具相關(guān)的高轉(zhuǎn)換成本來(lái)將用戶(hù)鎖定在他們的芯片產(chǎn)品中。雖然從芯片供應(yīng)商的角度來(lái)看,這種動(dòng)機(jī)是可以理解的,但從物聯(lián)網(wǎng)開(kāi)發(fā)人員的角度來(lái)看,由此產(chǎn)生的碎片化生態(tài)系統(tǒng)遠(yuǎn)非理想。想要工具包X,但出于其他設(shè)計(jì)或業(yè)務(wù)原因需要使用芯片Y?借助這些專(zhuān)屬解決方案,用戶(hù)面臨著在軟件工具功能和硬件選擇標(biāo)準(zhǔn)(如數(shù)據(jù)表規(guī)格、成本和第二來(lái)源替代方案)之間做出艱難選擇。當(dāng)這兩個(gè)目標(biāo)發(fā)生沖突時(shí),常見(jiàn)的結(jié)果是,物聯(lián)網(wǎng)開(kāi)發(fā)人員將簡(jiǎn)單地推出計(jì)劃的ML功能,直到 ML 工具成熟并且存在針對(duì)特定所需硬件和應(yīng)用程序需求的功能支持。
開(kāi)源TinyML工具如何提供幫助:SensiML認(rèn)為,為T(mén)inyML實(shí)施者提供選擇和靈活性可以更好地滿足用戶(hù)的需求,而不是與特定硬件供應(yīng)商的產(chǎn)品捆綁在一起。這種靈活性甚至可以被看作是一種戰(zhàn)略決策,它保留了在開(kāi)發(fā)機(jī)器學(xué)習(xí)工具技能和數(shù)據(jù)集方面的投入價(jià)值,這些技能和數(shù)據(jù)集可以跨硬件和特定工具實(shí)現(xiàn)進(jìn)行移植。通過(guò)為開(kāi)源貢獻(xiàn)一個(gè)基本 AutoML工具鏈,SensiML設(shè)想了一個(gè)事實(shí)上開(kāi)放和靈活的平臺(tái)的潛力,就像 Eclipse 作為許多供應(yīng)商特定實(shí)現(xiàn)以及 Eclipse 基金會(huì)本身維護(hù)的通用 IDE 技術(shù)一樣。
開(kāi)源對(duì)SensiML未來(lái)的商業(yè)計(jì)劃有何影響?
我們開(kāi)源SensiML核心AutoML應(yīng)用程序的主要?jiǎng)訖C(jī)是受益于協(xié)作開(kāi)源開(kāi)發(fā)模式帶來(lái)的更快的創(chuàng)新步伐。除了代碼貢獻(xiàn)之外,還包括增強(qiáng)的代碼質(zhì)量、與新硬件的集成、額外的預(yù)訓(xùn)練模型模板、示例應(yīng)用程序、改進(jìn)的文檔、QA測(cè)試和錯(cuò)誤提交。
與此同時(shí),SensiML將繼續(xù)提供其現(xiàn)有的托管云SaaS服務(wù)計(jì)劃,并為希望獲得更高支持水平的客戶(hù)提供TinyML模型開(kāi)發(fā)的用戶(hù)咨詢(xún)和定制工程服務(wù)。與RedHat的Linux商業(yè)模式類(lèi)似,SensiML將繼續(xù)在雙重許可策略下提供傳統(tǒng)的企業(yè)許可證選項(xiàng)。我們相信,SensiML的支持、技術(shù)使用的全力支持、互補(bǔ)產(chǎn)品和云服務(wù)管理有足夠的價(jià)值,可以為很大一部分用戶(hù)群體提供服務(wù),同時(shí)為那些傾向于自己實(shí)施工具的人提供免費(fèi)的開(kāi)源替代方案。
我分享了這個(gè)愿景,你們?nèi)绾螀⑴c其中?
在接下來(lái)的幾周內(nèi),SensiML將提供有關(guān)我們的開(kāi)源項(xiàng)目GitHub repo和OSS項(xiàng)目網(wǎng)站的最新信息,這些網(wǎng)站計(jì)劃于今年夏初推出。
有興趣參與的人(無(wú)論是作為用戶(hù)還是貢獻(xiàn)者)可以收到有關(guān)我們項(xiàng)目啟動(dòng)進(jìn)度的更新,就他們認(rèn)為最重要的改進(jìn)提供反饋,并在我們的正式發(fā)布日期之前搶先訪問(wèn)代碼庫(kù)。要注冊(cè)請(qǐng)掃描下面的二維碼并提交您的聯(lián)系信息。
我們希望您能像我們一樣發(fā)現(xiàn)這個(gè)消息令人興奮和潛在的影響力。只有通過(guò)開(kāi)發(fā)人員和用戶(hù)社區(qū)的集體利益,TinyML工具的這樣一個(gè)開(kāi)源項(xiàng)目才能發(fā)展壯大,使所有參與者受益!
-
引擎
+關(guān)注
關(guān)注
1文章
361瀏覽量
22588 -
開(kāi)源
+關(guān)注
關(guān)注
3文章
3370瀏覽量
42574 -
Studio
+關(guān)注
關(guān)注
2文章
190瀏覽量
28733 -
SensiML
+關(guān)注
關(guān)注
0文章
13瀏覽量
903
原文標(biāo)題:SensiML開(kāi)源了Analytics Studio AutoML引擎
文章出處:【微信號(hào):麥克泰技術(shù),微信公眾號(hào):麥克泰技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論