2023年,以聊天機器人ChatGPT爆火為代表,起起伏伏、整體向上的人工智能產(chǎn)業(yè)迎來了大模型時代。
回溯過往,人工智能的發(fā)展經(jīng)歷了三個階段:
第一次是上世紀(jì)末的專家系統(tǒng)時代,特征是將專家的領(lǐng)域知識轉(zhuǎn)變?yōu)橛嬎銠C模型,用以推理并得出與專家相同的結(jié)論。
第二次是不久前的“機器學(xué)習(xí)+深度學(xué)習(xí)”時代,在以CNN、RNN為代表的神經(jīng)網(wǎng)絡(luò)的賦能下,比如車牌識別、人臉識別這類計算機視覺應(yīng)用,識別準(zhǔn)確率從過去的92%、93%,提高到了99%以上,在該階段有部分產(chǎn)品徹底實現(xiàn)了產(chǎn)品化、規(guī)模化應(yīng)用。
第三次即是眼下的大模型時代,起源是2017年谷歌發(fā)表的一篇論文《AttentionIsAllYouNeed》,里面提出了革命性的Transformer深度神經(jīng)網(wǎng)絡(luò),一舉將深度學(xué)習(xí)的模型參數(shù)提高到了上億級別,并且在之后的迭代發(fā)展中,模型參數(shù)被逐步提升到了幾十億、幾百億甚至幾千億,意味著模型的復(fù)雜程度和學(xué)習(xí)能力逐步提高,越來越有接近人的表現(xiàn)。
換句話說,大模型產(chǎn)品并非采用上個時代模型參數(shù)受限的CNN、RNN架構(gòu),而是借助Transformer另起爐灶,達到了一種類似“小孩開竅”的「涌現(xiàn)」現(xiàn)象——當(dāng)模型突破某個規(guī)模時,能力水平直線上升。
這樣一來,大模型能做的事情變得更多了,并且效果更好,比如文本生成、語言理解、知識對話、邏輯推理等等。
再由于Transformer是一項新技術(shù),無論是傳統(tǒng)玩家還是新興企業(yè)都處在接近的起跑線,所以業(yè)界參與大模型的玩家非常多、類型非常廣,各方都希望通過大模型抓住新一輪產(chǎn)業(yè)機會。
此時,為了深入探究大模型與物聯(lián)網(wǎng)行業(yè)是否存在關(guān)聯(lián)?大模型是否將創(chuàng)新IoT產(chǎn)品或改善企業(yè)流程?物聯(lián)傳媒記者特別采訪了中科創(chuàng)達物聯(lián)網(wǎng)事業(yè)群副總裁楊新輝先生,基于中科創(chuàng)達近來在大模型領(lǐng)域的諸多動作,詢問行業(yè)及企業(yè)的詳細(xì)信息,希望增進大眾對大模型的了解。
中科創(chuàng)達大模型產(chǎn)品基本信息一覽:
產(chǎn)品名稱:中科創(chuàng)達魔方RUBIK大模型
產(chǎn)品定位:為行業(yè)客戶的智能化升級提供AI賦能
產(chǎn)品規(guī)劃:全面覆蓋了從邊緣端(RUBIK Edge)、語言大模型(RUBIK Language)、多模態(tài)(RUBIK Multi-Modal)、機器人(RUBIK Robot)等大模型系列,并積極探索大模型在不同行業(yè)場景的落地應(yīng)用。
以下是楊總和物聯(lián)傳媒的對話精選。
Part 1:
中科創(chuàng)達的大模型產(chǎn)品特征
物聯(lián)傳媒:根據(jù)2022年財報,中科創(chuàng)達的營收可以分出三類來源,分別是智能軟件業(yè)務(wù)、智能汽車業(yè)務(wù)、智能物聯(lián)網(wǎng)業(yè)務(wù),三者營收占比均接近三分之一,并且智能物聯(lián)網(wǎng)業(yè)務(wù)較上年同期增長39%,增長僅次于汽車業(yè)務(wù)。請問對于智能物聯(lián)網(wǎng)業(yè)務(wù),可否向我們簡單分享它的起源與發(fā)展方向。
楊新輝:中科創(chuàng)達成立于2008年,是全球領(lǐng)先的智能操作系統(tǒng)產(chǎn)品和技術(shù)提供商。得益于移動互聯(lián)網(wǎng)時代來自智能手機的爆發(fā)式需求,中科創(chuàng)達業(yè)績快速增長并于2015年在深交所上市。隨著發(fā)展向前推進,物聯(lián)網(wǎng)行業(yè)興起,中科創(chuàng)達物聯(lián)網(wǎng)業(yè)務(wù)最早開始于2016年,寄托了我們將操作系統(tǒng)從智能手機推進到物聯(lián)網(wǎng)的目標(biāo)。
我們物聯(lián)網(wǎng)業(yè)務(wù)的定位是硬件產(chǎn)品及解決方案提供商,覆蓋從智能模組、參考設(shè)計、到整機,再到物聯(lián)網(wǎng)平臺的端到端完整方案。但中科創(chuàng)達的優(yōu)勢還是操作系統(tǒng)及基于操作系統(tǒng)構(gòu)建的軟件和解決方案,包括端側(cè)、邊緣側(cè)操作系統(tǒng),再加上AI算法、平臺管理能力。
物聯(lián)傳媒:在所有業(yè)務(wù)中,了解到大模型是公司比較新的一項業(yè)務(wù),公司基于哪些原因推出了大模型?
楊新輝:主要是基于對產(chǎn)業(yè)發(fā)展的洞察,大模型有望推動產(chǎn)業(yè)產(chǎn)生結(jié)構(gòu)性的變化,雖然這還是一件長遠(yuǎn)的事,但我們看得到趨勢正在形成,中科創(chuàng)達也愿意擁抱、布局新興技術(shù)來給產(chǎn)業(yè)賦能。
物聯(lián)傳媒:公司大模型產(chǎn)品的定位和用途是什么?
楊新輝:我們的大模型產(chǎn)品叫中科創(chuàng)達魔方RUBIK大模型,定位是在邊緣側(cè)和端側(cè)產(chǎn)品上優(yōu)化交互,以及面向企業(yè)提供基于模型的AI服務(wù)。
為方便理解,可以將我們的業(yè)務(wù)拆分為兩部分:
一部分是產(chǎn)品創(chuàng)新,就是傳統(tǒng)的手機、汽車、物聯(lián)網(wǎng)業(yè)務(wù),會通過大模型把AI能力補充上去,以創(chuàng)新內(nèi)容交互的形式提高產(chǎn)品價值。比如市面上常見的語音實時轉(zhuǎn)寫終端,加入大模型能力后可以新增語篇規(guī)整、生成摘要、生成紀(jì)要等能力,顯著提高一些崗位的工作效率;再比如汽車場景,傳統(tǒng)座艙內(nèi)不少用戶困擾于繁雜的表盤信息,加入大模型能力后,智能座艙的出現(xiàn)為用戶提供更直觀、準(zhǔn)確的交互和指導(dǎo),跨越式提高了用戶體驗。
另一部分是流程創(chuàng)新或稱為企業(yè)數(shù)字化轉(zhuǎn)型,這部分的熱門應(yīng)用有智能客服、直播數(shù)字人等等。
物聯(lián)傳媒:現(xiàn)在中科創(chuàng)達魔方RUBIK大模型的應(yīng)用規(guī)模如何?
楊新輝:坦白講現(xiàn)在整個大模型行業(yè)都還處于發(fā)展早期,B端客戶們也都還在理解、認(rèn)知、思考、學(xué)習(xí)和研究大模型的階段,用量方面還有很大增長空間。
但中科創(chuàng)達也都一直在努力推動應(yīng)用落地。
今年6月,我們與高通合資成立的公司創(chuàng)通聯(lián)達推出了旗下首款集成大模型的智能搬運機器人解決方案,使用戶可以通過自然語言與智能搬運機器人交互,提出服務(wù)指令。
7月份,我們與北京智源人工智能研究院共同成立“魔方未來聯(lián)合實驗室”,希望推進大模型技術(shù)創(chuàng)新與成果轉(zhuǎn)化,促進技術(shù)在智能汽車、智能機器人、智慧工業(yè)、智能物聯(lián)網(wǎng)等領(lǐng)域的應(yīng)用落地。
Part2:
大模型與物聯(lián)網(wǎng)行業(yè)的相關(guān)性
物聯(lián)傳媒:會不會存在場景不需要用到大模型,直接用之前一代的人工智能版本就夠了呢?
楊新輝:這種情況是存在的。比如前面提的人臉識別、車牌識別應(yīng)用,行業(yè)的成本、效率都足夠好了,大模型就不需要往那個領(lǐng)域創(chuàng)新。但比如多輪對話,要讓對方感知不到是機器人,就需要更換為大模型。大模型解決的是以前技術(shù)無法解決的問題。
物聯(lián)傳媒:我們前面聊了ChatGPT是一種大語言模型應(yīng)用,但在實際的使用中,我個人感覺它在垂直領(lǐng)域產(chǎn)出有思想、有深度的內(nèi)容還依然有不足。
楊新輝:對,這方面它還不是說要完全取代,但是大模型完全可以做好一個助理的角色了,包括收集過去的信息、整理資料、列出框架,并且耗時非常短。比如說寫高考作文,人寫完需要30分鐘,大模型只需要30秒。
而且我們認(rèn)為,大模型的重要性是可以比擬工業(yè)革命時期蒸汽機的出現(xiàn)。當(dāng)時,以蒸汽機為動力的機械使紡紗、織布工序從人工轉(zhuǎn)向自動,可能產(chǎn)生了10倍以上的產(chǎn)能提升;現(xiàn)在大模型出現(xiàn),也在主打?qū)χ橇ぷ鬟M行替代或顯著增強。
打個比方,我們把人工智能的技術(shù)能力想象為一個水平面,技術(shù)的成熟和完善相當(dāng)于水平面不斷被抬高,以至于蓋過了一些島嶼和陸地,這些島嶼和陸地就是人類承擔(dān)的部分工作。
這種情況下,假設(shè)說基于CNN、RNN技術(shù)構(gòu)建的人臉識別、車牌識別等應(yīng)用可以算是小模型,替代了10%的人類工作;那么到大模型應(yīng)用里,對人類工作的替代率就可以達到30%-40%。
比例數(shù)據(jù)僅做參考,但根本上來說,大模型確實比此前幾代人工智能技術(shù)能做的事情更多了,甚至現(xiàn)在新型的大模型可以去通過圖靈測試,比如一些客服電話,可能當(dāng)我們發(fā)現(xiàn)是機器人的時候,其實這個電話已經(jīng)把想傳達、想詢問的信息說清楚了。
物聯(lián)傳媒:除了互聯(lián)網(wǎng)應(yīng)用,大模型將最先在哪些物聯(lián)網(wǎng)場景有應(yīng)用潛能?
楊新輝:今天我們談的大模型浪潮主要還是在AIGC大的范疇里,即基于人工智能做內(nèi)容產(chǎn)生。物聯(lián)網(wǎng)場景里有內(nèi)容產(chǎn)生的地方,比如說跟人有反復(fù)交互的產(chǎn)品類型,不管是語言還是圖像形式,大模型就會有突出的應(yīng)用價值。
物聯(lián)傳媒:既然行業(yè)整體處于發(fā)展早期,公司在該賽道上有哪些具體規(guī)劃?
楊新輝:我們的模型會做一個長期的工作。
今年是先從語言模型開始,從百億規(guī)模參數(shù)一直到千億規(guī)模參數(shù),大概會做五、六個檔次。其中參數(shù)規(guī)模相對最小的一類(比如說70億、130億或者300億以下參數(shù)),主要用在邊緣和端側(cè)設(shè)備上,這也是我們業(yè)務(wù)發(fā)展的重點。
到明年中期,預(yù)計多模態(tài)產(chǎn)品會出來,到時不止覆蓋語言,也會覆蓋圖像類應(yīng)用,并且這些產(chǎn)品也將逐步應(yīng)用在邊緣端和機器人領(lǐng)域。
物聯(lián)傳媒:我們應(yīng)該怎么想象和理解大模型的發(fā)展?jié)撃埽?/p>
楊新輝:從產(chǎn)品角度來看,大模型就是一個軟件形態(tài)的生產(chǎn)效率工具,把它用上去了,工作效率有望大幅提升。
從更產(chǎn)業(yè)化的角度來說,市面上好多需求都是由新技術(shù)來驅(qū)動的,因為沒有新技術(shù),用戶沒有替換的動力。大模型就是一項新技術(shù)。
比如現(xiàn)在我們看到一些品牌在醞釀、研發(fā)大模型手機,原因是用戶換機的意愿已經(jīng)大幅降低,當(dāng)未來大模型手機產(chǎn)品出來并且切中用戶痛點、爽點的時候,那就會驅(qū)動整個行業(yè)都用上大模型。其他很多行業(yè)也與此相似,大模型技術(shù)具有非常大的發(fā)展空間。
Part3:
大模型的建設(shè)與選型
物聯(lián)傳媒:您覺得大模型有沒有技術(shù)門檻?
楊新輝:大模型的技術(shù)門檻其實很高,壁壘主要有三個——數(shù)據(jù)、算力和算法,這三者分別代表了數(shù)據(jù)獲取及清理能力、投入資金水平、技術(shù)復(fù)雜度,除了部分頭部企業(yè),很多公司無法長期投入在所有這些事上。
物聯(lián)傳媒:在客戶了解大模型產(chǎn)品時,勢必會看到行業(yè)中有不少開源產(chǎn)品,您是如何看待開源大模型的?
楊新輝:現(xiàn)在開源模型的確有很多,可能初步能滿足用戶使用的需求,但在商業(yè)場景,開源產(chǎn)品存在的風(fēng)險不容忽視。
舉個簡單的例子,國外的開源模型可能就沒有做過與國內(nèi)價值觀、風(fēng)俗文化等方面的對齊,這才有模型區(qū)域化的趨勢,很難存在一個模型全球都好用。
另一方面,我們認(rèn)為大模型并非是一個直接套用的標(biāo)準(zhǔn)化產(chǎn)品,它的商業(yè)模式更多是“產(chǎn)品+服務(wù)”,所以大模型應(yīng)該有很多服務(wù)階段,比如對企業(yè)業(yè)務(wù)的咨詢、對數(shù)據(jù)的理解、對模型的訓(xùn)練/部署/調(diào)優(yōu),本質(zhì)上是一個非常復(fù)雜的工作,需要有非常復(fù)雜的、全棧的技術(shù)團隊才能把這件事做出來,這不是開源產(chǎn)品能保證效果的。
物聯(lián)傳媒:結(jié)合現(xiàn)在熱鬧的情況,您認(rèn)為最終行業(yè)會留下多少大模型?
楊新輝:通用模型可能只會剩下幾個,但是在垂直行業(yè)領(lǐng)域,面向不同的數(shù)據(jù)基礎(chǔ)會存在很多的領(lǐng)域模型。
領(lǐng)域模型與通用模型的區(qū)別,就好像專科醫(yī)生與普科大夫,專科醫(yī)生勢必在專業(yè)領(lǐng)域里能力更強,并且會有非常多類型的專科醫(yī)生。
物聯(lián)傳媒:中科創(chuàng)達大模型產(chǎn)品的定位是專科醫(yī)生還是普科大夫?
楊新輝:我們還是會先訓(xùn)練出一個普科大夫。因為從根本上說,中科創(chuàng)達的定位是提供基礎(chǔ)的、底層的技術(shù),以第三方平臺的身份,幫助垂直領(lǐng)域有數(shù)據(jù)資產(chǎn)的企業(yè)更快構(gòu)建屬于他們自己的模型而不用從0開始。
當(dāng)然,后期當(dāng)我們參與的行業(yè)、服務(wù)的企業(yè)、經(jīng)驗的積累足夠多時,也就有機會直接向他們提供專業(yè)的垂直行業(yè)模型。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4779瀏覽量
101052 -
人工智能
+關(guān)注
關(guān)注
1794文章
47642瀏覽量
239674 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132930 -
大模型
+關(guān)注
關(guān)注
2文章
2541瀏覽量
3026
原文標(biāo)題:質(zhì)疑大模型,理解大模型,用上大模型
文章出處:【微信號:ulinkmedia,微信公眾號:物聯(lián)傳媒】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論