最近,隨著人工智能(AI)2.0大模型的啟動,我不僅跟同事熱火朝天地研讀相關(guān)論文,還去美國一線了解AI2.0的新趨勢,探索這一領(lǐng)域產(chǎn)學研的深度融合。在人工智能大模型發(fā)展論壇上,我將近來關(guān)于AI2.0大模型方面的機遇與挑戰(zhàn)及部分爭議做一個比較通俗的分享和剖析。
大模型也會“胡說八道”
業(yè)內(nèi)人士熟悉的AI1.0是以AlphaGo為代表的深度學習,隨后AI1.0開始在計算機視覺等領(lǐng)域趕超人類,并且穿透實體行業(yè)創(chuàng)造了價值。但AI1.0也遇到了明顯的瓶頸,這些瓶頸正好是AI2.0時代的大模型能夠解決的。
AI1.0遇到的瓶頸是什么?在AI1.0時代,單領(lǐng)域數(shù)據(jù)集之間、數(shù)據(jù)集與模型之間各成孤島。當時還沒有大模型的時候,我們要做一個領(lǐng)域的AI應(yīng)用,要深入該領(lǐng)域收集數(shù)據(jù)、清洗數(shù)據(jù)、標注數(shù)據(jù),然后再去調(diào)整模型,整個過程的工作量和成本都非常可觀。
AI2.0的大模型有一個很大的特點,就是可以用海量數(shù)據(jù)訓練一個大模型,只需要微調(diào)就可以執(zhí)行五花八門的任務(wù)。現(xiàn)在用來訓練大模型的主要是文字數(shù)據(jù)內(nèi)容,未來還會增加多模態(tài)數(shù)據(jù),隨著數(shù)據(jù)的豐富化,再以這個模型去做微調(diào)。可以預想,AI2.0的未來將具備非常大的威力。
一個聰明的AI引擎有望帶來應(yīng)用的爆發(fā),那么這樣的應(yīng)用到底多快才能爆發(fā)?
前提還需要弄清楚一個重要問題,就是今天的大模型有時候會一本正經(jīng)地“胡說八道”,但大模型的能力也來自這個所謂的“胡說八道”。如果將其“胡說八道”的能力降為零,那么其推理能力也幾乎沒有了。
因此,我認為內(nèi)容生產(chǎn)、娛樂等是AI2.0最快也最易于落地應(yīng)用的領(lǐng)域,這些領(lǐng)域有一定的容錯空間,也能通過人工干預校準錯誤。未來,隨著AI2.0的不斷迭代發(fā)展,“胡說八道”的問題也有望解決。
不只是一個問答引擎
在此,我將AI2.0的大模型生態(tài)劃分為基礎(chǔ)模型層、中間層、應(yīng)用層3個層次。
基礎(chǔ)模型層主流的說法是模型即服務(wù);應(yīng)用層包括AI各種垂類應(yīng)用,如輔助寫稿、畫圖、摳圖等;中間層則是提供模型微調(diào)、推理遷移學習的各種工具,幫助大模型更高效實踐,讓應(yīng)用開發(fā)的成本降到最低,助推AI2.0應(yīng)用進入百花齊放的態(tài)勢,形成強大且有黏性的平臺生態(tài)。
由此可見,AI2.0將是一個巨大的平臺機遇,其規(guī)模將是移動互聯(lián)網(wǎng)的10倍,所有的應(yīng)用和界面都會被重寫一遍,將顛覆很多行業(yè)。
未來,我們可以想象這樣一個場景:一個很厲害的編輯可以通過AI寫出一篇深度報道;創(chuàng)作游戲時,角色、背景、道具、衣服、故事的產(chǎn)生,甚至所有的代碼最終都會用AI來寫。一些小朋友甚至會把自己想玩的游戲通過AI寫出來,再用文字做一個游戲介紹,幾秒鐘后就可以玩了,這跟今天的游戲制作有很大差別。
因此,大模型不只是一個問答引擎,它還將深刻改變未來應(yīng)用的生態(tài),可以成為人們的垂類智能助理,但也隨之帶來一些問題和挑戰(zhàn)。因此,開發(fā)AI2.0時,需要同時研究如何善用AI2.0技術(shù),以及制定管理AI2.0的法律、法規(guī)。
優(yōu)秀的技術(shù)產(chǎn)品是“賽馬”賽出來的
不難發(fā)現(xiàn),除了AI領(lǐng)域外,大模型的改革還會帶來一些平臺式的巨大差距。
另外,在所有的應(yīng)用里,AI-First(人工智能優(yōu)先)將是最重要的應(yīng)用。AI-First指這個應(yīng)用沒有AI就不能成立。簡單地說,當我們把大模型從應(yīng)用中抽掉,這個應(yīng)用將會完全癱瘓。
要在AI領(lǐng)域做應(yīng)用或創(chuàng)業(yè),就一定要做必須有AI參與的App應(yīng)用,因為它將是AI2.0時代的寵兒,它的整個用戶體驗將令人耳目一新。
近期,關(guān)于大模型有幾種質(zhì)疑的聲音:“使用海外的開源大模型就可以做出中國版OpenAI”“大模型耗錢且耗人,只有巨頭才有入場券”“開發(fā)小模型就夠用了”……
這些說法正確嗎?
首先,開源是非常重要的,中國技術(shù)未來的發(fā)展肯定需要開源,因為高校和創(chuàng)業(yè)者沒有開源就很難得到啟動的力量。但是,“使用海外的開源大模型就可以做出中國版的OpenAI”的說法是絕對錯誤的。雖然開源模型本身有一定局限性,但如果直接使用海外的開源大模型,技術(shù)的天花板將決定你永遠做不出達到或超越GPT-4.0技術(shù)水平的大模型。
第二,很多人做開源大模型訓練時用GPT-4.0來訓練,但誰也不敢保證GPT-4.0未來仍會讓每個人都能使用,從商業(yè)的角度也沒有理由讓你占這個便宜。
第三,拿海外訓練出來的大模型,在國內(nèi)做微調(diào)是值得商榷的。因為國內(nèi)外的文化習慣、法律法規(guī)不同,所以自主創(chuàng)新做大模型是中國企業(yè)的必經(jīng)之路。
當然,未來不可能有50家大模型公司存在,會收斂到一個很小的數(shù)字上。不過,在當前大模型這個領(lǐng)域,我們都在追趕,可以鼓勵以各種不同的模式去先行先試,優(yōu)秀的技術(shù)產(chǎn)品是“賽馬”賽出來的。
AI2.0市場規(guī)模巨大,足以容納巨頭、中小企業(yè)和初創(chuàng)公司在里面“賽馬”。創(chuàng)業(yè)公司與巨頭各擅勝場,正如ChatGPT背后的OpenAI公司一樣,創(chuàng)業(yè)公司更靈活、更專業(yè)。從硅谷經(jīng)驗來看,很多技術(shù)創(chuàng)新的發(fā)起者,都技術(shù)領(lǐng)先、策略靈活、市場反應(yīng)快。落地執(zhí)行力強的團隊將是中國大模型公司成功的關(guān)鍵。
創(chuàng)新需要合作,開放共創(chuàng)未來。我們期待中國大模型賽道能形成巨頭、中小微創(chuàng)新企業(yè)一起發(fā)展的“創(chuàng)新綜合體”,一起把AI2.0做大做強。
-
人工智能
+關(guān)注
關(guān)注
1793文章
47601瀏覽量
239513 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24773 -
大模型
+關(guān)注
關(guān)注
2文章
2524瀏覽量
2991
原文標題:自主創(chuàng)新是中國人工智能大模型必經(jīng)之路
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論