“什么叫生成式?比如說,給我畫一幅車水馬龍的圖片。這種東西,過去人們不覺得是人工智能應(yīng)該做的事,現(xiàn)在可以做了。”5月18日,百度CEO李彥宏在天津舉辦的第七屆世界智能大會上演講時,說了這么一句話。
不了解這個梗的朋友,可能Get不到這句話里的笑點,以及背后的更多意思。
在3月份,文心一言剛剛發(fā)布的時候,有網(wǎng)友發(fā)現(xiàn)讓文心一言畫一張“車水馬龍”的圖片,它真的會畫出來有車、有水,有馬、有龍的一張圖。
有網(wǎng)友戲稱,這是逐字逐句的新藝術(shù)流派,也有人以此質(zhì)疑文心一言的技術(shù)實力,甚至說讀不懂中文成語的AI,怕不會是套殼外國模型吧?
3個月過去,這個Bug早已不復(fù)存在,而當(dāng)時的熱議似乎也悄無聲息。在越來越多的生成式AI上線后,大家發(fā)現(xiàn)無論中外哪個模型,大多是有長處也有短板,而率先發(fā)布的文心一言,反而越用越好,漸漸有了獨樹一幟的意思。
這時候,李彥宏重新笑提“車水馬龍”,似乎也就有了更多含義。首先這不是一種自證和洗白,因為文心一言已經(jīng)完成了自技術(shù)和應(yīng)用上的自我證明,李彥宏在表達的,更多是一種云淡風(fēng)輕與坦然、誠懇。
這是百度面對AI的技術(shù)觀,也是中國AI面對未來的發(fā)展觀。
技術(shù)的誕生,往往迎著冷眼與嘲笑
事實上,任何一門能夠引起關(guān)注的技術(shù),在誕生時往往伴隨著的都不是歡迎,而是挑刺與嘲諷。這或許是人性使然,因為破壞比肯定更容易,也更能引發(fā)關(guān)注,又或許是創(chuàng)新必然會突破某些人、某些事的舒適圈,從而也必然會得到負面評價。
早一點的例子,是工業(yè)革命的著名笑話:汽車在發(fā)明時曾經(jīng)用來跟馬車比賽,結(jié)果輸了,當(dāng)時無數(shù)馬車夫都在嘲笑這種笨重的鐵疙瘩,結(jié)果后來,就沒有后來了。
上世紀中葉,在晶體管剛剛誕生時,全球各界普遍不看好這種脆弱、良品率低的半導(dǎo)體材質(zhì),反而認為優(yōu)雅堅固的電子管才是王道,隨后晶體管帶來了信息革命與計算時代,電子管被塵封在了歷史深處供人憑吊。
說個更近的例子,去年ChatGPT剛剛誕生時,就有人嘲笑它會把李煜、納蘭性德都說成明朝人,連林黛玉是《紅樓夢》人物都不知道,純純一個小傻子。與此同時,比起嘲笑更愛發(fā)現(xiàn)的用戶,已經(jīng)找到了使用生成式AI的一萬種方法。
事實上,挑錯永遠容易。掛一漏萬,任何技術(shù)總有短板,其實對于一個人也是一樣。HR面試,需要問這個人才會什么,而不是他不會什么,否則拿著百科全書去找,一個人總有知識盲區(qū)?!败囁R龍”這樣的問題,在文心一言這種涉及龐大數(shù)據(jù)與知識的模型剛剛發(fā)布時,近乎是必然存在的。今天乃至此后很久,文心一言也和其他大模型一樣,在很多垂直功能上有不確定性、不合理性。
只有快速發(fā)現(xiàn)問題,快速修復(fù)問題,才是正確的解題思路,并且這也恰好是大語言模型基于用戶反饋快速迭代的價值所在。事實證明,文心一言確實做到了這點。
那么換個角度想想,文心一言是不是能等一切都調(diào)教完美再發(fā)布呢?首先完美這件事本身就是相對概念,不可能存在絕對的完美。百度自己發(fā)現(xiàn)問題,效率遠不及跟全球用戶一起找問題。
其次,延遲發(fā)布雖然更穩(wěn)妥,但會平白浪費了產(chǎn)業(yè)機遇,浪費了各界可以了解、參與到生成式AI的機會窗口。中國AI需要爭分奪秒,而文心一言頂著壓力和被質(zhì)疑、被嘲笑的可能,搶在3月16日就完成了發(fā)布,這件事本身就有點“孤勇者”的味道。
所以說,新技術(shù)誕生近乎是必然迎接質(zhì)疑、嘲笑的。重要的不是你能說什么證明自己,而是你接下來能夠做什么來證明技術(shù)。
無法打敗你的,總是讓你更強大
李彥宏現(xiàn)在可以云淡風(fēng)輕提到“車水馬龍”,就是因為文心一言已經(jīng)證明了技術(shù)實力,并且驗證了高效發(fā)布、快速迭代這個策略的正確性。
所謂的“車水馬龍”,甚至更多問題,并沒有成為百度大模型發(fā)展道路上的阻礙,反而成為了百度能夠快速聽到反饋,完成迭代的佐證。
最終結(jié)果,已經(jīng)可以在過去幾個月的發(fā)展數(shù)據(jù)中得到證明。
從經(jīng)營業(yè)績上看,5月16日,百度發(fā)布了截至2023年第一季度未經(jīng)審計的財務(wù)報告,營收和利潤雙雙超市場預(yù)期,其中營收311億元,同比增長10%,凈利潤(non-GAAP)57億元,同比大幅增長48%。分析師認為,百度Q1的良好勢頭,與文心一言獲得的積極用戶反饋與市場回應(yīng)緊密相關(guān)。百度在大語言模型層面的先聲奪人,已經(jīng)取得了市場的廣泛認同。
而從技術(shù)數(shù)據(jù)上看,文心一言不僅在眾多核心技術(shù)上保持了領(lǐng)先,也為業(yè)界帶來了最高效的升級、發(fā)展方法。通過文心一言與百度自研的產(chǎn)業(yè)級深度學(xué)習(xí)框架飛槳進行聯(lián)合優(yōu)化,實現(xiàn)了文心一言發(fā)布后平均某周進行1此迭代的效率,經(jīng)過4次迭代,實現(xiàn)了一言的推理能力提升近10倍。這意味著,文心一言的模型推理成本大幅降低,可為10倍數(shù)量的用戶提供服務(wù)。
不難看出,“車水馬龍”這類問題,沒有成為百度的短板,沒有阻礙AI發(fā)展的腳步。相反,這些“?!钡拇嬖?,讓文心一言更加強大,讓中國AI更加強大。
心底無私天地寬
在中國科技圈里,確實總是有一些企業(yè),對自身技術(shù)存在過的問題大為忌諱,總是扭扭捏捏,好像被抓到了什么把柄。而這種態(tài)度,自然會激發(fā)網(wǎng)友的更熱烈討論,最終形成“你不讓說,那我偏要說”的惡性循環(huán)。
相反,真的像李彥宏這樣,主動說破這層小尷尬,用幽默和坦然的方式面對這一切,卻會將格局打開,視野放寬。當(dāng)然,這里需要的自然是企業(yè)家的襟懷氣度,更重要的則是有技術(shù)底氣,知道一些問題根本不構(gòu)成問題。
百度的技術(shù)底氣,就是百度并不僅僅有幾個模型、幾個算法。大模型要走向千行百業(yè),萬家燈火,光有模型是不夠的。模型從哪來?模型用什么來支持?還需要算力、框架、生態(tài)等多重動力,提供足夠的技術(shù)動能,來支撐大模型與行業(yè)適配,不斷完成升級。
這種積累,正是百度在AI領(lǐng)域的真正王牌。就像前面提到模型層的文心一言和框架層的飛槳進行聯(lián)合優(yōu)化,起到了獨特的效果。百度在模型、框架、開發(fā)套件、工具等全棧架構(gòu)上,都有自己的積累,都有領(lǐng)先的核心技術(shù),最終彼此適配,高效協(xié)同,才能夠一次次帶來百度在AI領(lǐng)域的“驚喜”。
這些“驚喜”包括首發(fā)文心一言,包括高效修復(fù)Bug,包括1月4次迭代,也包括李彥宏的云淡風(fēng)輕。
相反,其他沒有自研深度學(xué)習(xí)框架、沒有底層技術(shù)積累,卻依靠風(fēng)口進入AI領(lǐng)域的廠商,要么需要花費巨大資源和經(jīng)歷從頭研發(fā),要么基于TensorFlow和PyTorch等深度學(xué)習(xí)框架進行再開發(fā),往往容易顧此失彼,最終讓自己的底氣也有所缺失。
在中國科技的創(chuàng)新路上,似乎始終都在說套殼,永遠都要說套殼。其實“套殼與否”這東西怎么證明呢?只有具備充沛的基礎(chǔ)設(shè)施與核心技術(shù),漸漸會形成越來越明顯的差異化,最終用戶會證明一切,最終時間會證明一切。
談笑于過去,坦然于未來,勇猛于此刻,才能心底無私天地寬。百度如此,中國AI亦如是。
審核編輯黃宇
-
晶體管
+關(guān)注
關(guān)注
77文章
9744瀏覽量
138740 -
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269977 -
文心一言
+關(guān)注
關(guān)注
0文章
124瀏覽量
1313
發(fā)布評論請先 登錄
相關(guān)推薦
評論