12月28日,2024中國(guó)信通院ICT+深度觀察報(bào)告會(huì)上海分會(huì)場(chǎng)暨“虹橋之源”大模型驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)新生態(tài)峰會(huì)在上海長(zhǎng)寧召開。
會(huì)議首次深度聚焦大模型,邀請(qǐng)了眾多學(xué)者、專家論道AI前沿技術(shù)創(chuàng)新和落地應(yīng)用實(shí)踐。會(huì)議中,學(xué)者們就當(dāng)前AI發(fā)展現(xiàn)狀達(dá)成共識(shí):以十至二十年為周期,目前大模型還處在起步階段,2024年圍繞行業(yè)應(yīng)用會(huì)“落子不斷”。
圍繞當(dāng)前AI大模型行業(yè)落地中的挑戰(zhàn),這些專家、學(xué)者也基于自己的觀察,從算力、數(shù)據(jù)、算法出發(fā),圍繞醫(yī)療、通信、城市管理、金融服務(wù)等領(lǐng)域,給出了一些“最優(yōu)解”。相信AI應(yīng)用中遇到的大多數(shù)問題,都能在這次會(huì)議中找到答案,本文為演講實(shí)錄,enjoy~
阿里云:AI與算力驅(qū)動(dòng)產(chǎn)業(yè)創(chuàng)新
從IT時(shí)代、互聯(lián)網(wǎng)時(shí)代到智能時(shí)代的演進(jìn)過程中,產(chǎn)業(yè)發(fā)展和公司市值經(jīng)歷了巨大變化。 ? 在傳統(tǒng)軟件時(shí)代,許多巨頭公司打造了千億市值;互聯(lián)網(wǎng)+時(shí)代,蘋果等公司達(dá)到了萬億市值。 ? 進(jìn)入萬物互聯(lián)和大模型時(shí)代,我們預(yù)見將出現(xiàn)十萬億市值的公司。 ? 這不僅代表技術(shù)巨頭的壟斷,更意味著技術(shù)的普惠。 ?
人工智能和大模型的發(fā)展帶來的不僅是技術(shù)革新,更是產(chǎn)業(yè)與技術(shù)融合的新機(jī)遇。 ? 我們目睹了眾多創(chuàng)業(yè)公司的誕生,這些新生企業(yè)的涌現(xiàn)預(yù)示著產(chǎn)業(yè)發(fā)展將比以往任何時(shí)代都更加繁榮。
在新的智能時(shí)代,云計(jì)算的體系可能會(huì)發(fā)生變化。傳統(tǒng)的IaaS、PaaS、SaaS可能會(huì)被模型服務(wù)所取代。 ? 如果能將模型作為服務(wù)提供給更多開發(fā)者和合作伙伴,將會(huì)創(chuàng)造出更多創(chuàng)新場(chǎng)景。 ?
AI時(shí)代的新挑戰(zhàn)
阿里云致力于打造AI時(shí)代最開放的云。 ? 為了實(shí)現(xiàn)這一愿景,重點(diǎn)放在三個(gè)主要領(lǐng)域:首先是構(gòu)建AI時(shí)代關(guān)鍵的計(jì)算基礎(chǔ)設(shè)施,其次是以模型為中心來加速創(chuàng)新,最后則是構(gòu)建一個(gè)繁榮且開放的生態(tài)系統(tǒng)。
在智能時(shí)代,數(shù)據(jù)中心的概念經(jīng)歷了重新定義,從處理大量數(shù)據(jù)的集群轉(zhuǎn)變?yōu)槟軌蜻B接異構(gòu)計(jì)算芯片進(jìn)行高效預(yù)訓(xùn)練和推理的高效計(jì)算樞紐。 ? 對(duì)基礎(chǔ)設(shè)施提供商來說,這意味著面臨新挑戰(zhàn)。 ?
大模型訓(xùn)練尤其面臨四大挑戰(zhàn): ? 首先,梯度下降等步驟需要大量數(shù)據(jù)在機(jī)器之間傳輸,對(duì)網(wǎng)絡(luò)速度和穩(wěn)定性要求極高; ? 其次,復(fù)雜的訓(xùn)練算法需要依賴高效的數(shù)據(jù)處理和算法優(yōu)化; ? 第三,如何在指定的計(jì)算和網(wǎng)絡(luò)資源下實(shí)現(xiàn)效率和成本的最優(yōu)平衡; ? 最后,面對(duì)硬件故障,如何有效地遷移任務(wù)和恢復(fù)系統(tǒng)。
針對(duì)這些挑戰(zhàn),靈駿的平臺(tái)依靠高速網(wǎng)絡(luò)、網(wǎng)絡(luò)容錯(cuò)技術(shù)和強(qiáng)大的平臺(tái)調(diào)度能力。 ? 這不僅提升了預(yù)訓(xùn)練和SFT的效率,還實(shí)現(xiàn)了集群內(nèi)機(jī)器的動(dòng)態(tài)擴(kuò)展,確保在智能時(shí)代,數(shù)據(jù)中心依舊能像一臺(tái)高效的超級(jí)計(jì)算機(jī)般運(yùn)作。
訓(xùn)練是大模型應(yīng)用體系中的一個(gè)重要環(huán)節(jié),但在實(shí)際應(yīng)用中,推理的效率和成本同樣關(guān)鍵。 ? 當(dāng)下,雖然許多創(chuàng)業(yè)公司和研究團(tuán)隊(duì)專注于大模型的預(yù)訓(xùn)練,但真正的挑戰(zhàn)在于如何將大模型有效地應(yīng)用于實(shí)際場(chǎng)景中,確保模型在推理階段的高效、低成本運(yùn)行,并能夠適應(yīng)動(dòng)態(tài)的負(fù)載需求,特別是在全球不同地點(diǎn)進(jìn)行推理時(shí)。 ?
阿里云的靈積平臺(tái)通過顯著提升吞吐能力和計(jì)算效率,高達(dá)4倍的吞吐提升和8倍的計(jì)算資源節(jié)約,并支持快速動(dòng)態(tài)擴(kuò)容,全面支撐大模型從訓(xùn)練到推理的生命周期。 ? 同時(shí),它服務(wù)于政企行業(yè),通過專有云和混合云體系優(yōu)化基礎(chǔ)設(shè)施,提高訓(xùn)練效率和穩(wěn)定性。 ? 此外,平臺(tái)還支持行業(yè)特定模型的開發(fā),并通過API提供,使終端APP創(chuàng)業(yè)者和用戶能夠便捷地調(diào)用,加速大模型技術(shù)的廣泛應(yīng)用和發(fā)展。
阿里云的AI大模型行業(yè)落地
我們開發(fā)了多個(gè)專門的應(yīng)用來結(jié)合大模型技術(shù)和特定場(chǎng)景需求: ? 聽悟用于結(jié)合語(yǔ)言模型和文本生成會(huì)議摘要; ? 星塵用于構(gòu)建角色; ? 靈碼是一個(gè)編程輔助平臺(tái),它可以自動(dòng)生成代碼注釋,幫助那些不喜歡寫注釋的程序員; ? 曉蜜適用于客服場(chǎng)景; ? 點(diǎn)金用于金融領(lǐng)域; ? 智文幫助用戶分析和總結(jié)論文,尤其在醫(yī)藥和其他行業(yè)領(lǐng)域中的應(yīng)用; ? 法律領(lǐng)域有法睿; ? 仁心則面向終端用戶提供醫(yī)療知識(shí)查詢。 ? 這些應(yīng)用通過大模型技術(shù)實(shí)現(xiàn)了功能的創(chuàng)新和服務(wù)的優(yōu)化。 ?
阿里云推出了兩項(xiàng)關(guān)鍵技術(shù)模型:通義千問和通義萬相,分別用于語(yǔ)言理解和圖像生成,滿足創(chuàng)意及圖像場(chǎng)景需求。 ? 自2021年以來,阿里巴巴集團(tuán)深耕大模型研發(fā),推出了M6、M6-oba系列和千億參數(shù)的通義千問2.0版本,即使在Chat GPT引起廣泛關(guān)注的背景下,阿里云的模型在國(guó)際上仍表現(xiàn)出色。 ? 特別值得一提的是,阿里云開源了72B、7B、14B及1.8B參數(shù)模型,推動(dòng)了模型社區(qū)的快速發(fā)展,并且在提供更長(zhǎng)上下文、角色設(shè)定和語(yǔ)言風(fēng)格等方面展現(xiàn)了出色的性能,極大地促進(jìn)了應(yīng)用開發(fā)的微調(diào)過程。 ? 同時(shí),阿里云還建立了中國(guó)最大的模型社區(qū):魔搭社區(qū)(ModelScope)。 ? 其聚集了2300多個(gè)高質(zhì)量開源模型,實(shí)現(xiàn)了億級(jí)下載量,為開發(fā)者提供了豐富資源和廣闊的創(chuàng)新平臺(tái)。
魔搭社區(qū)不僅開放了各種模型,還提供了約600個(gè)數(shù)據(jù)集,支持開發(fā)者進(jìn)行全面的模型訓(xùn)練和創(chuàng)新,超越了僅依賴現(xiàn)有數(shù)據(jù)的局限。 ? 社區(qū)通過提供大量免費(fèi)的GPU資源(累計(jì)3000萬GPU小時(shí))大幅降低了技術(shù)門檻,促進(jìn)了模型開發(fā)和應(yīng)用。 ? 盡管將模型應(yīng)用于行業(yè)數(shù)字化場(chǎng)景仍在探索階段,魔搭社區(qū)正不斷推進(jìn)模型的實(shí)際落地和廣泛應(yīng)用。
阿里云也在探索Agent體系作為一種解決軟件開發(fā)和現(xiàn)實(shí)世界不確定性問題的有效方法,旨在重構(gòu)數(shù)字化軟件開發(fā)的過程,而不僅僅是構(gòu)建一個(gè)個(gè)人助理。 ? 這種探索代表了對(duì)模型和智能體系更深層次的理解和運(yùn)用,旨在為不同行業(yè)提供更精準(zhǔn)、高效的數(shù)字化解決方案。 ? ?
阿里云對(duì)未來AI大模型的思考
在整合模型應(yīng)用于產(chǎn)業(yè)和行業(yè)時(shí),單一的基礎(chǔ)模型或行業(yè)模型并不足夠; ? 它們需要與決策問答、情感分析等多項(xiàng)智能能力相結(jié)合,并融合各種AI技術(shù)來構(gòu)建針對(duì)特定領(lǐng)域的解決方案。 ? 這包括模型訓(xùn)練、應(yīng)用、管理、評(píng)估及安全性提升,并可能涵蓋第三方技術(shù)的集成,以增強(qiáng)模型的決策和知識(shí)處理能力。 ? 因此,需要構(gòu)建一個(gè)全面的系統(tǒng),包含平臺(tái)和工具鏈,以便快速有效地將模型整合并應(yīng)用于實(shí)際行業(yè),覆蓋從數(shù)據(jù)處理到智能化應(yīng)用的全流程。
在實(shí)際場(chǎng)景中,單個(gè)大模型或者混合專家模型(MOE)往往不足以應(yīng)對(duì)復(fù)雜多變的需求。未來的發(fā)展方向在于整合多個(gè)模型、行業(yè)規(guī)則和系統(tǒng)接口,通過AI Agent來完成復(fù)雜的工作流。 ? AI Agent不僅僅是簡(jiǎn)單的助手或搜索工具,而是能夠解決實(shí)際行業(yè)問題的綜合系統(tǒng),集成了多年來積累的行業(yè)知識(shí)和小型模型,具備長(zhǎng)短期記憶和規(guī)劃能力。 ? 這種轉(zhuǎn)變可能導(dǎo)致數(shù)字化系統(tǒng)的重構(gòu),改變我們對(duì)軟件開發(fā)和運(yùn)維的理解。 ? 我們期待通過Agent的建設(shè),與行業(yè)同仁和伙伴一同探索和實(shí)現(xiàn)軟件行業(yè)的重構(gòu),為未來的模型開發(fā)和應(yīng)用帶來更大的價(jià)值和成果。 ?
OPPO:大模型在終端中的應(yīng)用場(chǎng)景與演進(jìn)
回顧手機(jī)的發(fā)展,從最初的功能機(jī)到當(dāng)前廣泛使用的智能手機(jī),可以看到技術(shù)的演進(jìn)是逐步的。 ? 目前,我們正站在智能手機(jī)向智慧手機(jī)過渡的門檻上,這是移動(dòng)通信技術(shù)每十年大約邁進(jìn)一代的自然結(jié)果,顯然我們目前處于5G時(shí)代,并且已經(jīng)開始探討5G之后的技術(shù),包括5GA和6G。
在這個(gè)發(fā)展過程中,移動(dòng)通信不僅改變了我們個(gè)人的工作和生活方式,還成為推動(dòng)經(jīng)濟(jì)發(fā)展的重要力量。 ? 向前看,隨著5G及其后續(xù)技術(shù)的不斷發(fā)展和成熟,智慧互聯(lián)時(shí)代的到來將使得在線會(huì)議、虛擬現(xiàn)實(shí)、在線娛樂等服務(wù)更加普遍,進(jìn)一步改善我們的溝通方式。
從1G的模擬信號(hào)到5G時(shí)代的豐富智慧終端,每一次技術(shù)的飛躍都極大地推動(dòng)了社會(huì)的進(jìn)步。 ? 我們有理由相信,隨著5G、6G等更先進(jìn)技術(shù)的發(fā)展,未來的終端設(shè)備將不僅僅是智能的,而是更加智慧化,為我們帶來更全面的互聯(lián)體驗(yàn)和生活方式。
通信場(chǎng)景下的AI大模型
回溯至1954年,人工智能的概念首次被提出,后續(xù)發(fā)展至機(jī)器學(xué)習(xí)讓機(jī)器具備自我編程和學(xué)習(xí)的能力,進(jìn)一步演變?yōu)榛谏疃?a href="http://m.1cnz.cn/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)。 ? 現(xiàn)在,生成式AI,如ChatGPT,作為這一領(lǐng)域的典型應(yīng)用,已廣泛應(yīng)用于多個(gè)場(chǎng)景。 ? 大模型作為深度學(xué)習(xí)的一個(gè)分支,已迅速成為AI研究的主流。 ? 它的應(yīng)用場(chǎng)景大致可分為六類,包括問答、情緒分析、信息提取、圖像命名、物體識(shí)別和跟隨指示等。 ? 隨著技術(shù)的發(fā)展,大模型在各領(lǐng)域的應(yīng)用將進(jìn)一步深入。
值得一提,大模型在終端設(shè)備上的應(yīng)用是一個(gè)正在探索的領(lǐng)域。這涉及到AI+C的概念,其中"C"代表連接、創(chuàng)造、理解和陪伴。 ? 例如,大模型可以用于改善老年人的手機(jī)使用體驗(yàn),通過自然語(yǔ)言理解幫助他們更好地使用智慧設(shè)備。 ? 此外,大模型還可應(yīng)用于旅行中的智慧連接體驗(yàn)、基于情景的服務(wù)提供,以及智慧辦公場(chǎng)景如自動(dòng)生成會(huì)議紀(jì)要等,極大地提升工作效率和生活質(zhì)量。 ? 四個(gè)C的概念如下:首先Connection(連接),大模型可以用于智慧終端的連接,提升旅行或日常生活中的體驗(yàn)。 ? 例如,與東南亞的初創(chuàng)廠商合作,使用大模型技術(shù)豐富旅行過程中的體驗(yàn)。 ? 其次,Creation(創(chuàng)造),大模型可以激發(fā)創(chuàng)意表達(dá),比如增強(qiáng)手機(jī)攝影能力,或者在拍攝長(zhǎng)城時(shí)自動(dòng)去除照片中不需要的路人,提升創(chuàng)意和個(gè)性化體驗(yàn)。 ? 第三,Comprehension(理解),大模型能夠基于情景理解提供服務(wù),如對(duì)于前往新加坡旅游的情景,提供針對(duì)性的服務(wù)和建議,從而使手機(jī)成為更智慧的旅伴。 ? 最后,Companion(陪伴),大模型可以作為智慧辦公的伙伴,自動(dòng)化處理諸如郵件回復(fù)、會(huì)議紀(jì)要等任務(wù),大幅提升工作效率和便捷性。 ? ?
智慧終端的AI應(yīng)用
根據(jù)A16Z對(duì)2024年消費(fèi)者技術(shù)的四大預(yù)測(cè),可以預(yù)見的第一大變化是語(yǔ)言優(yōu)先的交互方式。 ? 如果能夠?qū)崿F(xiàn)語(yǔ)言優(yōu)先,我們與智慧終端的交互體驗(yàn)將得到顯著提升,移動(dòng)設(shè)備的使用將變得更加高效和直觀。
第二個(gè)預(yù)測(cè)是更多適合垂直領(lǐng)域的小模型的出現(xiàn)。 ? 在某些應(yīng)用場(chǎng)景下,例如生成會(huì)議紀(jì)要,我們可能不需要龐大的全功能模型,而是小而專一的模型就能滿足需求,這體現(xiàn)了消費(fèi)者技術(shù)的演進(jìn)和AI的垂直應(yīng)用。
手機(jī)的初衷,是實(shí)現(xiàn)遠(yuǎn)程通信?,F(xiàn)在,我們看到的是智慧交流和跨語(yǔ)言交流的潛力,這預(yù)示著智慧手機(jī)不僅是通訊工具,也是連接世界的橋梁。 ? 目前手機(jī)在家庭教育、運(yùn)動(dòng)健康等方面也有應(yīng)用,如智能輔導(dǎo)作業(yè)、提供健康建議等,這些都可利用本地大模型,確保數(shù)據(jù)隱私和安全的同時(shí)提供有用的服務(wù)。
智慧手機(jī)的目標(biāo)是實(shí)現(xiàn)高效工作、便捷生活和個(gè)性表達(dá)。 ? 我們預(yù)見未來不僅是智慧手機(jī),還將進(jìn)入到泛載CPS的時(shí)代。 ? CPS即物理世界和虛擬世界的交互,預(yù)示著在這樣的世界中,交互將變得更智能,連接將變得更廣泛。 ? 在2030年的智慧生活中,"可信"和"泛載"將成為兩個(gè)關(guān)鍵詞。 ? 我們相信,隨著大模型的蓬勃發(fā)展,其在終端設(shè)備上的應(yīng)用將為我們的工作和生活帶來更多益處,提供更有趣、更豐富的體驗(yàn)。 ?
優(yōu)刻得:構(gòu)筑垂直大模型算力底座
優(yōu)刻得公司副總裁 文天樂 ? GPT大模型的技術(shù)起源于谷歌的翻譯技術(shù),隨后OpenAI等企業(yè)通過多年技術(shù)提升,才在2023年3月發(fā)布了具有顯著市場(chǎng)影響力的產(chǎn)品。 ? 目前,國(guó)內(nèi)已有超過100家企業(yè)跟進(jìn)這一技術(shù)路線,取得了諸多成果。
GPT3.5發(fā)布后展示的智能體驗(yàn)為企業(yè)應(yīng)用開辟了廣闊的想象空間。 ? 大模型的訓(xùn)練是一項(xiàng)智力密集和算力密集的活動(dòng),這通常意味著巨大的資金投入。 ? 基本模型的訓(xùn)練依賴于萬億級(jí)互聯(lián)網(wǎng)數(shù)據(jù)的積累和數(shù)千張GPU卡的規(guī)模,通常需要數(shù)月時(shí)間,再加上高質(zhì)量數(shù)據(jù)的整合和有監(jiān)督的強(qiáng)化學(xué)習(xí),才能實(shí)現(xiàn)相較于傳統(tǒng)人工智能的智能體驗(yàn)。
垂域大模型構(gòu)建的三種實(shí)踐路徑
對(duì)于企業(yè)而言,構(gòu)建自己的垂直大模型有幾種途徑。 ? 如果不考慮資金和人力成本,可以從頭開始訓(xùn)練大模型,使用自己的數(shù)據(jù)加上通用數(shù)據(jù)進(jìn)行充分訓(xùn)練,這樣可以獲得最佳效果和性能,但需要較大的資金投入。
企業(yè)構(gòu)建垂直大模型,第二種方式是利用開源模型或廠商提供的模型,并使用企業(yè)自己垂直領(lǐng)域的私有數(shù)據(jù)進(jìn)行微調(diào)訓(xùn)練。 ? 這種方法可以達(dá)到相對(duì)較好的效果,且訓(xùn)練成本會(huì)大幅降低,但推理成本依然較高。
第三種方式是企業(yè)在嘗試使用大模型時(shí),選擇不進(jìn)行訓(xùn)練或僅進(jìn)行微調(diào),而是將業(yè)務(wù)數(shù)據(jù)象量化后加入模型上下文中以進(jìn)行業(yè)務(wù)嘗試。 ? 這種方法考慮到了現(xiàn)實(shí)世界的應(yīng)用限制,即訓(xùn)練或微調(diào)的模型難以實(shí)時(shí)更新,因此通常結(jié)合第一種和第三種方法,或第二種和第三種方法來使用。 ? 考慮到業(yè)務(wù)數(shù)據(jù)的持續(xù)變化,重新訓(xùn)練模型是成本高昂的,尤其是在數(shù)據(jù)安全和隱私合規(guī)方面,所有企業(yè)、政府單位的數(shù)據(jù)都是在網(wǎng)絡(luò)安全法前提下處理,這也是垂直領(lǐng)域大模型應(yīng)用的一個(gè)關(guān)鍵問題。 ? ?
構(gòu)建垂類大模型需考慮的因素
在實(shí)際應(yīng)用時(shí),不僅要考慮訓(xùn)練和推理成本,還要注重?cái)?shù)據(jù)安全、合規(guī)和管理。 ? 因此,許多企業(yè)和機(jī)構(gòu)在嘗試大模型時(shí)也在探索國(guó)產(chǎn)化和線上化的私有部署方案,以確保數(shù)據(jù)安全和合規(guī)性。 ? 對(duì)于政府和其他受監(jiān)管行業(yè)而言,自主可控的問題也是不可忽視的。 ? 另外,算力密集型的大模型應(yīng)用還涉及高能耗問題,在訓(xùn)練過程中尤其明顯,且模型通常以月為單位迭代更新,這導(dǎo)致巨大的能源消耗。
我們?cè)跒跆m察布部署的云基地旨在為大數(shù)據(jù)和人工智能提供低成本的算力中心,以解決幾個(gè)關(guān)鍵領(lǐng)域的問題,包括數(shù)據(jù)的長(zhǎng)期存儲(chǔ)。 ? 特別是隨著2023年AI大模型的爆發(fā),對(duì)電力和算力的需求急劇增加,烏蘭察布的新型IDC能夠提供8-12千瓦的針對(duì)大模型訓(xùn)練的機(jī)柜定制服務(wù)。 ? 大模型訓(xùn)練完畢后,為了更好地接近用戶和應(yīng)用,推理過程可以轉(zhuǎn)移到沿海東部地區(qū)進(jìn)行。 ? 除了基礎(chǔ)的高性價(jià)比算力中心,大模型的訓(xùn)練、部署和應(yīng)用還需要軟件和運(yùn)維的基礎(chǔ)設(shè)施。 ? 這涉及到頻繁更新迭代部署的需求,包括基于私有云的適配各種GPU卡和硬件,以及國(guó)產(chǎn)化、信息安全信創(chuàng)化硬件和開源模型技術(shù)應(yīng)用到開源框架的適配。 ? ? ? 在為企業(yè)應(yīng)用提供大模型解決方案方面,我們已經(jīng)適配了多種硬件,并提供了一體化的方案。 ? 此外UCloud為人工智能和大數(shù)據(jù)提供了三大價(jià)值:一是東數(shù)西存,二是東數(shù)西算,三是東推西訓(xùn)。 ? 這些策略符合國(guó)家的東數(shù)西算戰(zhàn)略和雙碳戰(zhàn)略,利用西部地區(qū)相對(duì)較低的綜合能源成本和較低的平均氣溫,用戶可以在西部地區(qū)享受到高性價(jià)比的存儲(chǔ)和算力服務(wù)。 ?
華為:構(gòu)筑智能根基,共建AI新生態(tài)
華為上海戰(zhàn)略與Marketing部部長(zhǎng)?房思哲 ? 2022年11月份,ChatGPT引發(fā)了AI大模型的新熱潮。 ? 這一趨勢(shì)不僅是技術(shù)上的拐點(diǎn),將AI從傳統(tǒng)的感知、識(shí)別進(jìn)化至生成階段,也是應(yīng)用上的轉(zhuǎn)折,預(yù)示著AI將深入千行百業(yè)。
華為在這一趨勢(shì)中一直在構(gòu)建全棧能力,從2020年開始,我們就已經(jīng)認(rèn)識(shí)到大模型的潛力,并致力于AI的基礎(chǔ)軟硬件,以此深化我們的根基技術(shù),并推動(dòng)AI大模型的創(chuàng)新。 ? 我們從最底層的AI加速硬件做起,提供了端到端的產(chǎn)品線,包括異構(gòu)計(jì)算框架、高性能算子庫(kù)等基礎(chǔ)加速庫(kù)。 ? 基于這些硬件,我們建立了適合大模型的昇思人工智能框架,進(jìn)而構(gòu)建了昇騰應(yīng)用使能MindX,包含了深度學(xué)習(xí)、智能邊緣等各種優(yōu)選模型庫(kù)和行業(yè)SDK,使得各行業(yè)的應(yīng)用能在此基礎(chǔ)上孵化。
華為構(gòu)建AI大模型生態(tài)
談及大模型的根基,我們認(rèn)為大模型真正走進(jìn)千行百業(yè)不僅僅是技術(shù)問題,還需要社會(huì)化視角和生態(tài)化理念。 ? 根基只是起點(diǎn),我們需要的是一棵枝繁葉茂的樹,即生態(tài)。 ? 自2020年以來,在過去的3-4年里,華為在計(jì)算產(chǎn)業(yè)領(lǐng)域堅(jiān)持了“硬件開放、軟件來源、使能伙伴、發(fā)展人才”的16字方針的生態(tài)理念。 ? 接下來,我將分別介紹我們?cè)谶@四方面的進(jìn)展。 ?
硬件開放:華為推出了自己的人工智能芯片,并且開放硬件平臺(tái)給合作伙伴,允許他們基于華為的技術(shù)開發(fā)和打造各種產(chǎn)品,以滿足各行各業(yè)的需求。
軟件來源:在軟件方面,華為的昇思人工智能框架作為構(gòu)建AI大模型生態(tài)的核心,支持各種異構(gòu)芯片,并孵化各種行業(yè)應(yīng)用。
使能伙伴:華為依托生態(tài)創(chuàng)新中心,推進(jìn)本地合作伙伴的使能工作,包括生態(tài)發(fā)展、聯(lián)合創(chuàng)新、技術(shù)支持和人才培養(yǎng)。
發(fā)展人才:華為與國(guó)家教育部聯(lián)合開發(fā)課程教材,推廣至全國(guó)高校。通過舉辦人工智能創(chuàng)新大賽、師資培訓(xùn)等活動(dòng),華為旨在培養(yǎng)更多熟悉中國(guó)自主人工智能技術(shù)的學(xué)生和教師,為產(chǎn)學(xué)研轉(zhuǎn)化做好準(zhǔn)備。
華為AI大模型的上海探索
在上海,華為圍繞大模型應(yīng)用進(jìn)行了一系列合作和探索。 ? 舉幾個(gè)例子來說明我們?cè)谶@一領(lǐng)域的進(jìn)展。
在今年7月份的上海人工智能大會(huì)上,我們與上海飛機(jī)設(shè)計(jì)研究院共同發(fā)布了“東方·翼風(fēng)”,這是一款基于華為昇騰和昇思人工智能根技術(shù)共同孵化的三維機(jī)翼仿真流體和力學(xué)仿真大模型。 ? 這個(gè)大模型在上海飛機(jī)設(shè)計(jì)研究院實(shí)測(cè)后顯示,在保持與傳統(tǒng)工業(yè)仿真相媲美的精度的同時(shí),效率得到了大幅度提升,仿真時(shí)間消耗降低到原來的千分之一,為大飛機(jī)設(shè)計(jì)和制造帶來了明顯的助力。
此外,我們還與中科院上海藥物所、以及上海人工智能研究院、商湯、綜合裝備院、達(dá)觀數(shù)據(jù)等多家企業(yè)在上海展開了深度合作,圍繞各行各業(yè)想要孵化和打造的大模型場(chǎng)景進(jìn)行了多方位的探索和合作。 ? 我們的目標(biāo)是堅(jiān)信人工智能最終將走入千行百業(yè),通過這些合作項(xiàng)目,我們?cè)趯?shí)現(xiàn)這一目標(biāo)的路上邁出了堅(jiān)實(shí)的步伐。 ?
百度:AI原生應(yīng)用觸手可及
百度智能云產(chǎn)業(yè)發(fā)展部總經(jīng)理 段永華 ? ? 這一年,我們見證了大模型的從理論到實(shí)用的轉(zhuǎn)變。尤其內(nèi)容創(chuàng)作、互動(dòng)交流、教育和游戲等領(lǐng)域的應(yīng)用逐漸增多。 ? 然而,從10年或20年的長(zhǎng)周期來看,大模型目前仍處于起步階段。它的能力存在一定的局限性,在應(yīng)用落地層面,仍需要進(jìn)行相對(duì)復(fù)雜的工作。
百度智能云千帆大模型平臺(tái)的行業(yè)實(shí)踐
百度公司推出了千帆大模型平臺(tái),繼續(xù)在AI領(lǐng)域的應(yīng)用開發(fā)上深耕細(xì)作。 ? 百度從2019年起投入大模型研發(fā),并已形成從底層硬件到應(yīng)用層面的一站式服務(wù)能力。 ? 百度的整體系統(tǒng)包括數(shù)據(jù)處理、工具鏈、模型廣場(chǎng)到AI衍生應(yīng)用,能夠提供全方位的技術(shù)支持。
在深入討論大模型未來應(yīng)用前景時(shí),重要的是采取以終為始的思考方式。 ? 目前廣泛認(rèn)可的大模型應(yīng)用不單是一個(gè)單體模型,而是一個(gè)由基礎(chǔ)大模型、行業(yè)特定模型、場(chǎng)景化模型組成的體系。 ? 這個(gè)體系不僅包含云端、汽車端到手機(jī)端的大小不一的模型,所有這些模型都需要有機(jī)協(xié)同工作以支持整個(gè)企業(yè)應(yīng)用生態(tài)。
尤其是在城市管理和金融服務(wù)等大型企業(yè)應(yīng)用體系中,需要一個(gè)綜合的模型體系來發(fā)揮作用。 ? 為此,更需要一套系統(tǒng)化的體系和機(jī)制來管理、調(diào)度和協(xié)調(diào)這些模型。 ? 從統(tǒng)計(jì)數(shù)據(jù)來看,眾多客戶已在百度千帆平臺(tái)上開展服務(wù),表明各行各業(yè)正在開發(fā)并實(shí)施具體的商業(yè)化應(yīng)用。 ? 這標(biāo)志著行業(yè)處于初步階段,并預(yù)計(jì)將在2024年以更快速度向各行各業(yè)擴(kuò)散。
然而,在基于大模型的應(yīng)用開發(fā)中,也面臨著多重挑戰(zhàn)。 ? 模型的精細(xì)調(diào)整通常既困難又需要專業(yè)知識(shí),而大模型技術(shù)人才相對(duì)稀缺,這對(duì)許多企業(yè)尤其是小型企業(yè)來說是一個(gè)挑戰(zhàn)。 ? 同時(shí),有數(shù)百上千個(gè)大模型可供選擇時(shí),需要一套評(píng)估機(jī)制和方法來決定哪個(gè)模型最適合特定場(chǎng)景。
最近,百度升級(jí)其千帆平臺(tái),集成全球優(yōu)秀模型并優(yōu)化模型調(diào)整、評(píng)估及推理,以數(shù)據(jù)和安全增強(qiáng)提高企業(yè)效率并降低成本。 ? 這些改進(jìn)不僅加快模型到業(yè)務(wù)應(yīng)用的轉(zhuǎn)化,還使企業(yè)通過高效的在線訓(xùn)練方法更好地利用數(shù)據(jù),降低時(shí)間和成本。 ?
在大模型選擇和應(yīng)用方面,百度提供了綜合的評(píng)價(jià)體系,結(jié)合AI自動(dòng)打分和專家評(píng)分,以幫助企業(yè)和合作伙伴挑選最適合的模型。 ? 面對(duì)推理資源限制,百度支持無損推理加速和國(guó)內(nèi)信創(chuàng)硬件適配,確保模型部署和訓(xùn)練的順暢進(jìn)行。 ? 應(yīng)用開發(fā)領(lǐng)域內(nèi),百度利用大模型的AI原生應(yīng)用生成工具及完整開發(fā)套件,使技術(shù)人員可以進(jìn)行深度定制和開發(fā)。 ? 同時(shí),將傳統(tǒng)確定性模型能力與大模型能力整合,預(yù)見這些能力將融合進(jìn)未來的基礎(chǔ)大模型。 ? 作為大模型提供商,百度還融合其云計(jì)算服務(wù),提供全面的云產(chǎn)品和服務(wù),以支持更廣泛的應(yīng)用和發(fā)展。 ?
九章云極DataCanvas:AI原生企業(yè)的黎明
九章云極DataCanvas副總裁 于建崗 ? ? 當(dāng)前正處于一個(gè)以大算力為特征的時(shí)代,全球范圍內(nèi)積極推進(jìn)算力建設(shè),英偉達(dá)以其在GPU市場(chǎng)的主導(dǎo)地位和業(yè)務(wù)多元,凸顯了這一趨勢(shì)。 ? 同時(shí),2023年美國(guó)股市的顯著上漲和SaaS企業(yè)收入的下滑反映出新時(shí)代的復(fù)雜性與挑戰(zhàn)。 ? 這些現(xiàn)象促使深入思考AI2.0或新智能時(shí)代下,企業(yè)系統(tǒng)可能面臨的顛覆性變化、重塑以及軟件生態(tài)的智能化重構(gòu)。
AI大模型變革IT建設(shè)
過去20年,企業(yè)在收入的驅(qū)動(dòng)下大量投入IT建設(shè),為滿足公司的數(shù)字業(yè)務(wù)需求,中至大型企業(yè)廣泛建立龐大的IT部門。 ? 然而,這一過程也引入了諸多復(fù)雜性和協(xié)同問題。 ? 例如,過于龐大的IT部門導(dǎo)致組織內(nèi)協(xié)同困難,業(yè)務(wù)部門與IT部門之間的溝通不暢,以及采購(gòu)多樣化SaaS服務(wù)帶來的一致性問題。 ? 這些問題最終阻礙了業(yè)務(wù)創(chuàng)新的速度和效率。
特別是在大模型時(shí)代的到來,這種情況更加凸顯。 ? 大模型,廣義上不僅僅是大語(yǔ)言模型的對(duì)話體驗(yàn),也開始延申到例如蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、機(jī)器人等應(yīng)用領(lǐng)域。 ? 這些先進(jìn)的技術(shù)為人類社會(huì)帶來深遠(yuǎn)的影響。 ? 因此,企業(yè)在數(shù)字化建設(shè)上需要重新定義策略,以適應(yīng)這一新的大模型時(shí)代。 ? 而IT部門的角色和操作模式,特別是在收入驅(qū)動(dòng)和效益創(chuàng)造方面,也必須進(jìn)行相應(yīng)的調(diào)整和優(yōu)化,以保持企業(yè)的競(jìng)爭(zhēng)力和創(chuàng)新能力。
在大模型的時(shí)代中,企業(yè)正面臨如何利用大模型推動(dòng)業(yè)務(wù)發(fā)展和創(chuàng)造利潤(rùn)的挑戰(zhàn)。 ? 關(guān)鍵在于將業(yè)務(wù)部門置于核心,驅(qū)動(dòng)IT建設(shè)和智能化升級(jí),因?yàn)闃I(yè)務(wù)部門深諳資金來源、業(yè)務(wù)路徑和客戶需求。
新時(shí)代的解決方案:模型即服務(wù)
觀察軟件行業(yè)的發(fā)展歷程,從基礎(chǔ)設(shè)施即服務(wù)(IaaS)到平臺(tái)即服務(wù)(PaaS),再到軟件即服務(wù)(SaaS),雖然帶來了便利,但也引入了割裂、分割和碎片化的問題。 ? 業(yè)務(wù)需求通過繁瑣的部門流程,導(dǎo)致項(xiàng)目延誤,甚至半年后也難以啟動(dòng)。 ? SaaS服務(wù)盡管有其優(yōu)勢(shì),但也不可避免地帶來了傳統(tǒng)軟件固有的問題。
為了解決傳統(tǒng)軟件建設(shè)中人才價(jià)值未能充分發(fā)揮的問題,新時(shí)代的解決方案趨向于采用大模型和模型即服務(wù)(MaaS)來覆蓋企業(yè)全員,釋放各自的專長(zhǎng)和創(chuàng)意。 ? 這些技術(shù)允許員工利用自然語(yǔ)言處理和其他靈活、多樣的工具,輕松實(shí)現(xiàn)業(yè)務(wù)訴求,而不需要深入了解復(fù)雜的底層技術(shù)。 ? 這種方式極大地簡(jiǎn)化了創(chuàng)意到實(shí)現(xiàn)的過程,讓員工可以更直接地將想法轉(zhuǎn)化為具體成果。
以繪畫為例,過去可能需要通過畫家來理解并轉(zhuǎn)化一個(gè)人的想法,而現(xiàn)在,員工可以直接與工具交流,即刻得到所需的繪畫成果,極大地提高了效率和創(chuàng)造力的發(fā)揮。 ? 在這樣的環(huán)境下,企業(yè)可以更加聚焦于構(gòu)建平臺(tái),讓每個(gè)員工都能在這樣的平臺(tái)上最大限度地發(fā)揮其價(jià)值。
未來的企業(yè),將遠(yuǎn)離傳統(tǒng)的、重度依賴專業(yè)開發(fā)人員的軟件開發(fā)模式。 ? 曾經(jīng)的開發(fā)人員,或"碼農(nóng)",喜愛使用傳統(tǒng)的IDE工具和手寫代碼,但未來的趨勢(shì)是采用更加圖形化的界面,通過拖拽等直觀操作來解決問題,使得軟件開發(fā)和業(yè)務(wù)實(shí)現(xiàn)更加民主化和普及化。 ? 這不僅限于少數(shù)具有專業(yè)編程技能的人員,而是讓更多員工能夠參與到創(chuàng)新和解決方案的制定中來。
低代碼平臺(tái)革命性地簡(jiǎn)化了業(yè)務(wù)邏輯或軟件邏輯的實(shí)現(xiàn)方式。 ? 每個(gè)具有獨(dú)立思維的個(gè)體都能通過直觀的用戶界面(UI)與機(jī)器或大模型交互,用自然語(yǔ)言指示完成所需任務(wù)。 ? 這種基于簡(jiǎn)單UI和自然用戶界面(NUI)的互動(dòng)方式,大大降低了技術(shù)門檻,使得非技術(shù)人員也能輕松實(shí)現(xiàn)復(fù)雜的工作。
這種方式不僅限于日常業(yè)務(wù)邏輯的實(shí)現(xiàn),還可用于數(shù)據(jù)分析、代碼編寫和內(nèi)容創(chuàng)作等多個(gè)領(lǐng)域。 ? 例如,在做業(yè)務(wù)分析時(shí),用戶可以簡(jiǎn)單詢問與之前報(bào)告的變化或?qū)Ρ炔煌貐^(qū)的投資策略;在軟件開發(fā)方面,用戶可以直接請(qǐng)求生成一個(gè)特定規(guī)格的程序,如128×128方塊的掃雷游戲;在內(nèi)容創(chuàng)作方面,用戶甚至可以指導(dǎo)大模型創(chuàng)作一篇文章。 ? ?
九章云極DataCanvas的大模型實(shí)踐
九章云極DataCanvas近期推出了新一代大模型應(yīng)用產(chǎn)品-TableAgent,使得企業(yè)用戶能夠更直接、更高效地利用大數(shù)據(jù)和人工智能。 ? 例如,通過自動(dòng)識(shí)別數(shù)據(jù)表中的信息,系統(tǒng)能夠根據(jù)用戶的詢問,分析并呈現(xiàn)所需信息,如連鎖酒店各地入住率的比較、原因分析等。 ? 這種智能化平臺(tái)不僅提供結(jié)論,更能逐步引導(dǎo)用戶理解結(jié)果背后的邏輯和因素,實(shí)現(xiàn)深度洞察和決策支持。
這樣的發(fā)展,標(biāo)志著企業(yè)進(jìn)入了一個(gè)基于智能化平臺(tái)的新時(shí)代。
在此背景下,九章云極DataCanvas開源了基于Alaya基座的大模型,融合了豐富的行業(yè)知識(shí)和訓(xùn)練改進(jìn),通過自然語(yǔ)言界面實(shí)現(xiàn)數(shù)據(jù)比較、預(yù)測(cè)和修正,極大簡(jiǎn)化了用戶與數(shù)據(jù)的交互過程。 ? 在知識(shí)庫(kù)和問答系統(tǒng)普及的背景下,九章云極DataCanvas也致力于開發(fā)知識(shí)管理系統(tǒng)。我們預(yù)測(cè)未來公司流程可能被數(shù)字員工執(zhí)行,從而提升企業(yè)管理效率。 ? 該系統(tǒng)體現(xiàn)了從傳統(tǒng)到智能變化的六個(gè)階段,包括視頻分析等多功能應(yīng)用,用戶可以使用這些系統(tǒng)編寫不同語(yǔ)言的代碼,解決各種問題。 ? OpenAI正致力于打造一個(gè)類似蘋果生態(tài)的閉源IOS,通過ChatGPT等工具推動(dòng)API的廣泛使用,激發(fā)各種應(yīng)用程序(APP)的創(chuàng)造,以滿足用戶需求。 ? 在這個(gè)以大模型支撐的基礎(chǔ)上,三大領(lǐng)域被認(rèn)為具有巨大潛力: ? 第一、APP tooling(APP工具)。如何做出一系列不同用途、不同場(chǎng)景的APP tooling,滿足用戶的需求? ? 第二,基于大模型的computing framework和LLMOps (大模型訓(xùn)練、微調(diào)、推理和監(jiān)控框架)如何實(shí)現(xiàn)? ? 第三,GPU Clouding。OpenAI做IOS生態(tài),未來也一定會(huì)出現(xiàn)一個(gè)安卓生態(tài)系統(tǒng),基于GPU Clouding可以在上層生成豐富的application(應(yīng)用程序),進(jìn)而滿足不同用戶的需求。 ? 九章云極DataCanvas響應(yīng)這一趨勢(shì),不僅研發(fā)出具有“通識(shí)+產(chǎn)業(yè)”系列模型矩陣的DataCanvas Alaya九章元識(shí)大模型,并基于九章元識(shí)打造出靈活高效的Alaya Enterprise(九章云極DataCanvas企業(yè)自有AI架構(gòu)),通過Alaya GCP對(duì)AI資源的有效調(diào)度和管理,有力支撐企業(yè)在頂層自主化開發(fā)各類AI應(yīng)用,加速企業(yè)的數(shù)智化建設(shè)翻開嶄新篇章。
九章云極DataCanvas的愿景不僅局限于現(xiàn)有的技術(shù)和市場(chǎng)需求,而是希望通過AI和智能化鏈接(Alaya link),幫助企業(yè)用戶數(shù)字化建設(shè)推向新的階段。 ? 他們看到了企業(yè)流程的復(fù)雜性,并希望通過AI生成技術(shù)簡(jiǎn)化和自然處理各種業(yè)務(wù)需求,展望一個(gè)充滿信心和陽(yáng)光的未來。 ?
科大訊飛:星火大模型技術(shù)進(jìn)展及生態(tài)賦能
科大訊飛(上海)科技有限公司總經(jīng)理?丁瞳瞳 ? 自ChatGPT3.5去年發(fā)布以來,通用人工智能技術(shù)已經(jīng)深刻影響了我們的生活和工作。 ? 據(jù)高盛預(yù)測(cè),未來十年通用人工智能將帶來超過7萬億美元的產(chǎn)值。 ? 最近的戰(zhàn)略技術(shù)趨勢(shì)報(bào)告和中央經(jīng)濟(jì)工作會(huì)議也都強(qiáng)調(diào)了通用人工智能的重要性和其對(duì)生產(chǎn)、生活方式的影響。
AI大模型的四個(gè)能力
語(yǔ)言大模型和通用人工智能的發(fā)展一直是行業(yè)關(guān)注的焦點(diǎn),然而,真正理解通用人工智能、大語(yǔ)言模型及相關(guān)技術(shù)并非易事。 ? 在GPT3.5提出的48個(gè)核心任務(wù)基礎(chǔ)上,結(jié)合科大訊飛開放平臺(tái)超過400萬開發(fā)者提供的數(shù)據(jù)分析,人工智能模型的能力主要集中在四個(gè)方面:文本生成的語(yǔ)言模型、自然語(yǔ)言理解、知識(shí)問答以及智能涌現(xiàn)。 ? 語(yǔ)言模型的文本生成,這不僅僅是關(guān)于生成文本或語(yǔ)言,更是關(guān)于模擬人與人之間自然邊界的交互方式,實(shí)現(xiàn)人機(jī)對(duì)話。 ? 自然語(yǔ)言理解能力強(qiáng)化了機(jī)器對(duì)語(yǔ)言的深層理解,而GPT4的發(fā)布,結(jié)合現(xiàn)存知識(shí)庫(kù),取得了顯著的進(jìn)步。 ? 而智能涌現(xiàn)是一個(gè)特別引人注目的現(xiàn)象,其中重要的能力包括邏輯推理、數(shù)學(xué)能力及多模態(tài)交互能力。 ? 這意味著大模型不僅僅是在訓(xùn)練范圍內(nèi)進(jìn)行應(yīng)答,而是通過智能涌現(xiàn)的方式,像生物一樣呈現(xiàn)出智慧化的應(yīng)用。
尤其是今年下半年,隨著各個(gè)廠商對(duì)百模、千模的代碼能力發(fā)布和應(yīng)用的提升,大模型的智能涌現(xiàn)能力得到了巨大增強(qiáng)。
人工智能大模型正在顛覆傳統(tǒng)的工具和應(yīng)用開發(fā)方式。 ? 傳統(tǒng)上,基于數(shù)據(jù)經(jīng)濟(jì)和社會(huì)環(huán)境下的應(yīng)用開發(fā)需要?jiǎng)?chuàng)意、內(nèi)容、文案以及技術(shù)編程能力,或者雇傭?qū)I(yè)的編程團(tuán)隊(duì)。 ? 然而,現(xiàn)在,從創(chuàng)意產(chǎn)生到實(shí)際實(shí)踐,效率可能提高了10倍甚至100倍。 ? ?
自主可控發(fā)展的三個(gè)維度
在介紹了對(duì)大模型及通用智能時(shí)代的理解后,現(xiàn)轉(zhuǎn)向探討認(rèn)知大模型在中國(guó)自主安全可控發(fā)展的關(guān)鍵要素。所謂的自主安全可控,主要涵蓋三個(gè)維度。
在算法和技術(shù)的安全可控方面,盡管人工智能領(lǐng)域的關(guān)鍵論文多起源于美國(guó),但當(dāng)前在大模型相關(guān)算法的研究上,并沒有顯著差異。 ? 尤其是在堅(jiān)持人工智能核心技術(shù)的研究上,從文本到語(yǔ)音識(shí)別,科大訊飛已經(jīng)取得顯著的進(jìn)展。 ? 過去十年,從最初應(yīng)用深度神經(jīng)網(wǎng)絡(luò)到語(yǔ)音識(shí)別,再到最近對(duì)預(yù)訓(xùn)練模型的優(yōu)化,科大訊飛在提升算法效率和理解精度方面取得了顯著進(jìn)步,特別是在處理中文內(nèi)容方面。
在數(shù)據(jù)方面,大模型的效果很大程度上依賴于數(shù)據(jù)的質(zhì)量和量。 ? 對(duì)中文語(yǔ)料的訓(xùn)練尤其關(guān)鍵且充滿挑戰(zhàn),由于行業(yè)壁壘和安全保密的需求,高質(zhì)量中文數(shù)據(jù)相對(duì)稀缺。 ? 然而,隨著中國(guó)網(wǎng)絡(luò)空間安全協(xié)會(huì)發(fā)布首批中文基礎(chǔ)語(yǔ)料數(shù)據(jù)庫(kù),標(biāo)準(zhǔn)化、高質(zhì)量的中文語(yǔ)料庫(kù)將不斷擴(kuò)大,預(yù)計(jì)將極大促進(jìn)大模型技術(shù)研發(fā)應(yīng)用的生態(tài)。 ?
在算力方面,由于國(guó)際政策限制,獲取頂尖芯片變得更加困難,尤其是美國(guó)政府對(duì)半導(dǎo)體出口限制,進(jìn)一步加劇了這一挑戰(zhàn)。 ? 盡管存在困難,行業(yè)正在積極尋找解決路徑,確保人工智能技術(shù)的持續(xù)發(fā)展和創(chuàng)新。
科大訊飛自2019年被列入美國(guó)實(shí)體清單后,對(duì)外部高端計(jì)算資源的獲取受到限制。 ? 面對(duì)這一挑戰(zhàn),公司采取了積極應(yīng)對(duì)措施,首先是通過集中公有算力資源,發(fā)布了規(guī)模龐大的百億參數(shù)大模型。 ? 在此過程中,華為等國(guó)內(nèi)優(yōu)秀企業(yè)的合作發(fā)揮了關(guān)鍵作用,共同攻關(guān),推動(dòng)了大模型技術(shù)的發(fā)展。
AI大模型的場(chǎng)景應(yīng)用
當(dāng)前,以認(rèn)知大模型為代表的通用人工智能正深刻改變各行各業(yè),從教育、辦公、汽車、運(yùn)營(yíng)商、金融、工業(yè)、疫苗等各個(gè)方面,其影響力已無庸置疑。
科大訊飛認(rèn)為,認(rèn)知大模型的作用不僅僅局限于寫詩(shī)繪畫等創(chuàng)造性任務(wù),更多的是服務(wù)于生產(chǎn)力的提升。 ? 在應(yīng)用場(chǎng)景方面,大模型正幫助企業(yè)實(shí)現(xiàn)研究、生產(chǎn)、供應(yīng)、銷售、管理和服務(wù)等全流程的優(yōu)化。
在中國(guó),盡管頭部企業(yè)及科技公司能夠在通用人工智能方向進(jìn)行自研或合作發(fā)展,但眾多中小、小微企業(yè)亦迫切需要人工智能能力,卻往往缺乏相應(yīng)的技術(shù)鑒別力。
科大訊飛響應(yīng)這一需求,科大訊飛與工信部下屬專注于服務(wù)中小企業(yè)的互聯(lián)網(wǎng)平臺(tái)合作,幫助企業(yè)在研發(fā)、生產(chǎn)、供應(yīng)、銷售、服務(wù)等全流程中提高效率。 ? 同時(shí),將來可能70%的應(yīng)用程序?qū)⒂傻痛a或無代碼平臺(tái)構(gòu)建,科大訊飛響應(yīng)市場(chǎng)需求,于8月份推出了基于代碼的解決方案。 ? 通過內(nèi)部研發(fā)平臺(tái)的應(yīng)用,短短3個(gè)多月的時(shí)間內(nèi)提升了代碼的采納率和編譯效率,顯著提高開發(fā)效率和質(zhì)量。
科大訊飛的創(chuàng)新技術(shù)在提高編程效率和可達(dá)性方面有兩個(gè)顯著的貢獻(xiàn):
首先,該技術(shù)使得完全沒有代碼編譯基礎(chǔ)的人也能通過自然語(yǔ)言交互方式進(jìn)行代碼的編譯、生成、運(yùn)行以及修改。 ? 這極大降低了編程門檻,使得編程更加普及化,為非專業(yè)人士提供了進(jìn)入編程世界的便捷通道。
其次,對(duì)于已經(jīng)在進(jìn)行代碼開發(fā)的人員,科大訊飛的技術(shù)能夠顯著提高編程效率。 ? 通常程序員編寫代碼時(shí)往往忽略編寫注釋,這是一個(gè)普遍現(xiàn)象。 ? 然而,通過標(biāo)準(zhǔn)化的代碼分平臺(tái)編譯,不僅可以提高代碼的結(jié)構(gòu)穩(wěn)定性和快速生成性,而且在編碼質(zhì)量上可以達(dá)到中級(jí)程序員的水平。
科大訊飛結(jié)合大模型技術(shù)開發(fā)的C端產(chǎn)品在雙11期間顯示出顯著的應(yīng)用效果。 ? 公司賦能的七個(gè)產(chǎn)品品類,包括辦公本、錄音筆、學(xué)習(xí)機(jī)和智能耳機(jī)等,均搭載了訊飛星火大模型的能力。 ? 在京東、天貓等平臺(tái)的七個(gè)品類中獲得銷售冠軍,即使在整體雙11購(gòu)物環(huán)境下滑的情況下,仍實(shí)現(xiàn)了126%的銷售增長(zhǎng)。
最后總結(jié)三個(gè)觀點(diǎn):首先,在認(rèn)知智能大模型方面,中國(guó)不會(huì)受制于人,同時(shí)也理性認(rèn)識(shí)到與國(guó)際頂尖產(chǎn)品如ChatGPT4.0的差距,我們有信心在未來會(huì)迎頭趕上。 ? 其次,人工智能的發(fā)展需要產(chǎn)、學(xué)、研、用等多方面的合作,希望形成中國(guó)在通用人工智能領(lǐng)域的綜合比較優(yōu)勢(shì)。 ? 最后,建議國(guó)家在數(shù)據(jù)算力方面積極布局,鼓勵(lì)國(guó)家實(shí)驗(yàn)室、科研機(jī)構(gòu)、高水平大學(xué)和科技領(lǐng)軍企業(yè)在戰(zhàn)略發(fā)展過程中發(fā)揮更大作用。
審核編輯:黃飛
評(píng)論
查看更多