沒有人能預見未來,但我們可以因循常識,去捕捉技術創新演進的節奏韻腳。
2023年最火的風口莫過于大模型。
2022年底,由美國初創企業OpenAI開發的聊天應用ChatGPT引爆市場,生成式AI成為科技市場熱點,ChatGPT背后是深度學習大模型,其理解和生成文字的能力超過以往AI產品。
全球主要云計算公司加入其中,爭奪算力、下場開發和銷售大模型,云計算市場迎來新一輪競爭熱潮,覆蓋AI計算所需的算力、算法、數據各層面。
如今,大模型這把火已經從自然語言燒到千行百業。相較于花力氣讓大模型更流暢地應對各種刁鉆問題,MaaS正成為AI大模型比拼的重點。
企業大模型落地挑戰重重
目前,行業大模型跟產業的結合,還處在比較早期的階段。
一方面,大模型技術的發展日新月異,無論是算力層面、模型小型化、數據標注、數據訓練還是開元模型層面,都在快速變化的過程中;另一方面,整個產業對大模型能力和應用方式的理解,也還在初級階段。
通常來說,一家企業想要搭建行業大模型,有幾個環節必不可少:挑選適合自己使用場景的模型,使用云廠商專業工具搭建一體化模型服務,梳理測試用例、建立服務質量評估流程,確保數據及模型應用安全、合規和可控。
而企業想要在實際業務場景中部署使用大模型服務,則面臨著成本、數據和安全等諸多落地難題。
首先,計算資源少。大模型需要比較高的計算資源和存儲資源。與一般服務器相比,GPU服務器的穩定性比較低,大模型訓練需要的GPU經常達到上千張卡。
同時,在訓練集群里,連接幾百臺GPU服務器所需要的網絡速度極高,一旦網絡產生擁堵,就會影響訓練效率。所以很多算法團隊傾向于選擇專業的云服務廠商進行云服務運維支持。
其次,數據質量比較差。
搭建大模型本身就是一項成本極高的系統工程,需要大量的高質量數據進行訓練和優化,還需要經過清洗和預處理,以消除噪聲、填補缺失值并確保數據質量。如果導入的數據質量低,那訓練出來的模型也會有問題。
第三,投入成本高,這也是大模型落地面臨的主要困難之一。大模型需要投入大量的數據、計算資源、專業技術和時間來訓練、調試、優化并部署實施。
第四,專業經驗少。大模型的開發落地需要比較多的技術和人力資源,部署大模型需要考慮到計算資源、網絡帶寬和安全性等多方面問題,很多企業比較缺乏相關技術和人才,導致大模型無法順利落地應用。
MaaS重塑云計算服務范式
MaaS,即“Model as a Service,模型即服務”,是通過云服務將數據處理和機器學習模型的功能集成到現有業務中,為企業提供智能化、自動化的解決方案。MaaS的大模型可以通過從海量的、多類型的場景數據中學習,總結學習不同場景業務下的通用特征和規則,成為具有泛化能力的模型底座。
數據集倉庫、模型倉庫、算力平臺通過提供零門檻模型體驗、快捷的模型使用、完整鏈路的模型定制和云端模型部署向每個人開放。
從形式上看,MaaS是典型的云智一體。所謂“云智一體”,是三年前百度智能云在戰略發布中提出的理念,通過云計算和人工智能融合創新,把算力、框架、模型,場景應用打造成標準化產品,進而降低企業獲取和使用人工智能的門檻。
百度、阿里乃至更多云計算企業,如今將目光投向“云智一體”,印證了AI應用能力是云計算產業基礎設施成熟后的核心能力。這種能力更在于“智”的水平,在智能基礎設施之上的通用型AI產品能力。
從云計算服務范式看,大模型的迭代升級也重塑了傳統的云計算服務。以往,云計算更專注算力能力,服務模型集中在IaaS、PaaS、SaaS三層;如今,云計算在大模型驅動下具備了更強的集成能力,在算力、算法和應用層中嵌入大模型,進而強化云計算的“智”,以智能底座集成應用并統一對外輸出,實現場景端的生產力解放。
雖然MaaS目前針對的場景還處在基于自然語言處理(NLP)的領域,但是隨著技術的迭代,遵循其核心思想進行延展,廣義的MaaS恰恰有可能針對上述的難點,發揮重要作用。
在數據清洗和整合方面,MaaS可以幫助企業將來自不同系統和部門的數據進行清洗、整合和轉換,形成完整、可靠的數據集。
通過將來自不同部門的數據整合到一個數據倉庫中,MaaS可以確保數據的完整性和一致性。此外,MaaS還可以對海量數據進行自動化處理和分析,快速發現業務的異常情況和趨勢變化。
在數據分析和挖掘方面,MaaS可以對業務數據進行分析和挖掘,從中發現業務之間的關聯和規律,為企業提供更全面、準確的財務數據,并支持更好的決策和管理。
例如,當企業需要進行銷售訂單和庫存的分析時,MaaS需要輸入銷售訂單和庫存數據,這些數據可以來自企業的不同部門,比如銷售部門、庫存管理部門等。之后,MaaS會使用NLP技術自動化處理和分析這些數據,例如,識別和分類訂單的狀態、計算庫存周轉率等。
在數據處理的過程中,MaaS會快速發現業務的異常情況和趨勢變化,如訂單的滯銷和庫存的積壓等。
在智能化決策支持方面,MaaS可以為企業提供智能化的決策支持,通過機器學習模型預測未來的業務走勢和財務狀況,幫助企業做出更明智的決策。
MaaS會將分析結果轉化為易于理解和操作的報告和圖表,并提供定制化的業務解決方案。企業可以根據自身的業務需求和數據特點,選擇不同的機器學習模型和數據處理算法,以實現更智能化、個性化的業務流程。
MaaS市場競爭激烈
今年3月,百度率先推出文心一言大模型。百度CTO王海峰在中關村論壇期間表示,未來MaaS將成為云計算的主流商業模式,各類應用將基于大模型來開發,每個行業需要打造行業自己的大模型。大模型將與實體經濟深度融合,賦能千行百業,加速產業轉型升級,促進經濟高質量發展。
4月,阿里也推出了自己的通義千問大模型。時任阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇當時宣布,阿里巴巴所有產品未來都將接入通義千問大模型,進行全面改造。
阿里云CTO周靖人在今年5月的中關村會議上也提出,MaaS概念正在被廣泛接受,模型會作為業務和開發系統開發的重要生產元素。
這背后,AI一直背負著商業化這個難題。而B端市場近年來越發成為互聯網大廠的增量市場。
5月,騰訊發布的今年一季度財報顯示,當期其營收1500億元,同比增長11%;凈利潤258.4億元,同比增長10%。
凈利潤(Non-IFRS)325.38億元,同比增長27%。其中,身處B端市場的金融科技與企業服務板塊今年一季度營收同比增長14%達到487億元。據記者了解,該板塊已連續八個季度在騰訊總收入中占比超過30%。
而此前各家云業務紛紛下調價格,不僅體現了B端業務的激烈競爭,在某種程度上也提現了大模型的開發對B端業務成本的影響。
張勇曾表示,未來希望在阿里云上訓練一個模型的成本,能夠降低到現在的十分之一,甚至是百分之一。即使是中小企業,也能通過云平臺獲得AI大模型的能力和服務。
目前,行業大模型的前景有賴于行業大模型的技術成熟度,大家的競爭點主要集中在行業數據源。行業不同,所形成的語料不同。廠商所在的優勢行業,能夠形成訓練AI所需要的語料庫,越完備的語料,意味著越有優勢的AI產品。
同時,在大模型這一賽道上,從來就不是“后來者居上”。只有越豐富的供應,才能帶來越多的客戶;更多的客戶,才能在數據反饋中幫助精進和迭代,從而產生“飛輪效應”。
如長期在機器學習模型有積累的社區Hugging Face,就基于社區已有的開源模型推出了HuggingGPT,以一個大模型調用多個AI模型的方式,迅速將長期積累的模型生態轉變成更大的行業影響力。
這個階段開始,生態的作用就會顯現。而這也是為什么構建一個生態,決定了MaaS的高度。但無論處在哪個階段,最核心的是,大模型依然是一個成本高昂的新事物。
不論在研發、迭代還是使用階段,大模型都是一個消耗資源巨大、使用成本也不低的“奢侈品”。
所以只有構建一個生態,才能真正通過規模效應降低成本、幫助迭代精進,最后實現大模型和MaaS真正的商業可持續,這更需要生態。所以真正重視大模型,真正重視MaaS的玩家,一定會不遺余力打造生態。
在MaaS新范式的游戲規則中,大模型決定了一開始走多快,生態決定了最后走多遠。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
云計算
+關注
關注
39文章
7852瀏覽量
137683 -
大模型
+關注
關注
2文章
2524瀏覽量
2994
發布評論請先 登錄
相關推薦
評論