筆者按:2024,行業“GPT時刻”來臨。筆者看到,在匯聚人類頂尖智慧與精湛工藝的半導體行業,以智現未來為代表的工業軟件供應商,正發揮著其深耕行業數十年的數據積淀、技術儲備和深厚的一線服務經驗,以大模型為武器,盤活工廠數據資產,解決晶圓廠數據孤島困局、“經驗沉沒”和“人才密度不足”等諸多難題,開啟全新的工業智能時代。
ChatGPT引爆了新一輪的人工智能浪潮,各行各業都在翹首期盼擁有專屬于自己的“AI引擎”。正如每一次技術革新都將人類生產力推向新的高度一樣,在特定行業內,對垂直領域大模型的需求日益增長。與應用廣泛的通用大型語言模型不同,這些垂直領域的大模型專注于深入理解和處理特定領域的信息,提供更專業化的服務,并從根本上提升相關行業的生產力。同時,利用大模型洞察垂直領域更為復雜的隱藏邏輯,讓大模型涌現出像人一樣去使用工具甚至制造工具的能力,提供切實的生產力的改進,將是我們一同面臨的機遇和挑戰。
作為國內首家推出專在泛半導體領域應用的大語言模型的企業,深圳智現未來工業軟件有限公司無疑在行業變革中扮演著領軍角色。其發布的“靈犀”大語言模型及其在泛半導體行業應用案例不僅展示了該技術在提升芯片制造效率、降低成本以及增強產品質量方面的巨大潛力,可以預見,其將為晶圓廠的智能制造提供強大助力。
半導體晶圓廠:數據資產的困局與大模型破局之道
半導體制造代表了當前工業的最高水準,其工藝極其復雜,往往涉及數千個步驟,在生產中會產生海量的數據;而單個工程師一般只具備某個小領域的專業知識,服務于不同的工程師的各種應用應需求而生,造成了數據割裂的現象;數據分析起來耗時費力,且高度依賴工程師的個人經驗。
以下是現階段以晶圓廠為代表的高端制造業面臨的典型問題:
?管中窺豹,問題處理效率低下:囿于個人經驗和精力的限制,工程師們雖精于一隅,卻難以窮盡全域。面對突發問題,工程師可依據過往經驗對知識能力范圍內的特定問題作出迅速響應,當超出自身經驗范疇時,只能從頭摸索,耗費大量時間和精力。只有當一線工程師處理不了的問題才會升級到?線,這無疑減緩了生產的步伐,影響整體效率。
?數據孤島,知識壁壘阻礙協作:單個工程師可能只負責產線的一小段,不同工藝段的數據互不貫通,難以理解其工藝段的數據結構和具體含義,處理問題就需要跨領域協調(Inter-Module Meeting),甚?反復多次,溝通成本較高,延誤問題解決。
?經驗沉淀和知識傳承成難題:海量生產數據是晶圓廠寶貴的“資產”。然而,問題往往是在發生后才被追溯,大量的經驗和知識散落在各個角落,難以積累沉淀。而且即使有意去調用這些數據,?檔、報告難以檢索,更難以借鑒,利?率低,造成“經驗沉沒”。
?重復操作易出錯,自動化機制亟需建立:晶圓廠生產過程中存在大量需要人工決策的重復性工作,不僅浪費了寶貴的人力資源,也容易導致人為失誤,降低生產質量。
為了應對這些挑戰,一方面,不少晶圓廠開始著手打造大數據底座,實現數據集成,雖然減少了數據對齊時間,卻仍未能擺脫對工程師個體經驗的依賴。
另一方面,雖然產業也在不斷地培養新人才。但是,新入行的初級工程師需要較長的訓練和學習時間,難以快速積累經驗。案例研究Case study和培訓手段匱乏、導師人手不足等問題,也制約了人才的培養速度和質量。此外,過往案例檢索困難,導致知識難以有效傳承,也成為人才培養的一大難題。更令人擔憂的是,好不容易培養出來的人才如果流失,寶貴的經驗也隨之付諸東流。
大語言模型的出現,為晶圓廠的困境帶來了破局的曙光。大語言模型一個已經驗證的能力是把非結構化的數據結構化,一方面能夠有效的把歷史上積累的數據資產盤活,另一方面通過整合結構化和非結構化數據形成對工廠全貌的認識。此外,大語言模型還具備強大的推理能力,特別是能夠從歷史分析、操作和報告中學習并進行邏輯推理。通過對大量數據的深度學習,大模型能夠打通信息孤島,實現全局的智能分析。同時,大模型還有希望從大量的數據和積累中,洞察出更為復雜的高階關聯,實現智能涌現的價值。
“種子”選手智現未來:用大模型打造半導體工廠的智能數字底座
面對全面的挑戰,?模型極有可能是實現下?代的智能制造的最佳路徑。通過大模型的思考鏈(chain of thought)和驗證鏈(chain of verification),進而結合多個專家系統,將不同的大模型串聯起來,形成價值鏈(chain of value),使大模型能夠從“被動調用”轉變為“主動發現問題”,通過“舉一反三”,創造涌現性價值,為制造業帶來革命性的變革。
然而,并不是簡單的遷移就可以讓大模型發揮理想的價值,想要參與到晶圓廠紛繁復雜的工藝制造中,大語言模型需要行業大量高質量的語料結合經驗的積淀來完成訓練,同時需要對行業充分的理解并贏得客戶的信任。行業大模型對數據、算法、算力皆有要求,需要深厚工程化思維的不斷積累,業內鮮少有企業能夠具備轉化的所有條件。在擁有并理解大量專業數據這方面,只有占據半導體數據高地、深耕工程智能領域幾十年的寥寥數家公司,可以生成并系統化、規范化地積累了大量的高質量語料。
智現未來在這場已經到來的技術革新浪潮中,就像是“天生”的種子選手一樣,具備發展泛半導體行業垂直大模型的所有先天條件。智現未來脫胎于工程智能全球“三大家”之一的BISTel,其在工程智能領域深耕20多年,具備深厚的經驗、清晰的行業認知、技術儲備及大量標桿客戶的成功案例,積累了豐富的生產數據和工藝數據。這些寶貴的數據財富、全面的行業理解、構建高質量模型的人才積累,為智現未來打造國內首個半導體垂直類大語言模型——“靈犀”,奠定了堅實的基礎。
以下是智現未來“靈犀”大語言模型的價值實現路徑:
①在當前市場中,眾多基礎大型語言模型(LLM)如GPT 4、Llama 3等紛紛涌現,它們具備基礎的讀寫能力,類似于知識面廣泛的“高中生”。盡管對半導體這類專業領域有所涉獵,但理解尚淺。如何對這些基礎大模型進行測評?一方面需要AI專家,另一方面,需要將其接入成熟的半導體行業應用軟件做基準測試(benchmark)。
②為進一步提升,模型需深入學習專業知識,仿佛“高中生”進入大學專攻半導體專業,通過吸收半導體領域公有域的知識和資料,逐步成長為知識豐富的“半導體專業大學生”。語料選擇和如何教授成為這一階段的關鍵點。
③接下來,由具備數十年實戰經驗和行業積累的資深專家“智現未來”擔任導師,結合智現未來20余年積累的私有數據(包括設備和工藝數據、文檔、模型、算法、代碼等等)深化訓練。
④經過上述的培育,模型蛻變為工程智能領域的“研究生”,這就是智現未來的“靈犀”大語言模型。
⑤進一步,“靈犀”大模型被放入客戶的晶圓廠實地環境中,采用智現未來提供的專業工具鏈和流程,由工廠和智現未來的專家共同指導,經過二次訓練和客戶私有數據的定制化學習,錘煉成為該領域的技術專家。
⑥作為工廠的技術專家,大模型能夠提供智能缺陷檢測、智能報告生成、智能故障分析以及客戶專屬的行業服務。
這樣的一個大模型集合了所有?程師的視?和經驗,既懂設備,又懂工藝、制造、良率分析,涌現出超越個體之和的分析和解決問題的能?,成為生產制造過程的“超級大腦”。
此外,區別于人類,AI可以實現24小時不間斷運行且錯誤率極低。AI更大的優勢在于,它不僅能處理常規數據,還能洞察更高維的關聯,提取到?看不到的信息,實現從“類人(like human)”到“超越人類(beyond human)”的智能飛躍。例如:為了適應人的感知,以往的wafer map通過晶圓網格配合顏色可以展現芯片的三個維度(x, y, Good/NG),但對于每個芯片(die)來說,除了基本的良品(good)與不良品(NG)分類外,其下還隱藏著更多維度的測試結果,如電性特性等關鍵參數,而AI能夠直接處理這些高維的數據。
“靈犀”大語言模型:半導體“智造”利器已光芒初現
盡管大語言模型在行業應用才處于探索階段,但是“靈犀”已經在有限的探索范圍內閃現了其可能照亮未來的光芒。基于前期長期的積累,僅僅不到半年的驗證及探索,“靈犀”大模型已經在缺陷圖像識別、Wafer Map失效自動分類、FDC設備異常監控、良率分析預測、設備預防維護、智能專家推理、群體智能知識中臺等多個領域都已展現出巨大潛力,迸發“靈犀”之光。
1.案例一:多模態缺陷識別
半導體生產中存在大量缺陷分析需求,傳統方法依賴人工標注和分析,需要大量(可能是上萬個)缺陷樣本的積累才能建立出一個缺陷識別機制,且依賴樣本照?與標記的質量,這不僅耗時且易出錯。如何有效整合多維度數據以提升分析的深度和積累經驗,從而提高缺陷分析的效率和準確性,成為行業面臨的一個重大挑戰。
基于“靈犀”大語言模型的多模智能缺陷改良系統,通過實時監控生產線,能夠結合圖?特征、產線數據、?本經驗等多模態的數據,構建復合矩陣的多元分析,實現自動識別缺陷,快速準確分類,并自主生成缺陷報告和根因分析。該方案僅需要以前2%的數據即可做到更準確的識別,將訓練的樣本數量減少2個數量級。這不僅大幅提升了效率,還減少了樣本標錯的機率。原來數百工程師一年的工作量,“靈犀”大模型只需要2~3個月就可以完成,分類準確率更是提升超過10%。
“靈犀”之光的閃現點:
?“靈犀"的多模態能力突破了單個工程師對單一知識領域的局限,打破了"管中窺豹"的狹窄視角,實現了對復雜工程問題的全面理解和深入洞察,真正做到知識集合、共享的群體智能。
?借助AI技術,“靈犀”大語言模型幫助工程師實現了對數據的即時分析,極大減少了人工干預,顯著提高了報告的準確性與及時性。
?至關重要的是,所有分析過程和結果都被有效整合并沉淀至大語言模型之中,為模型的持續學習與訓練提供了寶貴資源,確保了智能缺陷改良能力的不斷演進與升級。
2.案例二:良率分析應用(Yield Analysis)
良率(Yield)是半導體產業的終極挑戰,芯片的良率也直接關乎著芯片制造的成本,因此良率分析對于半導體制造商來說極為關鍵。通過系統分析不良品和確定造成不良的原因,可以采取措施提高良率,進而降低成本。
目前市場上廣泛使用的如YMS良率管理系統、DMS缺陷管理系統等良率分析平臺,均屬于管理系統。這些系統在設計時面臨一定挑戰,由于良率分析方法因人而異,對自由度有極高要求,使得軟件設計和操作起來都很復雜,也很難滿足高級分析需求,且常常無法有效關聯原始追蹤數據(Raw Trace Data)。
基于“靈犀”大語言模型的良率分析系統能夠根據歷史和實時數據自動建模,提供“千人千面”的分析工作臺,增強數據探索自由度。“靈犀”極大地簡化了交互流程,加快了問題解決速度。
不同于其他YMS良率管理系統,搭載“靈犀”的良率分析系統(YAS)融合了半導體領域資深AI工程師的智慧與能力,隨時在線的Copilot“老師傅當助理”,可快速調用數據、自動執行建模與分析,找到影響良率的根因,并提供優化建議,形成報告,幫助工廠快速做出更加精準的生產決策,大幅提升了生產管理的智能化水平。
除此之外,“靈犀”還在多個領域能夠創造令人驚嘆的價值。例如,“靈犀”大模型通過自動化建模和分析,使設備預測性維護從被動轉為主動,優化維護計劃,讓設備維護更加精準,既避免出現安全生產事故,又避免“過度”維護,從而提高半導體晶圓廠的生產效率并減少經濟損失。
可以預見,“靈犀”大模型的應用,將為半導體行業帶來一場深刻的變革,推動半導體制造業智能化升級,提高生產效率、降低生產成本、提升產品質量,釋放巨大的生產潛力,為行業發展注入新的活力。
展望:大模型碰撞工程智能,涌現高質量新質生產力的無限可能
目前,業界普遍認為大模型的能力在于其對復雜符號關系的把握以及對世界高階相關性的認知,這些能力正在超越人類的認知極限。特別是在智能制造這一領域,大模型通過分析和處理大量數據,能夠識別現階段人類工程師難以察覺的模式和關聯,從而優化生產流程,提升制造效率和質量。這種超越人類的認知能力,不僅加速了智能制造的發展,也必將會對其他相關領域產生深遠的影響。
工程智能作為高階智能制造技術,面對的是極復雜、高標準、擁有大量樣本數據和經驗積累的場景,而這些都作為大量的優質數據樣本,沉淀在代碼和文檔中。大模型與工程智能的相遇,更像是各自準備,相向而行的不期而遇。
可以預見的是,以智現未來為代表的工程智能解決方案供應商,將會用數十年來構建的成熟可靠的產品體系,在大模型的深度融合和加持下,實現革命性的全面煥新。大模型作為中間能力,必將深度滲透并強化了工程智能系統中數據搜集、智能監測、智能分析、智能預測、智能決策等各個關鍵環節。大模型與工程智能的碰撞,是如虎添翼的優勢相乘,天然的優質土壤遇到基因優良的種子,一定可以結出豐碩的成果。
“GPT時刻”已經到來。根據預測未來3年,AI在整個制造業的投入規模和產出價值都將會成倍增長。像”靈犀“這樣的工業大模型的崛起,正悄然開啟半導體工廠的全新篇章。在這個新的章節中,所有的數據、操作都必須接入大模型,所有的決策都將以大模型為基礎;每個?程師都需要?組?程師助理,以便集中精力解決更重要的問題,提升產線效率;每個??都需要?個專屬于自己的專家系統,將分散的知識經驗形成資產沉淀,打造可泛化的群體智能,靜待智能涌現,為“智造”創造無限可能。
審核編輯 黃宇
-
半導體
+關注
關注
334文章
27527瀏覽量
219996 -
晶圓
+關注
關注
52文章
4936瀏覽量
128120 -
AI
+關注
關注
87文章
31158瀏覽量
269524 -
GPT
+關注
關注
0文章
354瀏覽量
15442 -
大模型
+關注
關注
2文章
2491瀏覽量
2883
發布評論請先 登錄
相關推薦
評論