色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

技術干貨 | AI浪潮下的光模塊可靠性

廣電計量 ? 2024-08-13 09:37 ? 次閱讀

人工智能AI)技術的快速發展對數據處理和傳輸提出了前所未有的挑戰。在深度學習、自然語言處理和計算機視覺等AI應用中,訓練和學習需要巨大的數據量傳遞和交互。2023年GPT-4模型所需訓練的參數量有1.8萬億,要完成這么大的數據量的運算,需要上萬個GPU同時工作。如此龐大的數據傳輸對于傳統銅纜而言是個巨大的挑戰,因此光模塊在數據傳輸中發揮著非常重要的作用。光模塊在AI和數據中心中負責數據的轉換,將1bit的電信號轉為光信號,把1bit的光信號轉為電信號。400G模塊,能轉換0.4T bit,800G光模塊,轉換0.8T bit,以GPT-4的訓練參數計算,完成一次計算所需要調用的光模塊數量就可能多達數萬。而隨著大模型的不斷進化和訓練參數的急速增加,對光模塊的需求量只多不少。

AI場景對光模塊的故障率要求

因為訓練數據量大,所以AI場景架構采用GPU運算更合適,這與傳統的數據中心的服務器類型有所區別。CPU是串行運算,通常有較少的核心(一般在2到32個核心之間),每個核心都非常強大,適合執行復雜的單線程任務,適用于傳統數據中心的串行結構。GPU是并行運算,擁有大量的核心(數百到數千個),每個核心較簡單,適合執行大量的并行任務,因此更適用數據量超大的AI場景。傳統的數據中心結構,是基于串行方式的,對時延的要求雖然很看重,但不像AI場景中對時延的苛刻要求。并行任務的結果就是成千上萬的并行數據要傳輸,整個數據的完成是以時延最大,最慢的那個bit為準的。其他再快也不行。

光模塊的故障率比傳統的電學芯片的要高很多很多,光模塊選擇熱插拔,也是因為光學器件的故障率很高,用熱插拔方便維修和更換。傳統的數據中心,光模塊對于故障率的要求比傳統通信更寬松,少量的故障并不會影響到整體的運行傳輸,所以遇到光模塊故障后及時更換就可以了。但對于基于AI的這種場景就不適用,大數據量的并行計算,而且不是實時保存的。如果有任何一個數據傳錯了,那么整體要重來,重新計算一遍。中國移動也曾提到當前人工智能中主流萬卡集群的GPU網絡每月最大會發生上千次閃斷,其中34%是與網絡相關。其中每年大概會有60次左右的光模塊故障導致的訓練中斷,而且故障定位也通常會需要數天到數十天之久。所以光模塊失效率高會導致大的丟包率和維護成本,從而給設備服務商帶來巨大的運營壓力。因此在AI場景中對光模塊可靠性的要求非??量獭?/p>AI大模型中丟包率導致訓練所需時間增長

圖1 AI大模型中丟包率導致訓練所需時間增長

AI場景光模塊的可靠性問題

綜上所述,對于傳統數據中心而言,一般會把可靠性的要求放寬,是因為通常在實際部署中,數據中心的樹形網絡結構是配置了冗余的,從而這此前提下放寬了對模塊故障率的要求。冗余越大,有更多的節點可以實現業務傳輸,光模塊的失效率略大一些是不影響整體通信的。因此傳統數據中心的光模塊,有很長一段時間,是非氣密封裝,因為非氣密封裝,故障率會高一些,但成本也會下降很多。

但AI大模型與傳統數據中心不同,AI場景所采用的并行計算,如上一節所講,對故障零容忍,對光模塊的穩定性要求極高。因此,非氣密封裝已經不能滿足可靠性要求了,各家廠商又開始使用氣密封裝降低失效率。光模塊中產生的可靠性問題主要是光器件失效引起的,包括激光器、探測器和其他元器件,其中激光器失效最高。阿里曾經做過統計,在光模塊眾多的元器件中,超過90%以上的失效是與激光器相關的。

wKgaoma6uNSAfvtSAABrvbSmEgA777.png

圖2 阿里統計的光模塊各元件失效占比統計

光模塊自身已經面臨非常高的可靠性風險了,然而光模塊從400G、800G發展到1.6T,模塊功耗隨著芯片功率、射頻損耗,DSP補償等迅速增加,功耗增加提高了光模塊實際的工作溫度,同樣也使得光模塊壽命急速縮短,可靠性急劇下降。光模塊溫度升高,激光器芯片的發光效率降低,廢熱更大,也會帶來可靠性風險。

功耗增加機柜溫度升高可靠性下降

圖3 功耗增加機柜溫度升高可靠性下降

現行可供參考的可靠性標準如GR-468,一方面從標準提出到現在已有二十余年時間,另一方面該標準是作為通信用光電子器件的可靠性標準,對AI場景并不適用。近年來,大模型使用方以及光模塊廠商都對光器件提出了更嚴格的可靠性要求。在2023年CIOE上,阿里提出了自身對于光芯片可靠性的認證要求,要求光模塊FIT小于125,即有1000個光模塊在工作,5年后,只允許5個出現故障。同時也對激活能Ea,和n做了限定,限定激活能 Ea=0.35,n=0。老化公式的n,是加速壓力的指數,可以是電流,溫度,或者濕度,關鍵取決于芯片設計里哪個因素的影響最大。以電流為例,如果n按照3取值,老化電流是工作電流的1.5倍,得出激光器工作壽命是10年。如果相同條件下n取為0,那么壽命就只有3年了。Ea和n都取最小值,會得到很小的加速系數,最終會計算出很大的FIT值,這樣一來對可靠性的要求就更為苛刻了。

wKgZoma6uNSAeTRlAAA_SKky0L0632.png

圖4 可靠性中加速系數計算公式

如何提升光模塊可靠性

光模塊的可靠性重點關注的就是激光器。激光器從發光原理、制造工藝來看,降低優化的程度有限,并不能完全達到電芯片的尺度,近期內也不會有顛覆性的技術改良大幅提高可靠性。對于光模塊的可靠性控制重點還是在實際使用時的早期失效和隨機失效,早期失效可以通過選用一定參數的加速老化進行剔除,老化的條件,時間都需要通過科學的計算,避免老化時間過短剔除不到位或者時間過長降低產品壽命。對于隨機失效,目前有些方案如finisar等公司采用的備份激光器,通過增加多組激光器作為備用降低失效率,一個壞了立刻切到另一個好的激光器去工作,但是增加一組備份,成本、空間、功耗,又增加了很多難度。海思設計過一種智能光模塊,通過實時監控光模塊多種參數狀態,采用大數據訓練主動對光模塊做預警,提前判斷光模塊即將失效,這要求廠家對自身產品數據要有十分全面的掌握。

廣電計量光電器件可靠性分析

光模塊市場近兩年隨著AI浪潮的出現展現出了廣闊的想象空間,但也給光模塊的可靠性帶來了更高的挑戰。過去廠家不重視模塊的可靠性,缺乏對產品的失效評估,而現在解決產品可靠性問題,將會是占領用戶市場,打通產品從送樣到批量供貨的關鍵。

廣電計量是國內第一家完成激光發射器、探測器全套AEC-Q102車規認證的國有第三方上市檢測機構,具備VCSEL、LED、APD、SPAD等激光器和探測器批次性驗證試驗能力,具有豐富的光電器件可靠性驗證經驗。在人才隊伍上,形成以博士、專家為核心的光電器件測試分析團隊,可以協助客戶定制可靠性評估方案,建立準確的產品失效模型,滿足客戶在可靠性、失效分析領域的認證檢測需求。

廣電計量半導體服務優勢

  • 工業信息化部“面向集成電路、芯片產業的公共服務平臺”
  • 工業和信息化部“面向制造業的傳感器等關鍵元器件創新成果產業化公共服務平臺”
  • 國家發展和改革委員會“導航產品板級組件質量檢測公共服務平臺”
  • 廣東省工業和信息化廳“汽車芯片檢測公共服務平臺”
  • 江蘇省發展和改革委員會“第三代半導體器件性能測試與材料分析工程研究中心”
  • 上海市科學技術委員會“大規模集成電路分析測試平臺”

在集成電路及SiC領域是技術能力最全面、知名度最高的第三方檢測機構之一,已完成MCU、AI芯片、安全芯片等上百個型號的芯片驗證,并支持完成多款型號芯片的工程化和量產。

在車規領域擁有AEC-Q及AQG324全套服務能力,獲得了近50家車廠的認可,出具近400份AEC-Q及AQG324報告,助力100多款車規元器件量產。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31077

    瀏覽量

    269412
  • SiC
    SiC
    +關注

    關注

    29

    文章

    2837

    瀏覽量

    62713
  • 光模塊
    +關注

    關注

    77

    文章

    1270

    瀏覽量

    59078
收藏 人收藏

    評論

    相關推薦

    AEC-Q104認證:芯片模組的可靠性與質量標準

    車用多芯片模塊可靠性測試標準隨著汽車電子技術的快速發展,車載系統的復雜不斷增加,尤其是電子控制部件、導航系統和多媒體設備等的廣泛應用,使得多芯片
    的頭像 發表于 12-31 11:55 ?745次閱讀
    AEC-Q104認證:芯片模組的<b class='flag-5'>可靠性</b>與質量標準

    不同制造商TOPCon伏組件的老化測試:性能、穩定性與可靠性

    隨著TOPCon技術市場份額的快速增長,對其可靠性評估需求迫切。盡管早期報告認為TOPCon比PERC更可靠,但該技術伏組件
    的頭像 發表于 12-05 01:06 ?432次閱讀
    不同制造商TOPCon<b class='flag-5'>光</b>伏組件的老化測試:性能、穩定性與<b class='flag-5'>可靠性</b>

    半導體封裝的可靠性測試及標準

    產品可靠性是指產品在規定的使用條件和一定時間內,能夠正常運行而不發生故障的能力。它是衡量產品質量的重要指標,對提高客戶滿意度和復購率具有重要影響。金鑒實驗室作為一家提供檢測、鑒定、認證和研發服務
    的頭像 發表于 11-21 14:36 ?226次閱讀
    半導體封裝的<b class='flag-5'>可靠性</b>測試及標準

    PCB高可靠性化要求與發展——PCB高可靠性的影響因素(上)

    可靠性提出了更為嚴格的要求,特別是在焊接點的結合力、熱應力管理以及焊接點數量的增加等方面。本文將探討影響PCB可靠性的關鍵因素,并分析當前和未來提高PCB可靠性的制造技術發展趨勢。
    的頭像 發表于 10-11 11:20 ?371次閱讀
    PCB高<b class='flag-5'>可靠性</b>化要求與發展——PCB高<b class='flag-5'>可靠性</b>的影響因素(上)

    使用故障保護多路復用器提高模擬輸入模塊可靠性

    電子發燒友網站提供《使用故障保護多路復用器提高模擬輸入模塊可靠性.pdf》資料免費下載
    發表于 09-18 14:47 ?0次下載
    使用故障保護多路復用器提高模擬輸入<b class='flag-5'>模塊</b>的<b class='flag-5'>可靠性</b>

    OPSL 優勢4:良好的可靠性 - 龐大的安裝基數

    泵半導體激光器 (OPSL) 是一項獨有的技術,與其他連續 (CW) 固態激光器相比,它具有良好的可靠性和使用壽命。 加上 OPSL 的其他優勢,這種激光器的安裝量接近 100,000 萬臺
    的頭像 發表于 07-11 06:37 ?320次閱讀
    OPSL 優勢4:良好的<b class='flag-5'>可靠性</b> - 龐大的安裝基數

    晶科能源榮獲2024年伏組件可靠性“表現最佳”榮譽

    近日,晶科能源宣布其在Kiwa PVEL發布的2024年伏組件可靠性記分卡報告中斬獲“表現最佳”榮譽。
    的頭像 發表于 06-19 09:58 ?707次閱讀

    模塊的結構和分類

    隨著信息技術的飛速發展,光通信技術已成為現代通信系統的核心。模塊作為光通信系統中的關鍵器件,其性能的好壞直接影響到整個系統的穩定性和可靠性
    的頭像 發表于 05-29 16:09 ?934次閱讀

    請問FATFS文件系統可靠性如何?

    ST官方固件庫中使用了FATFS文件系統,想問下,這個文件系統可靠么? 我想了解一,有哪位朋友真正產品上使用FATFS文件系統,可靠性有什么問題沒有。
    發表于 05-16 06:35

    AC/DC電源模塊可靠性設計與測試方法

    OSHIDA ?AC/DC電源模塊可靠性設計與測試方法 AC/DC電源模塊是一種將交流電能轉換為直流電能的設備,廣泛應用于各種電子設備中,如電腦、手機充電器、顯示器等。由于其關系到設備的供電穩定性
    的頭像 發表于 05-14 13:53 ?788次閱讀
    AC/DC電源<b class='flag-5'>模塊</b>的<b class='flag-5'>可靠性</b>設計與測試方法

    翠展微新能源汽車功率模塊的關鍵技術突破與可靠性驗證

    隨著新能源汽車的快速發展,功率模塊作為新能源汽車的能量轉換的裝置,其重要不言而喻。由于汽車的行駛環境非常復雜,車企對于功率模塊的振動要求也越來越高,因此對模塊封裝的
    的頭像 發表于 04-12 16:18 ?1451次閱讀
    翠展微新能源汽車功率<b class='flag-5'>模塊</b>的關鍵<b class='flag-5'>技術</b>突破與<b class='flag-5'>可靠性</b>驗證

    硅通孔技術可靠性技術概述

    Via, TSV )成為了半導體封裝核心技術之一,解決芯片垂直方向上的電氣和物理互連,減小器件集成尺寸,實現封裝小型化。本文介紹了硅通孔技術可靠性,包括熱應力可靠性和工藝
    的頭像 發表于 04-12 08:47 ?236次閱讀

    單纖模塊與雙纖模塊的區別與比較

    本文介紹光通信中常用的單纖模塊和雙纖模塊。單纖模塊只使用一根光纖進行雙向傳輸,具有空間優勢
    的頭像 發表于 03-06 10:50 ?2071次閱讀

    如何確保IGBT的產品可靠性

    標準。安森美(onsemi)作為一家半導體供應商,為高要求的應用提供能在惡劣環境運行的產品,且這些產品達到了高品質和高可靠性。之前我們分享了如何對IGBT進行可靠性測試,今天我們來介紹如何通過
    的頭像 發表于 01-25 10:21 ?1665次閱讀
    如何確保IGBT的產品<b class='flag-5'>可靠性</b>

    IGBT的可靠性測試方案

    標準。安森美 (onsemi) 作為一家半導體供應商,為高要求的應用提供能在惡劣環境運行的產品,且這些產品達到了高品質和高可靠性。
    的頭像 發表于 01-17 09:56 ?1494次閱讀
    IGBT的<b class='flag-5'>可靠性</b>測試方案
    主站蜘蛛池模板: 日本不卡三卡四卡| 欲奴第一季在线观看全集| YY6080A旧里番在线观看| 青青青青草原国产免费| z00兽200俄罗斯| 脱女学小内内摸出水网站免费 | 无人影院在线播放视频| 国产学生无码中文视频一区| 欧美精品九九99久久在观看| 朝鲜女人性猛交| 亚洲成人免费| 国内久久久久影院精品| 影音先锋 av天堂| 日本19禁啪啪吃奶大尺度| 国产亚洲精品久久孕妇呦呦你懂| 在线国内自拍精品视频| 麻豆精品乱码WWW久久密| 荡乳乱公小说| 无码一区国产欧美在线资源| 久久精品一区| 高清国语自产拍免费| 午夜免费小视频| 久久综合久久伊人| 国产精品久久一区二区三区蜜桃| 亚洲精品国产精品麻豆99| 极品少妇高潮啪啪AV无码| qvod 韩国| 天美传媒在线观看完整高清| 久久精品亚洲热综合一本| 国产成人精品免费视频软件| 午夜宅宅伦电影网| 奶头被客人吸得又红又肿| 国模丽丽啪啪一区二区| 超碰人热人人热人人看| 在公交车上被JB草坏了被轮J了| 神马电影院午夜神福利在线观看| 国产午夜婷婷精品无码A片 | av亚洲2017色天堂| 亚洲免费成人| 毛片内射久久久一区| 国产在线aaa片一区二区99|