在中國圖象圖形大會的華為昇思MindSpore技術論壇上,中國科學院空天信息創新研究院(以下簡稱“空天院”)發布了首個面向跨模態遙感數據的生成式預訓練大模型“空天.靈眸”(RingMo,Remote Sensing Foundation Model)。
“空天.靈眸”大模型是空天院聯合北京昇騰人工智能生態創新中心技術團隊,基于成都智算中心的昇騰AI的澎湃算力訓練而完成。在昇騰AI基礎軟硬件平臺的支持下,尤其是依托昇思MindSpore AI框架原生支持大模型的能力,“空天.靈眸”大模型的并行訓練及下游任務開發得以加速實現,已在8個國際標準數據集上達到領先水平,填補了跨模態生成式預訓練模型在遙感領域的空白。
在模型設計、模型訓練、推理優化等方向均進行了獨特的技術創新,“空天.靈眸”大模型深入結合光學、SAR(合成孔徑雷達)等跨模態遙感數據的成像機理和目標特性,并在場景分類、檢測定位、細粒度識別、要素提取及變化檢測等典型下游任務中得到有效驗證。
總體來看,“空天.靈眸”大模型具備如下四大亮點:
1. 以遙感特性為研發驅動
不同于現有遙感預訓練模型大都采用有監督或者對比式學習的模式,基于昇騰AI的“空天.靈眸”大模型依托掩膜自編碼結構,是面向復雜場景且更具通用表征能力的遙感生成式自監督預訓練模型。
由于采用的是ViT和Swin Transformer等Transformer類骨干網絡,該大模型可對遙感數據的局部和全局特征的依賴關系進行有效建模,并結合目標特性引導的自監督學習方法,通過引入幾何、電磁、目標結構等多特性約束,讓遙感地物通用特征可被自動提取。
2. 擁有跨模態遙感數據集
為提升遙感預訓練模型的特征表達能力,“空天。靈眸”大模型的數據集包含了200多萬幅分辨率為0.1m到30m的遙感影像,分別來源于中國遙感衛星地面站、航空遙感飛機等平臺,以及高分系列衛星、吉林衛星、QuickBird衛星等。
同時,在數據集中包含了1億多具有任意角度分布的目標實例,覆蓋全球150多個典型城市、鄉鎮以及常用機場、港口等場景。所用樣本數據具備遙感專業特色,且整個樣本集都無需標注,能大幅節省訓練數據標注成本。
3. 具備應用任務泛化能力
“空天。靈眸”大模型具備遙感數據理解、復原能力,可實現對跨模態遙感數據的共性語義空間進行表征。
針對不同的下游任務僅需修改預測頭部網絡,即可靈活快速遷移到不同領域的下游任務中,進行簡單微調后可適應多目標細粒度分類、小目標檢測識別、復雜地物提取等任務。
4. 廣泛的產業應用方向
從目標檢測識別、地物要素分類等任務的實測比較看,相對于業界通用的視覺模型,“空天.靈眸”大模型對遙感數據應用效果的提升是顯著的。
可預見,在未來,基于昇騰AI的“空天。靈眸”大模型的應用不止于在三維重建等領域,或將進一步推廣至國土資源、交通、水利等更多行業,為天臨空地一體化應用提供整套解決方案。
-
AI
+關注
關注
87文章
31409瀏覽量
269817 -
模型
+關注
關注
1文章
3291瀏覽量
49031 -
昇騰
+關注
關注
1文章
136瀏覽量
6630 -
昇騰AI
+關注
關注
0文章
79瀏覽量
600 -
大模型
+關注
關注
2文章
2524瀏覽量
2990
原文標題:基于昇騰AI,空天院攜手華為共同發布全球首個面向跨模態遙感數據的生成式大模型“空天.靈眸”
文章出處:【微信號:gh_3a181fa836b6,微信公眾號:華為計算】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論