近日,國際著名AI學術機構CCF-A類頂尖會議IJCAI (International Joint Conference on Artificial Intelligence)發布了其2024年度論文名單,西安電子科技大學通信工程學院何剛教授帶領的研究團隊發表了名為“Beyond Alignment: Blind Video Face Restoration via Parsing-Guided Temporal-Coherent Transformer”的優秀科研成果,這項研究致力于開發先進的視頻人臉修復算法,以應對低質量視頻下人臉特征不清晰的問題。
人臉恢復是一項通過提升圖像質量來使面部特征更加清晰的技術,主要包括去模糊、去噪、恢復等步驟。而視頻人臉恢復則是將此技術應用到視頻序列中,除了要處理每一幀的圖像質量外,還需保持時間上的連續性和自然過渡,以確保視頻中人臉的動態表現和質量的一致性。
因此,算法必須能有效地處理視頻中的運動模糊、壓縮損失等問題。近年來,人臉恢復技術得到了廣泛關注與研究,并已在工業界得到了廣泛應用。
本次研究首次提出了一種全新的盲視頻人臉恢復方法——解析引導的時間一致性變換器(PGTFormer),旨在解決現有技術在處理低質量視頻人臉時面臨的難題。
該方法無需預對齊即可恢復高保真的人臉細節,同時增強視頻中不同姿態變化的時間連貫性。此外,研究團隊還引入了時間空間矢量量化自編碼器(TS-VQGAN)的預訓練模型及時間解析引導的碼本預測器(TPCP),這些創新技術極大地提升了人臉恢復的效率和準確性。
-
編碼器
+關注
關注
45文章
3664瀏覽量
135097 -
圖像
+關注
關注
2文章
1089瀏覽量
40542 -
模型
+關注
關注
1文章
3298瀏覽量
49092
發布評論請先 登錄
相關推薦
評論