AI數字人的底層邏輯主要基于兩種操作機制。一種是智能驅動型數字人,這種類型的數字人通過智能系統自動讀取和解析外界輸入信息,然后根據解析結果決策數字人后續的輸出文本,最后驅動人物模型生成相應的語音與動作,實現與用戶的互動。這個人物模型是通過AI技術預先訓練得到的,能夠通過文本驅動生成語音和對應動畫,業內將此模型稱為 TTSA(Text To Speech & Animation)人物模型。
另一種是真人驅動型數字人,其核心原理是由真人根據視頻監控系統傳來的用戶視頻,與用戶進行實時語音交流,同時通過動作捕捉采集系統將真人的表情、動作呈現在虛擬數字人形象上,從而實現與用戶的交互。
從技術角度來看,AI數字人的本質是人工智能的一種進化。它整合了人物形象模擬、人物聲音克隆、自然語言處理、知識圖譜解析等眾多世界領先的人工智能技術,提供了一種可以隨時隨地與真人進行準確交互性對話的方式。背后的技術原理涉及到符號主義、聯結主義和行為主義等多種研究視角。
隨著新技術浪潮的推動,虛擬數字人的制作過程得到有效簡化,性能也得到飛躍式提升,開始從外觀的數字化逐漸深入到行為的交互化、思想的智能化。現在,以虛擬主播、虛擬員工等為代表的數字人已經開始在影視、游戲、傳媒、文旅、金融等眾多領域大放異彩。
審核編輯 黃宇
-
AI
+關注
關注
87文章
31424瀏覽量
269818 -
人工智能
+關注
關注
1793文章
47601瀏覽量
239510 -
數字人
+關注
關注
0文章
131瀏覽量
2074
發布評論請先 登錄
相關推薦
評論