NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技術,增強了 AI 虛擬形象和數(shù)字人的真實感和可訪問性,這些新的動畫和語音功能實現(xiàn)了更自然的對話和情感表達。
開發(fā)者現(xiàn)在可以使用新的云 API 在應用中輕松實現(xiàn)和擴展智能虛擬形象,包括自動語音識別(ASR)、文本轉語音(TTS)、神經(jīng)機器翻譯(NMT)和 Audio2Face(A2F)。
借助這些高級功能,搶先體驗計劃的創(chuàng)作者可以利用 NVIDIA 技術快速構建新一代虛擬形象體驗?,F(xiàn)在,使用 Unreal Engine 5 等一些熱門渲染工具,可以更輕松地在任何地方大規(guī)模構建和部署數(shù)字人。
AI 驅動的情感動畫
用戶可使用最新的 ACE AI 動畫功能和微服務(包括新添加的 A2F 情感支持)構建更具表現(xiàn)力的數(shù)字人,現(xiàn)在還提供用于身體、頭部和眼球運動的 Animation Graph 微服務。
對于使用云來處理渲染生產或尋求進行實時推理的開發(fā)者,現(xiàn)在有了易于使用的微服務。A2F 的質量改進包括嘴型同步,可為數(shù)字人帶來更多的真實感。
圖 1. NVIDIA ACE 端到端開發(fā)套件
增強的 AI 語音功能
現(xiàn)在支持的語言包括意大利語、西班牙語、德語和普通話,ASR 技術的整體準確性也得到了提高,ASR、TTS 和 NMT 的云 API 簡化了對最新語音 AI 功能的訪問。
無論用戶是想使用自己的語音將自定義語音應用到智能 NPC,還是在視頻會議通話中隨機化用戶的語音,新的 Voice Font 微服務都能讓用戶自定義 TTS 輸出。這項技術可將說話者的獨特音調和音量轉換為參考音頻,同時保持相同的節(jié)奏和聲音模式。
新工具和框架
ACE Agent 是一家專業(yè)的對話管理和系統(tǒng)集成商,它能夠提供更加流暢的端到端體驗,并高效地協(xié)調微服務之間的連接。開發(fā)者還可以利用與 NVIDIA Omniverse 平臺的集成,通過 NVIDIA NeMo Guardrails、NVIDIA SteerLM 和 LangChain 來更好地控制精確且可調節(jié)的響應。
現(xiàn)在,可以更輕松地在用戶選擇的渲染器或編碼環(huán)境中啟動和運行這些工具。新功能包括:
在 Avatar 配置器中支持 Blendshape,以輕松集成 Unreal Engine 等熱門渲染器。
面向 Python 用戶的全新 A2F 應用程序。
一款參考應用程序,適用于有興趣為客戶服務構建虛擬助理的開發(fā)者。
總結
這些新推出的 NVIDIA ACE 功能提高了數(shù)字人體驗的質量標準。借助簡化構建和部署的增強功能,開發(fā)者現(xiàn)在可以獲得構建新一代數(shù)字人應用所需的簡化配置。
審核編輯:劉清
-
NVIDIA
+關注
關注
14文章
5076瀏覽量
103717 -
ASR
+關注
關注
2文章
43瀏覽量
18801 -
python
+關注
關注
56文章
4807瀏覽量
85037 -
TTS
+關注
關注
0文章
42瀏覽量
10833 -
NPC
+關注
關注
0文章
27瀏覽量
4811
原文標題:在 NVIDIA ACE 中使用 AI 動畫和語音功能打造逼真的虛擬形象
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論