英伟达开源Audio2Face:AI实时生成面部动画 多语言口型精准同步

抖音秀 热点资讯 4

9月25日消息,据媒体报道,英伟达宣布将其生成式AI面部动画模型Audio2Face正式开源,此次开放内容涵盖基础模型、完整软件开发工具包及训练框架,旨在推动游戏与3D应用领域快速集成智能虚拟角色。

Audio2Face能够基于输入音频,自动解析其中的音素、语调等声学特征,实时驱动虚拟角色生成精准的口型动作与自然的情感表情。

该技术可广泛应用于游戏开发、影视制作、虚拟客服等多个场景,并支持预录制音频的离线渲染与动态角色的实时流式处理两种运行模式。

目前,该技术已在游戏行业获得实际应用。例如,游戏开发商Survios在《异形:侠盗入侵进化版》中集成Audio2Face,显著简化了口型同步与面部动画的制作流程。

Farm 51工作室也在《切尔诺贝利人2:禁区》中借助该技术,直接通过音频生成细腻的面部表情,不仅大幅节省制作时间,也提升了角色的真实感与玩家的沉浸体验。该工作室创新总监Wojciech Pazdur称其为“革命性突破”。


标签: 英伟达 开源 AI