Skip to content

简介

Open Avatar Chat 是一个模块化的交互数字人对话实现,能够在单台PC上运行完整功能。支持使用云端的 API 实现 ASR + LLM + TTS,也支持本地多模态语言模型。

系统需求

  • Python版本 >=3.11.7, <3.12
  • 支持CUDA的GPU
  • 数字人部分可以使用GPU/CPU进行推理,测试设备CPU为i9-13980HX,CPU推理下可以达到30FPS.

TIP

使用云端 API 实现 ASR + LLM + TTS,可以大大降低配置需求,具体可参考 百炼API配置

组件依赖

类型开源项目Github地址模型地址
RTCHumanAIGC-Engineering/gradio-webrtcGitHub
WebUIHumanAIGC-Engineering/OpenAvatarChat-WebUIGitHub
VADsnakers4/silero-vadGitHub
AvatarHumanAIGC/lite-avatarGitHub
TTSFunAudioLLM/CosyVoiceGitHub
Avataraigc3d/LAM_Audio2ExpressionGitHubHuggingFace
facebook/wav2vec2-base-960hHuggingFace / ModelScope
AvatarTMElyralab/MuseTalkGitHub
AvatarSoul-AILab/SoulX-FlashHeadGitHubHuggingFace