Speech_NVIDIA-NeMo

Speech

NVIDIA NeMo Speech 是专为研究人员和 PyTorch 开发者设计的语音模型开发框架。它支持自动语音识别（ASR）、文本转语音（TTS）以及语音大语言模型（Speech LLMs），旨在帮助开发者高效地创建、微调及部署新的 AI 语音模型。该项目提供丰富的预训练模型检查点和示例代码，支持多种语言及流式/离线推理，并兼容灵活的 Python、PyTorch 和 CUDA 环境配置。

Speech ​

Speech