这是一个视频翻译配音工具,能够将一种语言的视频翻译成指定语言的视频,并自动生成和添加该语言的字幕及配音。语音识别采用的是 faster-whisper 和 openai-whisper 离线模型。文字翻译支持微软、谷歌、百度、腾讯、ch*tg*t、Azure、Gemini、DeepL、DeepLX 和离线翻译OTT。文字合成语音支持微软 Edge TTS、OpenAI TTS-1 以及 Elevenlabs TTS 自定义TTS服务器API,配合 clone-voice 可实现原音色克隆配音。此外,该工具还允许保留背景伴奏音乐等(基于 uvr5)。
优化更新:已修复并优化了 AzureTTS 配音功能,现在可以一次批量合成多达 200 条字幕。
已修复并优化了视频结尾延长的问题。
已修复并优化了字幕翻译的质量。