AI视频翻译配音
pyVideoTrans 是一款基于 GPL-V3 协议的开源免费视频翻译、语音转录、字幕翻译和 AI 配音软件。它的核心流程是将音视频中的人声转录为字幕,再翻译成目标语言,随后生成配音并与原视频、字幕合成,适合把外语视频批量转换为带目标语言字幕和配音的新视频。
工具的优势在于渠道覆盖极广。语音识别支持 faster-whisper、本地 openai-whisper、Qwen-ASR、FunASR、OpenAI、Gemini、Deepgram、智谱等;翻译支持 Microsoft、Google、DeepL、百度、腾讯、阿里,以及 ChatGPT、Gemini、DeepSeek、智谱、硅基流动、本地大模型和自定义 API;配音则覆盖 Edge-TTS、Qwen3-TTS、GPT-SoVITS、CosyVoice、ChatTTS、Azure、OpenAI、ElevenLabs 等。它既能做全自动视频翻译,也能拆开作为转录、字幕翻译或 TTS 工具使用。
软件本体完全免费,无需登录注册,也没有官方功能限制。Windows 10/11 提供预打包版,解压后运行 sp.exe;MacOS/Linux 需源码部署。若使用第三方 API,用户需自行提供密钥并承担费用。项目也接受微信、支付宝、Ko-fi 捐赠,并有付费技术群。
优点是开源、免费、可本地化程度高,支持批量处理、CUDA 加速、字幕多次人工校正、多角色配音和原音色克隆。中文文档较完整,对国内用户友好。局限也明显:完整包较大,部分模型首次使用需下载;国外服务如 Google、Gemini、OpenAI、HuggingFace 相关资源在中国大陆可能需要代理;最终质量取决于 ASR、翻译和 TTS 渠道。软件无法处理没有人声、只有背景音乐和硬字幕的视频,也不能抹除原硬字幕。
它适合内容创作者、教育视频制作者、字幕组、跨语种运营人员,以及愿意折腾本地模型的开发者。中国大陆访问官网和百度网盘下载相对友好,但涉及 Google、OpenAI、Gemini、HuggingFace 等渠道会部分受限;可优先选择微软翻译、Edge-TTS、阿里、腾讯、百度、DeepSeek、智谱或本地模型作为替代。
本测评基于公开资料整理,不构成购买建议,请以 pyvideotrans.com 官网实际信息为准。
开源免费视频翻译/转录/配音,内容出海很实用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。