海外资源测评导航
返回AI 应用 海外资源 / AI 应用 / 开源视频翻译配音 / pyvideotrans.com
P
🤖 AI 应用 开源视频翻译配音 中国总部 国内优化

pyvideotrans.com

AI视频翻译配音

9.0/10 中国可用
TTG4G 编辑组 ·更新于 2026-06-08 ·数据来源: ai_crawl 评测方法 ↗
数据来源
ai_crawl · 最近更新 2026-06-08
行业深度解析AI 深度分析
一句话开源免费的视频翻译、语音转录、字幕翻译与AI配音工具。
定价开源免费,第三方API自费,捐赠支持 软件基于 GPL-V3 协议开源,下载预打包版或部署源码后可直接使用,无需登录注册、无功能限制。若使用 OpenAI、Gemini、DeepL、ElevenLabs、阿里、腾讯、百度等第三方API,需要用户自行提供账户和SK密钥并承担费用。项目接受微信、支付宝、Ko-fi小额捐助;付费技术群要求首次捐赠¥30+,后续每月捐赠¥10+。
适合谁视频内容创作者、教育工作者、多语言视频运营者、字幕制作人员、需要批量转录/翻译/配音的个人用户与开发者
核心功能全自动视频/音频翻译流程语音转录并生成带时间轴SRT字幕批量翻译SRT字幕并保留时间码多渠道AI配音与文字转语音视频字幕、配音、画面合成与对齐支持本地模型、在线API和自定义API支持原音色克隆、多角色配音支持CLI命令行模式Windows预打包版,MacOS/Linux源码部署实时语音转文字、文稿对齐与打轴
AI能力与模型采用“语音转录→字幕翻译→配音→合成”的流水线。语音识别支持 faster-whisper、本地 openai-whisper、Qwen-ASR、FunASR、OpenAI、Gemini、Deepgram、智谱 GLM-ASR、自定义ASR等;翻译支持 Microsoft、Google、M2M100、百度、腾讯、阿里、DeepL、ChatGPT、Gemini、DeepSeek、智谱、硅基流动、OpenRouter、本地大模型/兼容AI接口等;配音支持 Edge-TTS、Qwe
典型用例全自动视频/音频翻译,生成目标语言字幕和配音视频;批量音视频转SRT;批量SRT字幕翻译;文字或SRT转语音;文稿对齐与打轴;实时麦克风语音转文字;多角色配音和原音色克隆。
免费额度/试用软件完全免费,无需登录注册,无官方功能限制。免费渠道包括部分在线服务如 Microsoft翻译、Edge-TTS、部分本地模型等;但部分免费在线渠道可能有频率限制。第三方付费API无内置免费额度说明,需以各平台为准。
定价软件本体开源免费,GPL-V3协议。使用第三方API需用户自行提供密钥并承担平台费用。项目接受小额捐赠;付费技术群规则为首次捐赠¥30+,后续每月捐赠¥10+,用于获得一定技术支持及bug快速修复。
中文支持文档和界面说明为中文,支持中文语音识别、中文字幕翻译与中文配音。文档中特别提到 Qwen-ASR 对中文支持效果较好,也支持百度、腾讯、阿里、DeepSeek、智谱等国内服务。
API与集成支持大量第三方API和自定义API。用户可在翻译设置、TTS设置、语音识别设置中填写API Key、API地址或本地模型服务地址。支持本地大模型/兼容AI接口、本地部署TTS、ASR服务,并提供CLI命令行模式。
数据隐私官方声明无需登录或卡密验证。第三方API密钥由用户自行填写且仅本地存储。若使用本地模型,可减少数据外传;若调用第三方ASR、翻译、TTS API,音频、字幕或文本会发送到对应服务商,相关隐私取决于第三方平台政策。
输出质量与局限输出质量高度依赖语音识别准确率、翻译模型和配音渠道。faster-whisper large-v3、openai-whisper large-v3等被建议用于较好识别效果;LLM重新断句可提升流畅度但也可能变差。跨语言配音存在时长差异,需通过音频加速或视频慢速改善同步。无法处理只有背景音乐和硬字幕、没有人声的视频;不能直接抹除原硬字幕。
支付软件本身免费;第三方API费用由用户在对应平台充值或购买。项目捐赠支持微信、支付宝、Ko-fi。
中国访问部分受限
适用场景外语视频翻译成中文字幕和中文配音;课程、访谈、播客批量转录为SRT;批量翻译字幕文件;为字幕生成多语言配音;根据文稿为音视频打轴;多角色配音与原音色克隆。
同类可对比使用剪映/CapCut字幕与配音功能、Whisper本地转录方案、DeepL/Google/Microsoft翻译、ElevenLabs配音、HeyGen等视频翻译工具。
性价比9
易用7
服务7
综合8
优点
  • 完全开源免费,无需登录注册,无官方功能限制
  • 覆盖语音识别、翻译、TTS、视频合成的完整工作流
  • 支持大量本地模型和第三方API,灵活度高
  • Windows版解压即用,适合非开发者快速上手
  • 支持批量处理、CUDA加速、字幕编辑与多次人工校正
不足
  • 完整包体积较大,Windows完整包约2.6G
  • MacOS/Linux需要源码部署,门槛高于Windows
  • 部分国外模型下载站和服务在中国大陆需代理
  • 高质量效果依赖所选ASR、翻译、TTS模型或第三方API
  • 视频翻译后字幕、配音、画面对齐仍可能受语言时长差异影响

深度测评

TG4G · 2026-06-08 更新 · 仅供参考

是什么

pyVideoTrans 是一款基于 GPL-V3 协议的开源免费视频翻译、语音转录、字幕翻译和 AI 配音软件。它的核心流程是将音视频中的人声转录为字幕,再翻译成目标语言,随后生成配音并与原视频、字幕合成,适合把外语视频批量转换为带目标语言字幕和配音的新视频。

核心能力

工具的优势在于渠道覆盖极广。语音识别支持 faster-whisper、本地 openai-whisper、Qwen-ASR、FunASR、OpenAI、Gemini、Deepgram、智谱等;翻译支持 Microsoft、Google、DeepL、百度、腾讯、阿里,以及 ChatGPT、Gemini、DeepSeek、智谱、硅基流动、本地大模型和自定义 API;配音则覆盖 Edge-TTS、Qwen3-TTS、GPT-SoVITS、CosyVoice、ChatTTS、Azure、OpenAI、ElevenLabs 等。它既能做全自动视频翻译,也能拆开作为转录、字幕翻译或 TTS 工具使用。

定价与易用性

软件本体完全免费,无需登录注册,也没有官方功能限制。Windows 10/11 提供预打包版,解压后运行 sp.exe;MacOS/Linux 需源码部署。若使用第三方 API,用户需自行提供密钥并承担费用。项目也接受微信、支付宝、Ko-fi 捐赠,并有付费技术群。

优缺点

优点是开源、免费、可本地化程度高,支持批量处理、CUDA 加速、字幕多次人工校正、多角色配音和原音色克隆。中文文档较完整,对国内用户友好。局限也明显:完整包较大,部分模型首次使用需下载;国外服务如 Google、Gemini、OpenAI、HuggingFace 相关资源在中国大陆可能需要代理;最终质量取决于 ASR、翻译和 TTS 渠道。软件无法处理没有人声、只有背景音乐和硬字幕的视频,也不能抹除原硬字幕。

适合谁与中国访问

它适合内容创作者、教育视频制作者、字幕组、跨语种运营人员,以及愿意折腾本地模型的开发者。中国大陆访问官网和百度网盘下载相对友好,但涉及 Google、OpenAI、Gemini、HuggingFace 等渠道会部分受限;可优先选择微软翻译、Edge-TTS、阿里、腾讯、百度、DeepSeek、智谱或本地模型作为替代。

本测评基于公开资料整理,不构成购买建议,请以 pyvideotrans.com 官网实际信息为准。

中文卖点

开源免费视频翻译/转录/配音,内容出海很实用。

官网快照

/shot/pyvideotrans-com.png
pyvideotrans.com

价格走势

当前价 · 仅供参考
价格未公开 当前定价
价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分
9.0/10
TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

pyvideotrans.com 是一家中国的AI 应用 (开源视频翻译配音)服务商. 本页收录其「AI视频翻译配音」套餐. 开源免费视频翻译/转录/配音,内容出海很实用.
pyvideotrans.com 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于中国, 主要面向海外市场.
访问 pyvideotrans.com 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类