多模态视频生成API
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Purple Squirrel Media 的 PSM-V3 是一个多模态视频生成基础模型,面向生产环境提供 API、on-prem 私有化部署和开放权重三种使用方式。页面宣称其支持文本、图像、音频、视频输入,并输出电影级视频,规格包括原生 4K、最高 60fps、最长 120 秒生成。
从能力覆盖看,PSM-V3 不只是文本生成视频,还包括图像转视频、音频驱动视频、视频到视频重渲染。音频部分可根据音乐节奏、语音和环境声驱动画面节奏、转场与场景;视频到视频支持风格迁移、超分和帧插值。架构信息披露了多模态编码器、3.2B 参数 Diffusion Transformer、Temporal Attention、VAE Decoder 与 C2PA 签名。生态方面支持 REST API、流式输出、Webhook、批处理,并列出 ComfyUI、Hugging Face、Replicate、RunPod、NVIDIA NIM、fal.ai、Together AI 等集成。
页面明确有免费层且无需信用卡,但未披露免费额度。托管 API 为按生成付费,支持批量折扣;企业计划通过订单和 Credits 结算,1 Credit 等于 1 美元价值。开放权重采用 Apache 2.0,并提供微调脚本和 LoRA 支持。自托管门槛较高,最低需要 NVIDIA A100 80GB 或 H100,推荐双 H100 以实现 4K 实时生成。
优点是输入模态完整、部署选择灵活、开放权重降低锁定风险,并且支持私有 VPC/数据中心以满足数据主权需求。缺点是页面未提供具体单价、真实样例集、第三方基准和失败案例;“production-ready”“低延迟”等说法仍需实测验证。托管 API 的数据保留、是否用于训练等细节也未在正文充分披露。
它更适合视频生成产品团队、广告与影视概念团队、音乐可视化应用、以及有 GPU 资源并需要微调的企业。不太适合只想低成本偶尔生成短视频的个人用户。中国大陆访问、支付方式和中文支持均未披露,实际使用可能需要测试网络连通性;可对比 Runway、Pika、Luma、Kling、PixVerse、Sora 等替代方案。
本测评基于公开资料整理,不构成购买建议,请以 purplesquirrelmedia.io 官网实际信息为准。
提供视频生成 API、开源与私有部署。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。