部署扩展开源LLM
Kriora 定位为“生产 AI 的基础设施层”,提供统一 API、Serverless 推理和按需 GPU 部署。它的核心卖点是 OpenAI-compatible API:现有基于 OpenAI SDK 的应用理论上只需修改 base_url 即可接入 Kriora。平台示例展示了通过 Chat Completions 调用 deepseek/deepseek-r1-0528,说明其重点覆盖开源大模型推理。
Kriora 提供两类能力:一是按 token 计费的 Serverless Inference,用于快速访问受支持模型;二是 On Demand Deployments,可将开源模型一键部署到托管 GPU,包括 B200、H200、H100、A100 等实例。它强调统一 API、计算抽象、可靠性和从原型到生产的平滑迁移,适合不想自管 GPU、部署和底层基础设施的开发团队。
定价模式较清晰:Serverless 推理按输入/输出 token 计费,无月度承诺,但完整模型单价需登录平台查看;GPU 按小时收费,例如 B200 180GB 为 6.75 美元/小时,H100 80GB 为 2.97 美元/小时。支付由 Paddle 处理,支持主要信用卡、PayPal 等,价格以美元展示,税费按账单地区计算,并提供 14 天退款窗口。
优点是迁移成本低、API 标准化、同时覆盖推理 API 与 GPU 部署,比较适合快速上线 AI 后端。缺点也明显:抓取内容未披露完整模型列表、token 单价、数据保留策略或是否用于训练;服务条款还明确表示不提供 SLA、不承诺 uptime、准确性或无错误,并保留随时限流或暂停服务的权利。因此,生产关键业务应先做压测、容灾和成本验证。
Kriora 适合熟悉 OpenAI SDK、希望接入开源模型或需要临时 GPU 计算的开发者和团队。中文支持、国内网络可访问性与人民币/本地支付均未说明,中国大陆用户需自行测试连通性、延迟和支付可用性。若访问或合规受限,可对比 OpenAI、Together AI、Fireworks AI、Replicate、RunPod,国内则可考虑阿里云百炼、火山方舟、腾讯云或硅基流动等替代方案。
本测评基于公开资料整理,不构成购买建议,请以 kriora.com 官网实际信息为准。
统一API加GPU算力,适合AI出海开发。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。