低价GPU云与推理
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
iframe.ai 是一个 GPU cloud 与 inference platform,定位于 AI labs、neoclouds 和 enterprise platform teams。它提供 B300、B200、H200、H100、A100 及 RTX 5090/4090 等 GPU,自助用户可通过 Console、CLI 或 API 在数分钟内启动实例;企业用户则可通过 VPC interconnect 接入 AWS、Azure、GCP 的既有网络环境。
其核心卖点有三类:一是低价 GPU 算力,官网称约为 hyperscaler list pricing 的三分之一;二是托管推理,支持 OpenAI-compatible API、自动量化、optimized kernels 和 smart batching,页面宣称相较 vLLM/TGI baseline 最高 20× throughput;三是企业集成,AWS Direct Connect、Azure ExpressRoute、GCP Cloud Interconnect 均标为 GA,Oracle FastConnect 为 Beta。适用场景包括分布式训练、微调、生产推理、长上下文负载和混合云突发算力。
定价透明度较高。B300/B200 为 $3.25–$4.60/GPU·hr,H200 为 $2.95–$4.18,H100 为 $2.25–$3.18;推理按百万 tokens 收费,例如 Llama 3.1 70B 输入 $0.32、输出 $0.55。自助模式按秒计量、按小时计费;保留容量按 6 个月、1 年、3 年提供更高折扣。页面有“Sign up free”,但未披露明确免费额度。创业公司可申请 $25,000 credits,研究机构可申请算力 credits。
优点是硬件代际新、价格公开、OpenAI 兼容 API 降低迁移成本,并且 VPC 互联对企业安全、审计和观测体系较友好。合规方面声明支持 SOC 2 Type II、HIPAA-ready、GDPR-ready、ISO 27001,并可提供 BAA/DPA。局限在于性能与成本优势主要来自官网自述,仍需结合其 benchmark 仓库和自身 workload 实测;VPC Interconnect 需要销售与 2–4 周部署周期;抓取中还出现“0 GPUs available now”,即时容量需核验。
它更适合已有工程团队、需要可控 GPU 成本和云上集成的企业、研究团队与 AI 创业公司,而不是普通个人 AI 工具用户。中国大陆访问、中文界面、人民币支付或本地合规信息未披露,访问状态评为未知。若中国团队采购,应先验证网络连通性、信用卡/发票、数据跨境与替代方案,可对比 AWS、Azure、GCP、Oracle Cloud、CoreWeave、Lambda Labs、RunPod、Together AI 等。
本测评基于公开资料整理,不构成购买建议,请以 iforels.com 官网实际信息为准。
主打低于云厂商GPU价格,适合AI团队。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。