低价高速LLM推理
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Lilac是2024年成立、Y Combinator背书的GPU云服务平台,核心定位是低成本高速度的大模型推理API提供商,同时支持企业闲置GPU资源变现。不同于传统云服务商的预留GPU模式,Lilac的核心逻辑是利用企业集群中普遍存在的30-50%闲置GPU容量,这些硬件已经处于通电运行状态,无需额外启动成本,因此可以大幅降低推理服务的价格,同时保持模型输出质量不变。
Lilac的核心功能围绕低门槛、高性能的推理服务设计:首先是完全兼容OpenAI SDK,开发者仅需修改原有OpenAI集成中的base_url,无需大幅调整代码即可完成迁移,大幅降低了替换成本。其次是高性能保障,平台主打低延迟、高吞吐,并且所有GPU资源始终处于预热状态,完全没有冷启动或资源拉起的等待时间。此外还提供实时模型性能监控面板,每30秒更新所有服务端点的TPS、吞吐量、TTFT(首字延迟)等指标,用户可以实时查看服务状态。数据安全方面,平台采用零数据保留(ZDR)政策,用户的提示词和生成内容不会被存储,也不会用于模型训练,目前SOC 2和HIPAA认证正在推进中。
Lilac采用纯按token计费的模式,无最低消费限制,也不需要签订任何合同或承诺最低用量。具体定价非常有竞争力:MiniMax M2.7 FP8(200K上下文)输入为每百万token 0.3美元,缓存每百万0.055美元,输出每百万1.2美元;Kimi K2.6 INT4(262K上下文)输入每百万0.7美元,缓存每百万0.2美元,输出每百万3.5美元;GLM 5.1 FP8(203K上下文)输入每百万0.9美元,缓存每百万0.27美元,输出每百万3美元;Gemma 4 (31B) BF16(262K上下文)输入每百万0.11美元,输出每百万0.35美元。
价格优势是Lilac的核心竞争力,闲置GPU的模式让其定价远低于主流推理服务商。同时OpenAI兼容的设计让开发者迁移成本极低,无冷启动、无最低消费的模式非常适合灵活的开发需求。加上YC的投资背书也为平台的可靠性提供了一定保障,零数据保留政策也满足了部分用户的数据安全需求。
目前平台支持的模型数量有限,更多模型仍在上线过程中,需要特定模型的用户需要主动联系团队申请。同时合规认证仍在进行中,尚未完成,对于有严格合规要求的企业可能存在一定限制。此外,由于依赖第三方闲置GPU资源,服务供应的长期稳定性还有待市场验证。
Lilac非常适合需要降低大模型推理成本的AI开发者和应用构建者,尤其是已经使用OpenAI生态、希望快速切换到更便宜方案的团队。对于有闲置GPU资源的企业也可以通过平台实现资源变现。同时,无最低消费的模式也非常适合个人开发者和小团队进行产品原型开发和测试。
目前从抓取的内容中没有明确的中国访问相关提示,中国访问情况未知。
本测评基于公开资料整理,不构成购买建议,请以 getlilac.com 官网实际信息为准。
YC项目,OpenAI兼容接口,适合开发者做模型成本优化。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。