Gemma模型推理API
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Norddahl 提供的是一个 Gemma 4 31B Inference API,端点为 https://api.norddahl.dk/v1,模型名 gemma-4-31b。它遵循 OpenAI /v1/chat/completions 协议,因此已有 OpenAI SDK 的项目通常只需替换 base_url 和 model 即可接入。
该 API 基于 NVIDIA NVFP4 量化的 Gemma 4 31B,支持文本对话、图片输入、视频输入和 SSE 流式输出。上下文窗口为 128K tokens,并可按协议扩展到 262144 tokens。图片支持 JPG、PNG、WebP、GIF 首帧;视频支持 MP4、WebM,最长 60 秒,按 1fps 采样。参数方面覆盖 temperature、top_p、stop、惩罚项和 max_tokens 等常规控制项。
文档给出了 cURL、Python、JavaScript 示例,并提供 /v1/models。鉴权采用 Bearer API Key,密钥按客户发放,且每个 key 有独立的 rpm、tpm 和月度美元预算 max_budget。但正文未披露公开 token 单价、套餐、支付方式或免费额度,商业可预期性一般。触发限流时返回 429,并带 Retry-After;连续 401 还可能触发 fail2ban 临时封禁。
优点是 OpenAI 兼容度高、接入成本低,支持多模态与流式响应,错误处理和限流说明较清晰,适合快速替换或补充现有 OpenAI 调用链。缺点是模型选择单一,价格和试用政策不透明;视频能力有时长和采样限制;隐私方面仅有 API Key 安全建议,未说明数据保留、训练使用或合规认证。
它更适合开发者、企业内部工具团队和多模态原型团队,尤其是想用 OpenAI SDK 调用 Gemma 4 31B 的场景。中文支持方面,文档只说明多语言并测试了丹麦语、英语、德语、法语、西班牙语,未提中文。中国大陆访问、支付可用性均无明确资料,建议先做网络连通性测试;可对比 OpenAI、Gemini、Claude,或国内的阿里云百炼、智谱、硅基流动等替代方案。
本测评基于公开资料整理,不构成购买建议,请以 norddahl.com 官网实际信息为准。
OpenAI兼容端点,可作小众LLM API备选。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。