AI系统内存扩展技术
Netpreme 是面向 AI 基础设施的内存扩展平台,主打 X-Mem™ Networked Memory Tiering™ 与 Memory Processing Unit(MPU)。从页面信息看,它试图解决大模型训练/推理中 GPU 或 XPU HBM 内存受限的问题,通过网络化内存分层把可用内存扩展到计算节点之外,而不是简单增加更多 GPU 计算节点。
其核心卖点是“Augmenting GPU with Potentially Infinite Memory”,即在不增加计算节点的前提下扩展 GPU 内存容量。开发者页面展示了可按 GPU 数量和 MTier Memory Capacity 配置实例,并提到最多 36 个内存节点、每节点 4TB 的内存池概念。Netpreme 还提供 SDK/API Documentation,包含架构指南、API 参考和集成示例;Performance Models 用于模拟 memory-to-compute ratio 对性能的影响,但目前标注为 Coming Soon。
当前 X-Mem™ pilot 为 Invitation Only。已有 access token 的用户可 Reserve Now,未获得 token 的用户需申请 Early Access。价格方面,页面示例显示 GPU 为 2.50 美元/GPU·小时,内存为 0.01 美元/GB·小时,并按配置汇总总价。不过页面也明确说明实例布局仅供说明,实际硬件规格和价格会随配置变化,需要参考产品页或联系官方确认。
优点是定位非常清晰,瞄准大模型基础设施中的高价值瓶颈:GPU 内存容量不足。按 GPU 与内存容量拆分计费,也有利于探索更灵活的 memory-to-compute ratio。缺点是公开信息仍较少,缺乏具体 benchmark、延迟、带宽、框架兼容性、SLA、数据隐私和安全合规说明。由于性能模型尚未上线,实际效果仍需以试点测试为准。
Netpreme 更适合 AI 云平台、算力基础设施团队、大模型训练/推理工程团队,以及需要大内存实例做系统设计验证的用户;不适合普通内容生成、办公或个人 AI 工具用户。页面未披露中文支持、中国大陆访问、支付方式等信息,中国访问状态只能判断为未知。若在国内落地,可能还需要考虑网络连通、跨境数据、发票与企业采购流程等问题。
本测评基于公开资料整理,不构成购买建议,请以 netpreme.com 官网实际信息为准。
Networked Memory Tiering概念新,适合AI基础设施关注。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。