海外资源测评导航
返回开发工具 海外资源 / 开发工具 / Python ETL框架 / pygrametl.org
P
🔧 开发工具 Python ETL框架 未知总部 国内优化

pygrametl.org

Python数据ETL框架

6.0/10 中国可用
TTG4G 编辑组 ·更新于 2026-06-08 ·数据来源: ai_crawl 评测方法 ↗
数据来源
ai_crawl · 最近更新 2026-06-08
行业深度解析AI 深度分析
一句话pygrametl 是一个开源 Python ETL 编程框架,用于以标准 Python 代码构建数据仓库抽取、转换、加载流程。
定价免费开源 文本说明 pygrametl 完全开源,并以 2-clause BSD 许可证发布;可通过 PyPI 安装或从 GitHub 获取开发版本,未提及商业收费。
适合谁需要用 Python/Jython 编写 ETL 程序的数据工程师、数据仓库开发者、研究人员,以及偏好代码化 ETL 而非图形化 ETL 工具的团队。
核心功能Python ETL 编程框架支持维度表和事实表抽象支持 CSV 数据源和数据源合并连接示例支持雪花维度支持多种缓慢变化维度,包括 Type 1 与 Type 2支持 CPython 与 Jython可使用 PEP 249 数据库连接器和 JDBC 驱动提供 BulkFactTable 等批量加载能力提供 HTML、PDF、安装指南和初学者指南
功能与用途pygrametl 是用于开发 Extract-Transform-Load 程序的 Python 框架,提供数据源、维度表、事实表等抽象。开发者用标准 Python 代码读取行、转换字段,并向维度和事实表插入数据。它支持雪花维度、缓慢变化维度、缓存维度和批量事实表加载等数据仓库场景。
支持语言/框架支持 CPython 和 Jython。可使用现有 Python 代码、原生扩展模块、PEP 249 数据库连接器,也可在 Jython 下使用 JVM 代码和 JDBC 驱动。
开源还是闭源完全开源,采用 2-clause BSD 许可证发布。示例代码片段中另有 GPLv2 声明,但项目介绍明确说明框架为 2-clause BSD。
自托管选项作为 Python 框架在用户自己的环境中安装和运行;可通过 PyPI 安装,也可从 GitHub 克隆开发版本。未提及云托管服务。
定价未提及收费;项目为免费开源软件。
API/SDK提供 Python 包和面向 ETL 的编程接口,例如 pygrametl.ConnectionWrapper、CSVSource、MergeJoiningSource、CachedDimension、SnowflakedDimension、SlowlyChangingDimension、BulkFactTable,以及 dimension.insert、facttable.insert、scdensure、ensure、lookup 等方法。
集成与生态可通过 PEP 249 连接器连接关系型数据库,通过 Jython 使用 JDBC 驱动。示例使用 PostgreSQL 与 psycopg2。项目托管在 GitHub,并发布到 PyPI;社区通过 GitHub issues、pull requests 和邮件列表协作。
文档质量提供 HTML 和 PDF 文档,并有安装指南、初学者指南、完整示例程序及多篇学术论文。论文解释框架思想,但文本提示论文不一定跟进最新功能,应以文档为准。
中国访问未知
适用场景构建数据仓库 ETL 流程;从 CSV 等数据源抽取并转换数据后写入维度表和事实表;处理雪花维度、缓存维度、缓慢变化维度;在医疗、金融、交通等行业生产系统中进行 ETL 开发。
同类Apache Hop、Pentaho Data Integration
性价比9
易用7
服务6
综合8
优点
  • 完全开源,采用 2-clause BSD 许可证
  • 基于标准 Python 程序,开发者对数据仓库 schema 和 ETL 逻辑控制力强
  • 对数据仓库常见模式支持较深入,如雪花维度、缓存维度、缓慢变化维度
  • 兼容 CPython 与 Jython,可连接 Python 与 JVM 生态中的数据库驱动
  • 有较长历史,2009 年已公开,文本称已用于医疗、金融、交通等生产系统
不足
  • 要求维度表和事实表已通过 SQL 创建,对数据仓库建模和 SQL 能力有要求
  • 不是图形化 ETL 工具,低代码或可视化编排能力未体现
  • 示例中部分高性能批量加载依赖数据库驱动特定代码,跨数据库迁移可能需要改造
  • 文本未提及托管服务、企业支持、SLA 或商业服务
  • 社区支持主要依赖 GitHub、邮件列表和公开讨论

深度测评

TG4G · 2026-06-08 更新 · 仅供参考

是什么

pygrametl 是一个用于编写 ETL 程序的 Python 框架,而不是图形化拖拽式 ETL 平台。它假定数据仓库中的维度表和事实表已由开发者用 SQL 创建,ETL 流程本身则以标准 Python 程序实现。项目自 2009 年公开,文本显示 2.8 版于 2023 年 9 月发布,并已在医疗、金融、交通等生产系统中使用。

核心能力

它的核心价值在于为数据仓库 ETL 提供常用抽象:数据源、缓存维度、事实表、雪花维度、缓慢变化维度等。开发者可以像遍历 Python 对象一样读取数据源行,用普通 Python 代码做转换,再调用 insert、ensure、lookup、scdensure 等方法写入目标表。对复杂维度场景支持较强,例如一次方法调用即可处理雪花维度中的查找和插入,也能处理缓慢变化维度 Type 1 覆盖与 Type 2 新增版本。

技术栈与集成

pygrametl 支持 CPython 和 Jython,因此既能使用 Python 原生扩展和 PEP 249 数据库连接器,也能在 JVM 环境中使用 JDBC 驱动。示例展示了 PostgreSQL 与 psycopg2,并通过驱动特定的 copy_from 实现批量加载。项目发布在 PyPI,也可从 GitHub 获取开发版本;社区协作主要依赖 GitHub、用户邮件列表和开发邮件列表。

定价与文档

项目完全开源,介绍中说明采用 2-clause BSD 许可证,未提及商业收费。安装方式简单,可 pip install pygrametl。文档方面提供 HTML、PDF、安装指南和初学者指南,还有完整示例及多篇学术论文,适合愿意阅读技术文档的工程团队。

优缺点与适合谁

优点是开放、轻量、代码化程度高,尤其适合需要精细控制 schema、转换逻辑和数据库加载方式的数据仓库开发者。缺点是门槛不低:用户需要懂 SQL、Python、维度建模和数据库连接器;它也不提供 Apache Hop 或 Pentaho Data Integration 那样的可视化编排体验。中国访问情况文本未说明,PyPI、GitHub 和项目站点的可达性可能受网络环境影响,应按实际环境验证。

本测评基于公开资料整理,不构成购买建议,请以 pygrametl.org 官网实际信息为准。

中文卖点

开源ETL库,适合数据仓库开发。

官网快照

/shot/pygrametl-org.png
pygrametl.org

价格走势

当前价 · 仅供参考
价格未公开 当前定价
价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分
6.0/10
TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

pygrametl.org 是一家未知的开发工具 (Python ETL框架)服务商. 本页收录其「Python数据ETL框架」套餐. 开源ETL库,适合数据仓库开发.
pygrametl.org 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于未知, 主要面向海外市场.
访问 pygrametl.org 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类