海外资源测评导航
返回开发工具 海外资源 / 开发工具 / 开放数据集 / patentdataset.org
P
🔧 开发工具 开放数据集 美国总部 国内优化

patentdataset.org 开发工具测评

哈佛USPTO专利数据集

8.0/10 中国可用
TTG4G 编辑组 ·更新于 2026-06-08 ·数据来源: ai_crawl 评测方法 ↗
数据来源
ai_crawl · 最近更新 2026-06-08

⚡ 评分构成

五维加权 · 满分 10
性能 / 功能25% 8.0
性价比20% 8.0
中国可用度20% 10.0
口碑20% 6.4
售后 / 退款15% 7.5

各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。

行业深度解析AI 深度分析
一句话HUPD 是一个面向研究与开发的美国 USPTO 英文实用专利申请大规模数据集。
定价免费/开放下载 正文提供“Download the Dataset”“View the GitHub Codebase”,未提及收费或商业定价。
适合谁自然语言处理研究者、专利分析研究者、机器学习开发者、学术机构与需要英文专利申请语料的开发团队
核心功能包含 2004 年 1 月至 2014 年 12 月提交至 USPTO 的英文实用专利申请大规模、结构化、多用途语料库提供论文、GitHub 代码库、数据集下载和 Google Colab Notebooks
功能与用途HUPD 是 Harvard USPTO Patent Dataset,一个大规模、结构化、多用途的英文实用专利申请语料库,覆盖 2004 年 1 月至 2014 年 12 月提交至美国 USPTO 的专利申请。适用于专利 NLP、机器学习、文本分类、生成与检索等研究开发场景。
支持语言/框架数据语言为英文。正文未说明支持的编程语言或机器学习框架,但提供 Google Colab Notebooks,暗示可用于 Notebook 环境中的实验。
开源还是闭源正文提供 GitHub Codebase 和 Dataset 下载,代码库可查看;但未明确说明开源许可证或数据许可证。
自托管选项作为可下载数据集,用户可在本地或自有计算环境中使用;正文未提供专门的自托管服务说明。
定价正文未提及收费,提供 Download the Dataset,推测可免费获取,但具体许可和使用限制未披露。
API/SDK正文未提及 API 或 SDK。
集成与生态提供论文、GitHub 代码库、数据集下载和 Google Colab Notebooks,便于学术引用、代码复现和实验演示;未提及与主流云平台或开发工具的正式集成。
文档质量正文展示了论文、GitHub 代码库、数据集下载入口和 Colab 笔记本,基础研究材料较完整;但抓取内容未显示详细字段说明、数据字典、许可证、版本更新和使用限制。
中国访问未知
适用场景专利文本分类、专利摘要生成、专利检索、法律/技术文本 NLP、专利申请语言建模、学术论文复现实验
同类Google Patents Public Datasets、USPTO bulk data、The Lens、PatentsView
性价比8
易用7
服务5
综合7
优点
  • 来源明确,基于 USPTO 专利申请
  • 数据集定位清晰,适合英文专利 NLP 与机器学习研究
  • 提供论文、代码库和 Colab 笔记本,便于复现实验
不足
  • 正文未披露数据规模、字段结构、许可证和更新频率
  • 仅覆盖 2004-2014 年英文美国实用专利申请,时效性和地域范围有限
  • 未看到商业支持、API 或 SDK 信息

深度测评

TG4G · 2026-06-08 更新 · 仅供参考

是什么

HUPD(Harvard USPTO Patent Dataset)是一个由斯坦福、牛津、哈佛等研究者发布的美国 USPTO 英文实用专利申请数据集。根据页面说明,它覆盖 2004 年 1 月至 2014 年 12 月提交到 USPTO 的英文 utility patent applications,定位为“大规模、结构化、多用途”语料库。它更像研究数据基础设施,而非传统 SaaS 开发者工具。

核心能力与生态

从功能与用途看,HUPD 适合专利文本 NLP、机器学习建模、专利分类、检索、摘要生成、法律技术文本分析等场景。页面提供论文、GitHub Codebase、数据集下载和 Google Colab Notebooks,说明其重视可复现研究和实验上手。支持语言方面,数据本身是英文;抓取内容未说明专门支持 Python、PyTorch、TensorFlow 等框架,也未披露 API 或 SDK。

开放性、自托管与文档

页面可查看 GitHub 代码库并下载数据集,因此开发者应能在本地或自有计算环境中使用,具备事实上的自托管可行性。但正文没有明确开源许可证、数据许可证、字段定义、数据规模、版本更新策略或商用限制。文档质量方面,论文与 Colab 对研究者很有帮助,但仅从抓取文本看,工程化文档和数据治理信息仍不充分。

定价与中国访问

正文没有任何收费、订阅或企业版描述,提供“Download the Dataset”,可视为免费/开放下载型资源,但具体许可仍需以实际下载页为准。中国访问情况无法仅凭文本判断;GitHub、Google Colab 在中国大陆可能存在网络不稳定或访问受限,因此实际使用可能需要替代下载源或代理环境。支付方式无信息。

优缺点与适合人群

优点是数据来源权威、时间范围明确、研究材料配套较好,适合高校、实验室、NLP 工程师和专利分析团队。缺点是覆盖时间止于 2014 年,地域限于美国英文实用专利申请,且缺少 API、商业支持和许可细节。若需要持续更新、可视化检索或生产级接口,可对比 USPTO bulk data、Google Patents Public Datasets、PatentsView、The Lens 等替代方案。

本测评基于公开资料整理,不构成购买建议,请以 patentdataset.org 官网实际信息为准。

中文卖点

适合做专利NLP、检索和AI训练研究。

官网快照

/shot/patentdataset-org.png
patentdataset.org

价格走势

当前价 · 仅供参考
价格未公开 当前定价
价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分
8.0/10
TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

patentdataset.org 是一家美国的开发工具 (开放数据集)服务商. 本页收录其「哈佛USPTO专利数据集」套餐. 适合做专利NLP、检索和AI训练研究.
patentdataset.org 综合评分 8.0/10, 总部美国. 是什么 HUPD(Harvard USPTO Patent Dataset)是一个由斯坦福、牛津、哈佛等研究者发布的美国 USPTO 英文实用专利申请数据集。根据页面说明,它覆盖 2004 年 1 月至 2014 年 12 月提交到 USPTO 的英文 utility patent applicat... 完整深度测评见本页下方.
patentdataset.org 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于美国, 主要面向海外市场.
访问 patentdataset.org 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类

🌾 农业食品 🤖 AI 应用 🔗 API 数据 🚪 API 网关 🧊 3D素材 🚗 汽车出行 🗃 备份容灾 📋 公司合规 📡 智能盒子 🧱 建站模板 🌐 CDN 💬 聊天 App ☁ 网盘云盘 📖 漫画网文 ✉ 通讯邮箱 🏢 跨国名企 💰 加密 🗄 托管数据库 🏷 比价优惠 🎨 设计创意 📡 DNS 解析 🌍 域名 ⬇ 下载软件 🛒 电商 📚 教育课程 📧 邮件发送 ⚡ 能源环保 🎫 活动票务 🎪 会展展会 📤 文件传输 🏦 金融钱包 📝 表单调研 💭 论坛社区 💸 众筹融资 🎮 游戏服务 🎮 游戏市场 🕹 游戏平台 🎁 订阅礼品卡 🏛 政府机构 🎯 GPU 算力 🔌 硬件 IoT 🩺 医疗健康 👔 招聘远程 🖼 图片灵感 🛡 保险 💼 求职招聘 📒 知识笔记 ⚖ 法务财税 📍 本地生活 📦 物流货运 🔎 生活查询 🗺 地图导航 📈 营销 SEO 📺 流媒体订阅 🎞 家庭影音 📰 新闻资讯 🤝 公益慈善 📄 办公协作 🌍 国际组织 ☁ 应用部署 🎛 主机面板 🔑 密码安全 💳 支付 🐾 宠物 👕 印刷定制 🎙 播客有声 🔌 代理 ❓ 问答内容 🏠 房产租售 ⚡ 实时通信 🖥 远程桌面 🗂 资源站 ⚙ SaaS ♻ 二手交易 🛡 安全 📱 短视频直播 📲 接码虚拟号 💬 社交约会 🔐 SSL 证书 💾 云存储 🎓 留学教育 🎧 在线客服 🧰 在线工具 🌐 翻译本地化 ✈ 旅游出行 🏛 全球大学 🚀 加速器 VC ▶ 视频平台 🎬 视频托管 🔒 VPN 隐私 🖥 服务器 🌐 虚拟主机 🔏 零信任组网