.NET HTML解析文档库
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Html Agility Pack(HAP)是一个用 C# 编写的 HTML 解析库,定位于在 .NET/C# 项目中读取、写入 HTML DOM,并支持 XPath 或 XSLT。它既可用于常规 HTML 文档处理,也可用于 C# 场景下的网页数据抽取。正文示例显示,它可以从文件、字符串和 Web URL 加载 HTML,并通过 HtmlDocument、HtmlWeb 等对象完成解析。
HAP 的核心能力集中在四类:解析、选择、操作和遍历。解析方面支持 From File、From String、From Web、From Browser;选择方面支持 XPath,并展示了 SelectNodes 用法,同时也可用 LINQ/Descendants 进行节点筛选。CSS 选择器在页面中标注为 Coming Soon,但正文也提到可借助 Fizzler 增强。DOM 操作包括 AppendChild、CreateNode、InsertAfter、PrependChild,并可读取 InnerHtml、InnerText。遍历能力包括 ChildNodes、Descendants()、Elements() 等。
页面明确说明 Html Agility Pack 是 FREE and always will be,并称其属于开源项目。项目接受贡献以支持维护,正文提到过去一年投入超过 3000 小时,并列出每年 3000+ 请求、500 次提交、100 次发布等维护指标。生态方面,它由 Entity Framework Extensions 赞助,并可结合 Fizzler、ScrapySharp 等第三方库使用。
优点是面向 C# 开发者非常直接,API 示例清晰,支持 XPath、XSLT 与 LINQ,覆盖 HTML 加载、查询、遍历和改写的常见需求;免费开源也带来较高性价比。局限在于正文没有说明 NuGet 安装、许可证、.NET 版本兼容性和完整 API 文档;CSS Selector 原生支持尚未明确完成;v2.x 也没有官方发布日期。
它适合 .NET/C# 后端、数据采集、内容清洗、测试工具或需要处理非严格 HTML 的开发者。若团队需要完整浏览器自动化、JavaScript 渲染或反爬处理,仅凭正文无法确认 HAP 能覆盖。中国访问情况正文未提供,支付信息也未提及;由于项目免费,主要关注包源与官网可达性。替代或增强方案可关注正文提到的 Fizzler、ScrapySharp。
本测评基于公开资料整理,不构成购买建议,请以 html-agility-pack.net 官网实际信息为准。
知名HAP库文档与示例,适合.NET爬虫解析。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。