Majestic爬虫说明站
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
MJ12Bot 是 Majestic 旗下的网络爬虫,定位为“Good crawler”,会标识自身,分布式、全球运行,并遵守 robots.txt。它服务于 Majestic.com 的数据体系,核心目标不是缓存网页内容或个人数据,而是抓取网站之间的链接关系,构建网页图谱与反向链接搜索索引。
从营销/SEO 角度看,MJ12Bot 的价值在于为 Majestic 的 Site Explorer 等反向链接分析能力提供底层数据。正文称 Majestic 是英国专业搜索引擎,覆盖 13 种语言、60 多个国家,被数十万企业使用。MJ12Bot 当前抓取的数据主要是 web graph of links,即链接图谱,而非全文网页缓存。
站长可通过 robots.txt 阻止 MJ12Bot:指定 User-agent: MJ12bot 并 Disallow: /。它还支持 Crawl-Delay,最高 20 秒;支持同站 robots.txt 重定向、Disallow 简单通配、Allow 优先级等扩展。由于其是社区分布式爬虫,没有固定连续 IP 段,因此官方不建议用 htaccess 按 IP 封禁。若需验证请求来源,可联系官方设置 CRAWLER-IDENT。支持渠道主要是邮箱 [email protected]。
抓取正文没有提供 Majestic 或 MJ12Bot 的定价、套餐、支付方式或免费试用信息。适用对象包括网站站长、SEO 团队、营销分析人员,以及需要管理爬虫访问的运维团队。对普通用户而言,MJ12Bot 不是直接使用的营销工具,而是 Majestic 外链数据的采集端。
优点是身份透明、遵守 robots.txt、说明文档较详细,并明确说明不缓存网页内容或个人数据。缺点是分布式 IP 难以按地址管理,且可能继续访问 404、301、nofollow 相关链接;Crawl-Delay 上限也有限。正文未披露中国大陆网络可访问性、支付方式或本地替代品信息,因此中国访问状态判断为未知。
本测评基于公开资料整理,不构成购买建议,请以 mj12bot.com 官网实际信息为准。
解释MJ12Bot来源,站长排查爬虫有用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。