惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - Franky
N
Netflix TechBlog - Medium
Google Online Security Blog
Google Online Security Blog
月光博客
月光博客
量子位
酷 壳 – CoolShell
酷 壳 – CoolShell
V
V2EX
腾讯CDC
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 聂微东
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
M
MIT News - Artificial intelligence
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Hugging Face - Blog
Hugging Face - Blog
博客园 - 【当耐特】
Apple Machine Learning Research
Apple Machine Learning Research
aimingoo的专栏
aimingoo的专栏
博客园 - 三生石上(FineUI控件)
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
MongoDB | Blog
MongoDB | Blog
H
Help Net Security
The Cloudflare Blog
Blog — PlanetScale
Blog — PlanetScale
F
Full Disclosure
G
Google Developers Blog
罗磊的独立博客
Jina AI
Jina AI
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Y
Y Combinator Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
J
Java Code Geeks
A
About on SuperTechFans
IT之家
IT之家
大猫的无限游戏
大猫的无限游戏
S
SegmentFault 最新的问题
有赞技术团队
有赞技术团队
GbyAI
GbyAI
雷峰网
雷峰网
T
The Blog of Author Tim Ferriss
The Register - Security
The Register - Security
U
Unit 42
D
Docker
Martin Fowler
Martin Fowler
L
LINUX DO - 热门话题
NISL@THU
NISL@THU
阮一峰的网络日志
阮一峰的网络日志
C
Cybersecurity and Infrastructure Security Agency CISA
博客园_首页
Google DeepMind News
Google DeepMind News

允赫先森'sBlog

停更的半个月,是一场与平安的等候 停更的半个月,是一场与平安的等候 当你看到这几张图的时候,还能看回去吗? 当你看到这几张图的时候,还能看回去吗? 今年妈妈的生日,刚好是母亲节 今年妈妈的生日,刚好是母亲节 免费领取 1 年英伟达 AI API Key 免费领取 1 年英伟达 AI API Key 分享一份robots.txt规则,彻底屏蔽垃圾蜘蛛 高情商说话的二十条准则 高情商说话的二十条准则 启东话托福考试资料 启东话托福考试资料 基于LiMhy v4.0对博客进行了二次升级优化 基于LiMhy v4.0对博客进行了二次升级优化 一封迟到了20天的明信片,一份从未迟到的温暖 一封迟到了20天的明信片,一份从未迟到的温暖 推荐,又一款简洁实用的个人博客系统!LiMhy v3.0 横空出世 推荐,又一款简洁实用的个人博客系统!LiMhy v3.0 横空出世 《允赫·问道长生》—纯文字修仙,重燃你的修真梦 为你的 LiMhy 博客增加博主在线状态 为你的 LiMhy 博客增加安全跳转卡片 允赫聚合正式上线:打破信息茧房,回归纯粹阅读 清明祭父:陵园一拜,思念绵长 为你的 LiMhy 博客系统首页添加动态轮播 为你的 LiMhy 博客系统首页添加毒鸡汤 DeepSeek v3.2加持,AI摘要插件v1.0.1 震撼上线 ICO图标生成工具迎来重磅更新 为你的 LiMhy 博客增加友链自动审核(更新) 晒单!博客 20 周年纪念 T 恤和帽子顺利签收
分享一份robots.txt规则,彻底屏蔽垃圾蜘蛛
允赫先森 · 2026-04-23 · via 允赫先森'sBlog

分享一份robots.txt规则,彻底屏蔽垃圾蜘蛛

685 字 约 2 分钟

很多站长都会遇到这样的困扰

网站每天消耗大量流量,排查服务器日志后才发现,这些流量大多来自毫无价值的垃圾蜘蛛。
这些垃圾蜘蛛不仅不会为网站带来任何正向价值,反而会持续占用服务器带宽和资源,拖慢网站加载速度,甚至影响正常用户访问。想要从根源上解决这个问题,最直接有效的方法就是屏蔽它们。
为此,我整理了一份robots.txt规则,专门用于屏蔽各类常见垃圾蜘蛛,现在分享给大家,建议收藏备用,避免后续需要时找不到。
以下是完整规则(建议直接复制到网站根目录使用):

User-agent: AhrefsBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: ZoominfoBot
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: aiHitBot
Disallow: /
User-agent: Mail.RU_Bot
Disallow: /
User-agent: XoviBot
Disallow: /
User-agent: MauiBot
Disallow: /
User-agent: SERankingBacklinksBot
Disallow: /

如何应用这份规则?

登录服务器,找到网站根目录。
创建或修改 robots.txt,粘贴上述规则。
这份 robots.txt 规则能屏蔽哪些爬虫?

User-agent所属公司/项目主要用途被禁止的原因
AhrefsBotAhrefs用于收集网页数据以进行SEO分析和反向链接检查。可能消耗大量服务器资源,影响网站性能。
MJ12botMajestic-12爬取网页以建立链接索引,支持Majestic搜索引擎的链接分析功能。高频爬取可能导致服务器负载过高。
DotBotDotNetDotCom.org为SEO工具提供数据支持,收集网页信息。爬取行为可能过于频繁,影响正常访问。
SemrushBotSemrush收集数据以支持SEO竞争分析、关键词研究等营销工具。大量爬取可能导致资源占用过高。
ZoominfoBotZoomInfo收集企业联系信息和公开数据,用于商业数据库。可能抓取非公开信息或导致隐私问题。
BLEXBotContent ad爬取网页内容以生成广告或内容推荐。可能抓取敏感内容或消耗过多带宽。
aiHitBotaiHit为aiHit公司收集企业数据,用于商业数据库。爬取频率高或目标数据可能涉及隐私。
Mail.RU_BotMail.RU (俄罗斯邮件服务)为Mail.ru搜索引擎索引内容。可能因爬取策略激进被网站屏蔽。
XoviBotXovi (SEO工具)支持Xovi的SEO分析工具,爬取网页数据。高频请求可能干扰正常服务。
SERankingBacklinksBotSE Ranking(海外知名 SEO 工具商)专门用来全网抓取、统计网站的反向链接(Backlinks)高频请求可能干扰正常服务。