惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Tenable Blog
Last Week in AI
Last Week in AI
P
Proofpoint News Feed
Engineering at Meta
Engineering at Meta
H
Help Net Security
F
Fortinet All Blogs
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 司徒正美
量子位
N
Netflix TechBlog - Medium
Apple Machine Learning Research
Apple Machine Learning Research
小众软件
小众软件
Recorded Future
Recorded Future
博客园 - 三生石上(FineUI控件)
Vercel News
Vercel News
aimingoo的专栏
aimingoo的专栏
I
InfoQ
Microsoft Security Blog
Microsoft Security Blog
Scott Helme
Scott Helme
The Last Watchdog
The Last Watchdog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
IT之家
IT之家
AI
AI
WordPress大学
WordPress大学
Security Archives - TechRepublic
Security Archives - TechRepublic
Google Online Security Blog
Google Online Security Blog
U
Unit 42
V2EX - 技术
V2EX - 技术
MongoDB | Blog
MongoDB | Blog
Schneier on Security
Schneier on Security
博客园 - Franky
H
Heimdal Security Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Jina AI
Jina AI
W
WeLiveSecurity
P
Privacy & Cybersecurity Law Blog
Cloudbric
Cloudbric
B
Blog RSS Feed
N
News | PayPal Newsroom
S
Securelist
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
I
Intezer
Hacker News - Newest:
Hacker News - Newest: "LLM"
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
博客园_首页
罗磊的独立博客
H
Hackread – Cybersecurity News, Data Breaches, AI and More
雷峰网
雷峰网

博客园 - Keep Walking

电商微博分享现状研究 关于各网站回到顶部的细节功能 大电商网站导航用户体验对比 回顾我的2010,20本书陪我度过的三十而立的年纪 mysql cardinality 运营一个网站,新增加一个功能,容易忽视哪些问题就匆匆上线? 强烈的孤独感,没有人能体味.... 改进UCHOME的记录发布,增强可访问性用户体验 关于疯狂想法的后续 一个疯狂想法 我的面试php程序员的面试题 china-pub登录问题 uchome为什么采用myisam类型表 关于验证码产品设计的一处细节问题 《高性能mysql》到手 用户体验之新浪滚动新闻 号外号外,美国53岁软件工程师架飞机撞政府楼 博客园logo HTML标签权重分值排列
周五了,发给大家个好玩的东西
Keep Walking · 2010-04-16 · via 博客园 - Keep Walking

http://www.dotnetdotcom.org/

今天在检查iis日志的时候发觉这个爬虫抓取我的博客频道的频率一天竟然高达 1000次!所以搜索了它,发觉了这么好玩的一个东西。

他是一群来自西雅图的人试图如何让互联网的数据更加公开。他们提供了互联网的一个索引(可以BT下载),重达3.2G,非压缩版14G,如果你正要准备做一个垃圾引擎,可以尝试下载下来用用。当然你也可以屏蔽这个搜索引擎,

User-agent: dotbot 

Disallow: / 

你还可以看到他对互联网的总体http状态统计,75%是200,404,403占8%。