惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Attack and Defense Labs
Attack and Defense Labs
The GitHub Blog
The GitHub Blog
C
Check Point Blog
博客园_首页
MongoDB | Blog
MongoDB | Blog
N
Netflix TechBlog - Medium
F
Full Disclosure
Microsoft Security Blog
Microsoft Security Blog
爱范儿
爱范儿
Recent Announcements
Recent Announcements
阮一峰的网络日志
阮一峰的网络日志
G
GRAHAM CLULEY
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
T
Threat Research - Cisco Blogs
C
Cybersecurity and Infrastructure Security Agency CISA
V
Vulnerabilities – Threatpost
K
Kaspersky official blog
博客园 - 司徒正美
S
Schneier on Security
T
The Exploit Database - CXSecurity.com
Project Zero
Project Zero
云风的 BLOG
云风的 BLOG
Cisco Talos Blog
Cisco Talos Blog
Know Your Adversary
Know Your Adversary
雷峰网
雷峰网
V
V2EX - 技术
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Spread Privacy
Spread Privacy
罗磊的独立博客
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
S
Security Affairs
SecWiki News
SecWiki News
Schneier on Security
Schneier on Security
O
OpenAI News
Jina AI
Jina AI
PCI Perspectives
PCI Perspectives
Cyberwarzone
Cyberwarzone
Y
Y Combinator Blog
Apple Machine Learning Research
Apple Machine Learning Research
B
Blog RSS Feed
I
InfoQ
D
Docker
P
Palo Alto Networks Blog
Recorded Future
Recorded Future
M
MIT News - Artificial intelligence
博客园 - Franky
B
Blog
Scott Helme
Scott Helme
博客园 - 叶小钗
D
DataBreaches.Net

博客园 - 简单就好

Google SEO官方《搜索引擎优化指南》(1):网页title篇 解析Html生成标签树(二) 解析Html生成标签树(一) 解析Html生成标签树(前言) 61条面向对象设计的经验原则 ORACLE系列(-)入门 XP下安装SQLSERVER2000企业版 将数据库从SQL2000迁移到SQL2005时,无法查看关系图的解决办法 - 简单就好 - 博客园 *.Config配置文件的操作 - 简单就好 - 博客园 存储过程编写经验和优化措施 - 简单就好 [转载]掌握 Ajax,第 1 部分: Ajax 简介 用XML数据岛创建上下文菜单 AOP 实现 [转]基于AJAX的ASP.NET聊天室 & 如何建立共识 - 简单就好 如何操作Excel - 简单就好 50种方法巧妙优化你的SQL Server数据库 - 简单就好 高效率Tree 提高睡眠质量 - 简单就好 SQL基础(二) - 简单就好 - 博客园
小旋风搜索教程(一)
简单就好 · 2009-03-21 · via 博客园 - 简单就好
 

        分页,是大家经常做的一件事,其中有一种分页是通过URL参数的传递而进行的。

              比如大家经常看到像这样的url 

http://www.xxx.com/page=1

http://www.xxx.com/page=2

http://www.xxx.com/page=3

….

利用这样URL而获取分页的数据。这里不考虑URL重写的问题。或者更好的分页方法。

下面我来告诉大家如果设置利用小旋风来抓取这样的网页。

下面大家来设置变量属性

URL地址: 设置你要挖掘数据url 比如说 http://www.xxx.com/page=1 但是把你要设置成变量的数字去掉,“page=1记得把1给去掉。

位置标识 设置变量名 比如http://www.xxx.com/page=1 就设置成page=,OK

起始: 设置变量的最小值

终止:设置变量的最大值

步长:设置变量的递增值"

这样就OK

完事。有不懂的话,联系我。第一次写教程,写的不好,忘大家见谅。

在此多谢飞狐指点。