惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Threat Research - Cisco Blogs
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
V
Vulnerabilities – Threatpost
GbyAI
GbyAI
P
Proofpoint News Feed
L
LINUX DO - 热门话题
P
Palo Alto Networks Blog
A
About on SuperTechFans
T
Tenable Blog
M
MIT News - Artificial intelligence
IT之家
IT之家
I
Intezer
D
DataBreaches.Net
爱范儿
爱范儿
T
Threatpost
C
CERT Recently Published Vulnerability Notes
云风的 BLOG
云风的 BLOG
博客园 - 三生石上(FineUI控件)
WordPress大学
WordPress大学
K
Kaspersky official blog
大猫的无限游戏
大猫的无限游戏
A
Arctic Wolf
Y
Y Combinator Blog
Cyberwarzone
Cyberwarzone
酷 壳 – CoolShell
酷 壳 – CoolShell
D
Darknet – Hacking Tools, Hacker News & Cyber Security
H
Help Net Security
Microsoft Security Blog
Microsoft Security Blog
Spread Privacy
Spread Privacy
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
AWS News Blog
AWS News Blog
博客园 - 聂微东
C
Check Point Blog
S
Securelist
有赞技术团队
有赞技术团队
雷峰网
雷峰网
aimingoo的专栏
aimingoo的专栏
Last Week in AI
Last Week in AI
Stack Overflow Blog
Stack Overflow Blog
MongoDB | Blog
MongoDB | Blog
D
Docker
G
GRAHAM CLULEY
T
The Exploit Database - CXSecurity.com
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tailwind CSS Blog
L
Lohrmann on Cybersecurity
G
Google Developers Blog
C
Cyber Attacks, Cyber Crime and Cyber Security
L
LangChain Blog

博客园 - 闪雷

[]一些好书 互联网创业者的20个自身检查 生活感悟 信息过载和个性化搜索 在你的blog上添加订阅到Google的代码 [转]谈 Page Rank – Google 的民主表决式网页排名技术 Feedburner关于Feed的思考 [转]RSS技术简介及其在中国的发展现状 [转]Gmail开始支持Feed阅读 [转]微软拟扩展RSS2.0 订阅者可修改内容 Jookster:六度搜索引擎 [转]Squidoo是什么? [转]RSS阅读的深度思考 [转]推荐关联RSS的方法 [转]Attention.xml初探 Reading List:升级版的OPML [转]Web 2.0创业公司流行小巧路线 关于RSS、OPML 关于 Blog 和 RSS 的全面介绍
Google最新算法 - 人肉搜索引擎
闪雷 · 2006-03-16 · via 博客园 - 闪雷

跟mop没什么关系,但早在上个月我就在donews论坛里看到一叫尚北京的哥们发明了人肉搜索引擎-即手工处理每个查寻,以email方式发送给你最准确的查寻结果。乍一看觉得不可能完成的任务,但是仔细想想只要人手够多就完全有可能,因为Google现在就是这样做的。

在前些天发的Google半官方对一些问题的解释一文里,提到了TrustRank这个名词。TrustRank是Google最近注册的一个专利名称,从名字上猜测是给个网站一个Trust值,人品高的Trust度高,人品差的Trust度低。然后根据这个Trust值去rank。听起来不错,不但听起来不错,而Google也正在这么做。

Google招聘页面里,有个职叫Quality Evaluation Associate/Administrator 。简单的说这个职位的工作是每天使用Google,然后挑出垃圾页面。一些分析apache raw log的站长发现一个叫eval.google.com的引用连接(即有人在eval.google.com为主机的页面点击该站长的网站URL,导致log文件留下了访问痕迹)。这显然是Quality Evaluation Associate/Administrator工作的动静。可以80%以上肯定的说,所有这些都在为Google TrustRank做准备。

面对TrustRank站长可以做些什么?

首先是正规的SEO手段了,包括(想到什么说什么):

  1. 有内容的网站
  2. 知道搜索引擎对网站的要求(Google 向网站管理员提供的信息, 百度与站长)
  3. 一致的站内链接策略(见Google半官方对一些问题的解释最后一个问题)
  4. 中文语句通顺,英文拼写正确,标点使用规范
  5. 最好使用XHTML web标准制作网站
  6. 每页主题明晰
  7. 不连接到人品差的网站
  8. 准确的whois信息

其次,别忘了TrustRank后面是人而不是Googlebot,所以网站要考虑人的因素(其实是废话,但现在很多网站都是给搜索引擎做的):

  1. 使用与Google相同的价值观建造和维护网站: Google 发现的十大真理  
  2. 有隐私策略页面(sina的隐私策略页面)。注意隐私策略不是形式,而是实事求是。比如你写了cookie,就要在该页面中说明为什么要写这个cookie,如何清除。又如用户需要注册,你就要说明你都用这些数据干什么,会不会把这些数据给别人,如果给为什么给。再如如果访问者可以订阅邮件列表,你就要说明如何退定,如何保证不把用户的email地址做垃圾邮件地址使用等等
  3. 有使用条款页面(Yahoo使用条款页面)。跟隐私策略页面一样,使用条款也要因网站而异。用户浏览你的网站就要遵守这些条款。
  4. 不要有SPAM记录。比如你的网站长期发送垃圾邮件、在论坛上SPAM,准会有人报告SPAM,这样一些机构会有记录。(某越南IP的SPAM记录:http://www.whois.sc/rbl/?ip=203.168.222.35
  5. 不要有乱七八糟的广告。这一点最重要,一些穷疯了的网站没有任何自己的内容,满屏飞广告。类似Adsense这样的干净的广告和内容健康位置固定的图片广告是没有问题的。
  6. 不要有违法内容,如提供破解软件、盗版电影等内容的网站是不会有好结果的。
  7. 没有原创内容的网站不应该存在。如果你的网站全是转载别人网站的内容,TrustRank是高不了的。

还有很多,越想越多。其实还是这句话,网站是给人做的,不是跟搜索引擎做的。再加一句:用不道德手段骗钱是对未来的透支 -可能透支未来的机会,可能透支未来的时间,可能透支未来的自由。