惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Simon Willison's Weblog
Simon Willison's Weblog
G
Google Developers Blog
Spread Privacy
Spread Privacy
I
InfoQ
V
V2EX
S
Schneier on Security
小众软件
小众软件
C
CERT Recently Published Vulnerability Notes
博客园 - 聂微东
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Stack Overflow Blog
Stack Overflow Blog
T
Threat Research - Cisco Blogs
L
Lohrmann on Cybersecurity
Recent Announcements
Recent Announcements
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Attack and Defense Labs
Attack and Defense Labs
云风的 BLOG
云风的 BLOG
The Hacker News
The Hacker News
S
SegmentFault 最新的问题
C
Cybersecurity and Infrastructure Security Agency CISA
NISL@THU
NISL@THU
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
GbyAI
GbyAI
Latest news
Latest news
S
Secure Thoughts
Project Zero
Project Zero
MongoDB | Blog
MongoDB | Blog
I
Intezer
Security Latest
Security Latest
Apple Machine Learning Research
Apple Machine Learning Research
Vercel News
Vercel News
N
Netflix TechBlog - Medium
V2EX - 技术
V2EX - 技术
量子位
T
Threatpost
T
The Blog of Author Tim Ferriss
Y
Y Combinator Blog
T
Tor Project blog
A
Arctic Wolf
Microsoft Security Blog
Microsoft Security Blog
T
The Exploit Database - CXSecurity.com
大猫的无限游戏
大猫的无限游戏
T
Tailwind CSS Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
C
Check Point Blog
博客园 - Franky
Google DeepMind News
Google DeepMind News
The Register - Security
The Register - Security
The GitHub Blog
The GitHub Blog
L
LINUX DO - 热门话题

搜索引擎技术研究

装机 配置 预算 - V2EX neko kasm 远程浏览器 docker 自部署 - V2EX 不知道有没有人精通 SEO,我想咨询下我网站的百度搜索问题 - V2EX 目前还有支持网页快照的搜索引擎没? - V2EX 如何起昵称,可以利用到搜索引擎的分词规则,进而避免在搜索引擎中被搜索到? - V2EX 如何让一些对搜索引擎不友好的内容平台变得友好? - V2EX 你们使用的常用搜索关键词或技巧是什么? - V2EX 分享一个搜索引擎 - V2EX 学习向量搜求教 - V2EX Brave Search 是当下我认为最好的搜索引擎 - V2EX 同样的搜索内容,为啥谷歌返回的结果差别那么大? - V2EX 关于 google 中文搜索结果的问题 - V2EX 想了解“概念”这个汉语词汇的词源,搜索引擎的搜索关键词应该用什么? - V2EX 求助各位 SEO 搜索的问题:百度站内搜索,搜一些没有内容的关键字会搜出广告,请问是被黑了吗,怎么防止呢? - V2EX 谷歌精确中文字符串搜索无效 - V2EX 百度/bing 搜索结果过滤插件有推荐的吗? - V2EX 谷歌的爬虫有点厉害啊 - V2EX 百度搜索已由提高自家站点权重的引流方式改变为屏蔽其他网站 - V2EX 分享一个集中式阅读英文技术文档的网站 - V2EX 关于大量文本搜索的功能要怎么设计 - V2EX dogedoge 什么时候可以上市呀?我一定要去买它的股票,国内上市好了,比较好买。 - V2EX 如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词 - V2EX 向各位大神请教关于搜索聚合的问题 - V2EX 从零开发的工作搜索网站,一个人全栈开发的,大家看看怎么样 - V2EX 什么样的搜索引擎,才是用户所需要的搜索引擎? - V2EX sphinx Linux 两千万数据 (current index format allows up to 4 GB) - V2EX 新站一个月,搜索引擎抓取留念 - V2EX Top 10 搜索引擎爬虫和 User-Agents - V2EX 那些不用百度搜索的,及不招用百度搜索的求职者的,怎么看待这个 - V2EX 网站统计可以运算吗 - V2EX 一种非常好的优化手段 - V2EX blekko | slashtag search - V2EX 求 SEO 的书籍/E-book/Blog? - V2EX 关于SEO - V2EX 关于目前 V2EX 搜索所用到的软件 - V2EX
Google Search Is Dying - V2EX
dcoder · 2022-02-17 · via 搜索引擎技术研究
4BVL25L90W260T9U

8

4BVL25L90W260T9U      2022 年 2 月 17 日

以我的体验来讲,99% 的搜索结果,首页至少有两条是被 ublacklist 屏蔽的垃圾采集站(小 X 百科网)。当然,75% 左右的情形下,还是能找到正确结果的,只不过大多数时候都是在 Stack Exchange 全家桶和 GitHub 上。而在 2020 年以前,几乎 100% 能找到正确结果。

十分同意原文作者关于 Google 尝试着用 AI 变得“smart”的论断。在搜一些冷门关键词的时候,几乎 100% 的首页结果都是垃圾站内容,可能就是因为 Google 内部做的 query 改写太“智能”了。