惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Microsoft Azure Blog
Microsoft Azure Blog
S
Securelist
V
Vulnerabilities – Threatpost
C
Cyber Attacks, Cyber Crime and Cyber Security
Schneier on Security
Schneier on Security
Cyberwarzone
Cyberwarzone
Simon Willison's Weblog
Simon Willison's Weblog
Hacker News - Newest:
Hacker News - Newest: "LLM"
P
Palo Alto Networks Blog
T
Troy Hunt's Blog
SecWiki News
SecWiki News
Security Archives - TechRepublic
Security Archives - TechRepublic
T
The Blog of Author Tim Ferriss
Project Zero
Project Zero
Microsoft Security Blog
Microsoft Security Blog
The Register - Security
The Register - Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
J
Java Code Geeks
F
Full Disclosure
阮一峰的网络日志
阮一峰的网络日志
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Attack and Defense Labs
Attack and Defense Labs
Know Your Adversary
Know Your Adversary
WordPress大学
WordPress大学
PCI Perspectives
PCI Perspectives
N
News | PayPal Newsroom
The Last Watchdog
The Last Watchdog
酷 壳 – CoolShell
酷 壳 – CoolShell
P
Privacy & Cybersecurity Law Blog
P
Proofpoint News Feed
V
Visual Studio Blog
C
CERT Recently Published Vulnerability Notes
H
Help Net Security
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
云风的 BLOG
云风的 BLOG
月光博客
月光博客
T
The Exploit Database - CXSecurity.com
I
InfoQ
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
U
Unit 42
腾讯CDC
小众软件
小众软件
V2EX - 技术
V2EX - 技术
罗磊的独立博客
Cloudbric
Cloudbric
Recorded Future
Recorded Future
IT之家
IT之家
Google DeepMind News
Google DeepMind News
C
CXSECURITY Database RSS Feed - CXSecurity.com

搜索引擎技术研究

装机 配置 预算 - V2EX neko kasm 远程浏览器 docker 自部署 - V2EX 不知道有没有人精通 SEO,我想咨询下我网站的百度搜索问题 - V2EX 目前还有支持网页快照的搜索引擎没? - V2EX 如何起昵称,可以利用到搜索引擎的分词规则,进而避免在搜索引擎中被搜索到? - V2EX 如何让一些对搜索引擎不友好的内容平台变得友好? - V2EX 你们使用的常用搜索关键词或技巧是什么? - V2EX 分享一个搜索引擎 - V2EX 学习向量搜求教 - V2EX Brave Search 是当下我认为最好的搜索引擎 - V2EX 同样的搜索内容,为啥谷歌返回的结果差别那么大? - V2EX 关于 google 中文搜索结果的问题 - V2EX 想了解“概念”这个汉语词汇的词源,搜索引擎的搜索关键词应该用什么? - V2EX 求助各位 SEO 搜索的问题:百度站内搜索,搜一些没有内容的关键字会搜出广告,请问是被黑了吗,怎么防止呢? - V2EX Google Search Is Dying - V2EX 谷歌精确中文字符串搜索无效 - V2EX 百度/bing 搜索结果过滤插件有推荐的吗? - V2EX 谷歌的爬虫有点厉害啊 - V2EX 百度搜索已由提高自家站点权重的引流方式改变为屏蔽其他网站 - V2EX 分享一个集中式阅读英文技术文档的网站 - V2EX 关于大量文本搜索的功能要怎么设计 - V2EX dogedoge 什么时候可以上市呀?我一定要去买它的股票,国内上市好了,比较好买。 - V2EX 向各位大神请教关于搜索聚合的问题 - V2EX 从零开发的工作搜索网站,一个人全栈开发的,大家看看怎么样 - V2EX 什么样的搜索引擎,才是用户所需要的搜索引擎? - V2EX sphinx Linux 两千万数据 (current index format allows up to 4 GB) - V2EX 新站一个月,搜索引擎抓取留念 - V2EX Top 10 搜索引擎爬虫和 User-Agents - V2EX 那些不用百度搜索的,及不招用百度搜索的求职者的,怎么看待这个 - V2EX 网站统计可以运算吗 - V2EX 一种非常好的优化手段 - V2EX blekko | slashtag search - V2EX 求 SEO 的书籍/E-book/Blog? - V2EX 关于SEO - V2EX 关于目前 V2EX 搜索所用到的软件 - V2EX
如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词 - V2EX
chenjunqiang · 2020-05-30 · via 搜索引擎技术研究

chenjunqiang

如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词

 

chenjunqiang · 2020 年 5 月 30 日 · 4408 次点击

这是一个创建于 2206 天前的主题,其中的信息可能已经有所发展或是发生改变。

目前小弟正在处理大批量的词,想问问,这些词是否有什么快捷的方法来分类出来。

因为有几十万个词,不奢求全自动化处理完全部的词。

希望有一个策略告知如何分类出来。

目前我已经处理的是:

导航词这个比较容易处理,就是别人品牌词,自己品牌词,之类的。好处理,但是没有策略自动化处理

事务搜索词,目前我用了价格词处理了一波

信息搜索词,还没有想到招怎么处理。

弱弱的问问各个大大如何处理