惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

阮一峰的网络日志
阮一峰的网络日志
C
Cyber Attacks, Cyber Crime and Cyber Security
P
Privacy & Cybersecurity Law Blog
Cloudbric
Cloudbric
GbyAI
GbyAI
T
Threatpost
Google DeepMind News
Google DeepMind News
Jina AI
Jina AI
The Hacker News
The Hacker News
Y
Y Combinator Blog
Blog — PlanetScale
Blog — PlanetScale
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
I
Intezer
美团技术团队
S
Schneier on Security
I
InfoQ
Project Zero
Project Zero
S
SegmentFault 最新的问题
IT之家
IT之家
C
CXSECURITY Database RSS Feed - CXSecurity.com
C
CERT Recently Published Vulnerability Notes
博客园 - 司徒正美
Security Latest
Security Latest
G
Google Developers Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Cisco Talos Blog
Cisco Talos Blog
L
LINUX DO - 最新话题
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
L
Lohrmann on Cybersecurity
G
GRAHAM CLULEY
Engineering at Meta
Engineering at Meta
L
LangChain Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
C
Cisco Blogs
大猫的无限游戏
大猫的无限游戏
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Apple Machine Learning Research
Apple Machine Learning Research
雷峰网
雷峰网
V
V2EX
The Register - Security
The Register - Security
A
Arctic Wolf
www.infosecurity-magazine.com
www.infosecurity-magazine.com
T
Tor Project blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Microsoft Security Blog
Microsoft Security Blog
Stack Overflow Blog
Stack Overflow Blog
Vercel News
Vercel News
Spread Privacy
Spread Privacy
H
Help Net Security
H
Heimdal Security Blog

搜索引擎技术研究

装机 配置 预算 - V2EX neko kasm 远程浏览器 docker 自部署 - V2EX 不知道有没有人精通 SEO,我想咨询下我网站的百度搜索问题 - V2EX 目前还有支持网页快照的搜索引擎没? - V2EX 如何起昵称,可以利用到搜索引擎的分词规则,进而避免在搜索引擎中被搜索到? - V2EX 如何让一些对搜索引擎不友好的内容平台变得友好? - V2EX 你们使用的常用搜索关键词或技巧是什么? - V2EX 分享一个搜索引擎 - V2EX 学习向量搜求教 - V2EX Brave Search 是当下我认为最好的搜索引擎 - V2EX 同样的搜索内容,为啥谷歌返回的结果差别那么大? - V2EX 关于 google 中文搜索结果的问题 - V2EX 想了解“概念”这个汉语词汇的词源,搜索引擎的搜索关键词应该用什么? - V2EX 求助各位 SEO 搜索的问题:百度站内搜索,搜一些没有内容的关键字会搜出广告,请问是被黑了吗,怎么防止呢? - V2EX Google Search Is Dying - V2EX 谷歌精确中文字符串搜索无效 - V2EX 百度/bing 搜索结果过滤插件有推荐的吗? - V2EX 谷歌的爬虫有点厉害啊 - V2EX 百度搜索已由提高自家站点权重的引流方式改变为屏蔽其他网站 - V2EX 分享一个集中式阅读英文技术文档的网站 - V2EX 关于大量文本搜索的功能要怎么设计 - V2EX dogedoge 什么时候可以上市呀?我一定要去买它的股票,国内上市好了,比较好买。 - V2EX 向各位大神请教关于搜索聚合的问题 - V2EX 从零开发的工作搜索网站,一个人全栈开发的,大家看看怎么样 - V2EX 什么样的搜索引擎,才是用户所需要的搜索引擎? - V2EX sphinx Linux 两千万数据 (current index format allows up to 4 GB) - V2EX 新站一个月,搜索引擎抓取留念 - V2EX Top 10 搜索引擎爬虫和 User-Agents - V2EX 那些不用百度搜索的,及不招用百度搜索的求职者的,怎么看待这个 - V2EX 网站统计可以运算吗 - V2EX 一种非常好的优化手段 - V2EX blekko | slashtag search - V2EX 求 SEO 的书籍/E-book/Blog? - V2EX 关于SEO - V2EX 关于目前 V2EX 搜索所用到的软件 - V2EX
如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词 - V2EX
chenjunqiang · 2020-05-30 · via 搜索引擎技术研究

chenjunqiang

如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词

 

chenjunqiang · 2020 年 5 月 30 日 · 4408 次点击

这是一个创建于 2206 天前的主题,其中的信息可能已经有所发展或是发生改变。

目前小弟正在处理大批量的词,想问问,这些词是否有什么快捷的方法来分类出来。

因为有几十万个词,不奢求全自动化处理完全部的词。

希望有一个策略告知如何分类出来。

目前我已经处理的是:

导航词这个比较容易处理,就是别人品牌词,自己品牌词,之类的。好处理,但是没有策略自动化处理

事务搜索词,目前我用了价格词处理了一波

信息搜索词,还没有想到招怎么处理。

弱弱的问问各个大大如何处理