惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - kevin's place

Using Enterprise Architect windows目录庞大的其中一个原因 [转]垂直搜索技术探讨(3) [转]垂直搜索相关新闻(2) [转]垂直搜索基础知识(1) [转]我对关系型数据库设计范式的理解 [转]当前的行业环境下选择创业? sharepoint portal server 2003--安装 sharepoint portal server 2003--入门资料 通信软件的发展现状和分析(zz) bug001 [旧文]关于权限的设计(1) NHibernate学习[1] - kevin's place 原来我的OO思维还在原始社会 杂谈3G的方方面面及其必然之失败[参考] 移动通信网络管理系统之网络监控系统[参考] 权限系统概要(转载) 权限系统的详细讨论 关于《Visual SourceSafe中的权限管理》
[转]垂直搜索技术讨论(4)
kevin's plac · 2007-03-16 · via 博客园 - kevin's place

垂直搜索引擎的选型

网页搜索引擎的存在有他存在的土壤,土壤环境是怎么样的呢?
1.海量的数据,互联网上有海量的数据,并且这些数据在快速增长、不断更新
2.分散的数据,这些数据存在于成千上万个网站中
3.多样化的数据
4.用户多样化的数据搜索需求
5.用户对搜索数据的实时性要求不是非常强
6.用户对这些数据有整合使用的需求,并且这种需求量很大
7.能够很好的对整合来的数据进行处理,能够完整的满足用户的这种需求,提供完整的信息检索体验

垂直搜索引擎存在的土壤:
1.网页搜索引擎无法对某类数据进行深度加工,提供更多的细化的服务
2.网页的数据实在是太多样化了(数据种类、数据类型等),不利于满足用户细分的服务
3.用户有对互联网数据进行深度采集,数据的深度加工提供更细化的服务的需求,这种需求量非常巨大
4.用户对某类信息的实时性的要求比较高
5.针对某类信息提供更简洁、更快速,更可依赖性更强的服务
6.行业性优化

垂直搜索存在的必备条件:
1.海量的数据,所选择的垂直搜索的数据必须是海量的数据,数据量和增长速度、增长量都比较大。符合搜索引擎的基本条件
2.分散的数据,这种数据必须要分散在很多个不同网站。不能是仅存在于几个网站。如果仅存在于几个网站不如做元搜索了(如果信息集中在几个网站,用户可以直接去使用)
3.用户对这些数据的实时性有一定要求,但是又不能是对实时性要求极高
(显然,春运期间的二手火车票信息就不适合做垂直搜索,因为等采集处理完毕,那票说不定已经卖掉了。拍卖的价格信息不适合做垂直搜索,有可能还没有采集处理完毕,价格已经变化了。)
4.用户对这类数据的需求量是很大的,而且需要长期使用。(搜索是需要学习、长期使用才能很好的驾驭的一种应用)
5.技术上能够很好的完成信息的整合、深度加工,并且加工后能够完整的满足用户对这类数据的搜索需求,提供完整的应用体验。
6.这种信息的深度采集、深度加工是网页搜索引擎完全不可以替代的。

垂直搜索选型的步骤:
1.选定适合您的,您熟悉的,有一定的资源背景的几个垂直搜索的被选方案。
2.查看google或百度(其它搜索引擎不行)检索关键词数据。
最好能搞到连续一段时间的全部词汇(按照检索频率排序),当然这几乎不可能,进行详细的分析、统计、挖掘。搞不到只要看风云榜和百度指数了,这估计就有很大偏差了。
对这些用户需求数据库进行深度分析找出用户到底要什么、互联网上缺什么。
(第1步和第2步交替进行)
3.分析相关行业的网站,评估用户需求、数据情况、横向竞争、纵向竞争、潜在竞争情况和可能遇到的其它问题。
4.如何满足用户的需求?如何保持产品和门户网站、搜索门户等的差异化和挖掘出用户潜在的最大的需求?
5.评估技术上的可行性,能否实现完整用户体验
6.如何保证产品的领先性(资源、效果、市场、技术、销售……)
7.产品的市场推广方式(这点非常非常重要,如何在竞争对手反应过来之前低成本的快速抵达有效用户群是成败的关键)
8.盈利模式;收入模型、成本模型
第一步完成到什么程度,达到什么目标。需要多少成本
第二步完成到什么程度,是否可以收支平衡或者获得投资
…………
9.产品的不足和先天的缺陷如何克服弥补。产品的生命周期的每一步可能出现的紧急问题如何应对。
10.不要认为自己很聪明,这世界上聪明人太多了,你能想到的肯定有n个人已经想到了。
  关键在于您能不能充分利用自己的资源,做好前期的调查后专注的执行。
11.务必要找百度和google这类搜索引擎不愿意花大功夫去做(市场暂时不够大)、或者不可能能做的应用(受制约、有更重要的事情要做),不要把你的模式和意图暴露得太早,这个市场的竞争实在是太激烈了,中国人也都太聪明了。
  务必要找和门户网站、网页搜索引擎有很大差异化,并且用户有持续的很大的需求的。理由很简单:搜索是需要持续使用才能熟练的一种产品、从门户和网页搜索引擎到您的垂直引擎的门槛很高(比多点击10次的门槛还高很多)。