惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Tenable Blog
Last Week in AI
Last Week in AI
P
Proofpoint News Feed
Engineering at Meta
Engineering at Meta
H
Help Net Security
F
Fortinet All Blogs
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 司徒正美
量子位
N
Netflix TechBlog - Medium
Apple Machine Learning Research
Apple Machine Learning Research
小众软件
小众软件
Recorded Future
Recorded Future
博客园 - 三生石上(FineUI控件)
Vercel News
Vercel News
aimingoo的专栏
aimingoo的专栏
I
InfoQ
Microsoft Security Blog
Microsoft Security Blog
Scott Helme
Scott Helme
The Last Watchdog
The Last Watchdog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
IT之家
IT之家
AI
AI
WordPress大学
WordPress大学
Security Archives - TechRepublic
Security Archives - TechRepublic
Google Online Security Blog
Google Online Security Blog
U
Unit 42
V2EX - 技术
V2EX - 技术
MongoDB | Blog
MongoDB | Blog
Schneier on Security
Schneier on Security
博客园 - Franky
H
Heimdal Security Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Jina AI
Jina AI
W
WeLiveSecurity
P
Privacy & Cybersecurity Law Blog
Cloudbric
Cloudbric
B
Blog RSS Feed
N
News | PayPal Newsroom
S
Securelist
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
I
Intezer
Hacker News - Newest:
Hacker News - Newest: "LLM"
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
博客园_首页
罗磊的独立博客
H
Hackread – Cybersecurity News, Data Breaches, AI and More
雷峰网
雷峰网

博客园 - Tiger!

centos 中通过yum安装最新的mono access需要替换日文编码的函数 网上搜集的webbrower的资料,很有借鉴价值 本地计算机可能没有必要的注册信息或消息 DLL 文件来从远程计算机显示消息。 C#常用的文件操作(网上收集) 转载 VB.NET编程调用迅雷下载文件(1) 进行网站建设,您应该想到的(zz) ASP常用的函数模块 Google AdSense 收藏几个有意思的SQL脚本(转载) C#/VB - Automated WebSpider / WebRobot 有人见过这么高的eCPM ? 一切都不象看起来那么严重 — 关于Fraud Clicks Google Adsense宝典: 如何合理地提高Google Adsense的收入 Google Adsense的致命伤 Google Adsense的无效点击 lucene倒排索引原理 基于.NET的开源搜索引擎-DotLucene(2) 基于.NET的开源搜索引擎-DotLucene(1)
DotLucene的一些知识(不完全总结)
Tiger! · 2006-07-07 · via 博客园 - Tiger!

DotLucene是什么?
搜索引擎的种类, 以及常见搜索算法,DotLucene是基于什么算法实现的

索引的基础概念和实现
搜索的基础概念和实现
Lucene的高级技巧

DotLucene的分析器
中文分词

==================================
搜索引擎一般来讲,可以分为两大类:全文检索引擎(FullText Search Engine)和分类目录(Directory)
全文检索:指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该
词在文章中出现的次数和位置。当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
全文检索的方法主要分为按字检索和按词检索两种
  按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中词与字是合一的,而中文字和词分别很大。
  按词检索是指对文章的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文是以空白切分词,而中文则不同,中文需要切分字词,以达到按中文语义单位建立索引的目的,需要分词方面的的技术。
  Lucene是一个全文检索的开源工具开发包,其实就是实现检索的API的集合。最初由JAVA实现。
现已有多个由不同语言实现的版本,DotLucene就用.net实现的Lucene.
  DotLucene的索引方式属于"倒排索引",倒排索引,简单来说,就是为了实现我们的一般"那些文章有这些关键字"到"这些关键字那些文章有",所以一般倒排索引需要实现一个"词典"和"出现情况"的倒排表。为什么说是倒排呢?
  DotLucene的一些基础概念:
 索引(index):文挡序列的集合;
 文挡(document):域序列的集合;
 域(field):项序列的集合;
 项(term):一个字串;
存在于不同域中的同一个字串被认为是不同的项。因此项实际是用一对字串表示的,第一个字串是域名,第二个是域中的字串。
http://lucene.cnblogs.com/archive/2004/12/20/79804.html

搜索一些的基础知识
http://kwklover.cnblogs.com/articles/424343.html

====================================
http://www.lietu.com/doc/index.htm
利用Lucene.net搜索引擎进行多条件搜索的做法
http://lucene.cnblogs.com/archive/2005/02/21/107033.html