惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
博客园 - Franky
GbyAI
GbyAI
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
爱范儿
爱范儿
IT之家
IT之家
酷 壳 – CoolShell
酷 壳 – CoolShell
aimingoo的专栏
aimingoo的专栏
博客园_首页
MongoDB | Blog
MongoDB | Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Recent Announcements
Recent Announcements
Scott Helme
Scott Helme
有赞技术团队
有赞技术团队
M
MIT News - Artificial intelligence
C
CERT Recently Published Vulnerability Notes
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Jina AI
Jina AI
F
Fortinet All Blogs
N
Netflix TechBlog - Medium
L
LangChain Blog
L
LINUX DO - 最新话题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
H
Hacker News: Front Page
MyScale Blog
MyScale Blog
P
Palo Alto Networks Blog
G
Google Developers Blog
Google DeepMind News
Google DeepMind News
AI
AI
T
Troy Hunt's Blog
Microsoft Azure Blog
Microsoft Azure Blog
阮一峰的网络日志
阮一峰的网络日志
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Vercel News
Vercel News
Microsoft Security Blog
Microsoft Security Blog
罗磊的独立博客
S
Secure Thoughts
大猫的无限游戏
大猫的无限游戏
博客园 - 叶小钗
人人都是产品经理
人人都是产品经理
Blog — PlanetScale
Blog — PlanetScale
博客园 - 司徒正美
Apple Machine Learning Research
Apple Machine Learning Research
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 三生石上(FineUI控件)
S
Security @ Cisco Blogs
Cloudbric
Cloudbric
E
Exploit-DB.com RSS Feed
Attack and Defense Labs
Attack and Defense Labs

博客园 - 寒 刚入门

如何在IIS7或IIS7.5中导入导出站点及应用程序池. 编程点滴.验证信息本地化遇到的问题 编程点滴.技巧小记.处理"可疑"数据库 编程点滴.技巧小记.数据库链接 Razor 语法快速参考 [转]SQL,LINQ,Lambda语法对照图 编程点滴.LUCENE保存检索表达式遇到的问题 - 寒 刚入门 - 博客园 编程点滴.如何在VS2010中使用Regex Editor - 寒 刚入门 小玩意.包含全国省市区街道邮编的数据库 编程点滴.LUCENE高亮代码 编程点滴.LUCENE.Luke查询工具 - 寒 刚入门 - 博客园 编程点滴.LUCENE.常用分词器 编程点滴.LUCENE的检索方式 编程点滴.LUCENE执行检索和分页 编程点滴.LUCENE.对数字、日期、时间等进行索引 - 寒 刚入门 - 博客园 jQuery1.3.2的选择器在IE8小[checked]失效的简单解决方法 我写的找重复数和过桥问题. CuteEditor6完整汉化包(更新到6.1) ASP.NET中设置CheckBox和RadioButton的默认值不可改变,并不丢失样式!
编程点滴.LUCENE的FILED选项
寒 刚入门 · 2010-08-26 · via 博客园 - 寒 刚入门

争取每日记录一些

Index选项

Index.ANALYZED – 索引并分词(适用于body, title, abstract等.).
Index.NOT_ANALYZED – 索引但不分词,可以使用NORM方式.(可以人为干预提权)

Index.ANALYZED_NO_NORMS – 索引并分词但不使用NORM方式(不可认为提权)

Index.NOT_ANALYZED_NO_NORMS – 索引但不分词也不使用NORM方式(经常用到,存储标志值最好的方式.)

Index.NO – 不索引

Store选项

Store.YES – 存储

Store.NO  – 不存储

TermVector选项

(除TermVector.NO外其他必须要求Index选项为Index.ANALYZED或Index.NOT_ANALYZED)

TermVector.YES – 最基本的向量存储(特殊性,数量,在哪个文档)

TermVector.WITH_POSITIONS – TermVector.YES+位置
TermVector.WITH_OFFSETS – TermVector.YES+偏移

TermVector.WITH_POSITIONS_OFFSETS – TermVector.YES+位置+偏移

TermVector.NO – 不做向量存储

各选项组合应用场景

Index

Store

TermVector

事例

NOT_ANALYZ

ED_NO_NORMS

YES

NO

主键,电话,身份证号,URLs,日期和需要排序的字段

ANALYZED

YES

WITH_POSITIONS_OFFSETS

文档标题,摘要.

ANALYZED

NO

WITH_POSITIONS_OFFSETS

文档主体

NO

YES

NO

文档类型,数据库主键(如果不需要检索该字段的话)

NOT_ANALYZED

NO

NO

隐藏字段

排序的注意事项

如果需要排序的字段是数字就用NumericField,如果是文本,一定要记得使用FIELD.Index.NOT_ANALYZED.

如果不需要提权则应该使用NOT_ANALYZED_NO_NORMS

多值字段的保存

在同一个Document下可以给同一个字段赋不同的值.例如

Document doc = new Document();
for (int i = 0; i < authors.length; i++) {
      doc.add(new Field("author", authors[i],
                                    Field.Store.YES,
                                    Field.Index.ANALYZED));
}

LUCENE.NET QQ交流群(81361051)