文章导航

  文章中的Lucene版本为7.5.0,欢迎同学们交流指正,blog目录中的文章如果与https://www.amazingkoala.com.cn 不同,以网页的内容为准,另外最新的文章可能会依据最新的Lucene版本,版本号会在文章的标题说明。

索引文件

1. DocValues
2. 索引文件之cfs&&cfe
3. 索引文件之segments_N
4. 索引文件之fnm
5. 索引文件之si
6. 索引文件之fdx&&fdt
7. 索引文件之tvx&&tvd
8. 索引文件之liv
9. 索引文件之dim&&dii
10. 索引文件之tim&&tip
11. 索引文件之doc
12. 索引文件之pos&&pay
13. 索引文件之nvd&&nvm

Index

1. 构造IndexWriter对象

 

2. 执行段的合并
3. 段的合并策略:
4. 段的合并调度MergeScheduler
5. 文档的增删改
6. 近实时搜索NRT
7. 文档提交之commit
8. 文档提交之flush
9. SegmentReader
10. 索引文件的生成
11. 软删除softDeletes

Search

1. 查询原理
2. Collector
3. 查询缓存LRUQueryCache
4. FieldComparator
5. 文档号合并(SHOULD)
6. 文档号合并(MUST)
7. BooleanQuery
8. Store
9. Directory
10. 索引文件的读取
11. 范围域(rangeField)

RangeField(一)

Util

1. RoaringDocIdSet
2. Bkd-Tree
3. Automaton
4. FixedBitSet
5. ByteRefHash
6. IntBlockPool
7. RamUsageEstimator
8. IndexedDISI(一)
9. IndexedDISI(二)

压缩存储

1. LZ4算法(上)
2. FST算法(上)
3. BulkOperationPacked
4. 去重编码(dedupAndEncode)
5. PackedInts
6. DirectWriter&&DirectReader

Other

1. 倒排表的数据结构:
2. SortedDocValues VS BinaryDocValues
3. 两阶段遍历(TwoPhaseIterator)
4. 查找表(lookup table)
5. off-heap/on-heap
6. TermRangeQuery