文章导航

  每篇文章的标题如果没有标明版本号,说明是基于Lucene 7.5.0写的。

  文件夹blog中的文章如果与https://www.amazingkoala.com.cn 不同,以网页的内容为准。

  另外最新的文章可能会依据最新的Lucene版本,版本号会在文章的标题说明。

Lucene核心技术

1.Lucene核心技术(一)

Changes

Changes(Lucene 8.7.0)

Codecs

1. SIMD(Single Instruction Multiple Data)

索引文件

1. DocValues

2. 索引文件之cfs&&cfe

3. 索引文件之segments_N

4. 索引文件之fnm

5. 索引文件之si

6. 索引文件之fdx&&fdt

7. 索引文件之tvx&&tvd

8. 索引文件之liv

9. 索引文件之dim&&dii

10. 索引文件之tim&&tip

11. 索引文件之doc

12. 索引文件之pos&&pay

13. 索引文件之nvd&&nvm

14. 索引文件之fdx&&fdt&&fdm-8.6.0

15. 索引文件之kdd&kdi&kdm-8.6.0

16. 索引文件之tvd&&tvx&&tvm-8.7.0

Index

1. 构造IndexWriter对象

 

2. 执行段的合并

3. 段的合并策略:

4. 段的合并调度MergeScheduler

5. 索引文件的合并

6. 文档的增删改

7. 近实时搜索NRT

8. 文档提交之commit

9. 文档提交之flush

10. SegmentReader

11. 索引文件的生成

12. 软删除softDeletes

13. ReaderPool

14. 索引文件的载入

15. 内存索引

16. 强制合并ForceMerge

17. 段内排序IndexSort

Search

1. 查询原理

2. Collector

3. 查询缓存LRUQueryCache

4. FieldComparator

5. 文档号合并(SHOULD)

6. 文档号合并(MUST)

7. BooleanQuery

8. Store

9. Directory

10. 索引文件的读取

11. 范围域(rangeField)

12. block-max-WAND

13. 查询TopN的优化之NumericDocValues

14. IndexOrDocValuesQuery

15. DisjunctionMaxQuery

16. GeoQuery

Util

1. RoaringDocIdSet

2. Bkd-Tree

3. Automaton

4. FixedBitSet

5. ByteRefHash

6. IntBlockPool

7. RamUsageEstimator

8. IndexedDISI

8. 文档号收集器DocIdSet

压缩存储

1. LZ4算法(上)

2. FST

3. BulkOperationPacked

4. 去重编码(dedupAndEncode)

5. PackedInts

6. DirectWriter&&DirectReader

7. DirectMonotonicWriter&&Reader

8. Run Length游标编码

Other

1. 倒排表的数据结构:

2. SortedDocValues VS BinaryDocValues

3. 两阶段遍历(TwoPhaseIterator)

4. 查找表(lookup table)

5. off-heap/on-heap

6. TermRangeQuery

7. TermsEnum

8. 删除队列DeleteQueue

9. GeoHash编码

OpenSearch

1. OpenSearch-SQL调研