计划:每个礼拜更新两篇

DocValues DocValues

DocValues概述……

Lucene 置顶,必看

博客计划……

Search 查询原理(三)

本文承接查询原理(二),继续介绍查询原理。……

Search 查询原理(二)

在查询原理(一)的文章中,我们介绍了几种常用查询方式的使用方法,从本篇文章开始,通过BooleanQuery来介绍查询原理。……

Search 查询原理(一)

从本篇文章开始介绍Lucene查询阶段的内容,由于Lucene提供了几十种不同方式的查询,但其核心的查询逻辑是一致的,该系列的文章通过Query的其中的一个子类BooleanQuery,同时也是作者在实……

Search Collector(四)

本文承接Collector(三),继续介绍其他的收集器。……

Search Collector(三)

本文承接Collector(二),继续介绍其他的收集器。……

Search Collector(二)

本文承接Collector(一),继续依次介绍每一个流程点,继续介绍其他的收集器。……

Search Collector(一)

在搜索阶段,每当Lucene找到一个满足查询条件的文档(Document),便会将该文档的文档号(docId)交给Collector,并在Collector中对收集的文档号集合进行排序(sorting)、过滤(filtering)或者……

Index 文档提交之flush(八)终

本文承接文档提交之flush(七),继续依次介绍每一个流程点,本篇文章是介绍文档提交之flush流程的最后一篇文章。r……

Index 文档提交之flush(七)

本文承接文档提交之flush(六),继续依次介绍每一个流程点。……

Index 文档提交之flush(六)

本文承接文档提交之flush(五),继续依次介绍每一个流程点。……

Index 文档提交之flush(五)

本文承接文档提交之flush(四),继续依次介绍每一个流程点。……

Index 文档提交之flush(四)

本文承接文档提交之flush(三),继续依次介绍每一个流程点。……

Index 文档提交之flush(三)

本文承接文档提交之flush(二),继续依次介绍每一个流程点……

Index 文档提交之flush(二)

本文承接文档提交之flush(一),继续依次介绍每一个流程点。……

Index 文档提交之flush(一)

触发flush的方式可以分为主动flush跟自动flush: - 主动flush:触发该方式的场景很多,本篇文章只介绍由IndexWriter.flush()方法触发的flush。其他的触发flush的场景包括执行段合并的操作Ind……

索引文件 索引文件之cfs&&cfe

索引文件.cfs、.cfe被称为复合(compound)索引文件,在IndexWriterConfig可以配置是否生成复合索引文件,默认开启。……

Index 文档的增删改(下)(part 3)

本文承接文档的增删改(上)、文档的增删改(中)、文档的增删改(下)(part 1)、文档的增删改(下)(part 2)继续介绍文档的增删改,是文档的增删改系列的最后一篇文章,另外……

Index 文档的增删改(下)(part 2)

本文承接文档的增删改(上)、文档的增删改(中)、文档的增删改(下)(part 1)继续介绍文档的增删改,为了能深入理解,还是得先介绍下几个预备知识。……

Index 文档的增删改(下)(part 1)

本文承接文档的增删改(上)、文档的增删改(中)、继续介绍文档的增删改,为了能深入理解,还是得先介绍下几个预备知识。……

Index 文档的增删改(中)

在文档的增删改(上)中,我们介绍了应用示例并给出了流程图,本篇文章承接上文,就流程图的每个流程点展开介绍,如果篇幅过长又得拖到下一篇文档啦……

Index 文档的增删改(上)

在Lucene中,可以对文档(Document)进行添加(增)、删除(删)、更新(改)的操作,而每一种操作各自又有多个功能的扩展。……

Store Directory(下)

在Directory(上)中,介绍了BaseDirectory类,它作为Directory的子类,该类及其子类实现了维护索引文件的所有操作,即创建、打开、删除、读取、重命名、同步(持久化索引文件至磁盘)、校……

Store Directory(上)

Directory类用来维护索引目录中的索引文件,定义了创建、打开、删除、读取、重命名、同步(持久化索引文件至磁盘)、校验和(checksum computing)等抽象方法。……

索引文件 索引文件之segments_N

segments_N文件,该文件描述了当前索引目录中所有有效的段信息文件(active segment info)……

索引文件 索引文件之fnm

索引文件.fnm用来描述域信息(FieldInfo)……

索引文件 索引文件之si

描述段文件信息(segmentInfo)的索引文件……

Store 索引文件锁LockFactory

实现互斥访问索引文件的锁LockFactory……

Index 两阶段生成索引文件之第一阶段

fdt fdx索引文件生成过程……

Index MergeScheduler

负责段合并的执行……

Index TieredMergePolicy

默认的合并策略……

Index LogMergePolicy

段的合并策略……

Search LRUQueryCache

查询缓存……

索引文件 索引文件之fdx&&fdt

索引文件数据结构……

索引文件 索引文件之tvx&&tvd

TermVector对应的索引文件……

Index 倒排表(中)

TermVector生成的倒排表……

Index 倒排表(上)

构建倒排表,介绍倒排表的存储结构……

索引文件 索引文件之liv

存放删除的文档号……

索引文件 索引文件之dim&&dii

存储数值类型数据,空间数据、点数据……

工具类 Bkd-Tree

Bkd-Tree 数值类型存储……

工具类 Automaton

用来范围查询的确定有穷自动机……

Search FieldComparator

FieldComparator用于对搜索结果排序……

Search 文档号合并(SHOULD)

多个SHOULD的TermQuery文档号合并……

Search 文档号合并(MUST)

倒排表合并,多个MUST……

DocValues BinaryDocValues

用于排序 打分的BinaryDocValues……

DocValues SortedSetDocValues

用于排序 打分的SortedSetDocValues……

DocValues SortedDocValues

SortedDocValues介绍……

DocValues SortedNumericDocValues

常用于用于排序 打分的SortedNumericDocValues……

DocValues NumericDocValues

数值类型DocValues……
博客主人Chris
80后,喜欢记录生活的点点滴滴,喜欢分享。
  • 文章总数
  • 33866访问次数
  • 建站天数
  • 友情链接