计划:每个礼拜更新两篇

DocValues DocValues

DocValues概述……

Lucene 置顶,必看

博客计划……

Index 近实时搜索NRT(二)

本文承接近实时搜索NRT(一),继续依次介绍每一个流程点。……

Index 近实时搜索NRT(一)

Lucene提供了近实时搜索NRT(near real time)的功能,它描述了索引信息发生改变后,不需要执行commit操作或者关闭IndexWriter(调用IndexWriter.close()方法)就能使得这些更改的信息很快(quick……

Index 文档提交之commit(二)

本篇文章承接文档提交之commit(一),继续介绍文档提交之commit的剩余流程点。……

Index 文档提交之commit(一)

阅读本文章(必须)需要前置知识:文档提交之flush、文档的增删改的系列文章,下文中出现的未展开介绍的变量说明已经这些文章中介绍,本文中不赘述。……

Search 查询原理(五)终

本文承接查询原理(四),继续介绍查询原理。……

Search 查询原理(四)

本文承接查询原理(三),继续介绍查询原理。……

Search 查询原理(三)

本文承接查询原理(二),继续介绍查询原理。……

Search 查询原理(二)

在查询原理(一)的文章中,我们介绍了几种常用查询方式的使用方法,从本篇文章开始,通过BooleanQuery来介绍查询原理。……

Search 查询原理(一)

从本篇文章开始介绍Lucene查询阶段的内容,由于Lucene提供了几十种不同方式的查询,但其核心的查询逻辑是一致的,该系列的文章通过Query的其中的一个子类BooleanQuery,同时也是作者在实……

Search Collector(四)

本文承接Collector(三),继续介绍其他的收集器。……

Search Collector(三)

本文承接Collector(二),继续介绍其他的收集器。……

Search Collector(二)

本文承接Collector(一),继续依次介绍每一个流程点,继续介绍其他的收集器。……

Search Collector(一)

在搜索阶段,每当Lucene找到一个满足查询条件的文档(Document),便会将该文档的文档号(docId)交给Collector,并在Collector中对收集的文档号集合进行排序(sorting)、过滤(filtering)或者……

Index 文档提交之flush(八)终

本文承接文档提交之flush(七),继续依次介绍每一个流程点,本篇文章是介绍文档提交之flush流程的最后一篇文章。r……

Index 文档提交之flush(七)

本文承接文档提交之flush(六),继续依次介绍每一个流程点。……

Index 文档提交之flush(六)

本文承接文档提交之flush(五),继续依次介绍每一个流程点。……

Index 文档提交之flush(五)

本文承接文档提交之flush(四),继续依次介绍每一个流程点。……

Index 文档提交之flush(四)

本文承接文档提交之flush(三),继续依次介绍每一个流程点。……

Index 文档提交之flush(三)

本文承接文档提交之flush(二),继续依次介绍每一个流程点……

Index 文档提交之flush(二)

本文承接文档提交之flush(一),继续依次介绍每一个流程点。……

Index 文档提交之flush(一)

触发flush的方式可以分为主动flush跟自动flush: - 主动flush:触发该方式的场景很多,本篇文章只介绍由IndexWriter.flush()方法触发的flush。其他的触发flush的场景包括执行段合并的操作Ind……

索引文件 索引文件之cfs&&cfe

索引文件.cfs、.cfe被称为复合(compound)索引文件,在IndexWriterConfig可以配置是否生成复合索引文件,默认开启。……

Index 文档的增删改(下)(part 3)

本文承接文档的增删改(上)、文档的增删改(中)、文档的增删改(下)(part 1)、文档的增删改(下)(part 2)继续介绍文档的增删改,是文档的增删改系列的最后一篇文章,另外……

Index 文档的增删改(下)(part 2)

本文承接文档的增删改(上)、文档的增删改(中)、文档的增删改(下)(part 1)继续介绍文档的增删改,为了能深入理解,还是得先介绍下几个预备知识。……

Index 文档的增删改(下)(part 1)

本文承接文档的增删改(上)、文档的增删改(中)、继续介绍文档的增删改,为了能深入理解,还是得先介绍下几个预备知识。……

Index 文档的增删改(中)

在文档的增删改(上)中,我们介绍了应用示例并给出了流程图,本篇文章承接上文,就流程图的每个流程点展开介绍,如果篇幅过长又得拖到下一篇文档啦……

Index 文档的增删改(上)

在Lucene中,可以对文档(Document)进行添加(增)、删除(删)、更新(改)的操作,而每一种操作各自又有多个功能的扩展。……

Store Directory(下)

在Directory(上)中,介绍了BaseDirectory类,它作为Directory的子类,该类及其子类实现了维护索引文件的所有操作,即创建、打开、删除、读取、重命名、同步(持久化索引文件至磁盘)、校……

Store Directory(上)

Directory类用来维护索引目录中的索引文件,定义了创建、打开、删除、读取、重命名、同步(持久化索引文件至磁盘)、校验和(checksum computing)等抽象方法。……

索引文件 索引文件之segments_N

segments_N文件,该文件描述了当前索引目录中所有有效的段信息文件(active segment info)……

索引文件 索引文件之fnm

索引文件.fnm用来描述域信息(FieldInfo)……

索引文件 索引文件之si

描述段文件信息(segmentInfo)的索引文件……

Store 索引文件锁LockFactory

实现互斥访问索引文件的锁LockFactory……

Index 两阶段生成索引文件之第一阶段

fdt fdx索引文件生成过程……

Index MergeScheduler

负责段合并的执行……

Index TieredMergePolicy

默认的合并策略……

Index LogMergePolicy

段的合并策略……

Search LRUQueryCache

查询缓存……

索引文件 索引文件之fdx&&fdt

索引文件数据结构……

索引文件 索引文件之tvx&&tvd

TermVector对应的索引文件……

Index 倒排表(中)

TermVector生成的倒排表……

Index 倒排表(上)

构建倒排表,介绍倒排表的存储结构……

索引文件 索引文件之liv

存放删除的文档号……

索引文件 索引文件之dim&&dii

存储数值类型数据,空间数据、点数据……

工具类 Bkd-Tree

Bkd-Tree 数值类型存储……

工具类 Automaton

用来范围查询的确定有穷自动机……

Search FieldComparator

FieldComparator用于对搜索结果排序……

Search 文档号合并(SHOULD)

多个SHOULD的TermQuery文档号合并……
博客主人Chris
80后,喜欢记录生活的点点滴滴,喜欢分享。
  • 文章总数
  • 41580访问次数
  • 建站天数
  • 友情链接