国家的疫情降温了我也要开始继续写文章喽

Lucene 置顶,必看

博客计划……

Lucene 文章导航

文章列表……
12-05 暂无评论 110301 阅读详情

DocValues BinaryDocValues-8.7.0

阅读本文前建议先看下BinaryDocValues、索引文件的生成(二十一)之dvm&&dvd两篇文章,因为很多重复的内容不会在本文中展开。……

索引文件 索引文件之tvd&&tvx&&tvm

在索引(Indexing)阶段,当某个域被设置为需要记录词向量(term vector)信息后……

Search 索引文件的读取(十五)之fdx&&fdt&&fdm

本文承接文章[索引文件的读取(十四)之fdx&&fdt&&fdm](https://www.amazingkoala.com.cn/Lucene/Search/2020/1102/174.html),继续介绍剩余的内容。为了更好的理解下文中的内容,建议先阅读文章[DirectMon……

Changes Changes(Lucene 8.7.0)

Lucene 8.7.0 changes……

IndexFile IndexFile kdd&kdi&kdm

Index file about kdd&kdi&kdm……

Search 索引文件的读取(十四)之fdx&&fdt&&fdm

前几篇索引文件的读取的系列文章中,我们介绍[索引文件tim&&tip](https://www.amazingkoala.com.cn/Lucene/suoyinwenjian/2019/0401/43.html)的读取时机点时说到,在生成[StandardDirectoryReader](https://www.amazing……

压缩存储 DirectMonotonicWriter&&Reader

DirectMonotonicWriter类用来存储单调递增的整数序列(monotonically-increasing sequences of integers),使用了**先编码后压缩**的存储方式,DirectMonotonicReader类则是用来解码跟解压……

索引文件 索引文件之kdd&kdi&kdm

从Lucene8.6.0开始,用于存储点数据(point value)的索引文件由原先的两个索引文件dim&&dii,改为三个索引文件kdd&kdi&kdm。由于生成kdd&kdi&kdm的过程基本上没有太大的变动,并且索引文件的数……

Index 索引文件的生成(二十四)之fdx&&fdt&&fdm

本文承接文章索引文件的生成(二十三)之fdx&&fdt&&fdm,继续介绍剩余的内容,先给出生成索引文件fdx&&fdt&&fdm的流程图……

Index 索引文件的生成(二十三)之fdx&&fdt&&fdm

从本篇文章开始介绍用于描述存储域(存储域的概念见文章索引文件之fdx&&fdt&&fdm)的索引文件.fdx、.fdt、.fdm的生成过程,直接给出流程图……

索引文件 索引文件之fdx&&fdt&&fdm

在索引阶段,如果某个域的属性中包含store,意味着该域的域值信息将被写入到索引文件fdx&&fdt&&fdm中,域的属性可以通过FieldType来设置,如下所示……

压缩存储 FST(二)

在文章FST(一)(必须先阅读该篇文章)中我们通过一个例子,简单的描述了Lucene是如何使用一个字节数组current[ ]存储FST信息的,为了能更好的理解读取过程,我们需要另外给出例子(……

Search block-max-WAND(一)

从Lucene 8.0.0开始,Lucene新增了block-max WAND(Weak AND)算法,用于优化TopN的查询。该算法的引入可谓是一波三折,可以查看作者Adrien Grand对该算法的介绍:https://www.elastic.co/cn/blog/faster-ret……

Search 索引文件的读取(十三)之doc&&pos&&pay

本文承接文章索引文件的读取(十二)之doc&&pos&&pay,继续介绍剩余的内容。索引文件.doc、.pos、.pay的读取过程相比索引文件.tim&&.tip较为简单……

Search 索引文件的读取(十二)之doc&&pos&&pay

在前几篇索引文件的读取的系列文章中,我们介绍索引文件tim&&tip的读取时机点时说到,在生成StandardDirectoryReader对象期间,会生成SegmentReader对象,该对象中的FieldsProducer信息描述了索引……

Index 索引文件的生成(二十二)之nvd&&nvm

在执行flush()的过程中,Lucene会将内存中的索引信息生成索引文件,本篇文章继续介绍索引文件.nvd&&.nvm,其生成的时机点如下图红色框标注……

工具类 Automaton(三)

在文章Automaton(二)中我们根据图1的例子生成了图2的转移图以及转移图对应在源码中的描述方式,即状态(state)、转移(transition)函数两个数组,如图3所示……

Search 索引文件的读取(十一)之tim&&tip

在上一篇文章索引文件的读取(十)之tim&&tip中我们遗留了一个问题……

Search 索引文件的读取(十)之tim&&tip

本文承接文章索引文件的读取(九)之tim&&tip,继续介绍剩余的流程点,先给出流程图……

Search 索引文件的读取(九)之tim&&tip

本文承接文章索引文件的读取(八)之tim&&tip,继续介绍剩余的流程点,先给出流程图……

DocValues DocValues

DocValues概述……

Search 索引文件的读取(八)之tim&&tip

本文承接文章索引文件的读取(七)之tim&&tip,继续介绍剩余的流程点,先给出流程图……

Search 索引文件的读取(七)之tim&&tip

本篇文章开始介绍索引文件tim&&tip的读取,通过TermRangeQuery的例子来介绍如何从索引文件.tim&&.tip中获取满足查询条件的所有term……

工具类 Automaton(二)

在文章Automaton中我们介绍了确定型有穷自动机(Deterministic Finite Automaton)的概念,以及在TermRangeQuery中如何根据查询条件生成一个转移图,本文依旧根据该文章中的例子,介绍在Lucene中如何……

Search RangeField(一)

本文将介绍Lucene中提供的范围域(RangeField),以及基于该域实现的范围查询……

Search 索引文件的读取(六)之dvd&&dvm

本文接着介绍索引文件.dvd、.dvm之BinaryDocValues的读取,它同SortedValues一样,其中一个用途用于对查询结果的进行排序,在搜索阶段,当获取了满足查询条件的文档号之后,它会交给Colle……

Search 索引文件的读取(五)之dvd&&dvm

本篇文章开始介绍索引文件.dvm&&dvd的读取,阅读本系列文章建议先看下文章索引文件的生成(十八)之dvm&&dvd、索引文件的生成(十九)之dvm&&dvd、IndexedDISI(一)、IndexedDISI(二),了解……

Index 软删除softDeletes(六)

我们接着文章软删除softDeletes(五)继续介绍合并策略SoftDeletesRetentionMergePolicy,在文章近实时搜索NRT(一)中使用方法三&&方法四获取StandardDirectoryReader和文章文档提交之flush(八)终中……

Index 软删除softDeletes(五)

在文章软删除softDeletes(二)中介绍了软删除在索引(index)阶段的相关内容,我们接着介绍在flush/commit阶段的内容……

Index 软删除softDeletes(四)

在文章软删除softDeletes(二)中我们说到,在Lucene 7.5.0版本中,使用了下面两个容器来存储软删除的删除信息、DocValues的更新信息: - Map> numeric……

Index 软删除softDeletes(三)

在文章软删除softDeletes(二)中我们说到,在Lucene 7.5.0版本中,使用了下面两个容器来存储软删除的删除信息、DocValues的更新信息……

Index 软删除softDeletes(二)

在文章软删除softDeletes(一)中我们介绍了软删除的一些应用,从本篇文章开始,将根据索引(index)、flush/commit、段的合并、搜索这几个不同的阶段来介绍跟软删除相关的内容。……

Index 软删除softDeletes(一)

软删除。。。……

Index 索引文件的生成(二十一)之dvm&&dvd

索引文件.dvm&&.dvd中根据文档中包含的不同类型的DocValuesFields,包含下面的DocValues信息……

Index 索引文件的生成(二十)之dvm&&dvd

本文承接文章索引文件的生成(十九)之dvm&&dvd继续介绍剩余的内容。……

Index 索引文件的生成(十九)之dvm&&dvd

在文章索引文件的生成(十八)之dvm&&dvd中,我们介绍了Lucene在索引阶段跟flush阶段收集到的SortedDocValues、SortedSetDocValues信息,这些信息将作为生成索引文件.dvm、dvd的依据。……

Index 索引文件的生成(十八)之dvm&&dvd

索引文件.dvm&&.dvd中根据文档中包含的不同类型的DocValuesFields,包含下面的DocValues信息……

Index 索引文件的生成(十七)之dvm&&dvd

本文承接索引文件的生成(十六)之dvm&&dvd继续介绍剩余的内容,先给出流程图……

Index 索引文件的生成(十六)之dvm&&dvd

在文章索引文件的生成(十五)之dvm&&dvd中,我们介绍了在索引(index)阶段收集文档的NumericDocValues信息的内容,随后在flush阶段,会根据收集到的信息生成索引文件.dvd&&.dvm。如果已经阅……

工具类 IndexedDISI(二)

在文章IndexedDISI(一)(阅读本文中之前,需要该前置文章)中我们介绍了在Lucene7.5.0中IndexedDISI的实现原理, 本文基于Lucene 8.4.0,将介绍优化后的IndexedDISI,即使用查找表(lookup table)……

工具类 IndexedDISI(一)

IndexedDISI工具类在Lucene中用来存储Norm/DovValues对应的文档号,其实现原理借鉴了roaring bitmaps(见文章RoaringDocIdSet),本文先通过介绍在Lucene7.5.0中的实现来理解其原理,接着会介绍在Luce……

Index 索引文件的生成(十五)之dvm&&dvd

在前面的文章中,我们介绍了在Lucene7.5.0中索引文件.dvd&&.dvm的数据结构,从本篇文章开始介绍其生成索引文件.dvd&&.dvm的内容,注意的是,由于是基于Lucene8.4.0来描述其生成过程,故如果……

Search 索引文件的读取(四)之dim&&dii

本文承接索引文件的读取(三)之dim&&dii继续介绍剩余的内容,下面先给出读取索引文件.dim&&dii的流程图:……

Search 索引文件的读取(三)之dim&&dii

本文承接索引文件的读取(二)之dim&&dii继续介绍剩余的内容,下面先给出读取索引文件.dim&&dii的流程图……

Search 索引文件的读取(二)之dim&&dii

本文承接索引文件的读取(一)之dim&&dii继续介绍剩余的内容,下面先给出读取索引文件.dim&&dii的流程图:……

Search 索引文件的读取(一)之dim&&dii

本系列的文章会通过例子来介绍索引文件的读取,本篇文章先介绍索引文件.dim&&.dii的读取,为了便于理解,请先阅读索引文件的生成(八)之dim&&dii至索引文件的生成(十四)之dim&&di……

Index 索引文件的生成(十四)之dim&&dii

在前面的文章中,我们介绍了构建BKD树的节点值(node value)的流程,其中叶子节点的信息被写入到了索引文件.dim中,本文开始的内容将会介绍将内部节点(非叶节点)的信息写入到索引……
博客主人Chris
80后,喜欢记录生活的点点滴滴,喜欢分享。
  • 文章总数
  • 606508访问次数
  • 建站天数
  • 友情链接