Lucene API分为以下几个包:
1) org.apache.lucene.analysis
定义了抽象类Analyzer的API,能将文本text从java.io.Reader转化成一个TokenStream,其中TokenStream是Attributes(即单词)的枚举。TokenStream可以通过对Tokenizer的输出调用TokenFilters来获得。一个Analyzer一般会用到Tokenzier以及TokenFilter。此包包含一些常用的Analyzer的实现类,如StopAnalyzer以及StandardAnalyzer。
2) org.apache.lucene.document
此包提供了一个简单的Document类。一个Document对象是字段Field的集合,这个集合可能是字符串或者java.io.Reader。
3) org.apache.lucene.index
提供了两个基础类:IndexWriter,用于创建和添加Documents到索引中;IndexReader,用于从索引中读取数据。
4) org.apache.lucene.search
提供了用于表示查询query的一些数据结构(TermQuery,PhraseQuery,BooleanQuery等等),除此之外还提供了抽象类Searcher,此类用于将查询query转化成TopDoc,即查询出来的最优结果。IndexSearcher是在IndexReader基础之上的一个Searcher类实现。
5) org.apache.lucene.queryParser
使用JavaCC来实现一个QueryParser。(JavaCC(Java Compiler Compiler)是一个用JAVA开发的最受欢迎的语法分析生成器。)
6) org.apache.lucene.store
定义了一个抽象类Directory来存储持久的数据,其实是一个文件索引集合,这些文件能被IndexOutput和IndexInput来读写。此包给出了两个实现:FSDirectory,将文件集合存到文件系统中;RAMDirectory,通过内存中的数据结构来存储文件。
7) org.apache.lucene.util
包括一些常用的数据结构以及工具类,如BitVector以及PriorityQueue等。
分享到:
相关推荐
lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例
lucene,lucene教程,lucene讲解。 为了对文档进行索引,Lucene 提供了五个基础的类 public class IndexWriter org.apache.lucene.index.IndexWriter public abstract class Directory org.apache.lucene.store....
NULL 博文链接:https://iamcrzay.iteye.com/blog/383742
lucene3.0 lucene3.0 lucene3.0 lucene3.0 lucene3.0
lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习...
Lucene3.0特性Lucene3.0特性
lucene学习教程lucene讲义 叫你用lucene算法
赠送jar包:lucene-core-7.7.0.jar; 赠送原API文档:lucene-core-7.7.0-javadoc.jar; 赠送源代码:lucene-core-7.7.0-sources.jar; 赠送Maven依赖信息文件:lucene-core-7.7.0.pom; 包含翻译后的API文档:lucene...
lucene3源码分析
lucene.NET 中文分词 高亮 lucene.NET 中文分词 高亮 lucene.NET 中文分词 高亮 lucene.NET 中文分词 高亮
本课程由浅入深的介绍了Lucene4的发展历史,开发环境搭建,分析lucene4的中文分词原理,深入讲了lucenne4的系统架构,分析lucene4索引实现原理及性能优化,了解关于lucene4的搜索算法优化及利用java结合lucene4实现...
Annotated Lucene 中文版 Lucene源码剖析
lucene-analyzers-common-4.2.0.jar; lucene-analyzers-kuromoji-4.2.0.jar; lucene-analyzers-phonetic-4.2.0.jar; lucene-codecs-4.2.0.jar; lucene-core-4.2.0.jar; lucene-grouping-4.2.0.jar; lucene-...
赠送jar包:lucene-core-7.2.1.jar; 赠送原API文档:lucene-core-7.2.1-javadoc.jar; 赠送源代码:lucene-core-7.2.1-sources.jar; 赠送Maven依赖信息文件:lucene-core-7.2.1.pom; 包含翻译后的API文档:lucene...
《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用Tika提取文本...
lucene
c#下实现Lucene时间区间查询匹配。主要还是对Lucene查循对像Query的实现
Lucene3.5全部源码,打包jar文件,可以直接打开查看源码,Lucene开发必备
lucenetest.rar,lucene,全文检索,lucene例子 lucenetest.rar,lucene,全文检索,lucene例子lucenetest.rar,lucene,全文检索,lucene例子
lucene-core-2.9.4,lucene-core-3.0.2,lucene-core-3.0.3,lucene-core-3.4.0