博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
01 lucene基础 北风网项目培训 Lucene实践课程 索引
阅读量:5221 次
发布时间:2019-06-14

本文共 556 字,大约阅读时间需要 1 分钟。

在创建索引的过程中IndexWriter会创建多个对应的Segment,这个Segment就是对应一个实体的索引段。随着索引的创建,Segment会慢慢的变大。为了提高索引的效率,IndexWriter会把多个索引段(独立的索引段)合并成一个大的索引段。这样的话可以降低I/O操作的频率,可以提高检索的效率,这就是Lucene索引的创新之处。

通过IndexWriter和Directory的具体实现类可以控制索引的具体存储位置。

抽象类Analyzer有多个实现类,不同的实现类切词的效果是不一样的。标准的分词器。会接触多个分词器,实现对应的分词操作。由于中文分词和英文分词的不同,在分词器中,Lucene对中文的支持比较有限,所以说以后对中文的分词需要依赖第三方的jar包来实现对中文分词的支持。

一个完整的lucene下面索引的建立就完成了。

创建索引的形式就类似于像关系数据库中向一个表中插入记录。对一个表中不仅有插入操作,还要有删除操作,刚才只是向索引中添加进去Document,怎么在索引中删除对应的Document?

这是关于lucene下面建立索引和对索引中的Document删除操作

转载于:https://www.cnblogs.com/ZHONGZHENHUA/p/6475994.html

你可能感兴趣的文章
java的Array和List相互转换
查看>>
layui父页面执行子页面方法
查看>>
如何破解域管理员密码
查看>>
Windows Server 2008 R2忘记管理员密码后的解决方法
查看>>
IE11兼容IE8的设置
查看>>
windows server 2008 R2 怎么集成USB3.0驱动
查看>>
Foxmail:导入联系人
查看>>
vue:axios二次封装,接口统一存放
查看>>
vue中router与route的区别
查看>>
js 时间对象方法
查看>>
网络请求返回HTTP状态码(404,400,500)
查看>>
Spring的JdbcTemplate、NamedParameterJdbcTemplate、SimpleJdbcTemplate
查看>>
Mac下使用crontab来实现定时任务
查看>>
303. Range Sum Query - Immutable
查看>>
图片加载失败显示默认图片占位符
查看>>
【★】浅谈计算机与随机数
查看>>
《代码阅读方法与实现》阅读笔记一
查看>>
解决 sublime text3 运行python文件无法input的问题
查看>>
javascript面相对象编程,封装与继承
查看>>
Atlas命名空间Sys.Data下控件介绍——DataColumn,DataRow和DataTable
查看>>