lucene的企业级搜索引擎
企业级:持久化数据
大量数据,很多人同时访问数据,大量用户操作界面,
通常需要与散步在企业周围的其他应用进行集成。
企业级分为两类:
面向企业用户HRM ERM
面向消费者
什么是lucene:
是一个高效的,基于java全文搜索库。
数据类型分为两大类:
1 结构化数据 固定格式的数据,sql 元数据
2 非结构化数据 grep ps aux|grep xxx
3 半结构化 html xml
顺序扫描法
非结构化数据中提取的然后重新组织的信息 索引
软件包分析
org.apache.lucene.analysis 分词器
org.apache.lucene.doument 封装索引所需要的类 Doument ,field
org.apache.lucene.index 协助创建索引的类,以及对象索引进行更新
org.apache.lucene.search 对建立好的索引搜索所需要的类
Document,field,indexWriter directory FSD RAM
如果现从数据库查询出索引文档,再取得数据,和数据库一样了。
如果数据发生变化了,如何更新文档呢,
1.判断文档存在
merge 归并算法,个别文件和原来有区分文件合并操作。
可以使用定时任务去更新。
solr lucene
1.兼容性好
2.实现了分块索引建立小文件,提升索引速度
3.易于学习
4.易于扩展
4.自带比较强力的模糊查询
缺点:
1.对磁盘占用太大,频繁操作磁盘 1024T
2.不支持API
3.不支持集群 继承Directory solr Nutch+Hadoop indexServer nutch集成
总结:
java 开源搜索引擎里面 lucene
项目中:
solr-solrj-4.10.4-sources.jar,
保存只有在定时任务里使用,保存的时候取DB数据,再保存到solr
solrServer.addBean(Object);
solrServer.commit();
solrServer.deleteById(id);
- 大小: 104.9 KB
分享到:
相关推荐
快速实现企业级搜索引擎,完成企业内部的检索需求,对企业内部网的海量文档和各种数据库数据提供全文搜索支持
详细介绍了企业级搜索引擎Solr的使用,关于solr很好的入门指南。
Apache Solr 是一个开源的搜索...Solr 是一个免费的开源搜索引擎免费软件。 Solr 是一个基于Lucence的开源项目,可以通过下面网址下载。 http://lucene.apache.org/solr/ http://archive.apache.org/dist/lucene/solr/
ElasticSearch:Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,...流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便
更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。 通过对 Solr 进行适当的配置, 某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此 外,很多 Lucene 工具(如 Nutch、...
通过学习本书,读者可以独立构建出一个企业级的搜索引擎网站。该书详细讲解了搜索引擎与信息检索基础,Lucene入门实例,Lucene索引的建立,使用Lucene进行搜索,排序,过滤和分页,Lucene的分析器,对Word、Excel和...
lucene的应用.pdf 01solr企业级搜索引擎准备阶段.pdf 02solr企业级搜索引擎实战演练.pdf 适合新手搭建solr使用
基于lucene的企业级搜索引擎。是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http G Solr et操作...
ElasticSearch 简称 ES ,是基于Apache Lucene构建的开源搜索引擎,是当前流行的企业级搜索引擎。 Lucene本身就可以被认为迄今为止性能最好的一款开源搜索引擎工具包,但是lucene的API相对复杂,需要 深厚的搜索理论...
NutzWk是集成了Shiro权限控制、Ehcache缓存、Redis、Email服务、Quartz定时任务、Lucene搜索引擎、Beetl/Velocity模板引擎等技术的开源企业级开发框架。 NutzWk 3.x 运行环境:1、JDK 82、Tomcat 83、Maven 3.3.94...
Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET...
OpenSearchServer是基于Lucene的功能强大的企业级搜索引擎软件。 使用Web用户界面,搜寻器(Web,文件,数据库等)和JSON Web服务,您将能够在应用程序中快速轻松地集成高级全文搜索功能。 OpenSearchServer在Linux ...
.NET是Microsoft面向Web服务的平台,由框架、Web服务、.NET企业服务器等几部分组成,提供涉及面较广、功能较全面的解决方案。数据库选择:根据需求分析选择了MSSQL Server 2000。 运行需求 1.硬件环境需求: 需要...
Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、...
ElasticSearch是一个基于Lucene的搜索...Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET...
Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET...
Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET...
Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET...
Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、...