百度算法

当前位置:

分布式多用户能力的全文检索程序库优点索引文件格式

浏览量:

尊敬的读者,请记住要注意,喜欢和发表评论。您的认可是我最大的动力,谢谢

全文检索搜索引擎

ElasticSearch是基于Lucene的搜索服务器。

基于RESTful Web界面,提供了具有分布式多用户功能的全文本搜索引擎。

专为云计算而设计,可以实现实时搜索,稳定,可靠全文检索搜索引擎,快速,易于安装和使用。

官方客户端支持Java,.NET(C#),PHP,Python,Apache Groovy,Ruby和许多其他语言。

Lucene

开源的全文本搜索引擎工具包(一种全文本搜索引擎体系结构)提供了完整的查询引擎全文检索搜索引擎,索引引擎以及一部分文本分析引擎。

一组用于全文搜索和搜索的开源库为全文索引和搜索提供了一个简单但功能强大的应用程序编程接口。

它是当前和近年来最受欢迎的免费Java信息检索库。

优势

索引文件格式独立于应用程序平台Lucene定义了一组基于8位字节的索引文件格式,以便兼容的系统或不同平台上的应用程序可以共享已建立的索引文件。

块索引是基于传统全文本搜索引擎的倒排索引,并实现了块索引,可以为新文件建立较小的文件索引,提高索引速度。然后通过与原始索引的合并,达到优化的目的。

优秀的面向对象系统体系结构使学习Lucene扩展和促进新功能的扩展变得更加容易。

文本分析界面,与语言和文件格式无关。设计了独立于语言和文件格式的文本分析界面。索引器通过接受令牌流来完成索引文件的创建。用户可以扩展新的语言和文件格式,只需要实现用于文本分析的界面即可。

默认配置默认情况下实现了一组功能强大的查询引擎。用户无需编写自己的代码即可使系统获得强大的查询功能。 Lucene的查询实现默认情况下实现布尔运算和模糊查询(模糊搜索[11]),组查询等。

Elasticsearch

说明

基于LLucene的分布式实时文件存储和全文本搜索引擎,每个字段都可以进行索引和搜索。分布式实时分析搜索引擎可以扩展到数百台服务器,处理PB级结构化或非结构化Data API

Java API 1、节点客户端:

节点客户端作为无数据节点加入群集。换句话说,它不存储任何数据,但是知道数据在集群中的特定位置,并且可以将请求直接转发到相应的节点。

2、运输客户:

此较轻的传输客户端可以将请求发送到远程群集。它不加入群集本身,而只是将请求转发到群集中的节点。

两个Java客户端都使用Elasticsearch传输协议(Elasticsearch传输协议)通过端口9300与集群进行交互。群集中的节点也通过端口9300进行通信。

RESTful API所有其他编程语言都可以使用RESTful API通过9200端口与Elasticsearch通信。

对Elasticsearch的请求

卷曲-X'

://:

/

?'-d''

1、 VERB

HTTP方法:GET,POST,PUT,HEAD,DELETE

2、协议

[声明]本网转载网络媒体稿件是为了传播更多的信息,此类稿件不代表本网观点,本网不承担此类稿件侵权行为的连带责任。故此,如果您发现本网站的内容侵犯了您的版权,请您的相关内容发至此邮箱【83030543@qq.com】,我们在确认后,会立即删除,保证您的版权。