Elasticsearch Archive

为Elasticsearch添加中文分词,对比分词器效果

Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(例如“the”这个词)等......

Elasticsearch的备份和恢复

距离上次讲Elasticsearch的安装已经快一个半月了,作为一个半路出家的前端开发,简单的使用中也体验到了Elasticsearch的强大。目前在一个自己开发的小站点中,使用Elasticsearch索引了近200W简单数据,占用资源极小,搜索速度极快。下一步打算优化一下分词(目前使用的是标准分词器),所以想先备份一下,于是有了今天的文章......

Elasticsearch的安装,运行和基本配置

Elasticsearch是一个非常赞的实时分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析等。更重要的是入门简单,api也比较清晰。根据官方的介绍,目前Wikipedia,Github和StackOverflow等都使用Elasticsearch进行搜索和分析...