zoukankan      html  css  js  c++  java
  • 第一章:引擎介绍

    引擎介绍——ElasticSearch

    引擎可视化页面

     

    引擎检索结果页面(一)—— 数据量:5,7949;took:6ms

     

    引擎检索结果页面(二)—— 数据量:6027,9429;took:906ms

     

      ElasticSearch是一个基于Lucene构建的开源、分布式、高可用性、多用户、RESTful全文搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便,支持通过HTTP使用JSON进行数据索引,是当前流行的企业级搜索引擎。

    硬件要求

    1.内存

    普遍使用的是32GB或者16GB

    最理想的是64GB

    小于8GB的达不到预期的目标,这样会要求提供很多机器

    多于64G的会产生一些问题

    2.CPU

    大多数ElasticSearch集群都对CPU压力不大

    处理器要处理的事情比其他资源少得多

    可选择多核的处理器

    一般集群会使用2至8核处理器

    3.硬盘

    最好的效果是使用SSD(Solid State Drives)——固态硬盘

    避免使用网络附属存储(NAS)(连接在网络上,具备资料存储功能的装置)

    实时数据

      数据流进入的系统后,问题就是,数据怎么能够快速的可视化。用elasticsearch,实时展现当前的数据。 

       

    分布式

      ElasticSearch允许你开始的时候容量比较小,但是随着你商业的增长,它是建立在横向扩展的开箱即用。当你需要更多的容量,只需添加更多的节点,并让集群重组,只需要增加额外的硬件,保护了你以前的硬件投入。

    高可用性

      Elasticsearch集群是弹性的–它们将自动检测和删除失败的节点,并重新组织自己,以确保您的数据安全和访问。

      

    强大的分词功能

      

    analyzer(分词器)有两种:index_analyzer(索引分词)和search_analyzer(检索分词)

    常见的analyzer(分词器)插件有:

    "analyzer": "ik" 中文分词

    "analyzer": "simple_english_analyzer" 英文分词

    "analyzer": "standard" 中文分词

    "analyzer": "keyword_custom" 关键词定制,不分词,一般用在聚类字段

    "index_analyzer": "pct_spliter" 百分号(%)分割

    "index_analyzer": "semicolon_spliter" 分号(;)和顿号(、)分割

    "index_analyzer": "custom_snowball_analyzer" 中英日俄文分词

  • 相关阅读:
    MeshLab编译理解
    几个经典的数学库之一学习---VCGlib(1)
    开源协议的几种类型认识
    Win & Mac 系统之间U盘传递的U盘文件格式选取问题
    用VS2010编译python2.7的源码
    类之间关系理解:组合>聚合>关联>依赖;实现,继承
    Linux进阶:让效率翻倍的Bash技巧(一)
    Linux下nc命来实现文件传输
    nginx 405 not allowed问题的解决
    vim同时打开多个文件进行编辑
  • 原文地址:https://www.cnblogs.com/hynet/p/6897221.html
Copyright © 2011-2022 走看看