在安装 Elasticsearch 之前,请确保你的计算机已经安装了 Java。目前 Elasticsearch 的最新版是 5.2,需要安装 Java 8,如果你用的是老版本的 Elasticsearch,如 2.x 版,可用 Java 7,但还是推荐使用 Java 8。

安装前检查

可以使用如下的命令检查 Java 的版本

1
$ java -version

接着,我们可以从这里下载最新版本的 Elasticsearch,也可使用 wget 下载,如下:

1
$ wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.1.tar.gz

下载完后进行解压

1
$ tar -zxvf elasticsearch-5.5.1.tar.gz

运行

注意:启动elasticsearch的用户不能是root。

首先,我们进入到刚刚解压出来的目录中:

1
$ cd elasticsearch-5.5.1

接着,使用如下命令启动 Elasticsearch:

1
$ ./bin/elasticsearch

此时,如果正常的话,你可以在终端看到类似如下的输出:

1
2
3
4
5
6
7
[2017-03-04T23:25:09,961][INFO ][o.e.n.Node               ] [] initializing ...
[2017-03-04T23:25:10,073][INFO ][o.e.e.NodeEnvironment ] [yO11WLM] using [1] data paths, mounts [[/ (/dev/disk0s2)]], net usable_space [141.1gb], net total_space [232.9gb], spins? [unknown], types [hfs]
[2017-03-04T23:25:10,074][INFO ][o.e.e.NodeEnvironment ] [yO11WLM] heap size [1.9gb], compressed ordinary object pointers [true]
[2017-03-04T23:25:10,095][INFO ][o.e.n.Node ] node name [yO11WLM] derived from node ID [yO11WLMOQDuAOpZbYZYjzw]; set [node.name] to override
[2017-03-04T23:25:10,100][INFO ][o.e.n.Node ] version[5.5.1], pid[7607], build[db0d481/2017-02-09T22:05:32.386Z], OS[Mac OS X/10.11.5/x86_64], JVM[Oracle Corporation/Java HotSpot(TM) 64-Bit Server VM/1.8.0_102/25.102-b14]
[2017-03-04T23:25:11,363][INFO ][o.e.p.PluginsService ] [yO11WLM] loaded module [aggs-matrix-stats]
...

上面的命令是在前台运行的,如果想在后台以守护进程模式运行,可以加 -d 参数。

Elasticsearch 启动后,也启动了两个端口 9200 和 9300:

  • 9200 端口:HTTP RESTful 接口的通讯端口
  • 9300 端口:TCP 通讯端口,用于集群间节点通信和与 Java 客户端通信的端口

默认运行端口

安装成功后,Elastic 就会在默认的9200端口运行。

请求地址

现在,让我们做一些测试。在浏览器访问链接http://localhost:9200/,或使用 curl 命令:

1
curl 'http://localhost:9200/?pretty'

我们可以看到类似如下的输出:

1
2
3
4
5
6
7
8
9
10
11
12
13
{
"name": "MxO5-r8",
"cluster_name": "elasticsearch",
"cluster_uuid": "uQakSfM7Qi-cphDkxwRdxg",
"version": {
"number": "5.5.1",
"build_hash": "19c13d0",
"build_date": "2017-07-18T20:44:24.823Z",
"build_snapshot": false,
"lucene_version": "6.6.0"
},
"tagline": "You Know, for Search"
}

相关概念

在进一步使用 Elasticsearch 之前,让我们先了解几个关键概念。

在逻辑层面

  • Index (索引):这里的 Index 是名词,一个 Index 就像是传统关系数据库的 - Database,它是 Elasticsearch 用来存储数据的逻辑区域。我们唯一需要做的仅仅是选择一个索引名。这个名字必须是全部小写,不能以下划线开头,不能包含逗号。
  • Type (类型):文档归属于一种 Type,就像是关系数据库中的一个 Table
  • Document (文档):Elasticsearch 使用 JSON 文档来表示一个对象,就像是关系数据库中一个 Table 中的一行数据
  • Field (字段):每个文档包含多个字段,类似关系数据库中一个 Table 的列

在物理层面

  • Node (节点):node 是一个运行着的 Elasticsearch 实例,一个 node 就是一个单独的 server
  • Cluster (集群):cluster 是多个 node 的集合
  • Shard (分片):数据分片,一个 index 可能会存在于多个 shard

Relational DB 和 Elasticsearch的区别

在ElasticSearch中,我们常常会听到Index、Type以及Document等概念,那么它们与传统的熟知的关系型数据库中名称的类比如下:

Mysql Elasticsearch
Database(数据库) Index(索引)
Table(表) Type(类型)
Row(行) Document(文档)
Column(列) Field(字段)
Schema(表设计) Mapping(映射)
Index(索引) Everything Indexed by default(所有字段都被索引)
SQL(结构化查询语言) Query DSL(查询专用语言)

其文件目录结构如下

1
2
3
4
5
6
7
8
9
10
elasticsearch---这是Elasticsearch解压的目录
  bin---这里面是ES启动的脚本

  conf---elasticsearch.yml为ES的配置文件

  data---这里是ES得当前节点的分片的数据,可以直接拷贝到其他的节点进行使用

  logs---日志文件

  plugins---这里存放一些常用的插件,如果有一切额外的插件,可以放在这里使用。

HTTP请求链接说明

一个 Elasticsearch 请求和任何 HTTP 请求一样由若干相同的部件组成:

curl -X://:/?<QUERY_STRING>’ -d ‘‘

< > 标记的部件

参数 说明
VERB 适当的 HTTP _方法_ 或 _谓词_ : GETPOSTPUTHEAD 或者 DELETE
PROTOCOL http 或者 https(如果你在 Elasticsearch 前面有一个 https 代理)
HOST Elasticsearch 集群中任意节点的主机名,或者用 +localhost+ 代表本地机器上的节点。
PORT 运行 Elasticsearch HTTP 服务的端口号,默认是 9200
PATH API 的终端路径(例如 _count 将返回集群中文档数量)。Path 可能包含多个组件,例如:_cluster/stats_nodes/stats/jvm
QUERY_STRING 任意可选的查询字符串参数 (例如 ?pretty 将格式化地输出 JSON 返回值,使其更容易阅读)
BODY 一个 JSON 格式的请求体 (如果请求需要的话)

解决不能以root身份运行

在ElasticSearch 2.x版本中,默认是不允许以Root用户身份运行实例,可以使用bin/elasticsearch -Des.insecure.allow.root=true来以Root身份启动集群,此外还可以使用bin/elasticsearch -f -Des.path.conf=/path/to/config/dir参数来读取相关的.yml或者.json配置。

Restful API

参考文档:
https://juejin.im/entry/57e222528ac24700617b8c78
https://imququ.com/post/elasticsearch.html
http://blog.csdn.net/lvhong84/article/details/23936697