25.3 使用Swarm

前面演示了基于Consul服务发现后端来配置一个本地Swarm集群。其中,Consul也可以被替换为Etcd、ZooKeeper等。

另外一个更方便的方式是直接使用Docker Hub提供的免费服务发现后端。下面使用这种方式来演示Swarm的主要操作,包括:

·create:创建一个集群;

·list:列出集群中的节点;

·manage:管理一个集群;

·join:让节点加入到某个集群。

注意,使用Docker Hub的服务发现后端,需要各个节点能通过公网访问到Docker Hub的服务接口。

1.创建集群id

在任意一台安装了Swarm的机器上执行swarm create命令来在Docker Hub服务上进行注册。Swarm会通过服务发现后端(此处为Docker Hub提供)来获取一个唯一的由数字和字母组成的token,用来标识要管理的集群:


  1. $ docker run --rm swarm create
  2. 946d65606f7c2f49766e4dddac5b4365

注意返回的字符串,这是集群的唯一id,加入集群的各个节点将需要这个信息。

2.配置集群节点

在所有要加入集群的普通节点上执行swarm join命令,表示把这台机器加入指定集群当中。例如,某台机器的IP地址为192.168.0.2,将其加入我们刚创建的946d65606-f7c2f49766e4dddac5b4365集群,则可以使用如下命令:


  1. $ docker run --rm swarm join --addr=192.168.0.2:2375 token://946d65606f7c2f49766
  2. e4dddac5b4365
  3. time="2015-12-09T08:59:43Z" level=info msg="Registering on the discovery
  4. service every 20s..." addr="192.168.0.2:2375" discovery="token://
  5. 946d65606f7c2f49766e4dddac5b4365"
  6. ...

其中,—addr指定的IP地址信息将被发送给服务发现后端,用以区分集群不同的节点。manager服务必须要通过这个地址可以访问到该节点。

通过控制台可以看到,上述命令执行后,默认每隔20秒(可以通过—heartbeat选项指定)会输出一条心跳信息。对于发现服务后端来说,默认如果超过60秒(可以通过—ttl选项指定)没有收到心跳信息,则将节点从列表中删除。

如果不希望看到输出日志信息,则可以用-d选项替换—rm选项,让服务后台执行。

执行swarm join命令实际上是通过agent把自己的信息注册到发现服务上,因此,此时对于后端的发现服务来说,已经可以看到有若干节点注册上来了。那么,如何管理和使用这些节点呢?这就得需要Swarm的manager服务了。

3.配置管理节点

配置管理节点需要使用swarm manage命令,该命令将启动manager服务,默认监听到2375端口,所有对集群的管理都可以通过该服务接口进行。

读者可能注意到,manager服务默认监听的端口跟Docker服务监听端口是一样的,这是为了兼容其他基于Docker的服务,可以无缝地切换到Swarm平台上来。

仍然在节点192.168.0.2进行操作。由于我们是采用Docker容器形式启动manager服务,本地的2375端口已经被Docker Daemon占用,我们将manager服务监听端口映射到本地一个空闲的12375端口:


  1. $ docker run -d -p 12375:2375 swarm manage token://946d65606f7c2f49766e4dddac5b4365
  2. 1e1ca8c4117b6b7271efc693f9685b4e907d8dc95324350392b21e94b3cffd18

可以通过docker ps命令来查看启动的swarm manager服务容器:


  1. $ docker ps
  2. CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
  3. 1e1ca8c4117b swarm "/swarm manage token:" 11 seconds ago Up 10 seconds
  4. 0.0.0.0:12375->2375/tcp jovial_rosalind

命令如果执行成功会返回刚启动的Swarm容器的ID。此时一个简单的Swarm集群就已经搭建起来了,包括一个普通节点和一个管理节点。

4.查看集群节点列表

集群启动成功以后,用户可以在任何一台节点上使用swarm list命令查看集群中的节点列表。例如:


  1. $ docker run --rm swarm list token://946d65606f7c2f49766e4dddac5b4365
  2. 192.168.0.2:2375

显示正是之前用swarm join命令加入集群的节点的地址。

我们在另外一个节点192.168.0.3上同样使用swarm join命令新加入一个节点:


  1. $docker run --rm swarm join --addr=192.168.0.3:2375 token://946d65606f7c2f49766
  2. e4dddac5b4365
  3. time="2015-12-10T02:05:34Z" level=info msg="Registering on the discovery
  4. service every 20s..." addr="192.168.0.3:2375" discovery="token:
  5. //946d65606f7c2f49766e4dddac5b4365"
  6. ...

再次使用swarm list命令查看集群中的节点列表信息,可以看到新加入的节点:


  1. $ docker run --rm swarm list token://946d65606f7c2f49766e4dddac5b4365
  2. 192.168.0.3:2375
  3. 192.168.0.2:2375

5.使用集群服务

那么,怎么使用Swarm提供的服务呢?实际上,所有Docker客户端可以继续使用,只要指定使用Swarm manager服务的监听地址即可。

例如,manager服务监听的地址为192.168.0.2:12375,则可以通过指定-H 192.168.0.2:12375选项来继续使用Docker客户端,执行任意Docker命令,例如ps、info、run等。

在任意节点上使用docker run来启动若干容器,例如:


  1. $docker -H 192.168.0.2:12375:12375 run -d ubuntu ping 127.0.0.1
  2. 4c9bccbf86fb6e2243da58c1b15e9378fac362783a663426bbe7058eea84de46

使用ps命令查看集群中正在运行的容器:


  1. $ docker -H 192.168.0.2:12375 ps
  2. CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS
  3. NAMES
  4. 4c9bccbf86fb buntu "ping 127.0.0.1" About a minute ago Up About a minute
  5. clever_wright
  6. 730061a3801a registry:latest "docker-registry" 2 minutes ago
  7. Up 2 minutes 192.168.0.2:5000->5000/tcp Host-1/registry_registry_1
  8. 72d99f24a06f redis:3.0 "/entrypoint.sh redis" 2 minutes ago
  9. Up 2 minutes 6379/tcp Host-1/registry_redis_1,
  10. Host-1/registry_registry_1/redis,Host-1/registry_registry_1/redis_1,Host-1
  11. /registry_registry_1/registry_redis_1

输出结果中显示目前集群中正在运行的容器(注意不包括Swarm manager服务容器),可以在不同节点上使用docker ps查看本地容器,会发现这些容器实际上可能运行在集群中的多个节点上(由Swarm调度策略进行分配)。使用info查看所有节点的信息:


  1. $ docker -H 192.168.0.2:12375 info
  2. Containers: 18
  3. Images: 36
  4. Role: primary
  5. Strategy: spread
  6. Filters: health, port, dependency, affinity, constraint
  7. Nodes: 2
  8. Host-1: 192.168.0.2:2375
  9. Containers: 15
  10. Reserved CPUs: 0 / 4
  11. Reserved Memory: 1 GiB / 4.053 GiB
  12. Labels: executiondriver=native-0.2, kernelversion=3.16.0-43-generic,
  13. operatingsystem=Ubuntu 14.04.3 LTS, storagedriver=aufs
  14. Host-2: 192.168.0.3:2375
  15. Containers: 3
  16. Reserved CPUs: 0 / 8
  17. Reserved Memory: 0 B / 16.46 GiB
  18. Labels: executiondriver=native-0.2, kernelversion=3.16.0-30-generic,
  19. operatingsystem=Ubuntu 14.04.3 LTS, storagedriver=aufs
  20. CPUs: 12
  21. Total Memory: 20.51 GiB
  22. Name: 1e1ca8c4117b

结果输出显示这个集群目前只有两个节点,地址分别是192.168.0.2和192.168.0.3。

类似地,也可以通过Compose模板来启动多个服务。不过请注意,要想让服务分布到多个Swarm节点上,需要采用版本2的写法。

6.使用网络

为了支持跨主机的网络,Swarm默认采用了overlay网络类型,实现上通过vxlan来构建联通整个Swarm集群的网络。

首先在集群中的所有节点上添加配置Docker daemon选项:


  1. --cluster-store=<DISCOVERY_HOST:PORT> --cluster-advertise=<DOCKER_DAEMON_HOST:PORT>

以consul服务为例,可能类似:


  1. --cluster-store=consul://<consul服务地址>:8500 --cluster-advertise=192.168.0.3:2375

之后重启Docker服务。首先创建一个网络:


  1. $ docker -H 192.168.0.2:12375 network create swarm_network

查看网络,将看到一个overlay类型的网络:


  1. $ docker -H 192.168.0.2:12375 network ls
  2. NETWORK ID NAME DRIVER
  3. 6edf2d16ec97 swarm_network overlay

此时,所有添加到这个网络上的容器将自动被分配到集群中的节点上,并且彼此联通。