Docker容器监控:cAdvisor+InfluxDB+Grafana

简介

容器监控三剑客:cAdvisor监控收集 + InfluxDB存储数据 + Grafana展示图表

我们在主机上部署了很多个容器,要想监控它们该怎么办,通常我们使用原生命令 docker ps 或 docker stats 就可以查看到容器的状态。

如下:

[root@localhost ~]# docker ps
CONTAINER ID   IMAGE                           COMMAND             CREATED          STATUS          PORTS                                                                                            NAMES
2a10d91cae48   portainer/portainer-ce:2.11.1   "/portainer"        17 minutes ago   Up 17 minutes   0.0.0.0:8000->8000/tcp, :::8000->8000/tcp, 0.0.0.0:9443->9443/tcp, :::9443->9443/tcp, 9000/tcp   portainer
554e72db6ef0   billygoo/tomcat8-jdk8           "catalina.sh run"   29 hours ago     Up 59 seconds   0.0.0.0:8082->8080/tcp, :::8082->8080/tcp                                                        tomcat82
9e7e05d78b86   billygoo/tomcat8-jdk8           "catalina.sh run"   29 hours ago     Up 57 seconds   0.0.0.0:8081->8080/tcp, :::8081->8080/tcp                                                        tomcat81
[root@localhost ~]# docker stats
CONTAINER ID   NAME        CPU %     MEM USAGE / LIMIT     MEM %     NET I/O           BLOCK I/O     PIDS
2a10d91cae48   portainer   0.00%     17.2MiB / 1.777GiB    0.95%     2.52MB / 6.98MB   0B / 2.02MB   5
554e72db6ef0   tomcat82    0.17%     92.44MiB / 1.777GiB   5.08%     1.1kB / 0B        165MB / 0B    42
9e7e05d78b86   tomcat81    0.15%     88.45MiB / 1.777GiB   4.86%     836B / 0B         11.6MB / 0B   42

通过docker stats命令可以很方便的看到当前宿主机上所有容器的CPU,内存以及网络流量等数据,一般小公司够用了。。。。但是,docker stats统计结果只能是当前宿主机的全部容器,数据资料是实时的,没有地方存储、没有健康指标过线预警等功能。

如何解决,那就要用到接下来所要讲的方案:cAdvisor+InfluxDB+Grafana

是什么

容器监控三剑客:cAdvisor监控收集 + InfluxDB存储数据 + Grafana展示图表

cAdvisor

cAdvisor 是一个容器资源监控工具,包括容器的内存、CPU、网络IO、磁盘IO等监控,同时提供了一个Web页面用于查看容器的实时运行状态。

cAdivisor 默认存储2分钟的数据,而且只是针对单物理机。不过,cAdivisor提供了很多数据集成接口,支持InfluxDB、Redis、Kafka、Elasticsearch等集成,可以加上对应配置将监控数据发往这些数据库存储起来。

cAdvisor 功能主要有两点:

  • 展示Host和容器两个层次的监控数据。
  • 展示历史变化数据。

InfluxDB

InfluxDB 使用Go语言编写的一个开源分布式时许、时间和指标数据库,无需外部依赖。

cAdvisor 默认旨在本机保存最近2分钟的数据,为了持久化存储数据和统一收集展示监控数据,需要将数据存储到InfluxDB中。InfluxDB是一个时许数据库,专门用于存储时许相关数据,很适合存储CADvisor的数据,而且,CAdvisor本身已经提供了InfluxDB的集成方法,启动容器时指定配置即可。

InfluxDB主要功能:

  • 基于时间序列,支持与时间有关的相关函数(如最大、最小、求和等);
  • 可度量性:你可以实时对大量数据进行计算;
  • 基于事件:它支持任意的事件数据。

Grafana

Grafana 是一个开源的数据监控分析可视化平台,支持多种数据源配置(支持的数据源包括InfluxDB、Mysql、Elasticsearch、OpenTSDB、Graphite等)和丰富的插件及模块功能,支持图表权限控制和报警。

Grafana主要特性:

  • 灵活丰富的图形化选项;
  • 可以混合多种风格;
  • 支持白天和夜间模式;
  • 多个数据源。

 

环境搭建

方式一:分别安装

通常在进行监控的时候是需要一台单独机器作为监控主机的,这里我们创建一台新的监控主机(192.168.92.148),在监控主机上部署InfluxDB+Grafana,然后在被监控主机(192.168.92.149)上部署cAdvisor

部署InfluxDB(监控主机)

这里预先定义了创建一个初始数据库:

INFLUXDB_DB=cadvisor     # 初始数据库名称
INFLUXDB_USER=root        # 初始数据库用户名
INFLUXDB_USER_PASSWORD=root123456     # 初始数据库密码

docker run -d -p 8086:8086 --restart=always --name influxdb \
-e INFLUXDB_DB=cadvisor \
-e INFLUXDB_USER=root \
-e INFLUXDB_USER_PASSWORD=root123456 \
-v influxdb_data:/var/lib/influxdb \
influxdb:1.8

部署Grafana(监控主机)

docker run -d -p 3000:3000 --restart=always --name grafana \
-v grafana_data:/var/lib/grafana \
grafana/grafana

部署cAdvisor(被监控主机)

这里注意填入在部署influxdb时设置的数据库、用户名、密码

-storage_driver_db=cadvisor                          # influxdb的数据库名称
-storage_driver_host=192.168.92.148:8086    # influxdb的主机地址
-storage_driver_user=root                              # influxdb的用户名
-storage_driver_password=root123456          # influxdb的密码

docker run -d -p 8080:8080 --restart=always --name cadvisor \
-v /:/rootfs:ro \
-v /var/run:/var/run:rw \
-v /sys:/sys:ro \
-v /var/lib/docker/:/var/lib/docker:ro \
google/cadvisor \
-storage_driver=influxdb -storage_driver_db=cadvisor -storage_driver_host=192.168.92.148:8086 -storage_driver_user=root -storage_driver_password=root123456

 

方式二:Compose容器编排一套带走

如果你想将cAdvisor+InfluxDB+Grafana以及其他的容器都安装到同一台主机上,那使用这个compose一套带走方案就可以了。

新建目录

mkdir -p /data/cig

新建3件套组合的 docker-compose.yml 文件

cd /data/cig/

vim docker-compose.yml

文件内容如下:

version: '3.1'

services:    
  influxdb:
    image: influxdb:1.8
    restart: always
    environment:
      - INFLUXDB_DB=cadvisor
      - INFLUXDB_USER=root
      - INFLUXDB_USER_PASSWORD=root123456
    ports:
      - "8086:8086"
    volumes:
      - influxdb_data:/var/lib/influxdb
  
  cadvisor:
    image: google/cadvisor
    depends_on:
      - influxdb
    command: -storage_driver=influxdb -storage_driver_db=cadvisor -storage_driver_host=influxdb:8086 -storage_driver_user=root -storage_driver_password=root123456
    restart: always
    ports:
      - "8080:8080"
    volumes:
      - /:/rootfs:ro
      - /var/run:/var/run:rw
      - /sys:/sys:ro
      - /var/lib/docker/:/var/lib/docker:ro
      
  grafana:
    user: "104"
    image: grafana/grafana
    restart: always

    depends_on:
      - influxdb
    ports:
      - "3000:3000"
    volumes:
      - grafana_data:/var/lib/grafana

volumes:
  influxdb_data: {}
  grafana_data: {}

检查语法:

没有输出则正常。

docker-compose config -q

启动:

docker-compose up -d

查看是否都启动:

[root@localhost cig]# docker ps
CONTAINER ID   IMAGE                           COMMAND                  CREATED         STATUS         PORTS                                                                                            NAMES
06dffc78e480   grafana/grafana                 "/run.sh"                3 seconds ago   Up 2 seconds   0.0.0.0:3000->3000/tcp, :::3000->3000/tcp                                                        cig_grafana_1
bdee27fbd3c8   google/cadvisor                 "/usr/bin/cadvisor -…"   3 seconds ago   Up 2 seconds   0.0.0.0:8080->8080/tcp, :::8080->8080/tcp                                                        cig_cadvisor_1
a328796c8d2a   tutum/influxdb:0.9              "/run.sh"                4 seconds ago   Up 3 seconds   0.0.0.0:8083->8083/tcp, :::8083->8083/tcp, 0.0.0.0:8086->8086/tcp, :::8086->8086/tcp             cig_influxdb_1

 

访问测试

1. 浏览CAdvisor收集服务:http://被监控主机的IP:8080/

2. 浏览Grafana展现服务,http://部署Grafana的主机IP:3000/

 

配置Grafana

添加数据源:

如果是使用 docker-compose 部署的,这里URL直接写 http://influxdb:8086 即可;

如果是单独安装的,这里URL要写 http://influxdb的IP:8086

滚动到下面,填写部署influxdb时初始化的数据库cadvisor、用户名root、密码root123456,点击Save &Test.

添加 dashboard:

点击右上角 Save 保存。

还可以点击右上角添加新的图表,监控其他项目,如:CPU、网络、磁盘等,需要具体去看看查询语法获取正确的值制作图表。

版权声明:
作者:admin
链接:https://www.chenxie.net/archives/2649.html
来源:蜀小陈
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>
文章目录
关闭
目 录