Jonnyan的原创笔记
alpine
alpine里python安装mssql笔记
Alpine linux如何配置和管理自定义服务
windows
window server2012远程授权重置
window获取本机所有IP
window远程桌面RDP加速方案
远程监控 Win10 资源占用
windows 下 mysql 区分大小写敏感问题
window下navicat无限试用脚本
Linux
解决openvpn的CRL has expired笔记
centos7.x配置时间服务器(chrony)
centos7.x下安装wireguard
解决influxdb的log日志输出位置
保存 iptable 规则并开机自动加载 | SA-Logs
kafka笔记
kafka的server.properties 配置文件参数说明
CentOS 和 RedHat 下 8 个最常用的 YUM 库
外网IP查询网站
VirtualBox Ubuntu20/centos7 命令行如何扩容分区磁盘
如何备份sqlite数据库
yum 安装 redis5/mq/consul
centos7.x 安装 docker-ce
zabbix4.2 的 yum+mariadb 方式部署安装
如何在 Linux 中查找最大的 10 个文件
mongodb 备份与还原操作
Linux 高频工具快速教程
yum 安装 influxdb/telegraf
ubuntu 14.04/16.04/18.04 yum 安装 zabbix-agent 教程
逃不掉的 mysql 数据库安装方式大全 yum rpm 源码
VIM 配置入门
find 命令结合 cp bash mv 命令使用的 4 种方式
Tomcat nginx log 日志按天分割切割
linux 和 pycharm 下终端彩色打印输出
centos5/6/7 下 yum 安装 zabbix-agent(被控端)
shell 脚本头,#!/bin/sh 与 #!/bin/bash 的区别.
electerm/tabby在执行screen命令后不显示滚动条
python
python virtualenv笔记
python配置文件INI/TOML/YAML/ENV的区别
python限制函数的执行时间
python里and和or的理解
SQLite is not a toy database | Anton Zhiyanov
四行代码实现 Python 管道 - Aber's blog
systemd管理虚拟环境Django+uwsgi+nginx配置教程
Linux shell命令创建python django用户
nginx子路径下反代运行多个django
django web 应用 runserver 模式下 cpu 占用高解决办法
解决 pip 安装模块报错 Cannot fetch index base URL http://pypi.python.org/simple/
docker
仅在首次启动时在Docker容器中运行命令
Docker多平台架构镜像构建
解决cadvisor监控内存值与docker stats命令值不一致问题
docker 清理指定日期之前的镜像
docker 部署 graylog 使用教程
docker 一键搭建 zerotier-moon 节点
alpine的docker镜像安装mysql/mariadb/redis
dockerfile 多阶段构建参考
Warning: Stopping docker.service, but it can still be activated by: docker.socket
nginx
Nginx限制并发连接数与下载速度
nginx仅允许域名访问禁止IP访问
Nginx 强制跳转 Https
nginx强制跳转https无限301循环问题
万字总结,带你全面系统的认识 Nginx
linux 下编译安装 nginx 完整版
解决 nginx 同端口强制跳转 https 配置 ssl 证书问题
nginx 关闭日志功能 access_log 关闭
基于 nginx 的 token 认证
杂记
小米手机MIUI12安装Google服务
使用sphinx+markdown+readthedocs+github来编写文档
N1由armbian直刷openwrt
N1安装docker版本的openwrt做旁路由
NUC10 i3/i5/i7系列开启局域网wol唤醒
威联通qnap安装nginx
威联通qnap配置开机自启动项
telegram bot python使用示例教程
两款paste临时文本分享平台
docker部署微力同步(verysync)
Android和IOS自部署通知程序
苹果M1如何科学上网
M1 mac iterm2配置lrzsz命令
漫威轮播
网件XR500/R7800刷机
DIY 编译 openwrt 固件
苹果 mac 版微软官方远程连接工具下载 Microsoft Remote Desktop For Mac
wireguard 实现 peer 互联, NAT to NAT
学习本来的样子
解决 aws ec2 的 centos7 设置时区无效
redis 问题优化
N1 如何完美刷入 armbian 系统教程
v2rayN 的 pac 简单规则
博客园 markdown 使用折叠语法和颜色标签
十年感悟之 python 之路
在浏览器输入 URL 回车后发生了什么?
grafana 里 prometheus 查询语法
国内开源镜像站点汇总
解决阿里云部署 office web apps ApplicationFailedException 报错问题
解决 mac 休眠睡眠异常耗电方法
jira 集成 fisheye 代码深度查看工具安装绿色版
阿里云 ecs 开启 x11 图形化桌面
markdown 完整语法规范 3.0 + 编辑工具介绍
pycharm 重置设置,恢复默认设置
[已解决]window 下 Can't connect to MySQL server on'localhost' (10061) 与无法启动 MYSQL 服务”1067 进程意外终止”
解决 xshell6 评估过期, 需采购问题
[已解决]pycharm 报错: AttributeError: module 'pip' has no attribute 'main'
[已解决]windows 下 python3.x 与 python2.7 共存版本 pip 使用报错问题
云策文档think配置https教程
机器监控告警
zabbix
yum / 编译安装 Zabbix 5.0 LTS
zabbix 监控 AWS-SQS 队列
Zabbix-agent 端配置文件说明
Prometheus+grafana
prometheus+grafana安装和配置
node_exporter主机监控
cadvisor容器监控
redis_exporter监控
rabbitmq_exporter监控
consul_exporter监控
windows_exporter
Open-Falcon
falcon 数据丢失处理方法参考
日志监控告警
graylog
graylog 通过 python 实现钉钉 / 微信 / webhook 告警
loki+grafana
Loki简介
Loki安装
Loki查询语法
grafana面板pannel语法
内网穿透
frp
zerotier
zerotier充当网关实现内网互联,访问其它节点内网
一分钟自建zerotier-plant
nps
anylink
N2N
本文档发布于https://mrdoc.fun
-
+
首页
prometheus+grafana安装和配置
>i 这里我们采用 docker-compose 方式安装 # 1.前期准备 ```bash # 创建目录 mkdir -p /opt/jonnyan404/prometheus # prometheus主目录 mkdir -p /opt/jonnyan404/prometheus-tsdb # prometheus数据持久化目录 mkdir -p /opt/jonnyan404/prometheus/rules # prometheus告警规则目录 mkdir -p /opt/jonnyan404/prometheus/target # 被监控的机器列表,由于我们采用文件发现,需要手动更新文件. mkdir -p /opt/jonnyan404/alertmanager # alertmanager配置文件目录 mkdir -p /opt/jonnyan404/grafana-data # grafana数据持久化目录 mkdir -p /opt/jonnyan404/dingding # 综合告警配置和数据持久化目录 # 赋权 chmod 777 /opt/jonnyan404/prometheus-tsdb chmod 777 /opt/jonnyan404/grafana-data ``` # 1.编辑必要的配置文件 ## 1.1 prometheus配置 - 基于文件发现的prometheus配置文件 - 配置文件参数:<https://prometheus.io/docs/prometheus/latest/configuration/configuration/> - vim /opt/prometheus/prometheus.yml ```bash # my global config global: scrape_interval: 15s # 采集数据间隔 evaluation_interval: 15s # 告警规则表执行间隔 # Alertmanager configuration alerting: alertmanagers: - static_configs: - targets: - alert:9093 # Load rules once and periodically evaluate them according to the global 'evaluation_interval'. rule_files: - "/etc/prometheus/rules/*.yml" # - "first_rules.yml" # - "second_rules.yml" # A scrape configuration containing exactly one endpoint to scrape: # Here it's Prometheus itself. scrape_configs: # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config. - job_name: 'prometheus' # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ['localhost:9090'] - job_name: 'aws_ec2' # scrape_interval: 10s file_sd_configs: - refresh_interval: 30s # 30s重载配置文件 files: - /etc/prometheus/target/*.yml - /etc/prometheus/target/*.json ``` ## 1.2 alertmanager配置文件 - vim /opt/jonnyan404/alertmanager/alertmanager.yml ```yaml global: resolve_timeout: 5m route: group_by: ['alertname'] group_wait: 10s group_interval: 10s repeat_interval: 1h #未解决的告警间隔 receiver: 'default' receivers: - name: 'default' webhook_configs: - url: 'http://主机IP:9000/prometheusalert?type=dd&tpl=dingding&ddurl=钉钉告警地址' # 这里依赖3.3prometheusalert配置,请注意!!! inhibit_rules: - source_match: severity: 'critical' target_match: severity: 'warning' equal: ['alertname', 'dev', 'instance'] ``` ## 1.3 配置dingding告警 ```bash cd /opt/jonnyan404/dingding git clone https://github.com/feiyu563/PrometheusAlert.git cp PrometheusAlert/conf/app-example.conf app.conf ``` # 2. 配置docker-compose >i 集成 prometheus/alertmanager/dingding/grafana - vim docker-compose.yml ```yaml version: "3" services: promethtus: image: prom/prometheus container_name: prometheus restart: always volumes: - /opt/jonnyan404/prometheus:/etc/prometheus - /opt/jonnyan404/prometheus-tsdb:/prometheus-tsdb environment: - TZ=Asia/Shanghai ports: - "9090:9090" command: - '--config.file=/etc/prometheus/prometheus.yml' - '--storage.tsdb.path=/prometheus-tsdb' - '--storage.tsdb.retention.time=90d' #数据保存时间,默认15天 depends_on: - alert alert: image: prom/alertmanager container_name: alert restart: always volumes: - /opt/jonnyan404/alertmanager:/etc/alertmanager environment: - TZ=Asia/Shanghai ports: - "9093:9093" command: - "--config.file=/etc/alertmanager/alertmanager.yml" - "--web.external-url=http://x.x.x.x:9093/" #外网IP,裸机搭建的可能需要 grafana: image: grafana/grafana:latest container_name: grafana restart: always environment: - TZ=Asia/Shanghai - LANG=zh_CN.UTF-8 ports: - "3000:3000" volumes: - /opt/jonnyan404/grafana-data:/var/lib/grafana dingding: image: feiyu563/prometheus-alert:latest container_name: dingding restart: always environment: - TZ=Asia/Shanghai ports: - "9000:8080" volumes: - /opt/jonnyan404/dingding:/app/conf - /opt/jonnyan404/dingding:/app/db # Volumes for persisting data, see https://docs.docker.com/engine/admin/volumes/volumes/ #volumes: # prometeus-tsdb: # driver: local # grafana_data: # driver: local # alertmanager_journal: # driver: local ``` # 3. 启动 1. 执行 `docker-compose up -d` 启动 2. 打开 `http://ip:3000` 访问 grafana 并配置数据源 ## 3.3 prometheusalert插件钉钉告警配置 >w 这里如果有疑问,请参考:<https://github.com/feiyu563/PrometheusAlert/blob/master/doc/readme/customtpl.md> - 打开 `http://ip:9000` 访问prometheusalert界面,点击上方菜单`alerttemplate`-->`添加模板`,配置自定义dingding告警模板.以下是模板内容: ```go {{ $var := .externalURL}}{{ range $k,$v:=.alerts }} {{if eq $v.status "resolved"}} #### [Prometheus恢复信息]({{$v.generatorURL}}) ##### <font color="#02b340">告警名称</font>:[{{$v.labels.alertname}}]({{$var}}) ##### <font color="#02b340">告警级别</font>:{{$v.labels.severity}} ##### <font color="#02b340">触发时间</font>:{{$v.startsAt}} ##### <font color="#02b340">结束时间</font>:{{$v.endsAt}} ##### <font color="#02b340">主机名称</font>:{{$v.labels.nodename}} **{{$v.annotations.summary}}** [点击打开grafana]($v.annotations.grafana) {{else}} #### [Prometheus告警信息]({{$v.generatorURL}}) ##### <font color="#FF0000">告警名称</font>:[{{$v.labels.alertname}}]({{$var}}) ##### <font color="#FF0000">告警级别</font>:{{$v.labels.severity}} ##### <font color="#FF0000">触发时间</font>:{{$v.startsAt}} ##### <font color="#FF0000">主机名称</font>:{{$v.labels.nodename}} **{{$v.annotations.summary}}** [点击打开grafana]($v.annotations.grafana) {{end}} {{ end }} ``` 这样就把基础程序都运行起来了,剩下就是安装配置各种exporter了. # Reference Link - 官方配置文件示例:<https://github.com/prometheus/prometheus/tree/main/documentation/examples> - 三方中文手册:<https://www.prometheus.wang/> - 官方exporter列表: <https://prometheus.io/docs/instrumenting/exporters/>
Jonny
2021年5月20日 14:07
665
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
【腾讯云】爆款2核2G4M云服务器一年45元,企业首购最高获赠300元京东卡
【腾讯云】爆款2核2G4M云服务器一年45元,企业首购最高获赠300元京东卡
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期