From a5084e8411ae5b8e3d15635c8413e0e178e99218 Mon Sep 17 00:00:00 2001 From: benjas <909336740@qq.com> Date: Thu, 13 Aug 2020 18:06:54 +0800 Subject: [PATCH] =?UTF-8?q?Create=20=E7=AC=AC=E4=B9=9D=E7=AB=A0=E2=80=94?= =?UTF-8?q?=E2=80=94=E5=B7=A5=E4=BD=9C=E4=B8=AD=E7=9A=84=E5=94=A0=E5=97=91?= =?UTF-8?q?=E5=8F=8A=E5=B8=B8=E7=94=A8=E6=93=8D=E4=BD=9C.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 第九章——工作中的唠嗑及常用操作.md | 18 ++++++++++++++++++ 1 file changed, 18 insertions(+) create mode 100644 第九章——工作中的唠嗑及常用操作.md diff --git a/第九章——工作中的唠嗑及常用操作.md b/第九章——工作中的唠嗑及常用操作.md new file mode 100644 index 0000000..6ed36ae --- /dev/null +++ b/第九章——工作中的唠嗑及常用操作.md @@ -0,0 +1,18 @@ +## 第九章——工作中的唠嗑及常用操作 + +> 唠嗑章节,本章节会增加一些在工作中常用的操作,以及开发交付的一些贴近场景的组件及工具代替原本教程中的内容 + +### 关于监控 + +第七章节中,我们用到Promtheus来做监控,随着不断更新换代,为了追求越轻便、越快速越好,可以更好的兼容其他不同程序,我们会采用Jaeger、ELK、Telegraf、Grafana的组合,再加上时序数据库InfluxDB。 + +- **Jaeger:分布式追踪系统**(go语言),微服务系统更需要全链路跟踪,传统中,页面bug我们会开始排查前端问题,前端确认没问题说调用接口有错误日志,我们在去看后端,看完后端说底层就报错我们再去排查集群问题实在太耗费时间了,而全链路跟踪可以直接明了的看到是哪一环节的问题。 +- **ELK:ES、Logstash、Kibana** +- **Telegraf:数据采集工具**(go语言),代替Prometheus +- **InfluxDB:时序数据库**(go语言),代替TSDB,各个指标都高于TSDB,随着推出时间越来越久,对市面上的产品也已经很兼容了。 +- **Grafana:监控指标展示工具**(go语言) + +##### 关于InfluxDB在实际应用中遇到的情况 + +在生产中由于机器数过多,使用默认配置的InfluxDB直接撑爆内存,重启内存会逐渐增大然后挂掉,也没办法进入,会报refused并提示确认是否在running,解决办法是直接把influx对应的路径下大的数据目录_retention结尾下的数字文件夹全部删掉,这样就有足够的空间,进入influx修改数据保存日期`alter retention policy "db_name__retention" on "db_name" duration 7d default` +