k8s_PaaS/第九章——工作中的唠嗑及常用操作.md

1.7 KiB
Raw Blame History

第九章——工作中的唠嗑及常用操作

唠嗑章节,本章节会增加一些在工作中常用的操作,以及开发交付的一些贴近场景的组件及工具代替原本教程中的内容

关于监控

第七章节中我们用到Promtheus来做监控随着不断更新换代为了追求越轻便、越快速越好可以更好的兼容其他不同程序我们会采用Jaeger、ELK、Telegraf、Grafana的组合再加上时序数据库InfluxDB。

  • Jaeger分布式追踪系统go语言微服务系统更需要全链路跟踪传统中页面bug我们会开始排查前端问题前端确认没问题说调用接口有错误日志我们在去看后端看完后端说底层就报错我们再去排查集群问题实在太耗费时间了而全链路跟踪可以直接明了的看到是哪一环节的问题。
  • ELKES、Logstash、Kibana
  • Telegraf数据采集工具go语言代替Prometheus
  • InfluxDB时序数据库go语言代替TSDB各个指标都高于TSDB随着推出时间越来越久对市面上的产品也已经很兼容了。
  • Grafana监控指标展示工具go语言
关于InfluxDB在实际应用中遇到的情况

在生产中由于机器数过多使用默认配置的InfluxDB直接撑爆内存重启内存会逐渐增大然后挂掉也没办法进入会报refused并提示确认是否在running解决办法是直接把influx对应的路径下大的数据目录_retention结尾下的数字文件夹全部删掉这样就有足够的空间进入influx修改数据保存日期alter retention policy "db_name__retention" on "db_name" duration 7d default