服务健康状况识别(运行状态)
在服务治理方面,Nebula.Venus 给开发人员提供了一个简单又强大的大屏界面,可辅助他们快速治理服务的稳定性问题。
在这个界面中(下图),
- 每个服务以一个卡片的形式显示它的运行状态,
- 并根据一定的健康评价规则给每个服务打分,
- 然后使用直观的颜色来区分它们的健康状况
例如:
在这个页面中,5种底色(0-4)分别代表不同的含意:
- 0-白底色:表示程序运行状态【健康】
- 1-4 颜色:颜色越深,表示越【不健康】
健康度打分参考了2个指标:
- 异常数
- 延迟数
你是不是可以很容易地发现哪些服务不健康?
治理服务稳定问题3步骤:
- 看颜色
- 点数字
- 穿透到日志,可参考:性能问题排查-通用方法
进程健康状况识别
这个页面会针对2个指标做出颜色高亮提醒:
- 错误数(ERR)
- 内存占用(MEM)
内存占用,以MB为单位=x,
- 白底色: x <= 200
- 淡红底色: 200 < x <= 500
- 亮红底色:x > 500