仪表盘设计 #
一、设计原则 #
1.1 核心原则 #
text
仪表盘设计核心原则:
┌─────────────────────────────────────────────┐
│ 1. 清晰性 │
├─────────────────────────────────────────────┤
│ • 信息一目了然 │
│ • 避免信息过载 │
│ • 使用清晰的标题和标签 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 2. 相关性 │
├─────────────────────────────────────────────┤
│ • 相关指标放在一起 │
│ • 按逻辑顺序排列 │
│ • 使用行分组 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 3. 一致性 │
├─────────────────────────────────────────────┤
│ • 统一的颜色方案 │
│ • 统一的单位格式 │
│ • 统一的命名规范 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 4. 可操作性 │
├─────────────────────────────────────────────┤
│ • 提供足够的上下文 │
│ • 包含阈值和基准线 │
│ • 支持下钻分析 │
└─────────────────────────────────────────────┘
1.2 信息层次 #
text
仪表盘信息层次:
┌─────────────────────────────────────────────┐
│ 第一层:概览 │
├─────────────────────────────────────────────┤
│ • 系统健康状态 │
│ • 关键指标概览 │
│ • 告警摘要 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 第二层:详细 │
├─────────────────────────────────────────────┤
│ • 各组件详细指标 │
│ • 趋势图表 │
│ • 对比分析 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 第三层:下钻 │
├─────────────────────────────────────────────┤
│ • 问题定位 │
│ • 详细日志 │
│ • 历史数据 │
└─────────────────────────────────────────────┘
二、仪表盘类型 #
2.1 系统概览仪表盘 #
text
系统概览仪表盘内容:
┌─────────────────────────────────────────────┐
│ 顶部状态行 │
├─────────────────────────────────────────────┤
│ • 实例总数 / 在线数 / 离线数 │
│ • 告警数量(按严重级别) │
│ • 系统运行时间 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 资源使用概览 │
├─────────────────────────────────────────────┤
│ • CPU使用率(仪表盘) │
│ • 内存使用率(仪表盘) │
│ • 磁盘使用率(仪表盘) │
│ • 网络流量(图表) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 趋势图表 │
├─────────────────────────────────────────────┤
│ • CPU使用率趋势 │
│ • 内存使用趋势 │
│ • 磁盘IO趋势 │
│ • 网络流量趋势 │
└─────────────────────────────────────────────┘
2.2 应用监控仪表盘 #
text
应用监控仪表盘内容:
┌─────────────────────────────────────────────┐
│ 服务状态 │
├─────────────────────────────────────────────┤
│ • 服务实例数 │
│ • 服务健康状态 │
│ • 错误率 │
│ • 可用性 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 请求指标 │
├─────────────────────────────────────────────┤
│ • QPS(每秒请求数) │
│ • 响应时间(P50/P90/P99) │
│ • 错误数/错误率 │
│ • 请求大小 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 业务指标 │
├─────────────────────────────────────────────┤
│ • 活跃用户数 │
│ • 订单数 │
│ • 交易额 │
│ • 转化率 │
└─────────────────────────────────────────────┘
2.3 数据库监控仪表盘 #
text
数据库监控仪表盘内容:
┌─────────────────────────────────────────────┐
│ 连接指标 │
├─────────────────────────────────────────────┤
│ • 当前连接数 │
│ • 最大连接数 │
│ • 连接使用率 │
│ • 等待连接数 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 查询指标 │
├─────────────────────────────────────────────┤
│ • QPS │
│ • 慢查询数 │
│ • 查询延迟 │
│ • 查询错误 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 存储指标 │
├─────────────────────────────────────────────┤
│ • 数据库大小 │
│ • 表数量 │
│ • 索引使用率 │
│ • 缓存命中率 │
└─────────────────────────────────────────────┘
三、可视化组件选择 #
3.1 图表类型选择 #
text
图表类型选择指南:
┌─────────────────────────────────────────────┐
│ 时间序列数据 │
├─────────────────────────────────────────────┤
│ • 使用:Time series / Graph │
│ • 示例:CPU使用率、内存使用率 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 当前值/状态 │
├─────────────────────────────────────────────┤
│ • 使用:Stat / Gauge │
│ • 示例:在线实例数、错误率 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 比例/占比 │
├─────────────────────────────────────────────┤
│ • 使用:Pie chart / Bar gauge │
│ • 示例:磁盘使用分布、请求分布 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 表格数据 │
├─────────────────────────────────────────────┤
│ • 使用:Table │
│ • 示例:实例列表、告警列表 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 状态显示 │
├─────────────────────────────────────────────┤
│ • 使用:Status history / State timeline │
│ • 示例:服务状态历史 │
└─────────────────────────────────────────────┘
3.2 颜色方案 #
text
颜色方案建议:
┌─────────────────────────────────────────────┐
│ 状态颜色 │
├─────────────────────────────────────────────┤
│ • 绿色:正常 │
│ • 黄色:警告 │
│ • 红色:严重 │
│ • 灰色:未知/无数据 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 使用率颜色 │
├─────────────────────────────────────────────┤
│ • 0-70%:绿色 │
│ • 70-85%:黄色 │
│ • 85-100%:红色 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 趋势颜色 │
├─────────────────────────────────────────────┤
│ • 上升:绿色(正面)/ 红色(负面) │
│ • 下降:红色(正面)/ 绿色(负面) │
│ • 平稳:蓝色 │
└─────────────────────────────────────────────┘
四、仪表盘模板 #
4.1 主机监控模板 #
text
主机监控仪表盘结构:
Row 1: 概览
├── Stat: 在线主机数
├── Stat: 离线主机数
├── Stat: 平均CPU使用率
└── Stat: 平均内存使用率
Row 2: CPU
├── Time series: CPU使用率趋势
├── Time series: CPU负载趋势
└── Bar gauge: 各实例CPU使用率
Row 3: 内存
├── Time series: 内存使用趋势
├── Time series: Swap使用趋势
└── Bar gauge: 各实例内存使用率
Row 4: 磁盘
├── Time series: 磁盘使用率趋势
├── Time series: 磁盘IO趋势
└── Bar gauge: 各实例磁盘使用率
Row 5: 网络
├── Time series: 网络流量趋势
├── Time series: 网络错误趋势
└── Bar gauge: 各实例网络流量
4.2 应用监控模板 #
text
应用监控仪表盘结构:
Row 1: 服务状态
├── Stat: 服务实例数
├── Stat: 健康实例数
├── Stat: 错误率
└── Stat: 可用性
Row 2: 请求指标
├── Time series: QPS趋势
├── Time series: 响应时间趋势
└── Time series: 错误数趋势
Row 3: 延迟分布
├── Time series: P50延迟
├── Time series: P90延迟
└── Time series: P99延迟
Row 4: 资源使用
├── Time series: CPU使用率
├── Time series: 内存使用率
└── Time series: 连接数
五、最佳实践 #
5.1 命名规范 #
text
命名规范建议:
┌─────────────────────────────────────────────┐
│ 仪表盘命名 │
├─────────────────────────────────────────────┤
│ • 格式:[环境] [服务/系统] [类型] │
│ • 示例:Production API Overview │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 面板命名 │
├─────────────────────────────────────────────┤
│ • 清晰描述指标内容 │
│ • 包含单位 │
│ • 示例:CPU Usage (%) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 变量命名 │
├─────────────────────────────────────────────┤
│ • 使用小写和下划线 │
│ • 有意义的名称 │
│ • 示例:instance, service, environment │
└─────────────────────────────────────────────┘
5.2 性能优化 #
text
仪表盘性能优化:
┌─────────────────────────────────────────────┐
│ 查询优化 │
├─────────────────────────────────────────────┤
│ • 减少查询数量 │
│ • 使用变量减少仪表盘数量 │
│ • 合理设置查询范围 │
│ • 使用Recording Rules │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 面板优化 │
├─────────────────────────────────────────────┤
│ • 减少面板数量 │
│ • 使用行折叠 │
│ • 合理设置刷新间隔 │
└─────────────────────────────────────────────┘
六、总结 #
设计原则:
| 原则 | 说明 |
|---|---|
| 清晰性 | 信息一目了然 |
| 相关性 | 相关指标放在一起 |
| 一致性 | 统一的风格 |
| 可操作性 | 提供上下文 |
图表选择:
| 数据类型 | 推荐图表 |
|---|---|
| 时间序列 | Time series |
| 当前值 | Stat/Gauge |
| 比例 | Pie chart |
| 表格 | Table |
下一步,让我们学习高级特性!
最后更新:2026-03-27