更新时间:2025-02-12 gmt 08:00

查看flexusrds for postgresql实例监控指标-九游平台

操作场景

本章指导用户如何查看flexusrds for postgresql实例的监控指标,并设置告警规则。用户可自定义监控目标与通知策略,及时了解实例运行状况,从而起到预警作用。

查看监控指标

  1. 在实例列表,选择目标实例,单击实例名称。
  2. 选择“监控”,查看实例的监控指标。
    图1 监控指标
    表1 支持的监控指标

    指标名称

    指标含义

    取值范围

    测量对象

    监控周期(原始指标)

    非活跃逻辑复制槽数量

    该指标用于统计当前数据库中存在的非活跃逻辑复制槽数量。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    cpu使用率

    该指标用于统计测量对象的cpu使用率,以比率为单位。

    0-100%

    flexusrds for postgresql实例

    1分钟

    每分钟临时文件生成数量

    该指标为获取临时文件在1分钟内生成的数量。

    ≥ 0 count/min

    flexusrds for postgresql实例

    1分钟

    内存使用率

    该指标用于统计测量对象的内存使用率,以比率为单位。

    0-100%

    flexusrds for postgresql实例

    1分钟

    每分钟临时文件生成大小

    该指标为获取临时文件在1分钟内生成的大小。

    ≥ 0 byte/min

    flexusrds for postgresql实例

    1分钟

    iops

    该指标用于统计当前实例,单位时间内系统处理的i/o请求数量(平均值)。

    ≥ 0 counts/s

    flexusrds for postgresql实例

    1分钟

    同步复制阻塞时间

    该指标为获取同步复制主备机间复制阻塞的时长。

    ≥ 0 s

    flexusrds for postgresql实例

    1分钟

    网络输入吞吐量

    该指标用于统计平均每秒从测量对象的所有网络适配器输入的流量,以字节/秒为单位。

    ≥ 0 bytes/s

    flexusrds for postgresql实例

    1分钟

    备机(只读)流复制状态

    该指标为获取备机(只读)流复制状态,0:备机(只读)异常,1:备机(只读)正常,2:该实例为主机。

    count

    flexusrds for postgresql实例

    1分钟

    网络输出吞吐量

    该指标用于统计平均每秒从测量对象的所有网络适配器输出的流量,以字节/秒为单位。

    ≥ 0 bytes/s

    flexusrds for postgresql实例

    1分钟

    inode数

    数据盘已使用的inode数。

    ≥ 0 counts

    flexusrds for postgresql实例

    5分钟

    磁盘利用率

    该指标用于统计测量对象的磁盘利用率,以比率为单位。

    0-100%

    flexusrds for postgresql实例

    1分钟

    事务日志使用量

    事务日志所占用的磁盘容量。

    ≥ 0 mb

    flexusrds for postgresql实例

    1分钟

    复制插槽使用量

    复制插槽文件所占磁盘容量。

    ≥ 0 mb

    flexusrds for postgresql实例

    1分钟

    数据库连接数

    当前连接到数据库的后端量。

    ≥ 0 counts

    flexusrds for postgresql实例

    1分钟

    事务最大已使用id数

    事务最大已使用id。

    ≥ 0 counts

    flexusrds for postgresql实例

    1分钟

    事务日志生成速率

    平均每秒生成的事务日志大小。

    ≥ 0 mb/s

    flexusrds for postgresql实例

    1分钟

    最滞后副本滞后量

    多个副本中最滞后副本(依据接收到的wal数据)滞后量。

    ≥ 0 mb

    flexusrds for postgresql实例

    1分钟

    复制时延

    副本滞后时延。

    ≥ 0 ms

    flexusrds for postgresql实例

    1分钟

    用户使用连接数

    该指标为统计用户实际使用的连接数(不包括监控运维使用的内置连接)。

    ≥ 0 counts

    flexusrds for postgresql实例

    1分钟

    用户活跃连接数

    该指标为统计用户实际使用的活跃连接数(不包括监控运维使用的内置活跃连接)。

    ≥ 0 counts

    flexusrds for postgresql实例

    1分钟

    tps

    该指标用于统计平均每秒事务执行次数,含提交和回退的次数。

    ≥ 0 次/秒

    flexusrds for postgresql实例

    1分钟

    连接数使用率

    该指标用于统计当前已用的pgsql连接数占总连接数的百分比。

    0-100%

    flexusrds for postgresql实例

    1分钟

    活跃连接数

    该指标为统计数据库当前活跃连接数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    事务空闲连接数

    该指标为统计数据库当前空闲连接数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    操作行数

    实例每秒增删改查操作的行数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    最长事务存活时长

    该指标为统计当前数据库中存在的最长事务存活时长。

    ≥ 0 ms

    flexusrds for postgresql实例

    1分钟

    最长未决事务存活时长

    该指标为统计当前数据库存在的最长未决事务存活时长。

    ≥ 0 ms

    flexusrds for postgresql实例

    1分钟

    磁盘io使用率

    该指标为统计磁盘io使用率。磁盘io使用率是指磁盘正在处理io请求的时间与总时间的百分比。

    说明:

    当磁盘io使用率达到100%,只能说明在统计时间段内,磁盘一直有数据写入,磁盘性能还需要结合iops、磁盘的吞吐量、读写时延等多个指标共同决定。

    0-100%

    flexusrds for postgresql实例

    1分钟

    等待锁的会话数

    该指标为统计当前处于阻塞状态的会话个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    swap in速率

    该指标为统计每秒从交换区写到内存的大小。

    ≥ 0 kb/s

    flexusrds for postgresql实例

    1分钟

    swap out速率

    该指标为统计每秒写入交换区的内存的大小。

    ≥ 0 kb/s

    flexusrds for postgresql实例

    1分钟

    交换区总容量大小

    该指标为统计交换区总量。

    ≥ 0 mb

    flexusrds for postgresql实例

    1分钟

    交换区容量使用率

    该指标为统计交换区使用率。

    0-100%

    flexusrds for postgresql实例

    1分钟

    最大数据库年龄

    该指标为统计当前数据库的最大数据库年龄(获取表pg_database中max(age(datfrozenxid))值)。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    用户态cpu时间占比

    该指标为统计用户态cpu时间占比。

    0-100%

    flexusrds for postgresql实例

    1分钟

    内核态cpu时间占比

    该指标为统计内核态cpu时间占比。

    0-100%

    flexusrds for postgresql实例

    1分钟

    硬盘io等待时间占比

    该指标为统计硬盘io等待时间占比。

    0-100%

    flexusrds for postgresql实例

    1分钟

    io读响应延迟

    该指标为统计磁盘读响应平均延迟(以毫秒为单位)。

    ≥ 0 ms

    flexusrds for postgresql实例

    1分钟

    io写响应延迟

    该指标为统计磁盘写响应平均延迟(以毫秒为单位)。

    ≥ 0 ms

    flexusrds for postgresql实例

    1分钟

    读iops

    该指标用于统计当前实例,单位时间内系统处理的读i/o请求数量(平均值)。

    ≥ 0 counts/s

    flexusrds for postgresql实例

    1分钟

    写iops

    该指标用于统计当前实例,单位时间内系统处理的写i/o请求数量(平均值)。

    ≥ 0 counts/s

    flexusrds for postgresql实例

    1分钟

    已执行1s的sql数

    该指标为统计数据库执行时长1秒以上的慢sql个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行3s的sql数

    该指标为统计数据库执行时长3秒以上的慢sql个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行5s的sql数

    该指标为统计数据库执行时长5秒以上的慢sql个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行log_min_duration_statement时长的sql数

    该指标为统计数据库执行时长比参数log_min_duration_statement大的慢sql个数,该参数大小可根据业务需要进行更改。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    wal日志占用空间大小

    该指标为获取当前wal日志所占空间大小。

    ≥ 0 gb

    flexusrds for postgresql实例

    5分钟

    审计日志大小

    该指标为获取当前审计日志的大小。

    ≥ 0 gb

    flexusrds for postgresql实例

    5分钟

    内存命中率

    内存命中率

    ≥ 0 %

    flexusrds for postgresql实例

    1分钟

    已开启1s的事务数

    该指标为统计数据库开启时长1秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已开启3s的事务数

    该指标为统计数据库开启时长3秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已开启5s的事务数

    该指标为统计数据库开启时长5秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已空闲1s的事务数

    该指标为统计数据库空闲时长1秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已空闲3s的事务数

    该指标为统计数据库空闲时长3秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已空闲5s的事务数

    该指标为统计数据库空闲时长5秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行1s的两阶段事务

    该指标为统计数据库两阶段执行时长1秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行3s的两阶段事务

    该指标为统计数据库两阶段执行时长3秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

    已执行5s的两阶段事务

    该指标为统计数据库两阶段执行时长5秒以上的长事务个数。

    ≥ 0

    flexusrds for postgresql实例

    1分钟

设置告警规则

  1. 在监控指标卡片上,单击“ ”,跳转到设置告警规则页面。
    图2 选择监控指标
  2. “创建告警规则”页面,填选相关信息。
    • 名称:系统会随机产生一个名称,用户也可以进行修改。
    • 描述:告警规则描述。
    • 告警策略:触发告警规则的告警策略。是否触发告警取决于连续周期的数据是否达到阈值。
    • 发送通知:配置是否发送邮件、短信、http和https通知用户。

      关于告警通知的配置,请参见《云监控用户指南》。

  3. 单击“立即创建”,告警规则创建完成。

相关文档

网站地图