监控告警

监控告警能够提供对LakeWare平台上的产品及资源的监控,通过告警通知管理及监控模板的设置,能够实时掌握资源及应用的状态,保障服务的良好运行

配置步骤

1.创建告警渠道

告警渠道定义了告警接收方式,目前支持:邮箱、Teams、企业微信、短信、钉钉、飞书、Slack。

创建邮箱、短信渠道时需要输入发送网关的相关配置,其他的渠道只需要输入接收的webhook、密钥信息。

  • 创建通知渠道

qudao

2.创建联系人/组

当告警需要发送给邮箱、短信用户时需要设置联系人,确保联系人的邮箱、手机可以正常接收信息,并把联系人加入联系人组中。

  • 创建联系人

group
  • 创建联系人组

group
  • 联系人加入组

group

3.创建触发条件模板

触发条件模板用于设置告警对象触发告警的条件,告警的对象可以为设备、端口、连接。

设备支持告警的指标:CPU、内存、存储、设备离线

端口支持告警的指标:上行带宽、下行带宽、端口离线

连接支持告警的指标:上行带宽、下行带宽、丢包、延时、抖动、连接离线

  • 创建触发条件模板

trigger-alarm

4.创建通知模板

通知模板用于定义告警的接收对象、告警发送时间、告警通知渠道、告警通知内容。

  • 创建通知模板

trigger-alarm

5.创建告警策略

告警策略用于选择目标告警对象,并可以从上面的已经创建好的触发条件模板、通知模板中灵活的实现条件组合。您也可以在创建告警策略的时候定义新的触发条件模板和通知模板

alarm-policy

创建告警策略:

new-alarm-policy

新建告警策略包括以下步骤:

  • 输入策略名称

  • 选择告警对象,对象类型包括:设备、连接、端口

  • 选择触发条件模板

  • 选择通知模板

6.创建屏蔽策略

上面1-5步描述了告警的创建过程,但屏蔽策略并不是必须要创建的一步,当您在某些场景下想要忽略资源的告警信息时可以创建屏蔽策略,策略生效后仅在告警历史中可以看到告警记录不会发送至通知渠道

alarm-mask

7.配置流程视频

告警历史

提供所有资源的告警历史,记录告警发生的生命周期

alarm-history

告警历史