# 部署告警

EMQX Cloud 提供了一个全面的告警系统，帮助用户和运维团队实时监控部署的健康状态与运行情况。该系统支持告警事件的生成、可自定义的告警规则，以及多种集成方式，确保告警能够及时通知相关人员并迅速响应。

你可以通过左侧导航栏进入**监控 > 告警**页面访问告警系统。

告警页面包括三个标签页：

- **告警列表**：查看已触发的告警事件。
- **告警规则**：配置触发告警的条件。
- **告警集成**：设置接收告警通知的渠道（如邮箱、PagerDuty、Webhook 等）。

## 告警列表

**告警列表**标签页展示了当前部署已触发的告警信息。如果尚未触发任何告警，表格将显示 “暂无数据”。

每条告警信息包含以下字段：

- **时间**：告警发生的时间，显示格式为 `2025-07-30 11:22`。
- **告警级别**：告警的严重等级（如 Warning、Error）。
- **告警信息**：告警的详细说明。

## 告警规则

::: tip

Serverless 部署暂不支持告警规则模块。

:::

在**告警规则**标签页中，你可以定义哪些类型的事件会触发告警。你可以为每条规则单独启用或禁用，也可以通过右上角的总开关一键启用或停用所有规则。被禁用的规则将不会向已配置的集成渠道发送告警通知。

每条告警规则包含：

- **是否启用**：用于启用或停用该规则的开关。
- **名称**：告警规则的名称，以及触发条件的说明。
- **阈值**：定义触发告警的条件。阈值可以基于使用率、消息数量或退订率等指标来设置。您可以为同一规则配置多个严重性级别（如 *Warning*、*Error*、*Critical*），每个级别对应一个具体的阈值。例如，当使用率达到或超过 100%，或当超过 50% 的客户端退订时，可以触发告警。

所有规则按类别组织展示。

### 管理告警阈值

您可以点击**阈值**列中的编辑图标来设置告警阈值。

每条告警规则支持一个或多个严重性级别，例如 `Warning`、`Error` 和 `Critical`。每个级别都对应一个具体的触发条件，用于决定在什么情况下触发告警。

您可以在**管理告警阈值**对话框中，通过下拉菜单和输入框来修改、删除或新增阈值。修改完成后，点击**确认**以应用更改。

![alert_threshold](./_assets/alert_threshold.png)


## 告警集成

EMQX Cloud 目前提供邮箱， PagerDuty 和 Webhook 事件告警集成。如您需要其他告警集成方式，可以向我们提工单或发送邮件。

### 发送至邮箱

您可以在告警集成，发送至邮箱中添加接受告警信息的邮箱，当部署产生告警时会第一时间向邮箱发送告警提醒。

![email_alert](./_assets/email_alert.png)

您可以使用测试功能查看告警邮箱是否配置正确，点击**测试**，选择一个邮箱发送测试邮件。

### PagerDuty 集成

将告警信息发送到 PagerDuty 的事件，并且 PagerDuty 指定通知方法。

1. 在 PagerDuty 创建告警服务。

   ![pagerduty_service](./_assets/pagerduty_service.png)

2. 添加 api v2 集成，并复制集成秘钥。
   ![pagerduty_service](./_assets/pagerduty_integrations_api.png)

3. 在告警集成页面，新建 PageDuty 事件，填写名称和集成秘钥。

   ![pagerduty_alerts](./_assets/pagerduty_alerts.png)

您可以使用测试功能查看告警事件是否配置正确，点击**测试**，选择一个事件发送测试消息。

### Webhook 集成

关于 Webhook 集成告警的详细内容，参阅[集成 Webhook 告警](./alerts_webhook.md)。

## 告警节流机制

为避免短时间内大量重复的告警通知被第三方邮件服务拦截或识别为垃圾邮件，EMQX Cloud 默认启用告警节流机制。

当同一类型的告警在 8 小时内连续触发超过 3 次时，系统将在该时间窗口内自动静默后续相同类型的告警，不再重复发送。

告警节流机制仅影响通知发送频率，不会影响告警本身的生成或处理。
