动作状态异常告警处理指南
动作状态异常告警表示在过去一段时间内,EMQX 数据集成中的某个或多个动作未处于正常运行状态。
该告警不一定会导致消息丢弃。当动作关联的连接器恢复正常后,缓存在动作中的消息通常可以继续发送。如果存在消息丢弃,会伴随出现动作失败的告警。
关联连接器状态异常
问题描述
在数据集成页面中,如果某个动作状态显示为异常或不可用,且持续一段时间未恢复,则可能符合此类情况。
常见原因
动作所使用的连接器因以下原因出现异常,导致动作无法正常运行:
- 网络故障或网络不稳定
- 认证信息失效
- 资源或配额耗尽
- 目标服务(如数据库、消息队列等)不可用
- 集群中各节点连接状态不一致
处理方法
请优先检查并修复该动作所关联的连接器状态。可参考连接器状态异常告警处理指南对连接器进行排查和修复。
当连接器状态恢复正常后,动作会自动尝试重新建立连接,并开始发送缓冲区中积压的消息。
排查步骤
登录 EMQX Cloud 控制台,进入目标部署。
打开数据集成 -> 动作页面,查找状态异常的动作,并确认其所关联的连接器。
检查对应连接器的状态:
- 若连接器状态为
已断开、错误或显示为集群中各节点状态不一致,则需要优先处理连接器问题。
- 若连接器状态为
参照连接器状态异常告警处理指南定位并修复连接器异常。
在连接器状态恢复为
已连接后,观察动作状态是否同步恢复正常,并确认缓冲区中的消息是否开始正常发送。
注意事项
- 动作状态异常不代表规则匹配失败。只要动作缓冲区未满,消息会在状态异常期间进入缓存等待后续发送。
- 当动作状态恢复正常后,缓存在动作中的消息通常可以被重新发送。
- 如果连接器长时间无法恢复,导致动作缓冲区被占满,以及超过请求超期时间,可能会出现旧消息被丢弃的情况。