Skip to content

动作状态异常告警处理指南

动作状态异常告警表示在过去一段时间内,EMQX 数据集成中的某个或多个动作未处于正常运行状态。

该告警不一定会导致消息丢弃。当动作关联的连接器恢复正常后,缓存在动作中的消息通常可以继续发送。如果存在消息丢弃,会伴随出现动作失败的告警。

关联连接器状态异常

问题描述

在数据集成页面中,如果某个动作状态显示为异常或不可用,且持续一段时间未恢复,则可能符合此类情况。

常见原因

动作所使用的连接器因以下原因出现异常,导致动作无法正常运行:

  • 网络故障或网络不稳定
  • 认证信息失效
  • 资源或配额耗尽
  • 目标服务(如数据库、消息队列等)不可用
  • 集群中各节点连接状态不一致

处理方法

请优先检查并修复该动作所关联的连接器状态。可参考连接器状态异常告警处理指南对连接器进行排查和修复。

当连接器状态恢复正常后,动作会自动尝试重新建立连接,并开始发送缓冲区中积压的消息。

排查步骤

  1. 登录 EMQX Cloud 控制台,进入目标部署。

  2. 打开数据集成 -> 动作页面,查找状态异常的动作,并确认其所关联的连接器。

  3. 检查对应连接器的状态:

    • 若连接器状态为 已断开错误 或显示为集群中各节点状态不一致,则需要优先处理连接器问题。
  4. 参照连接器状态异常告警处理指南定位并修复连接器异常。

  5. 在连接器状态恢复为 已连接 后,观察动作状态是否同步恢复正常,并确认缓冲区中的消息是否开始正常发送。

注意事项

  • 动作状态异常不代表规则匹配失败。只要动作缓冲区未满,消息会在状态异常期间进入缓存等待后续发送。
  • 当动作状态恢复正常后,缓存在动作中的消息通常可以被重新发送。
  • 如果连接器长时间无法恢复,导致动作缓冲区被占满,以及超过请求超期时间,可能会出现旧消息被丢弃的情况。