OpenTelemetryを統合したログ管理
ファイルログと同様に、OpenTelemetryログは重要なイベント、ステータス情報、エラーメッセージを記録し、開発者や運用チームがアプリケーションの挙動を理解しトラブルシューティングを行うのに役立ちます。ただし、OpenTelemetryログは標準化されたログフォーマットを採用しているため、ログの解析、分析、処理が容易です。さらに、OpenTelemetryログはTrace ID、タグ、属性などの豊富なコンテキスト情報をレコードに追加することをサポートしています。
本ページでは、EMQXにOpenTelemetryログハンドラーを統合して高度なログ管理を実現するための包括的なガイドを提供します。OpenTelemetry Collectorのセットアップ、EMQXでのOpenTelemetryログハンドラーの設定およびログのエクスポート、ログ過負荷の管理方法について説明します。この統合により、EMQXのログイベントをOpenTelemetryログデータモデルに準拠した形式でフォーマットし、設定済みのOpenTelemetry Collectorやバックエンドシステムにエクスポートできるようになり、監視やデバッグ機能が向上します。
OpenTelemetry Collectorのセットアップ
EMQXでOpenTelemetryログを有効にする前に、OpenTelemetry CollectorおよびOpenTelemetry対応のログ収集システムをデプロイし設定する必要があります。本ガイドでは、OpenTelemetry Collectorのデプロイ方法と、debugエクスポーターを使ってログをstdoutにリダイレクトする設定方法を説明します。
otel-logs-collector-config.yamlという名前でOpenTelemetry Collectorの設定ファイルを作成します。yamlreceivers: otlp: protocols: grpc: exporters: logging: verbosity: detailed processors: batch: extensions: health_check: service: extensions: [health_check] pipelines: logs: receivers: [otlp] processors: [batch] exporters: [logging]同じディレクトリに、
docker-compose-otel-logs.yamlというDocker Composeファイルを作成します。yamlversion: '3.9' services: # Collector otel-collector: image: otel/opentelemetry-collector:0.90.0 restart: always command: ["--config=/etc/otel-collector-config.yaml", "${OTELCOL_ARGS}"] volumes: - ./otel-logs-collector-config.yaml:/etc/otel-collector-config.yaml ports: - "13133:13133" # Health check extension - "4317:4317" # OTLP gRPC receiverDocker Composeを使ってCollectorを起動します。
bashdocker compose -f docker-compose-otel-logs.yaml up起動後、OpenTelemetry Collectorはhttp://localhost:4317でアクセス可能になります。
EMQXでOpenTelemetryログハンドラーを有効化
EMQXがローカルで動作していることを前提に、
cluster.hoconファイルに以下の設定を追加します。bashopentelemetry { exporter { endpoint = "http://localhost:4317" headers { authorization = ""Basic dXNlcjpwYXNzd29yZA==" } } logs {enable = true, level = warning} }また、ダッシュボードの Management -> Monitoring にアクセスし、ページ内の Integration タブからOpenTelemetryログ統合の設定も可能です。
注意
opentelemetry.logs.levelの設定は、EMQXログハンドラーで設定されたデフォルトのログレベルによって上書きされます。例えば、OpenTelemetryのログレベルがinfoであっても、EMQXのコンソールログレベルがerrorの場合、error以上のレベルのイベントのみがエクスポートされます。EMQXノードを起動します。
ダッシュボードからアクセスできないHTTPサービスへのブリッジを作成するなどして、EMQXのログイベントを発生させます。

しばらくすると(デフォルトで約1秒後)、Otel CollectorにHTTPブリッジ接続失敗を示すようなEMQXログイベントが表示されます。

ログの過負荷管理
EMQXはログイベントを蓄積し、定期的にバッチでエクスポートします。 このエクスポート頻度はopentelemetry.logs.scheduled_delayパラメータで制御され、デフォルトは1秒です。 バッチログハンドラーには過負荷保護機構が組み込まれており、蓄積できるイベント数の上限が設定されています。デフォルトは2048です。この上限は以下の設定で変更可能です。
opentelemetry {
logs { max_queue_size = 2048 }
}max_queue_sizeの上限に達すると、現在のキューがエクスポートされるまで新しいログイベントは破棄されます。
注意
OpenTelemetryログの過負荷保護は、デフォルトのEMQXログハンドラーの過負荷保護とは独立して動作します。 そのため、設定によっては同じログイベントがOpenTelemetryハンドラーで破棄される一方、デフォルトのEMQXログハンドラーでは記録される場合や、その逆もあり得ます。