Skip to content

EMQX 5.8 の既知の問題

e5.8.6

バージョン問題回避策ステータス
5.8.5クラスターから離脱したノードへの接続試行失敗により、ログに断続的にRPCエラーが表示される
この種のログメッセージの急増は、通常のローリングアップグレード後に始まることが多いです。ログ例:
pid: <0.123456.0>, msg: event=connect_to_remote_server, peer=emqx@10.11.12.13, port=5370, reason=ehostunreach
これらのメッセージが表示されても、既存接続のメッセージ配信には影響ありません。
EMQXホストのいずれかで以下のコマンドを実行してください。エラーログにあるノード名 emqx@10.11.12.13 を実際のノード名に置き換えてください。
実行前に、そのノードがクラスターから外れていることを必ず確認してください。
$ emqx eval "emqx_router:cleanup_routes('emqx@10.11.12.13')"
5.9.0で解決予定
5.4.0デフォルト設定で起動したTLSリスナーはtlsv1.3のみへのホットアップデートができない。
incompatible,[client_renegotiation,{versions,['tlsv1.3']}] のようなエラーが発生する場合があります。
リスナーを一旦無効化し、設定変更後に再度有効化してください。5.9.0で解決予定
5.0.0Linuxの単調クロックが逆戻りするとノードがクラッシュする
一部の仮想Linux環境ではOSが単調クロックを維持できず、Erlang VMが OS monotonic time stepped backwards! のメッセージとともに終了することがあります。
そのような環境では、etc/vm.args+c フラグを false に設定してください。
5.0.0IoTDBがbatch_size > 1のバッチモードで正常に動作しない場合がある
EMQXはIoTDB v1 APIを使用しており、バッチ操作のネイティブサポートがありません。バッチ機能は反復処理で代用しているため、原子性がなくバグを引き起こす可能性があります。
-
5.8.1IoTDBのThriftドライバーはasyncモードをサポートしていない-
5.3.0SAMLベースのSSOの制限
EMQXダッシュボードはSAML 2.0準拠のシングルサインオンをサポートし、OktaやOneLoginと連携可能です。ただし、SAMLベースのSSOは証明書署名検証機構をサポートしておらず、Azure Entra IDの複雑さにより非対応です。
-

e5.8.4

バージョン問題回避策ステータス
5.0.0停止中に新しいノードがクラスターに参加するとノードが起動できなくなる
2ノード以上のクラスターで、一部ノードが停止中に新ノードが参加すると、停止していたノードは再起動に失敗し、以下のようなログを出力します。
2024-10-03T17:13:45.063985+00:00 [error] Mnesia('emqx@172.17.0.5'): ** ERROR ** (core dumped to file: "/opt/emqx/MnesiaCore.emqx@172.17.0.5_1727_975625_63176"), ** FATAL ** Failed to merge schema: {aborted,function_clause}
data/mnesiaディレクトリを削除してノードを再起動してください。5.8.5で解決済み
5.8.0サイト数が失われるとシャードレプリカセットの変更が停止する
Durable Sessionsが有効でDS Raftバックエンドを使用している場合にのみ発生する可能性があります。
Durable Storageデータのレプリケーションサイトとして機能するノードがデータの引き継ぎなしにクラスターから永久に離脱すると、レプリカセットの遷移が完了しなくなることがあります。
簡単な例として、emqx ctl ds infoの出力は以下のようになります。emqx@emqxc1-core0.localノードがクラスターを離脱し、すべてのシャードの唯一のレプリケーションサイトであった状態で、emqx@emqxc2-core0.localemqx ds join messages ABCDEF2222222222で引き継ぎを要求した場合です。
Site
ABCDEF1111111111 'emqx@emqxc1-core0.local' (!) UNIDENTIFIED
ABCDEF2222222222 'emqx@emqxc2-core0.local' up
<...>

Shard Replicas
messages/0 (!) ABCDEF1111111111
messages/1 (!) ABCDEF1111111111
<...>
messages/9 (!) ABCDEF1111111111

Shard Transitions
messages/0 +ABCDEF2222222222 -ABCDEF1111111111
messages/1 +ABCDEF2222222222 -ABCDEF1111111111
<...>
messages/9 +ABCDEF2222222222 -ABCDEF1111111111
この例では、+ABCDEF2222222222の遷移が完了しません。
-5.8.5で解決済み

e5.8.1

バージョン問題回避策ステータス
5.8.0Kafkaディスクバッファのディレクトリ名変更
Kafka(Azure EventHubs、Confluent Platform)プロデューサー統合で動的トピックテンプレートが導入され、ディスク上のバッファディレクトリ名に互換性のない変更が加わりました。
diskモードバッファを使用している場合、古いバージョンからアップグレード後にメッセージが失われるのを防ぐため、5.8.2リリースまで待つことを推奨します。
hybridモードバッファの場合は、アップグレード後に古いディレクトリを手動で削除する必要があります。
-5.8.2で解決済み
5.8.0Kafkaディスクバッファの再開問題
diskモードバッファを使用している場合、ノード再起動後にKafka(Azure EventHubs、Confluent Platform)プロデューサーがディスクからKafkaへの送信を自動的に再開しません。新しいメッセージがトピックプロデューサーの動的追加をトリガーしたときのみ送信が開始されます。
-5.8.2で解決済み
5.4.0監査イベント閲覧時のパフォーマンス低下
監査ログを有効にし、ダッシュボードで特定イベントを閲覧すると、まれに大幅なパフォーマンス低下やEMQXノードのクラッシュを引き起こすことがあります。特にメモリ制約のあるノードで顕著です。問題となるイベントにはバックアップ・リストアAPIリクエストや大規模データ構造を操作するリモートコンソールコマンドが含まれます。これによりノードの起動や応答が遅くなる場合もあります。
ダッシュボードのMax Dashboard Record Sizeを調整するか、log.audit.max_filter_size設定を下げてください。問題のあるイベントは新規イベントの記録により徐々に監査ログから消去されます。5.8.2で解決済み
5.8.1GET /monitor HTTP APIおよびダッシュボードでのゲージ値の歪み
GET /monitor HTTP API(ダッシュボードのデータも提供)で、時間範囲を1時間からより長い期間に変更すると、直近1時間以内に収集された新しいデータポイントが歪んで表示されることがあります。例えば、3つの接続が誤って9つ以上と表示される場合があります。この問題は直近1時間以内のデータポイントに限り視覚的なものであり、1時間より古いデータでは歪みが修正できません。
影響を受けるゲージ:
disconnected_durable_sessions
subscriptions_durable
subscriptions
topics
connections
live_connections
-5.8.2で解決済み

e5.8.0

バージョン問題回避策ステータス
5.0.0ノードクラッシュのレースコンディション
RPCチャネル確立中にノードがシャットダウンすると、ピアノードがクラッシュすることがあります。
-5.8.1で解決済み