ルールSQLリファレンス
EMQXでは、データの抽出、フィルタリング、拡張、および変換のために、ルールでSQLベースの構文を使用します。このSQLライクな構文には、SELECT と FOREACH の2種類のステートメントがあります。
| ステートメント | 説明 |
|---|---|
SELECT | SQLステートメントの結果が単一のメッセージとなる場合に使用します。 |
FOREACH | 1つの入力メッセージからゼロ個以上のメッセージを生成する場合に使用します。 |
各ルールはちょうど1つのステートメントを持つことができます。SQLステートメントは豊富な組み込み関数を提供し、簡単な変換やタイムスタンプの作成などが可能です。
また、SQLステートメントは式の中にjqプログラムを埋め込むことをサポートしており、必要に応じて複雑なデータ変換を行えます。式はSELECTおよびFOREACHステートメント内に埋め込むことができます。SELECTおよびFOREACHステートメントで参照可能なフィールドについては、データソースとフィールドを参照してください。
SELECT ステートメント
SELECTステートメントは、入力メッセージから特定のフィールドを選択し、フィールド名の変更、データの変換、条件に基づくメッセージのフィルタリングを行います。
ルールエンジンSQLにおけるSELECTステートメントの基本形式は以下の通りです。
SELECT <fields_expressions> FROM <topic> [WHERE <conditions>]SELECT句で出力に含めるフィールド(メッセージのペイロードおよびメタデータの両方から)を指定し、WHERE句で特定の条件に基づいてメッセージをフィルタリングできます。
FROM句
FROM句はクエリのデータソースを指定します。特定のトピックや条件に合致するイベントからデータを選択できます。
トピックによる選択
例えば、t/#およびmy/other/topicにパブリッシュされたすべてのメッセージに適用されるルールを定義したい場合、以下のように記述します。
SELECT clientid, payload.clientid as myclientid FROM "t/#", "my/other/topic"ここで、
SELECT句は出力に含めるフィールドを指定します。clientid:メタデータ内のクライアントIDpayload.clientid:メッセージペイロード内のクライアントID。ペイロード内のすべてのフィールドはpayloadの下に格納されています。as構文はpayload.clientidフィールドをmyclientidに名前変更しています。
イベントによる選択
ルールをイベントに紐づけることも可能です。例えば、クライアントc1がEMQXへの接続を開始した際にIPアドレスとポート番号を取得したい場合、以下のように記述します。
SELECT peername as ip_port FROM "$events/client_connected" WHERE clientid = 'c1'TIP
利用可能なすべてのイベントは、EMQXダッシュボードのルール編集画面のEventsタブで確認できます。
WHERE句
WHERE句は、FROM句で指定したトピックやイベントのフィルタに加えて、メッセージが満たすべき追加条件を指定し、メッセージのフィルタリングをより詳細に行うためのオプションです。
例えば、トピックt/#のメッセージのうち、ユーザー名がericであるメッセージのみをフィルタリングするSQLは以下の通りです。
SELECT * FROM "t/#" WHERE username = 'eric'TIP
WHERE句で使用するフィールドは、メッセージのメタデータまたはペイロードに存在するフィールドでなければなりません。そうでない場合はエラーになります。
式の利用
式はSELECT句やWHERE句でデータの変換に使用可能です。例えば、以下のSQLはclientidフィールドの値を大文字に変換し、接尾辞を追加して、結果をcidという名前で出力します。
SELECT (upper(clientid) + '_UPPERCASE_LETTERS') as cid FROM "t/#"以下は括弧付きの算術式を使ったデータ変換の例です。
SELECT (payload.integer_field + 2) * 2 as num FROM "t/#"ドット表記を使い、複雑な構造のペイロード内のフィールドにアクセスすることもできます(ペイロードがJSON形式であることが前提です)。
SELECT payload.a.b.c.deep as my_field FROM "t/#"以下はWHERE句で等価演算子(=)を使い、特定の値を持つフィールドをテストする例です。SELECT *はすべてのメタデータとペイロードを出力メッセージに転送します。
SELECT * FROM "t/#" WHERE payload.x.y = 1WHERE句ではandやor演算子を使い、複雑なブール式を形成できます。
SELECT * FROM "t/#" WHERE payload.name = "sensor_1" and payload.temperature > 39FOREACH ステートメント
FOREACHステートメントはSELECTステートメントのより一般的な形と考えられます。1つの入力メッセージからゼロ個以上の出力メッセージを生成できます。特定の条件に基づいてデータをフィルタリングし、結果をMQTTトピックやデータブリッジに出力する際に使用します。
ルールエンジンSQLにおけるFOREACHステートメントの基本形式は以下の通りです。
FOREACH <expression_that_evaluates_to_array> [as <name>]
[DO <fields_expressions>]
[INCASE <condition>]
FROM <topic>
[WHERE <condition>]FOREACHステートメントは、入力メッセージから配列を作成するFOREACH句から始まります。FROM句とWHERE句はSELECTステートメントの同名句と同じ目的・動作を持ちます。FOREACHステートメントにはさらに2つのオプション句があります。
| 句 | 必須/任意 | 説明 |
|---|---|---|
DO | 任意 | FOREACHで選択された配列の各要素を変換します。SELECTステートメントのSELECT句に対応し、同じ式を受け入れます。 |
INCASE | 任意 | 指定した条件に合致しない配列要素をフィルタリングします。WHERE句と同じ式を受け入れます。 |
TIP
FOREACH句を除き、FOREACHステートメントの他の句はすべてSELECTステートメントの対応する句と対応しています。つまり、FOREACHステートメントは前述の通りSELECTステートメントの一般化と見なせます。以下の2つのステートメントは等価です(jq('.', payload)はペイロードを配列でラップしています)。
FOREACH jq('.', payload) as it
DO it.field_1, it.field_2
FROM "t/#"SELECT payload.field_1, payload.field_2
FROM "t/#"上記のFOREACH句のas構文は配列要素に名前を付けるために使われ、DO句内で「現在の」要素を簡単に参照できます。as name部分を省略すると、デフォルトでitemという名前が使われます。
以下はFOREACHステートメントを使って2つの値を出力する例です。両方の値はvalueという1つのフィールドのみを持ち、valueの値は1つ目のメッセージのfield_1の値、2つ目のメッセージのfield_2の値です。
FOREACH jq('[.field_1, .field_2]', payload)
DO item as value
FROM "t/#"FOREACHステートメントは入力データが配列形式であることを要求します。入力メッセージがすでに配列を含む場合は、直接FOREACHステートメントを適用できます。
例えば、トピックt/#にパブリッシュされたメッセージで、センサーのidxが1以上の場合にタイムスタンプ、クライアントID、センサー名、インデックスを出力したい場合、以下のコードを使えます。
FOREACH
payload.sensors as sensor
DO
timestamp,
clientid,
upper(sensor.name) as name,
sensor.idx as idx
INCASE
sensor.idx >= 1
FROM "t/#"ここで、
FOREACH句は入力メッセージのペイロード内のsensorsフィールドを配列として指定し、配列要素にsensorという名前を付けています。DO句は出力に含めるフィールドを指定しています。timestampは入力メッセージのメタデータからのタイムスタンプです。clientidは入力メッセージのメタデータからのクライアントIDです。sensor.nameは組み込みのupper関数で大文字化され、as構文でnameに名前変更されます。ここでのsensorはFOREACH句で選択された配列の現在の要素を指します。sensor.idxはas句でidxに名前変更されます。
INCASE句は追加のフィルタ条件を指定し、idxフィールドの値が1以上のセンサーのみを取得します。FROM句はトピックパターンt/#にマッチするメッセージを対象とします。
ルール作成後は、本番環境に投入する前に必ずテストすることを推奨します。ダッシュボードUIにはサンプルメッセージでルールをテストできる機能があります。SQLステートメントのテスト方法についてはルールのテストを参照してください。上記のルールは以下のJSON形式のペイロードを入力としてテストできます。
{"sensors": [
{"idx":0, "name":"t0"},
{"idx":1, "name":"t1"},
{"idx":2, "name":"t2"}
]
}入力メッセージに配列が含まれていない場合は、jq関数を使ってペイロードを配列でラップできます。例えば以下のように記述します。
FOREACH jq('.', payload)
DO item.field_1, item.field_2
FROM "t/#"EMQXは高度な変換のためにjq関数の使用をサポートしています。詳しいコード例は組み込みjq関数を参照してください。
式と演算
EMQXのルール構文では、データの変換やメッセージのフィルタリングのために式を使用できます。これらの式はSELECT、FOREACH、DO、INCASE、WHEREなどの句で利用可能です。このセクションでは式の使用方法について説明します。以下は式を形成するために使える演算子の一覧です。また、多数の組み込み関数も式内で使用可能です。
算術演算
| 演算子 | 用途 | 戻り値 |
|---|---|---|
+ | 加算、または文字列の連結 | 合計、または連結された文字列 |
- | 減算 | 差分 |
* | 乗算 | 積 |
/ | 除算 | 商 |
div | 整数除算 | 整数の商 |
mod | 剰余 | 剰余 |
論理演算
| 演算子 | 用途 | 戻り値 |
|---|---|---|
> | より大きい | true/false |
< | より小さい | true/false |
<= | 以下 | true/false |
>= | 以上 | true/false |
<> | 等しくない | true/false |
!= | 等しくない | true/false |
= | 2つのオペランドが完全に等しいかを判定。値の比較に使用可能 | true/false |
=~ | トピックがトピックフィルターにマッチするかを判定。トピックマッチング専用 | true/false |
and | 論理積 | true/false |
or | 論理和 | true/false |
CASE式
CASE式は条件分岐を実行するために使用できます。CASE式は他言語のif-then-else文に相当します。以下の例で使い方を示します。
SELECT
CASE WHEN payload.x < 0 THEN 0
WHEN payload.x > 7 THEN 7
ELSE payload.x
END as x
FROM "t/#"メッセージが以下の場合、
{"x": 8}出力は以下のようになります。
{"x": 7}さらに例
SELECTステートメントの例
トピック
t/aのメッセージからすべてのフィールドを抽出:sqlSELECT * FROM "t/a"トピック
t/aまたはt/bのメッセージからすべてのフィールドを抽出:sqlSELECT * FROM "t/a","t/b"トピック
t/#にマッチするメッセージからすべてのフィールドを抽出:sqlSELECT * FROM "t/#"トピック
t/#にマッチするメッセージからqos、username、clientidフィールドを抽出(出力メッセージのペイロードにこれらのフィールドが含まれます):sqlSELECT qos, username, clientid FROM "t/#"ペイロードに
usernameフィールドがあり、その値がStevenである任意のメッセージからusernameフィールドを抽出(FROM句で#のようなトピックフィルターを使うことは推奨されません。これはすべてのメッセージに対してルールをチェックする必要があるためです):sqlSELECT username FROM "#" WHERE username='Steven'入力メッセージのペイロードから
xフィールドを抽出し、出力メッセージでyに名前変更。yはWHERE句でも使用可能。このSQLはペイロードが{"x": 1}のメッセージにマッチし、{"x": 2}にはマッチしません。sqlSELECT payload.x as x FROM "tests/test_topic_1" WHERE y = 1ペイロードが
{"x": {"y": 1}}(例:{"x": {"y": 1}, "other": "field"})のメッセージにマッチするSQL:sqlSELECT * FROM "#" WHERE payload.x.y = 1クライアントIDが
c1のMQTTクライアントが接続した場合、そのソースIPアドレスとポート番号を抽出:sqlSELECT peername as ip_port FROM "$events/client_connected" WHERE clientid = 'c1'トピック
my/topicにマッチし、QoSレベルが1のサブスクリプションすべてにマッチし、clientidを抽出:sqlSELECT clientid FROM "$events/session_subscribed" WHERE topic = 'my/topic' and qos = 1上記の例と似ていますが、トピックマッチ演算子
=~を使い、トピックフィルターt/#にマッチするものにマッチ:sqlSELECT clientid FROM "$events/session_subscribed" WHERE topic =~ 't/#' and qos = 1キーが
fooのユーザープロパティを抽出(ユーザープロパティはMQTT 5.0で新規追加されたため、古いMQTTバージョンには該当しません):sqlSELECT pub_props.'User-Property'.foo as foo FROM "t/#"
TIP
FROM句のトピックはダブルクォーテーション("")またはシングルクォーテーション('')で囲む必要があります。WHERE句の条件で文字列を使う場合はシングルクォーテーション('')で囲みます。FROM句に複数のトピックがある場合はカンマ(,)で区切ります。例:SELECT * FROM "t/1", "t/2"。- ペイロードの内部フィールドにアクセスするにはピリオド(
.)を使います。例:ネストされたJSON構造のpayload.outer_field.inner_field。 - ペイロードにエイリアスを付けるとパフォーマンスに影響するため、
SELECT payload as pのような使い方は避けてください。 - 一部のエスケープシーケンスは使用時にアンエスケープが必要です。詳細はunescape関数を参照してください。
FOREACHステートメントの例
クライアントIDがc_steveのメッセージがトピックt/1に届き、メッセージ本文はJSON形式でsensorsフィールドが複数のオブジェクトを含む配列であるとします。例:
{
"date": "2020-04-24",
"sensors": [
{"name": "a", "idx":0},
{"name": "b", "idx":1},
{"name": "c", "idx":2}
]
}例 1
sensors配列の各オブジェクトを、オブジェクトのidxを使ったトピックsensors/${idx}に再パブリッシュし、内容はオブジェクトのnameとします。上記の入力例に対し、ルールエンジンは以下の3つのメッセージを発行します。
- トピック: sensors/0
内容: a - トピック: sensors/1
内容: b - トピック: sensors/2
内容: c
このルールのアクション設定は以下の通りです。
- アクションタイプ: メッセージ再パブリッシュ
- 送信先トピック:
sensors/${idx} - 送信先QoS: 2
- メッセージ内容テンプレート:
${name}
SQLステートメントは以下のように記述します。
FOREACH
payload.sensors
FROM "t/#"上記SQLのFOREACH句は配列sensorsを指定しています。FOREACHステートメントは結果の配列の各オブジェクトに対して「メッセージ再パブリッシュ」アクションを実行するため、3回アクションが実行されます。
例 2
sensors配列のうち、idフィールドの値が1以上のオブジェクトのみを、トピックsensors/${idx}に再パブリッシュし、内容はclientid=${clientid},name=${name},date=${date}とします。上記の入力例に対し、idが0の要素は除外されるため、2つのメッセージが発行されます。
- トピック: sensors/1
内容: clientid=c_steve,name=b,date=2023-04-24 - トピック: sensors/2
内容: clientid=c_steve,name=c,date=2023-04-24
このルールのアクション設定は以下の通りです。
- アクションタイプ: メッセージ再パブリッシュ
- 送信先トピック:
sensors/${idx} - 送信先QoS: 2
- メッセージ内容テンプレート:
clientid=${clientid},name=${name},date=${date}
SQLステートメントは以下のように記述します。
FOREACH
payload.sensors
DO
clientid,
item.name as name,
item.idx as idx
INCASE
item.idx >= 1
FROM "t/#"上記SQLのFOREACH句は配列sensorsを指定し、DO句で各操作に必要なフィールドを選択しています。clientidはメッセージのメタデータから、nameとidxは現在のセンサーオブジェクトから選択されます。itemはsensors配列の現在のオブジェクトを表します。INCASE句は配列オブジェクトのフィルタ条件を指定し、条件に合わないオブジェクトは無視されます。
DO句とINCASE句では、itemで現在のオブジェクトにアクセスできますが、FOREACH句のas構文で変数名をカスタマイズすることも可能です。したがって、上記SQLは以下のようにも書けます。
FOREACH
payload.sensors as s
DO
clientid,
s.name as name,
s.idx as idx
INCASE
s.idx >= 1
FROM "t/#"例 3
例2を拡張し、クライアントIDのc_steveのc_プレフィックスを削除します。
ルールエンジンにはFOREACH、DO、INCASE句で呼び出せる多数の組み込み関数があります。c_steveをsteveに変換したい場合、例2のSQLを以下のように変更します。
FOREACH
payload.sensors as s
DO
nth(2, tokens(clientid,'_')) as clientid,
s.name as name,
s.idx as idx
INCASE
s.idx >= 1
FROM "t/#"複数の式をFOREACH句に記述可能ですが、最後の式が配列を指定している必要があります。
例えば、入力メッセージのペイロードが以下のような形式の場合:
{
"date": "2020-04-24",
"data": {
"sensors": [
{"name": "a", "idx":0},
{"name": "b", "idx":1},
{"name": "c", "idx":2}
]
}
}FOREACH句でペイロードのdataに別名を付けてから配列を選択できます。
FOREACH
payload.data as d
d.sensors as s
...これは以下と等価です。
FOREACH
payload.data.sensors as s
...この機能は複雑な構造のペイロードを扱う際に便利です。