メインコンテンツへスキップ
ClickHouse では、SELECT クエリとともに、クエリの処理に必要なデータをサーバーに送信できます。このデータは一時テーブルに格納され (“Temporary tables” セクションを参照) 、クエリ内で使用できます (たとえば IN 演算子で使用できます) 。 たとえば、重要なユーザー識別子を含むテキストファイルがある場合、そのリストでフィルタリングするクエリと一緒にサーバーへアップロードできます。 大量の外部データを使って複数のクエリを実行する必要がある場合は、この機能は使用しないでください。事前にデータを DB にアップロードしておくほうが適切です。 外部データは、コマンドラインクライアント (非対話型モード) または HTTP インターフェイスを使用してアップロードできます。 コマンドラインクライアントでは、次のフォーマットで parameters セクションを指定できます
--external --file=... [--name=...] [--format=...] [--types=...|--structure=...]
このようなセクションが、転送されるテーブル数に応じて複数含まれる場合があります。 –external – 句の開始を示します。 –file – テーブルのダンプファイルへのパス、または stdin を指す - です。 stdin から取得できるテーブルは 1 つだけです。 次のパラメータは省略可能です: –name– テーブル名。省略した場合は _data が使用されます。 –format – ファイル内のデータのフォーマットです。省略した場合は TabSeparated が使用されます。 次のパラメータのいずれか 1 つが必須です:–types – カンマ区切りのカラム型のリスト。例: UInt64,String。カラム名は _1, _2, … になります。 –structureUserID UInt64, URL String 形式のテーブル構造です。カラム名と型を定義します。 ‘file’ で指定されたファイルは、‘types’ または ‘structure’ で指定されたデータ型を使用して、‘format’ で指定されたフォーマットでパースされます。テーブルはサーバーにアップロードされ、そこで ‘name’ で指定した名前の一時テーブルとして利用できます。 例:
$ echo -ne "1\n2\n3\n" | clickhouse-client --query="SELECT count() FROM test.visits WHERE TraficSourceID IN _data" --external --file=- --types=Int8
849897
$ cat /etc/passwd | sed 's/:/\t/g' | clickhouse-client --query="SELECT shell, count() AS c FROM passwd GROUP BY shell ORDER BY c DESC" --external --file=- --name=passwd --structure='login String, unused String, uid UInt16, gid UInt16, comment String, home String, shell String'
/bin/sh 20
/bin/false      5
/bin/bash       4
/usr/sbin/nologin       1
/bin/sync       1
HTTP インターフェイスを使用する場合、外部データは multipart/form-data フォーマットで渡されます。各テーブルは、それぞれ個別のファイルとして送信されます。テーブル名はファイル名から取得されます。query_string には、name_formatname_typesname_structure というパラメータが渡されます。ここで、name はこれらのパラメータに対応するテーブル名です。これらのパラメータの意味は、コマンドラインクライアントを使用する場合と同じです。 例:
$ cat /etc/passwd | sed 's/:/\t/g' > passwd.tsv

$ curl -F 'passwd=@passwd.tsv;' 'http://localhost:8123/?query=SELECT+shell,+count()+AS+c+FROM+passwd+GROUP+BY+shell+ORDER+BY+c+DESC&passwd_structure=login+String,+unused+String,+uid+UInt16,+gid+UInt16,+comment+String,+home+String,+shell+String'
/bin/sh 20
/bin/false      5
/bin/bash       4
/usr/sbin/nologin       1
/bin/sync       1
分散クエリ処理では、一時テーブルがすべてのリモートサーバーに送信されます。
最終更新日 2026年6月10日