Настройки форматов - ClickHouse Documentation

Эти настройки автоматически сгенерированы на основе исходного кода.

allow_special_bool_values_inside_variant

Позволяет разбирать значения типа Bool внутри типа Variant из специальных строковых представлений булевых значений, таких как “on”, “off”, “enable”, “disable” и т. д.

bool_false_representation

Текстовое представление значения false для типа bool в форматах TSV/CSV/Vertical/Pretty.

bool_true_representation

Текстовое представление логического значения true в форматах TSV/CSV/Vertical/Pretty.

check_conversion_from_numbers_to_enum

Сгенерировать исключение при преобразовании Numbers в Enum, если такого значения нет в Enum. Возможные значения:

0 — Отключено.
1 — Включено.

Пример

CREATE TABLE tab (
  val Enum('first' = 1, 'second' = 2, 'third' = 3)
) ENGINE = Memory;

INSERT INTO tab SETTINGS check_conversion_from_numbers_to_enum = 1 VALUES (4); -- возвращает ошибку

column_names_for_schema_inference

Список имён столбцов, используемых при определении схемы для форматов без имён столбцов. Формат: ‘column1,column2,column3,…‘

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

Динамически удаляет конечные нули у значений datetime64, чтобы масштаб вывода принимал значения [0, 3, 6], что соответствует ‘секундам’, ‘миллисекундам’ и ‘микросекундам’

date_time_input_format

Позволяет выбрать парсер для текстового представления даты и времени. Эта настройка не применяется к функциям даты и времени. Возможные значения:

'best_effort' — Включает расширенный разбор. ClickHouse может разбирать базовый формат YYYY-MM-DD HH:MM:SS и все форматы даты и времени ISO 8601. Например, '2018-06-08T01:02:03.000Z'.
'best_effort_us' — Аналогично best_effort (см. различия в parseDateTimeBestEffortUS
'basic' — Использует базовый парсер. ClickHouse может разбирать только базовые форматы YYYY-MM-DD HH:MM:SS или YYYY-MM-DD. Например, 2019-08-20 10:18:56 или 2019-08-20.

См. также:

date_time_output_format

Позволяет выбирать различные форматы вывода текстового представления даты и времени. Возможные значения:

simple - Простой формат вывода. ClickHouse выводит дату и время в формате YYYY-MM-DD hh:mm:ss. Например, 2019-08-20 10:18:56. Вычисление выполняется в соответствии с часовым поясом типа данных (если он задан) или часовым поясом сервера.
iso - Формат вывода ISO. ClickHouse выводит дату и время в формате ISO 8601 YYYY-MM-DDThh:mm:ssZ. Например, 2019-08-20T10:18:56Z. Обратите внимание, что вывод выполняется в UTC (Z означает UTC).
unix_timestamp - Формат вывода Unix-временной метки. ClickHouse выводит дату и время в формате Unix timestamp. Например, 1566285536.

См. также:

date_time_overflow_behavior

Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в результирующем типе. Возможные значения:

ignore — Молча игнорировать переполнение. Результат не определён.
throw — Сгенерировать исключение в случае переполнения.
saturate — Ограничить результат предельными значениями. Если значение меньше минимального значения, которое может быть представлено целевым типом, в качестве результата выбирается минимальное представимое значение. Если значение больше максимального значения, которое может быть представлено целевым типом, в качестве результата выбирается максимальное представимое значение.

Значение по умолчанию: ignore.

errors_output_format

Метод записи ошибок в текстовый вывод.

format_avro_schema_registry_connection_timeout

Для формата AvroConfluent: тайм-аут подключения в секундах для HTTP-клиента Confluent Schema Registry. Используется как при получении схемы, так и при её регистрации. Должен быть больше 0 и меньше 600 (10 минут).

format_avro_schema_registry_receive_timeout

Для формата AvroConfluent: тайм-аут получения ответа в секундах для HTTP-клиента Confluent Schema Registry. Используется как при получении схемы, так и при её регистрации. Должен быть больше 0 и меньше 600 (10 минут).

format_avro_schema_registry_send_timeout

Для формата AvroConfluent: тайм-аут отправки в секундах для HTTP-клиента Confluent Schema Registry. Используется как для получения схемы, так и для её регистрации. Должен быть больше 0 и меньше 600 (10 минут).

format_avro_schema_registry_url

Для формата AvroConfluent: URL-адрес Confluent Schema Registry.

format_binary_max_array_size

Максимально допустимый размер Array в формате RowBinary. Предотвращает выделение большого объёма памяти в случае повреждения данных. 0 означает, что ограничение отсутствует

format_binary_max_object_size

Максимально допустимое количество путей в одном объекте для формата RowBinary типа JSON. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничения нет

format_binary_max_string_size

Максимально допустимый размер значения типа String в формате RowBinary. Предотвращает выделение большого объема памяти в случае повреждения данных. 0 означает, что ограничения нет

format_capn_proto_enum_comparising_mode

Как сопоставляются Enum в ClickHouse и CapnProto

format_capn_proto_max_message_size

Максимальный размер одного сообщения CapnProto в байтах. Защищает от чрезмерного выделения памяти из-за некорректных или повреждённых данных. Значение по умолчанию — 1 GiB.

format_capn_proto_use_autogenerated_schema

Использовать автоматически сгенерированную схему CapnProto, если параметр format_schema не задан

format_csv_allow_double_quotes

Если установлено значение true, разрешает строки в двойных кавычках.

format_csv_allow_single_quotes

Если установлено значение true, разрешает строки в одинарных кавычках.

format_csv_delimiter

Символ, используемый в качестве разделителя в данных CSV. Если параметр задаётся строкой, её длина должна быть равна 1.

format_csv_null_representation

Настраиваемое представление значения NULL в формате CSV

format_custom_escaping_rule

Правило экранирования поля (для формата CustomSeparated)

format_custom_field_delimiter

Разделитель полей (для формата CustomSeparated)

format_custom_result_after_delimiter

Суффикс после результирующего набора (для формата CustomSeparated)

format_custom_result_before_delimiter

Префикс перед результирующим набором (для формата CustomSeparated)

format_custom_row_after_delimiter

Разделитель после поля последнего столбца (для формата CustomSeparated)

format_custom_row_before_delimiter

Разделитель перед полем первого столбца (для формата CustomSeparated)

format_custom_row_between_delimiter

Разделитель между строками (для формата CustomSeparated)

format_display_secrets_in_show_and_select

Включает или отключает отображение secrets в запросах SHOW и SELECT для таблиц, баз данных, table functions и словарей. Пользователь, который хочет видеть secrets, также должен иметь включенную настройку сервера display_secrets_in_show_and_select и привилегию displaySecretsInShowAndSelect. Возможные значения:

0 — Отключено.
1 — Включено.

format_json_object_each_row_column_for_object_name

Имя столбца, которое будет использоваться для хранения/записи имён объектов в формате JSONObjectEachRow. Тип столбца должен быть String. Если значение пустое, в качестве имён объектов будут использоваться имена по умолчанию row_{i}.

format_protobuf_use_autogenerated_schema

Использовать автоматически сгенерированную схему Protobuf, если format_schema не задан

format_regexp

Регулярное выражение (для формата Regexp)

format_regexp_escaping_rule

Правило экранирования поля (для формата Regexp)

format_regexp_skip_unmatched

Пропускать строки, не соответствующие регулярному выражению (для формата Regexp)

format_schema

Этот параметр полезен при использовании форматов, для которых требуется описание схемы, например Cap’n Proto или Protobuf. Его значение зависит от формата.

format_schema_message_name

Задаёт имя требуемого сообщения в схеме, определённой в format_schema. Чтобы сохранить совместимость с устаревшим форматом format_schema (file_name:message_name):

Если format_schema_message_name не указан, имя сообщения определяется по части message_name в устаревшем значении format_schema.
Если format_schema_message_name указан при использовании устаревшего формата, будет сгенерирована ошибка.

format_schema_source

Определяет источник format_schema. Возможные значения:

‘file’ (по умолчанию): format_schema — это имя файла схемы, расположенного в каталоге format_schemas.
‘string’: format_schema — это буквальное содержимое схемы.
‘query’: format_schema — это запрос для получения схемы. Если format_schema_source установлено в значение ‘query’, действуют следующие условия:
Запрос должен возвращать ровно одно значение: одну строку с одним строковым столбцом.
Результат запроса считается содержимым схемы.
Этот результат кэшируется локально в каталоге format_schemas.
Локальный кэш можно очистить с помощью команды: SYSTEM DROP FORMAT SCHEMA CACHE FOR Files.
После кэширования одинаковые запросы больше не выполняются для повторного получения схемы, пока кэш не будет явно очищен.
Помимо файлов локального кэша, сообщения Protobuf также кэшируются в памяти. Даже после очистки файлов локального кэша кэш в памяти необходимо очистить с помощью SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf], чтобы полностью обновить схему.
Выполните запрос SYSTEM DROP FORMAT SCHEMA CACHE, чтобы сразу очистить кэш и для файлов кэша, и для схем сообщений Protobuf.

format_template_resultset

Путь к файлу, содержащему строку формата для результирующего набора (для формата Template)

format_template_resultset_format

Строка формата результирующего набора (для формата Template)

format_template_row

Путь к файлу, содержащему строку формата для строк (для формата Template)

format_template_row_format

Строка формата строк (для формата Template)

format_template_rows_between_delimiter

Разделитель строк (для формата Template)

format_tsv_null_representation

Настраиваемое представление значения NULL для формата TSV

input_format_allow_errors_num

Задаёт максимально допустимое число ошибок при чтении из текстовых форматов (CSV, TSV и т. д.). Значение по умолчанию — 0. Всегда используйте его вместе с input_format_allow_errors_ratio. Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей. Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.

input_format_allow_errors_ratio

Задаёт максимально допустимую долю ошибок при чтении данных в текстовых форматах (CSV, TSV и т. д.). Доля ошибок задаётся числом с плавающей точкой в диапазоне от 0 до 1. Значение по умолчанию — 0. Всегда используйте его вместе с input_format_allow_errors_num. Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей. Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.

input_format_allow_seeks

Разрешает операции seek (или чтение диапазонов) при чтении входных форматов ORC, Parquet и Arrow. Если параметр включен и источник это поддерживает (например, локальный файл, S3, HTTP с поддержкой диапазонов и известным размером), ClickHouse может читать только нужные диапазоны байтов и использовать меньше памяти. Если параметр отключен или источник не поддерживает seek (например, размер файла неизвестен или поток не поддерживает seek), некоторые средства чтения могут переключиться на загрузку всего файла в память. Включено по умолчанию.

input_format_arrow_allow_missing_columns

Разрешает отсутствие столбцов при чтении входных форматов Arrow

input_format_arrow_case_insensitive_column_matching

Игнорирует регистр при сопоставлении столбцов Arrow со столбцами ClickHouse.

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Arrow

input_format_avro_allow_missing_fields

Для формата Avro/AvroConfluent: если поле не найдено в схеме, использовать значение по умолчанию вместо выдачи ошибки

input_format_avro_null_as_default

Для формата Avro/AvroConfluent: использовать значение по умолчанию, если передан null, а столбец не имеет типа Nullable

input_format_binary_decode_types_in_binary_format

Читать типы данных в бинарном формате вместо названий типов во входном формате RowBinaryWithNamesAndTypes

input_format_binary_max_type_complexity

Максимальное количество узлов типа при декодировании бинарных типов (не глубина, а общее число). Map(String, UInt32) = 3 узла. Защищает от вредоносного ввода. 0 = без ограничений.

input_format_binary_read_json_as_string

Считывать значения типа данных JSON как значения String, содержащие JSON, во входном формате RowBinary.

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

Пропускать поля с неподдерживаемыми типами при определении схемы для формата BSON.

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата CapnProto

input_format_column_name_matching_mode

Определяет режим сопоставления имён столбцов при ингестии данных в различных форматах (включая, помимо прочего, JSONEachRow, CSVWithNames, JSONColumns, BSONEachRow, RowBinaryWithNames). Поддерживаемые режимы:

match_case: сопоставление с учётом регистра
- ignore_case: регистронезависимое сопоставление
- auto: сначала пытается сопоставить с учётом регистра, а если это не удаётся — регистронезависимо.

input_format_connection_handling

Если эта опция включена и соединение неожиданно закрывается, все оставшиеся в буфере данные будут разобраны и обработаны, а не считаться ошибкой

Включение этой опции отключает параллельный разбор и делает дедупликацию невозможной

input_format_csv_allow_cr_end_of_line

Если задано значение true, \r допускается в конце строки, если за ним не следует

input_format_csv_allow_variable_number_of_columns

Игнорировать лишние столбцы во входных CSV-данных (если в файле столбцов больше, чем ожидается) и считать отсутствующие поля во входных CSV-данных значениями по умолчанию

input_format_csv_allow_whitespace_or_tab_as_delimiter

Разрешает использовать пробелы и символы табуляции(\t) в качестве разделителей полей в строках CSV

input_format_csv_arrays_as_nested_csv

При чтении Array из CSV предполагается, что его элементы были сериализованы во вложенном CSV, а затем помещены в строку. Example: ”[""Hello"", ""world"", ""42"""" TV""]”. Скобки вокруг массива можно не указывать.

input_format_csv_deserialize_separate_columns_into_tuple

Если задано значение true, отдельные столбцы, записанные в формате CSV, могут быть десериализованы в столбец Tuple.

input_format_csv_detect_header

Автоматически определяет заголовок с именами и типами в формате CSV

input_format_csv_empty_as_default

Считать пустые поля во входных CSV-данных значениями по умолчанию.

input_format_csv_enum_as_number

Рассматривать вставляемые значения enum в форматах CSV как индексы enum

input_format_csv_skip_first_lines

Пропускать указанное число строк в начале данных в формате CSV

input_format_csv_skip_trailing_empty_lines

Пропускать пустые строки в конце в формате CSV

input_format_csv_trim_whitespaces

Удаляет пробелы и символы табуляции (\t) в начале и в конце CSV-строк

input_format_csv_try_infer_numbers_from_strings

Если включено, при определении схемы ClickHouse будет пытаться определять числа в строковых полях. Это может быть полезно, если данные CSV содержат числа UInt64 в кавычках. По умолчанию отключено.

input_format_csv_try_infer_strings_from_quoted_tuples

Интерпретирует кортежи во входных данных, заключённые в кавычки, как значение типа String.

input_format_csv_use_best_effort_in_schema_inference

Использовать дополнительные настройки и эвристики для определения схемы в формате CSV

input_format_csv_use_default_on_bad_values

Разрешает использовать значение по умолчанию для столбца, если десериализация поля CSV завершилась ошибкой из-за некорректного значения

input_format_custom_allow_variable_number_of_columns

Игнорирует лишние столбцы во входных данных CustomSeparated (если файл содержит больше столбцов, чем ожидается) и обрабатывает отсутствующие поля во входных данных CustomSeparated как значения по умолчанию

input_format_custom_detect_header

Автоматически определять заголовок с именами и типами в формате CustomSeparated

input_format_custom_skip_trailing_empty_lines

Пропускать пустые строки в конце в формате CustomSeparated

input_format_defaults_for_omitted_fields

При выполнении запросов INSERT пропущенные значения входных столбцов заменяются значениями по умолчанию соответствующих столбцов. Этот параметр применяется к форматам JSONEachRow (и другим JSON-форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native, а также к форматам с суффиксами WithNames/WithNamesAndTypes.

Когда этот параметр включен, с сервера клиенту отправляются расширенные метаданные таблицы. Это требует дополнительных вычислительных ресурсов на сервере и может снизить производительность.

Возможные значения:

0 — Отключено.
1 — Включено.

input_format_force_null_for_omitted_fields

Принудительно инициализирует пропущенные поля значениями NULL

input_format_hive_text_allow_variable_number_of_columns

Игнорировать лишние столбцы во входных данных Hive Text (если в файле столбцов больше, чем ожидается) и считать отсутствующие поля во входных данных Hive Text значениями по умолчанию

input_format_hive_text_collection_items_delimiter

Разделитель между элементами коллекций (Array или Map) в формате Hive Text File

input_format_hive_text_fields_delimiter

Разделитель полей в Hive Text File

input_format_hive_text_map_keys_delimiter

Разделитель между ключом и значением в паре map в Hive Text File

input_format_import_nested_json

Включает или отключает вставку JSON-данных с вложенными объектами. Поддерживаемые форматы:

JSONEachRow

Возможные значения:

0 — Отключено.
1 — Включено.

См. также:

Использование вложенных структур в формате JSONEachRow.

input_format_ipv4_default_on_conversion_error

При десериализации IPv4 при ошибке преобразования будут использоваться значения по умолчанию вместо генерации исключения. По умолчанию отключено.

input_format_ipv6_default_on_conversion_error

При десериализации IPv6 при ошибке преобразования будут использоваться значения по умолчанию вместо генерации исключения. По умолчанию отключено.

input_format_json_compact_allow_variable_number_of_columns

Разрешает переменное число столбцов в строках входных форматов JSONCompact/JSONCompactEachRow. Лишние столбцы в строках, где столбцов больше, чем ожидается, игнорируются, а отсутствующим столбцам присваиваются значения по умолчанию. По умолчанию отключено.

input_format_json_defaults_for_missing_elements_in_named_tuple

Подставляет значения по умолчанию для отсутствующих элементов в объекте JSON при обработке именованного кортежа. Этот параметр работает, только если включен параметр input_format_json_named_tuples_as_objects. Включен по умолчанию.

input_format_json_empty_as_default

Если параметр включен, пустые поля во входном JSON заменяются значениями по умолчанию. Для сложных выражений со значениями по умолчанию также должен быть включен параметр input_format_defaults_for_omitted_fields. Возможные значения:

0 — Отключено.
1 — Включено.

input_format_json_ignore_unknown_keys_in_named_tuple

Игнорирует неизвестные ключи в объекте JSON для именованных кортежей. Включено по умолчанию.

input_format_json_ignore_unnecessary_fields

Игнорировать лишние поля и не разбирать их. При включении этого параметра исключения для строк JSON с некорректным форматом или дублирующимися полями могут не генерироваться

input_format_json_infer_array_of_dynamic_from_array_of_different_types

Если параметр включен, при определении схемы ClickHouse будет использовать тип Array(Dynamic) для JSON-массивов со значениями разных типов данных. Пример:

SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=1;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');

┌─name─┬─type───────────┐
│ a    │ Array(Dynamic) │
└──────┴────────────────┘

SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=0;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');

┌─name─┬─type─────────────────────────────────────────────────────────────┐
│ a    │ Tuple(Nullable(Int64), Nullable(String), Array(Nullable(Int64))) │
└──────┴──────────────────────────────────────────────────────────────────┘

Включено по умолчанию.

input_format_json_infer_incomplete_types_as_strings

Позволяет использовать тип String для JSON-ключей, которые в выборке данных при автоматическом определении схемы содержат только Null/{}/[]. В JSON-форматах любое значение можно прочитать как String, и благодаря этому можно избежать ошибок вида

Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps

при автоматическом определении схемы, используя тип String для ключей с неизвестными типами. Пример:

SET input_format_json_infer_incomplete_types_as_strings = 1, input_format_json_try_infer_named_tuples_from_objects = 1;
DESCRIBE format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
SELECT * FROM format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');

Результат:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Array(Nullable(Int64)), b Nullable(String), c Nullable(String), d Nullable(String), e Array(Nullable(String))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

┌─obj────────────────────────────┐
│ ([1,2,3],'hello',NULL,'{}',[]) │
└────────────────────────────────┘

Включено по умолчанию.

input_format_json_map_as_array_of_tuples

Десериализует столбцы типа Map как JSON-массивы кортежей. По умолчанию отключено.

input_format_json_max_depth

Максимальная глубина поля в JSON. Это не жёсткое ограничение, и оно не обязано соблюдаться в точности.

input_format_json_named_tuples_as_objects

Разбирать столбцы с именованными кортежами как объекты JSON. Включено по умолчанию.

input_format_json_read_arrays_as_strings

Разрешает разбирать JSON-массивы как строки во входных JSON-форматах. Пример:

SET input_format_json_read_arrays_as_strings = 1;
SELECT arr, toTypeName(arr), JSONExtractArrayRaw(arr)[3] from format(JSONEachRow, 'arr String', '{"arr" : [1, "Hello", [1,2,3]]}');

Результат:

┌─arr───────────────────┬─toTypeName(arr)─┬─arrayElement(JSONExtractArrayRaw(arr), 3)─┐
│ [1, "Hello", [1,2,3]] │ String          │ [1,2,3]                                   │
└───────────────────────┴─────────────────┴───────────────────────────────────────────┘

Включено по умолчанию.

input_format_json_read_bools_as_numbers

Разрешает разбирать логические значения как числа во входных JSON-форматах. Включено по умолчанию.

input_format_json_read_bools_as_strings

Разрешает считывать булевы значения как строки во входных JSON-форматах. Включено по умолчанию.

input_format_json_read_numbers_as_strings

Разрешает разбирать числа как строки во входных JSON-форматах. Включено по умолчанию.

input_format_json_read_objects_as_strings

Разрешает парсинг объектов JSON как строк в JSON-форматах ввода. Пример:

SET input_format_json_read_objects_as_strings = 1;
CREATE TABLE test (id UInt64, obj String, date Date) ENGINE=Memory();
INSERT INTO test FORMAT JSONEachRow {"id" : 1, "obj" : {"a" : 1, "b" : "Hello"}, "date" : "2020-01-01"};
SELECT * FROM test;

Результат:

┌─id─┬─obj──────────────────────┬───────date─┐
│  1 │ {"a" : 1, "b" : "Hello"} │ 2020-01-01 │
└────┴──────────────────────────┴────────────┘

Включено по умолчанию.

input_format_json_throw_on_bad_escape_sequence

Генерирует исключение, если строка JSON содержит некорректную escape-последовательность во входных JSON-форматах. Если параметр отключен, некорректные escape-последовательности останутся в данных как есть. Включено по умолчанию.

input_format_json_try_infer_named_tuples_from_objects

Если включено, то при определении схемы ClickHouse будет пытаться определять именованный Tuple из объектов JSON. Получившийся именованный Tuple будет содержать все элементы из всех соответствующих объектов JSON в выборке данных. Пример:

SET input_format_json_try_infer_named_tuples_from_objects = 1;
DESC format(JSONEachRow, '{"obj" : {"a" : 42, "b" : "Hello"}}, {"obj" : {"a" : 43, "c" : [1, 2, 3]}}, {"obj" : {"d" : {"e" : 42}}}')

Результат:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Nullable(Int64), b Nullable(String), c Array(Nullable(Int64)), d Tuple(e Nullable(Int64))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

Включено по умолчанию.

input_format_json_try_infer_numbers_from_strings

Если включено, при определении схемы ClickHouse будет пытаться определять числа из строковых полей. Это может быть полезно, если данные JSON содержат числа UInt64 в кавычках. По умолчанию отключено.

input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects

Использовать тип String вместо исключения при неоднозначных путях в объектах JSON во время определения именованных кортежей

input_format_json_validate_types_from_metadata

Для входных форматов JSON/JSONCompact/JSONColumnsWithMetadata, если этот параметр установлен в 1, типы из метаданных во входных данных будут сравниваться с типами соответствующих столбцов таблицы. Включён по умолчанию.

input_format_max_block_size_bytes

Ограничивает размер блоков в байтах, формируемых при разборе данных во входных форматах. Используется во входных форматах на основе строк, когда блок формируется на стороне ClickHouse. 0 означает отсутствие ограничения в байтах.

input_format_max_block_wait_ms

Ограничивает максимальное время ожидания в миллисекундах перед выдачей блока при разборе данных в построчных входных форматах. 0 означает отсутствие ограничения.

Этот параметр работает только при включенном input_format_connection_handling. Установка значения также отключает параллельный разбор и делает дедупликацию невозможной.

Для стриминговых вставок также необходимо задать min_insert_block_size_rows=0 и min_insert_block_size_bytes=0. В противном случае разобранные блоки все равно могут накапливаться в памяти на этапе укрупнения блоков до достижения этих порогов, что мешает своевременной вставке.

Пример: стриминг недавних изменений из Википедии в ClickHouse

clickhouse-client --query 'CREATE TABLE wikipedia_edits (data JSON)'

curl -sS --globoff -H 'Accept: application/json' --no-buffer \
  'https://stream.wikimedia.org/v2/stream/recentchange' \
  | clickhouse-client \
      --query 'INSERT INTO wikipedia_edits FORMAT JSONAsObject' \
      --input_format_max_block_wait_ms 1000 \
      --input_format_connection_handling 1 \
      --min_insert_block_size_rows 0 \
      --min_insert_block_size_bytes 0

input_format_max_bytes_to_read_for_schema_inference

Максимальный объём данных в байтах, считываемых для автоматического определения схемы.

input_format_max_rows_to_read_for_schema_inference

Максимальное количество строк данных, считываемых при автоматическом определении схемы.

input_format_msgpack_number_of_columns

Количество столбцов во вставляемых данных MsgPack. Используется для автоматического определения схемы по данным.

input_format_mysql_dump_map_column_names

Сопоставлять по именам столбцы таблицы из дампа MySQL и столбцы таблицы ClickHouse

input_format_mysql_dump_table_name

Имя таблицы в дампе MySQL, из которой считываются данные

input_format_native_allow_types_conversion

Разрешить преобразование типов в формате ввода Native

input_format_native_decode_types_in_binary_format

Читать типы данных в бинарном формате вместо имен типов во входном формате Native

input_format_null_as_default

Включает или отключает инициализацию полей со значением NULL значениями по умолчанию, если тип данных этих полей не Nullable. Если тип столбца не Nullable и этот параметр отключен, вставка NULL вызывает исключение. Если тип столбца — Nullable, значения NULL вставляются как есть независимо от этого параметра. Этот параметр применяется к большинству входных форматов. Для сложных выражений со значениями по умолчанию также должен быть включен input_format_defaults_for_omitted_fields. Возможные значения:

0 — Вставка NULL в столбец, не допускающий NULL, вызывает исключение.
1 — Поля со значением NULL инициализируются значениями столбца по умолчанию.

input_format_orc_allow_missing_columns

Разрешать отсутствие столбцов при чтении входных данных в формате ORC

input_format_orc_case_insensitive_column_matching

Игнорировать регистр при сопоставлении столбцов ORC со столбцами ClickHouse.

input_format_orc_dictionary_as_low_cardinality

Обрабатывать столбцы ORC, закодированные словарём, как столбцы LowCardinality при чтении файлов ORC.

input_format_orc_filter_push_down

При чтении файлов ORC пропускает целые stripe или группы строк на основании выражений WHERE/PREWHERE, статистики min/max или bloom filter в метаданных ORC.

input_format_orc_reader_time_zone_name

Название часового пояса для считывателя строк ORC; по умолчанию для считывателя строк ORC используется GMT.

input_format_orc_row_batch_size

Размер батча при чтении сегментов ORC.

input_format_orc_skip_columns_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата ORC

input_format_orc_use_fast_decoder

Использует более быструю реализацию декодера ORC.

input_format_parallel_parsing

Включает или отключает параллельный разбор форматов данных с сохранением порядка строк. Поддерживается только для форматов TabSeparated (TSV), TSKV, CSV и JSONEachRow. Возможные значения:

1 — Включено.
0 — Отключено.

input_format_parquet_allow_geoparquet_parser

Используйте парсер гео-столбцов для преобразования Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon

input_format_parquet_allow_missing_columns

Разрешает отсутствующие столбцы при чтении данных в формате Parquet

input_format_parquet_bloom_filter_push_down

При чтении файлов Parquet пропускать целые группы строк по выражениям WHERE и bloom filter в метаданных Parquet.

input_format_parquet_case_insensitive_column_matching

Игнорировать регистр при сопоставлении столбцов Parquet со столбцами ClickHouse.

input_format_parquet_enable_json_parsing

При чтении файлов Parquet разбирать JSON-столбцы как JSON-столбцы ClickHouse.

input_format_parquet_enable_row_group_prefetch

Включает предзагрузку групп строк при парсинге Parquet. В настоящее время предзагрузка поддерживается только при однопоточном парсинге.

input_format_parquet_filter_push_down

При чтении файлов Parquet пропускает целые группы строк на основе выражений WHERE/PREWHERE и статистики min/max из метаданных Parquet.

input_format_parquet_local_file_min_bytes_for_seek

Минимальное число байтов при локальном чтении из файла, необходимое для выполнения seek вместо чтения с пропуском во входном формате Parquet

input_format_parquet_local_time_as_utc

Определяет тип данных, используемый при определении схемы для временных меток Parquet с isAdjustedToUTC=false. Если true: DateTime64(…, ‘UTC’), если false: DateTime64(…). Ни один из вариантов не является полностью корректным, поскольку в ClickHouse нет типа данных для локального времени на часах. Как ни парадоксально, вариант true, вероятно, менее ошибочен, потому что форматирование временной метки UTC как String даст корректное представление локального времени.

input_format_parquet_max_block_size

Максимальный размер блока для ридера Parquet.

input_format_parquet_memory_high_watermark

Примерный лимит памяти для ридера Parquet v3. Ограничивает количество групп строк или столбцов, которые можно читать параллельно. При чтении нескольких файлов в одном запросе лимит распространяется на общее использование памяти для всех этих файлов.

input_format_parquet_memory_low_watermark

Более агрессивно планирует операции предварительного чтения, если использование памяти ниже порога. Может быть полезно, например, если по сети нужно считывать много небольших bloom-фильтров.

input_format_parquet_page_filter_push_down

Пропускать страницы по минимальным/максимальным значениям из индекса столбца.

input_format_parquet_prefer_block_bytes

Средний размер в байтах блока, выдаваемого ридером Parquet

input_format_parquet_preserve_order

Не переупорядочивать строки при чтении из файлов Parquet. Не рекомендуется, так как порядок строк обычно не гарантируется, а другие части конвейера выполнения запроса могут его нарушить. Вместо этого используйте ORDER BY _row_number.

input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при автоматическом определении схемы для формата Parquet

input_format_parquet_use_offset_index

Небольшое изменение логики чтения страниц из файла Parquet, когда фильтрация страниц не используется.

input_format_parquet_verify_checksums

Проверять контрольные суммы страниц при чтении файлов Parquet.

input_format_protobuf_flatten_google_wrappers

Включает обёртки Google для обычных невложенных столбцов, например google.protobuf.StringValue ‘str’ для столбца String ‘str’. Для столбцов с типом Nullable пустые обёртки распознаются как значения по умолчанию, а отсутствующие — как NULL

input_format_protobuf_oneof_presence

Указывает, какое поле protobuf oneof было найдено, задавая значение enum в специальном столбце

input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference

Пропускать поля с неподдерживаемыми типами при автоматическом определении схемы для формата Protobuf

input_format_record_errors_file_path

Путь к файлу, используемому для записи ошибок при чтении текстовых форматов (CSV, TSV).

input_format_skip_unknown_fields

Включает или отключает пропуск дополнительных данных при вставке. При записи данных ClickHouse генерирует исключение, если входные данные содержат столбцы, которых нет в целевой таблице. Если пропуск включен, ClickHouse не вставляет дополнительные данные и не генерирует исключение. Поддерживаемые форматы:

JSONEachRow (и другие JSON-форматы)
BSONEachRow (и другие JSON-форматы)
TSKV
Все форматы с суффиксами WithNames/WithNamesAndTypes
MySQLDump
Native

Возможные значения:

0 — Отключено.
1 — Включено.

input_format_try_infer_dates

Если включено, ClickHouse будет пытаться автоматически определять тип Date по строковым полям при автоматическом определении схемы для текстовых форматов. Если все поля столбца во входных данных были успешно разобраны как даты, результирующий тип будет Date; если хотя бы одно поле не удалось разобрать как дату, результирующий тип будет String. Включено по умолчанию.

input_format_try_infer_datetimes

Если включено, ClickHouse будет пытаться определять тип DateTime64 для строковых полей при автоматическом определении схемы для текстовых форматов. Если все значения в столбце входных данных были успешно разобраны как дата и время, результирующим типом будет DateTime64; если хотя бы одно значение не удалось разобрать как дату и время, результирующим типом будет String. Включено по умолчанию.

input_format_try_infer_datetimes_only_datetime64

Когда включен параметр input_format_try_infer_datetimes, автоматически определяется только тип DateTime64, но не типы DateTime

input_format_try_infer_exponent_floats

Пытаться определять числа с плавающей точкой в экспоненциальной записи при автоматическом определении схемы в текстовых форматах (кроме JSON, где числа в экспоненциальной записи определяются всегда)

input_format_try_infer_integers

Если включено, ClickHouse будет пытаться определять целые числа вместо чисел с плавающей точкой при автоматическом определении схемы для текстовых форматов. Если все числа в столбце входных данных являются целыми, результирующим типом будет Int64, а если хотя бы одно число является числом с плавающей точкой, результирующим типом будет Float64. Включено по умолчанию.

input_format_try_infer_variants

Если включено, ClickHouse будет пытаться определять тип Variant при автоматическом определении схемы для текстовых форматов, когда для элементов столбца/массива возможно более одного типа. Возможные значения:

0 — Отключено.
1 — Включено.

input_format_tsv_allow_variable_number_of_columns

Игнорировать лишние столбцы во входных данных TSV (если в файле столбцов больше, чем ожидается) и трактовать отсутствующие поля во входных данных TSV как значения по умолчанию

input_format_tsv_crlf_end_of_line

Если задано значение true, функция file будет читать формат TSV с окончаниями строк \r\n вместо \n.

input_format_tsv_detect_header

Автоматически определять в формате TSV заголовок с именами и типами

input_format_tsv_empty_as_default

Обрабатывать пустые поля во входных данных TSV как значения по умолчанию.

input_format_tsv_enum_as_number

Рассматривать значения enum, вставляемые в форматах TSV, как индексы enum.

input_format_tsv_skip_first_lines

Пропускать указанное число строк в начале данных в формате TSV

input_format_tsv_skip_trailing_empty_lines

Пропускать пустые строки в конце в формате TSV

input_format_tsv_use_best_effort_in_schema_inference

Использовать дополнительные настройки и эвристики для автоматического определения схемы в формате TSV

input_format_values_accurate_types_of_literals

Для формата Values: при разборе и интерпретации выражений с использованием шаблона проверяйте фактический тип литерала, чтобы избежать возможных проблем с переполнением и потерей точности.

input_format_values_deduce_templates_of_expressions

Для формата Values: если поле не удалось разобрать стриминговым парсером, запускается SQL-парсер, определяется шаблон SQL-выражения, затем предпринимается попытка разобрать все строки по этому шаблону, после чего выражение интерпретируется для всех строк.

input_format_values_interpret_expressions

Для формата Values: если поле не удалось разобрать стриминговым парсером, запустить SQL-парсер и попытаться интерпретировать его как SQL-выражение.

input_format_with_names_use_header

Включает или отключает проверку порядка столбцов при вставке данных. Чтобы повысить производительность вставки, рекомендуем отключить эту проверку, если вы уверены, что порядок столбцов во входных данных совпадает с порядком столбцов в целевой таблице. Поддерживаемые форматы:

Возможные значения:

0 — Отключено.
1 — Включено.

input_format_with_types_use_header

Управляет тем, должен ли парсер формата проверять, соответствуют ли типы данных во входных данных типам данных целевой таблицы. Поддерживаемые форматы:

Возможные значения:

0 — Отключено.
1 — Включено.

insert_distributed_one_random_shard

Включает или отключает случайную вставку в один из сегментов таблицы Distributed, когда распределённый ключ отсутствует. По умолчанию при вставке данных в таблицу Distributed с более чем одним сегментом сервер ClickHouse отклоняет любой запрос на вставку, если распределённый ключ не задан. Когда insert_distributed_one_random_shard = 1, вставки разрешаются, и данные случайным образом направляются в один из всех сегментов. Возможные значения:

0 — Вставка отклоняется, если сегментов несколько и распределённый ключ не задан.
1 — Вставка выполняется случайным образом в один из всех доступных сегментов, если распределённый ключ не задан.

interval_output_format

Позволяет выбирать различные форматы вывода для текстового представления типов interval. Возможные значения:

kusto - формат вывода в стиле KQL. ClickHouse выводит интервалы в формате KQL. Например, toIntervalDay(2) будет отформатирован как 2.00:00:00. Обратите внимание, что для типов interval переменной длины (то есть IntervalMonth и IntervalYear) учитывается среднее количество секунд в интервале.
numeric - числовой формат вывода. ClickHouse выводит интервалы в виде их числового представления. Например, toIntervalDay(2) будет отформатирован как 2.

См. также:

Interval

into_outfile_create_parent_directories

Автоматически создаёт родительские каталоги при использовании INTO OUTFILE, если они ещё не существуют.

json_type_escape_dots_in_keys

Если параметр включен, точки в ключах JSON будут экранироваться при парсинге.

max_dynamic_subcolumns_in_json_type_parsing

Максимальное количество динамических подстолбцов, которое может быть создано в каждом столбце при парсинге JSON-столбца. Позволяет управлять количеством динамических подстолбцов при парсинге независимо от динамических параметров, указанных в типе данных.

output_format_arrow_compression_method

Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (без сжатия)

output_format_arrow_date_as_uint16

Записывает значения Date как обычные 16-битные числа (при обратном чтении — как UInt16) вместо преобразования в 32-битный тип Arrow DATE32 (при обратном чтении — как Date32).

output_format_arrow_fixed_string_as_fixed_byte_array

Использовать тип Arrow FIXED_SIZE_BINARY вместо Binary для столбцов FixedString.

output_format_arrow_low_cardinality_as_dictionary

Включить вывод типа LowCardinality как типа Dictionary в Arrow

output_format_arrow_string_as_string

Использовать тип Arrow String вместо Binary для столбцов String

output_format_arrow_unsupported_types_as_binary

Выводит типы, для которых нет преобразования, в виде необработанных бинарных данных. Если false, для таких типов будет возникать исключение UNKNOWN_TYPE.

output_format_arrow_use_64_bit_indexes_for_dictionary

Всегда использовать 64-битные целочисленные индексы для словаря в формате Arrow

output_format_arrow_use_signed_indexes_for_dictionary

Использовать знаковые целые числа для индексов словарей в формате Arrow

output_format_avro_codec

Кодек сжатия, используемый при выводе. Возможные значения: ‘null’, ‘deflate’, ‘snappy’, ‘zstd’.

output_format_avro_confluent_subject

Для формата вывода AvroConfluent: имя subject, под которым схема регистрируется в Confluent Schema Registry. Обязательно при записи в формате вывода AvroConfluent.

output_format_avro_rows_in_file

Максимальное количество строк в файле (если это допускается хранилищем)

output_format_avro_string_column_pattern

Для формата Avro: шаблон регулярного выражения для выбора столбцов String, которые следует интерпретировать как строки AVRO.

output_format_avro_sync_interval

Интервал синхронизации, в байтах.

output_format_binary_encode_types_in_binary_format

Записывать типы данных в бинарном формате вместо имён типов в выходном формате RowBinaryWithNamesAndTypes

output_format_binary_write_json_as_string

Записывает значения типа данных JSON в виде значений JSON String в выходном формате RowBinary.

output_format_bson_string_as_string

Использовать тип BSON String вместо Binary для столбцов типа String.

output_format_compression_level

Уровень сжатия по умолчанию, если вывод запроса сжат. Настройка применяется, когда запрос SELECT использует INTO OUTFILE или при записи в табличные функции file, url, hdfs, s3 или azureBlobStorage. Возможные значения: от 1 до 22

output_format_compression_zstd_window_log

Может использоваться, если для сжатия вывода выбран метод zstd. Если значение больше 0, эта настройка явно задаёт размер окна сжатия (степень 2) и включает режим дальнего действия для сжатия zstd. Это может помочь добиться лучшего коэффициента сжатия. Возможные значения: неотрицательные числа. Обратите внимание, что если значение слишком маленькое или слишком большое, zstdlib сгенерирует исключение. Типичные значения — от 20 (размер окна = 1MB) до 30 (размер окна = 1GB).

output_format_csv_crlf_end_of_line

Если задано значение true, в формате CSV в качестве окончания строки будет использоваться \r\n вместо \n.

output_format_csv_serialize_tuple_into_separate_columns

Если установлено значение true, то Tuple в формате CSV сериализуются в отдельные столбцы (то есть их вложенность теряется)

output_format_decimal_trailing_zeros

Выводить конечные нули при отображении значений Decimal. Например, 1.230000 вместо 1.23. По умолчанию отключено.

output_format_json_array_of_rows

Включает вывод всех строк в виде JSON-массива в формате JSONEachRow. Возможные значения:

1 — ClickHouse выводит все строки как массив, где каждая строка имеет формат JSONEachRow.
0 — ClickHouse выводит каждую строку отдельно в формате JSONEachRow.

Пример запроса с включённой настройкой Запрос:

SET output_format_json_array_of_rows = 1;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Результат:

[
{"number":"0"},
{"number":"1"},
{"number":"2"}
]

Пример запроса с отключённым параметром Запрос:

SET output_format_json_array_of_rows = 0;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Результат:

{"number":"0"}
{"number":"1"}
{"number":"2"}

output_format_json_escape_forward_slashes

Управляет экранированием прямых слешей при выводе строк в формате JSON. Это сделано для совместимости с JavaScript. Не путайте с обратными слешами, которые экранируются всегда. Включено по умолчанию.

output_format_json_map_as_array_of_tuples

Сериализует столбцы типа Map как JSON-массивы из кортежей. По умолчанию отключена.

output_format_json_named_tuples_as_objects

Сериализует столбцы именованных Tuple как объекты JSON. Включено по умолчанию.

output_format_json_pretty_print

Эта настройка определяет, как вложенные структуры, такие как Tuple, Map и Array, отображаются в массиве data при использовании формата вывода JSON. Например, вместо такого вывода:

"data":
[
  {
    "tuple": {"a":1,"b":2,"c":3},
    "array": [1,2,3],
    "map": {"a":1,"b":2,"c":3}
  }
],

Вывод будет иметь следующий формат:

"data":
[
    {
        "tuple": {
            "a": 1,
            "b": 2,
            "c": 3
        },
        "array": [
            1,
            2,
            3
        ],
        "map": {
            "a": 1,
            "b": 2,
            "c": 3
        }
    }
],

Включено по умолчанию.

output_format_json_quote_64bit_floats

Управляет заключением в кавычки 64-битных чисел с плавающей запятой при выводе в форматах JSON*. По умолчанию отключено.

output_format_json_quote_64bit_integers

Управляет тем, будут ли 64-битные и более крупные целые числа (например, UInt64 или Int128) заключаться в кавычки при выводе в формате JSON. По умолчанию такие целые числа заключаются в кавычки. Такое поведение совместимо с большинством реализаций JavaScript. Возможные значения:

0 — Целые числа выводятся без кавычек.
1 — Целые числа заключаются в кавычки.

output_format_json_quote_decimals

Управляет тем, будут ли десятичные числа заключаться в кавычки в выходных JSON-форматах. По умолчанию отключено.

output_format_json_quote_denormals

Включает вывод значений +nan, -nan, +inf, -inf в формате вывода JSON. Возможные значения:

0 — Отключено.
1 — Включено.

Пример Рассмотрим следующую таблицу account_orders:

┌─id─┬─name───┬─duration─┬─period─┬─area─┐
│  1 │ Andrew │       20 │      0 │  400 │
│  2 │ John   │       40 │      0 │    0 │
│  3 │ Bob    │       15 │      0 │ -100 │
└────┴────────┴──────────┴────────┴──────┘

Когда output_format_json_quote_denormals = 0, запрос возвращает значения null на выходе:

SELECT area/period FROM account_orders FORMAT JSON;

{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.003648093,
                "rows_read": 3,
                "bytes_read": 24
        }
}

Когда output_format_json_quote_denormals = 1, запрос возвращает:

{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": "inf"
                },
                {
                        "divide(area, period)": "-nan"
                },
                {
                        "divide(area, period)": "-inf"
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.000070241,
                "rows_read": 3,
                "bytes_read": 24
        }
}

output_format_json_skip_null_value_in_named_tuples

Пропускать пары «ключ-значение» со значением NULL при сериализации столбцов именованных Tuple как объектов JSON. Применяется только если output_format_json_named_tuples_as_objects имеет значение true.

output_format_json_validate_utf8

Управляет проверкой последовательностей UTF-8 в форматах вывода JSON; не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, так как в них UTF-8 проверяется всегда. По умолчанию отключено.

output_format_markdown_escape_special_characters

Если включено, экранирует специальные символы в Markdown. Common Mark определяет следующие специальные символы, которые можно экранировать с помощью :

! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Возможные значения:

0 — Отключено.
1 — Включено.

output_format_msgpack_uuid_representation

Определяет способ вывода UUID в формате MsgPack.

output_format_native_encode_types_in_binary_format

Записывает типы данных в бинарном формате вместо имён типов в формате вывода Native

output_format_native_use_flattened_dynamic_and_json_serialization

Записывает данные столбцов JSON и Dynamic в плоском формате (все типы и пути представлены как отдельные подстолбцы).

output_format_native_write_json_as_string

Записывает данные JSON-столбца как столбец String, содержащий JSON-строки, вместо стандартной нативной JSON-сериализации.

output_format_orc_compression_block_size

Размер блока сжатия в байтах для выходного формата ORC.

output_format_orc_compression_method

Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (без сжатия)

output_format_orc_dictionary_key_size_threshold

Для строкового столбца в формате вывода ORC: если число различных значений превышает эту долю от общего числа строк, не равных NULL, кодирование с использованием словаря отключается. В противном случае кодирование с использованием словаря включается

output_format_orc_row_index_stride

Целевой шаг индексации строк в формате вывода ORC

output_format_orc_string_as_string

Использовать тип ORC String вместо Binary для столбцов String

output_format_orc_writer_time_zone_name

Название часового пояса для ORC writer; по умолчанию ORC writer использует часовой пояс GMT.

output_format_parallel_formatting

Включает или отключает параллельное форматирование данных. Поддерживается только для форматов TSV, TSKV, CSV и JSONEachRow. Возможные значения:

1 — Включено.
0 — Отключено.

output_format_parquet_batch_size

Проверяйте размер страницы через каждые N строк. Рассмотрите возможность уменьшить это значение, если средний размер значений в столбцах превышает несколько КБ.

output_format_parquet_bloom_filter_bits_per_value

Примерное число битов для каждого отдельного значения в bloom-фильтрах Parquet. Оценочные уровни ложноположительных срабатываний:

6 бит — 10%
10.5 бит — 1%
16.9 бит — 0.1%
26.4 бит — 0.01%
41 бит — 0.001%

output_format_parquet_bloom_filter_flush_threshold_bytes

Определяет, где в файле Parquet размещаются bloom-фильтры. Bloom-фильтры будут записываться группами приблизительно такого размера. В частности:

если 0, bloom-фильтры каждой группы строк записываются сразу после группы строк,
- если значение больше общего размера всех bloom-фильтров, bloom-фильтры для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
- в противном случае bloom-фильтры будут накапливаться в памяти и записываться, когда их общий размер превысит это значение.

output_format_parquet_compression_method

Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (без сжатия)

output_format_parquet_data_page_size

Целевой размер страницы в байтах, до сжатия.

output_format_parquet_date_as_uint16

Записывает значения Date как обычные 16-битные числа (при обратном чтении — UInt16) вместо преобразования в 32-битный тип Parquet DATE (при обратном чтении — Date32).

output_format_parquet_datetime_as_uint32

Записывает значения DateTime как сырую Unix-временную метку (при чтении — UInt32) вместо преобразования в миллисекунды (при чтении — DateTime64(3)).

output_format_parquet_enum_as_byte_array

Записывать Enum с использованием физического типа Parquet: BYTE_ARRAY и логического типа: ENUM

output_format_parquet_fixed_string_as_fixed_byte_array

Использует тип Parquet FIXED_LEN_BYTE_ARRAY вместо Binary для столбцов FixedString.

output_format_parquet_geometadata

Позволяет записывать сведения о гео-столбцах в метаданные Parquet и кодировать столбцы в формате WKB.

output_format_parquet_max_dictionary_size

Если размер словаря превышает указанное количество байт, используется кодирование без словаря. Установите значение 0, чтобы отключить кодирование с использованием словаря.

output_format_parquet_parallel_encoding

Выполнять кодирование в формате Parquet в нескольких потоках.

output_format_parquet_row_group_size

Целевой размер группы строк в строках.

output_format_parquet_row_group_size_bytes

Целевой размер группы строк в байтах до сжатия.

output_format_parquet_string_as_string

Использовать тип Parquet String вместо Binary для столбцов String.

output_format_parquet_write_bloom_filter

Записывать bloom-фильтры в файлы Parquet.

output_format_parquet_write_checksums

Добавляет контрольные суммы CRC32 в заголовки страниц Parquet.

output_format_parquet_write_page_index

Записывает индекс столбца и индекс смещений (то есть статистику по каждой странице данных, которую можно использовать для pushdown фильтров при чтении) в файлы Parquet.

output_format_pretty_color

Использовать ANSI-последовательности экранирования в форматах Pretty. 0 — отключено, 1 — включено, ‘auto’ — включено при выводе в терминал.

output_format_pretty_display_footer_column_names

Отображает имена столбцов в нижнем колонтитуле, если в таблице много строк. Возможные значения:

0 — Имена столбцов не отображаются в нижнем колонтитуле.
1 — Имена столбцов отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, заданному параметром output_format_pretty_display_footer_column_names_min_rows (50 по умолчанию).

Пример Запрос:

SELECT *, toTypeName(*) FROM (SELECT * FROM system.numbers LIMIT 1000);

Результат:

      ┌─number─┬─toTypeName(number)─┐
   1. │      0 │ UInt64             │
   2. │      1 │ UInt64             │
   3. │      2 │ UInt64             │
   ...
 999. │    998 │ UInt64             │
1000. │    999 │ UInt64             │
      └─number─┴─toTypeName(number)─┘

output_format_pretty_display_footer_column_names_min_rows

Задает минимальное количество строк, при котором отображается нижний колонтитул с именами столбцов, если включена настройка output_format_pretty_display_footer_column_names.

output_format_pretty_fallback_to_vertical

Если параметр включен и таблица широкая, но короткая, формат Pretty будет выводить её так же, как формат Vertical. Подробную настройку этого поведения см. в output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width.

output_format_pretty_fallback_to_vertical_max_rows_per_chunk

Переключение на формат Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если количество строк во фрагменте не превышает указанное значение.

output_format_pretty_fallback_to_vertical_min_columns

Переход на формат Vertical (см. output_format_pretty_fallback_to_vertical) выполняется, только если количество столбцов больше указанного значения.

output_format_pretty_fallback_to_vertical_min_table_width

Переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) произойдёт только в том случае, если суммарная длина столбцов в таблице не меньше указанного значения или если хотя бы одно значение содержит символ новой строки.

output_format_pretty_glue_chunks

Если данные в форматах Pretty поступают несколькими фрагментами, даже с задержкой, и при этом следующий фрагмент имеет ту же ширину столбцов, что и предыдущий, используются ANSI-последовательности экранирования, чтобы вернуться к предыдущей строке и перезаписать нижний колонтитул предыдущего фрагмента, продолжив его данными из нового фрагмента. Это делает вывод визуально более приятным. 0 — отключено, 1 — включено, ‘auto’ — включено при выводе в терминал.

output_format_pretty_grid_charset

Кодировка символов для вывода границ таблицы. Доступные кодировки: ASCII, UTF-8 (по умолчанию).

output_format_pretty_highlight_digit_groups

Если параметр включен и вывод осуществляется в терминал, цифры в разрядах тысяч, миллионов и т. д. будут подчеркнуты.

output_format_pretty_highlight_trailing_spaces

Если настройка включена и выводится в терминал, конечные пробелы выделяются серым цветом и подчеркиванием.

output_format_pretty_max_column_name_width_cut_to

Если имя столбца слишком длинное, оно будет обрезано до этой длины. Имя столбца будет обрезано, если его длина превышает output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_name_width_min_chars_to_cut

Минимальное количество символов, на которое нужно сократить имя столбца, если оно слишком длинное. Имя столбца будет обрезано, если его длина превышает output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_pad_width

Максимальная ширина дополнения для всех значений в столбце в форматах Pretty.

output_format_pretty_max_rows

Ограничение на количество строк для форматов Pretty.

output_format_pretty_max_value_width

Максимальная ширина отображаемого значения в форматах Pretty. Если ширина больше, значение будет обрезано. Значение 0 означает, что обрезка не выполняется никогда.

output_format_pretty_max_value_width_apply_for_single_value

Обрезайте значения (см. настройку output_format_pretty_max_value_width) только в том случае, если это не одиночное значение в block. В противном случае выводите его целиком, что полезно для запроса SHOW CREATE TABLE.

output_format_pretty_multiline_fields

Если включено, форматы Pretty будут отображать многострочные поля внутри ячеек таблицы, сохраняя её границы. Если нет, они будут отображаться как есть, что может привести к искажению таблицы (при этом в отключенном состоянии многострочные значения будет проще копировать и вставлять).

output_format_pretty_named_tuples_as_json

Управляет тем, выводятся ли именованные кортежи в формате Pretty в виде красиво отформатированных объектов JSON.

output_format_pretty_row_numbers

Добавляет номера строк перед каждой строкой в выходном формате Pretty

output_format_pretty_single_large_number_tip_threshold

Выводить справа от таблицы подсказку с удобочитаемым числом, если блок содержит одно число, превышающее это значение (кроме 0)

output_format_pretty_squash_consecutive_ms

Ожидает следующий блок в течение указанного числа миллисекунд и перед записью объединяет его с предыдущим. Это позволяет избежать слишком частого вывода слишком маленьких блоков, сохраняя при этом возможность потокового отображения данных.

output_format_pretty_squash_max_wait_ms

Выводить ожидающий блок в форматах Pretty, если с момента предыдущего вывода прошло больше указанного количества миллисекунд.

output_format_protobuf_nullables_with_google_wrappers

При сериализации столбцов с типом Nullable с использованием обёрток Google значения по умолчанию сериализуются как пустые обёртки. Если параметр отключён, значения по умолчанию и значения NULL не сериализуются

output_format_schema

Путь к файлу, в который будет сохранена автоматически сгенерированная схема в формате Cap’n Proto или Protobuf.

output_format_sql_insert_include_column_names

Включать имена столбцов в запрос INSERT

output_format_sql_insert_max_batch_size

Максимальное количество строк в одном операторе INSERT.

output_format_sql_insert_quote_names

Заключать имена столбцов в символы ```

output_format_sql_insert_table_name

Имя таблицы в выходном INSERT-запросе

output_format_sql_insert_use_replace

Использовать оператор REPLACE вместо INSERT

output_format_trim_fixed_string

Удаляет завершающие null-байты из значений FixedString в текстовых форматах вывода. Например, toFixedString('John', 8) выводится как John вместо John\0\0\0\0.

output_format_tsv_crlf_end_of_line

Если задано значение true, окончание строки в формате TSV будет \r\n вместо \n.

output_format_values_escape_quote_with_quote

Если значение равно true, экранирует ’ как ”, в противном случае используется '

output_format_write_statistics

Выводит статистику о количестве прочитанных строк, байтов и затраченном времени в подходящих форматах вывода. Включено по умолчанию

precise_float_parsing

Использовать более точный (но более медленный) алгоритм разбора чисел с плавающей запятой

schema_inference_hints

Список имён столбцов и типов, используемых в качестве подсказок при определении схемы для форматов без схемы. Пример: Запрос:

desc format(JSONEachRow, '{"x" : 1, "y" : "String", "z" : "0.0.0.0" }') settings schema_inference_hints='x UInt8, z IPv4';

Результат:

x   UInt8
y   Nullable(String)
z   IPv4

Если schema_inference_hints отформатирован неправильно или содержит опечатку, неверный тип данных и т. п., то schema_inference_hints будет полностью проигнорирован.

schema_inference_make_columns_nullable

Управляет тем, будут ли типы, определённые при определении схемы, иметь тип Nullable. Возможные значения:

0 - тип, определённый при определении схемы, никогда не будет Nullable (используйте input_format_null_as_default, чтобы указать, что делать со значениями NULL в этом случае),
1 - все типы, определённые при определении схемы, будут Nullable,
2 or auto - тип, определённый при определении схемы, будет Nullable только если столбец содержит NULL в образце, разбираемом во время определения схемы, или если метаданные файла содержат информацию о допустимости NULL для столбца,
3 - допустимость NULL для типа, определённого при определении схемы, будет соответствовать метаданным файла, если формат её поддерживает (например, Parquet); в противном случае тип всегда будет Nullable (например, CSV).

schema_inference_make_json_columns_nullable

Управляет тем, будут ли автоматически определённые типы JSON делаться Nullable при определении схемы. Если этот параметр включён вместе с schema_inference_make_columns_nullable, автоматически определённый тип JSON будет Nullable.

schema_inference_mode

Режим определения схемы. ‘default’ — предполагается, что все файлы имеют одинаковую схему и её можно определить по любому файлу; ‘union’ — файлы могут иметь разные схемы, и итоговая схема должна представлять собой объединение схем всех файлов

show_create_query_identifier_quoting_rule

Задает правило заключения идентификаторов в кавычки в запросе SHOW CREATE

show_create_query_identifier_quoting_style

Задает стиль заключения идентификаторов в кавычки в запросе SHOW CREATE

type_json_allow_duplicated_key_with_literal_and_nested_object

Если включено, разрешается разбирать JSON-документы вида {"a" : 42, "a" : {"b" : 42}}, где ключ дублируется, но одно из его вхождений является вложенным объектом.

type_json_skip_duplicated_paths

Если включено, при разборе объекта JSON в тип JSON дублирующиеся пути будут игнорироваться, и вместо исключени будет вставлен только первый

type_json_skip_invalid_typed_paths

Если параметр включен, поля со значениями, которые невозможно привести к объявленному типу в столбцах с типом JSON и типизированными путями, пропускаются вместо генерации ошибки. Пропущенные поля считаются отсутствующими, и для них используются значения по умолчанию/NULL в соответствии с определением типизированного пути. Этот параметр применяется только к столбцам с типом JSON (например, JSON(a Int64, b String)), где для определённых путей объявлены типы. Он не применяется к обычным JSON input formats, таким как JSONEachRow, при вставке в обычные типизированные столбцы. Возможные значения:

0 — Отключено (ошибка при несоответствии типов).
1 — Включено (поле пропускается при несоответствии типов).

type_json_use_partial_match_to_skip_paths_by_regexp

Если включено, то при разборе объекта JSON в тип JSON для пропуска пути регулярным выражениям, указанным с помощью SKIP REGEXP, будет достаточно частичного совпадения. Если отключено, потребуется полное совпадение.

validate_experimental_and_suspicious_types_inside_nested_types

Проверяет использование экспериментальных и подозрительных типов во вложенных типах, таких как Array/Map/Tuple

Последнее изменение 10 июня 2026 г.

Бета- и экспериментальные возможностиВ ClickHouse есть бета- и экспериментальные возможности. На этой странице документации рассматриваются эти понятия.

​allow_special_bool_values_inside_variant

​bool_false_representation

​bool_true_representation

​check_conversion_from_numbers_to_enum

​column_names_for_schema_inference

​date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

​date_time_input_format

​date_time_output_format

​date_time_overflow_behavior

​errors_output_format

​format_avro_schema_registry_connection_timeout

​format_avro_schema_registry_receive_timeout

​format_avro_schema_registry_send_timeout

​format_avro_schema_registry_url

​format_binary_max_array_size

​format_binary_max_object_size

​format_binary_max_string_size

​format_capn_proto_enum_comparising_mode

​format_capn_proto_max_message_size

​format_capn_proto_use_autogenerated_schema

​format_csv_allow_double_quotes

​format_csv_allow_single_quotes

​format_csv_delimiter

​format_csv_null_representation

​format_custom_escaping_rule

​format_custom_field_delimiter

​format_custom_result_after_delimiter

​format_custom_result_before_delimiter

​format_custom_row_after_delimiter

​format_custom_row_before_delimiter

​format_custom_row_between_delimiter

​format_display_secrets_in_show_and_select

​format_json_object_each_row_column_for_object_name

​format_protobuf_use_autogenerated_schema

​format_regexp

​format_regexp_escaping_rule

​format_regexp_skip_unmatched

​format_schema

​format_schema_message_name

​format_schema_source

​format_template_resultset

​format_template_resultset_format

​format_template_row

​format_template_row_format

​format_template_rows_between_delimiter

​format_tsv_null_representation

​input_format_allow_errors_num

​input_format_allow_errors_ratio

​input_format_allow_seeks

​input_format_arrow_allow_missing_columns

​input_format_arrow_case_insensitive_column_matching

​input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

​input_format_avro_allow_missing_fields

​input_format_avro_null_as_default

​input_format_binary_decode_types_in_binary_format

​input_format_binary_max_type_complexity

​input_format_binary_read_json_as_string

​input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

​input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

​input_format_column_name_matching_mode

​input_format_connection_handling

​input_format_csv_allow_cr_end_of_line

​input_format_csv_allow_variable_number_of_columns

​input_format_csv_allow_whitespace_or_tab_as_delimiter

​input_format_csv_arrays_as_nested_csv

​input_format_csv_deserialize_separate_columns_into_tuple

​input_format_csv_detect_header

​input_format_csv_empty_as_default

​input_format_csv_enum_as_number

​input_format_csv_skip_first_lines

​input_format_csv_skip_trailing_empty_lines

​input_format_csv_trim_whitespaces

​input_format_csv_try_infer_numbers_from_strings

​input_format_csv_try_infer_strings_from_quoted_tuples

​input_format_csv_use_best_effort_in_schema_inference

​input_format_csv_use_default_on_bad_values

​input_format_custom_allow_variable_number_of_columns

​input_format_custom_detect_header

​input_format_custom_skip_trailing_empty_lines

​input_format_defaults_for_omitted_fields

allow_special_bool_values_inside_variant

bool_false_representation

bool_true_representation

check_conversion_from_numbers_to_enum

column_names_for_schema_inference

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

date_time_input_format

date_time_output_format

date_time_overflow_behavior

errors_output_format

format_avro_schema_registry_connection_timeout

format_avro_schema_registry_receive_timeout

format_avro_schema_registry_send_timeout

format_avro_schema_registry_url

format_binary_max_array_size

format_binary_max_object_size

format_binary_max_string_size

format_capn_proto_enum_comparising_mode

format_capn_proto_max_message_size

format_capn_proto_use_autogenerated_schema

format_csv_allow_double_quotes

format_csv_allow_single_quotes

format_csv_delimiter

format_csv_null_representation

format_custom_escaping_rule

format_custom_field_delimiter

format_custom_result_after_delimiter

format_custom_result_before_delimiter

format_custom_row_after_delimiter

format_custom_row_before_delimiter

format_custom_row_between_delimiter

format_display_secrets_in_show_and_select

format_json_object_each_row_column_for_object_name

format_protobuf_use_autogenerated_schema

format_regexp

format_regexp_escaping_rule

format_regexp_skip_unmatched

format_schema

format_schema_message_name

format_schema_source

format_template_resultset

format_template_resultset_format

format_template_row

format_template_row_format

format_template_rows_between_delimiter

format_tsv_null_representation

input_format_allow_errors_num

input_format_allow_errors_ratio

input_format_allow_seeks

input_format_arrow_allow_missing_columns

input_format_arrow_case_insensitive_column_matching

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

input_format_avro_allow_missing_fields

input_format_avro_null_as_default

input_format_binary_decode_types_in_binary_format

input_format_binary_max_type_complexity

input_format_binary_read_json_as_string

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

input_format_column_name_matching_mode

input_format_connection_handling

input_format_csv_allow_cr_end_of_line

input_format_csv_allow_variable_number_of_columns

input_format_csv_allow_whitespace_or_tab_as_delimiter

input_format_csv_arrays_as_nested_csv

input_format_csv_deserialize_separate_columns_into_tuple

input_format_csv_detect_header

input_format_csv_empty_as_default

input_format_csv_enum_as_number

input_format_csv_skip_first_lines

input_format_csv_skip_trailing_empty_lines

input_format_csv_trim_whitespaces

input_format_csv_try_infer_numbers_from_strings

input_format_csv_try_infer_strings_from_quoted_tuples

input_format_csv_use_best_effort_in_schema_inference

input_format_csv_use_default_on_bad_values

input_format_custom_allow_variable_number_of_columns

input_format_custom_detect_header

input_format_custom_skip_trailing_empty_lines

input_format_defaults_for_omitted_fields