Эти настройки автоматически сгенерированы на основе исходного кода.
allow_special_bool_values_inside_variant
Позволяет разбирать значения типа Bool внутри типа Variant из специальных строковых представлений булевых значений, таких как “on”, “off”, “enable”, “disable” и т. д.
bool_false_representation
Текстовое представление значения false для типа bool в форматах TSV/CSV/Vertical/Pretty.
Текстовое представление логического значения true в форматах TSV/CSV/Vertical/Pretty.
check_conversion_from_numbers_to_enum
Сгенерировать исключение при преобразовании Numbers в Enum, если такого значения нет в Enum.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Пример
CREATE TABLE tab (
val Enum('first' = 1, 'second' = 2, 'third' = 3)
) ENGINE = Memory;
INSERT INTO tab SETTINGS check_conversion_from_numbers_to_enum = 1 VALUES (4); -- возвращает ошибку
column_names_for_schema_inference
Список имён столбцов, используемых при определении схемы для форматов без имён столбцов. Формат: ‘column1,column2,column3,…‘
Динамически удаляет конечные нули у значений datetime64, чтобы масштаб вывода принимал значения [0, 3, 6],
что соответствует ‘секундам’, ‘миллисекундам’ и ‘микросекундам’
Позволяет выбрать парсер для текстового представления даты и времени.
Эта настройка не применяется к функциям даты и времени.
Возможные значения:
-
'best_effort' — Включает расширенный разбор.
ClickHouse может разбирать базовый формат YYYY-MM-DD HH:MM:SS и все форматы даты и времени ISO 8601. Например, '2018-06-08T01:02:03.000Z'.
-
'best_effort_us' — Аналогично best_effort (см. различия в parseDateTimeBestEffortUS
-
'basic' — Использует базовый парсер.
ClickHouse может разбирать только базовые форматы YYYY-MM-DD HH:MM:SS или YYYY-MM-DD. Например, 2019-08-20 10:18:56 или 2019-08-20.
См. также:
Позволяет выбирать различные форматы вывода текстового представления даты и времени.
Возможные значения:
-
simple - Простой формат вывода.
ClickHouse выводит дату и время в формате YYYY-MM-DD hh:mm:ss. Например, 2019-08-20 10:18:56. Вычисление выполняется в соответствии с часовым поясом типа данных (если он задан) или часовым поясом сервера.
-
iso - Формат вывода ISO.
ClickHouse выводит дату и время в формате ISO 8601 YYYY-MM-DDThh:mm:ssZ. Например, 2019-08-20T10:18:56Z. Обратите внимание, что вывод выполняется в UTC (Z означает UTC).
-
unix_timestamp - Формат вывода Unix-временной метки.
ClickHouse выводит дату и время в формате Unix timestamp. Например, 1566285536.
См. также:
date_time_overflow_behavior
Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в результирующем типе.
Возможные значения:
ignore — Молча игнорировать переполнение. Результат не определён.
throw — Сгенерировать исключение в случае переполнения.
saturate — Ограничить результат предельными значениями. Если значение меньше минимального значения, которое может быть представлено целевым типом, в качестве результата выбирается минимальное представимое значение. Если значение больше максимального значения, которое может быть представлено целевым типом, в качестве результата выбирается максимальное представимое значение.
Значение по умолчанию: ignore.
Метод записи ошибок в текстовый вывод.
Для формата AvroConfluent: тайм-аут подключения в секундах для HTTP-клиента Confluent Schema Registry. Используется как при получении схемы, так и при её регистрации. Должен быть больше 0 и меньше 600 (10 минут).
Для формата AvroConfluent: тайм-аут получения ответа в секундах для HTTP-клиента Confluent Schema Registry. Используется как при получении схемы, так и при её регистрации. Должен быть больше 0 и меньше 600 (10 минут).
Для формата AvroConfluent: тайм-аут отправки в секундах для HTTP-клиента Confluent Schema Registry. Используется как для получения схемы, так и для её регистрации. Должен быть больше 0 и меньше 600 (10 минут).
Для формата AvroConfluent: URL-адрес Confluent Schema Registry.
Максимально допустимый размер Array в формате RowBinary. Предотвращает выделение большого объёма памяти в случае повреждения данных. 0 означает, что ограничение отсутствует
Максимально допустимое количество путей в одном объекте для формата RowBinary типа JSON. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничения нет
Максимально допустимый размер значения типа String в формате RowBinary. Предотвращает выделение большого объема памяти в случае повреждения данных. 0 означает, что ограничения нет
Как сопоставляются Enum в ClickHouse и CapnProto
Максимальный размер одного сообщения CapnProto в байтах. Защищает от чрезмерного выделения памяти из-за некорректных или повреждённых данных. Значение по умолчанию — 1 GiB.
Использовать автоматически сгенерированную схему CapnProto, если параметр format_schema не задан
Если установлено значение true, разрешает строки в двойных кавычках.
Если установлено значение true, разрешает строки в одинарных кавычках.
Символ, используемый в качестве разделителя в данных CSV. Если параметр задаётся строкой, её длина должна быть равна 1.
Настраиваемое представление значения NULL в формате CSV
Правило экранирования поля (для формата CustomSeparated)
Разделитель полей (для формата CustomSeparated)
Суффикс после результирующего набора (для формата CustomSeparated)
Префикс перед результирующим набором (для формата CustomSeparated)
Разделитель после поля последнего столбца (для формата CustomSeparated)
Разделитель перед полем первого столбца (для формата CustomSeparated)
Разделитель между строками (для формата CustomSeparated)
Включает или отключает отображение secrets в запросах SHOW и SELECT для таблиц, баз данных,
table functions и словарей.
Пользователь, который хочет видеть secrets, также должен иметь
включенную
настройку сервера display_secrets_in_show_and_select
и
привилегию displaySecretsInShowAndSelect.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Имя столбца, которое будет использоваться для хранения/записи имён объектов в формате JSONObjectEachRow.
Тип столбца должен быть String. Если значение пустое, в качестве имён объектов будут использоваться имена по умолчанию row_{i}.
Использовать автоматически сгенерированную схему Protobuf, если format_schema не задан
Регулярное выражение (для формата Regexp)
Правило экранирования поля (для формата Regexp)
Пропускать строки, не соответствующие регулярному выражению (для формата Regexp)
Этот параметр полезен при использовании форматов, для которых требуется описание схемы, например Cap’n Proto или Protobuf. Его значение зависит от формата.
Задаёт имя требуемого сообщения в схеме, определённой в format_schema.
Чтобы сохранить совместимость с устаревшим форматом format_schema (file_name:message_name):
- Если
format_schema_message_name не указан, имя сообщения определяется по части message_name в устаревшем значении format_schema.
- Если
format_schema_message_name указан при использовании устаревшего формата, будет сгенерирована ошибка.
Определяет источник format_schema.
Возможные значения:
- ‘file’ (по умолчанию):
format_schema — это имя файла схемы, расположенного в каталоге format_schemas.
- ‘string’:
format_schema — это буквальное содержимое схемы.
- ‘query’:
format_schema — это запрос для получения схемы.
Если format_schema_source установлено в значение ‘query’, действуют следующие условия:
- Запрос должен возвращать ровно одно значение: одну строку с одним строковым столбцом.
- Результат запроса считается содержимым схемы.
- Этот результат кэшируется локально в каталоге
format_schemas.
- Локальный кэш можно очистить с помощью команды:
SYSTEM DROP FORMAT SCHEMA CACHE FOR Files.
- После кэширования одинаковые запросы больше не выполняются для повторного получения схемы, пока кэш не будет явно очищен.
- Помимо файлов локального кэша, сообщения Protobuf также кэшируются в памяти. Даже после очистки файлов локального кэша кэш в памяти необходимо очистить с помощью
SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf], чтобы полностью обновить схему.
- Выполните запрос
SYSTEM DROP FORMAT SCHEMA CACHE, чтобы сразу очистить кэш и для файлов кэша, и для схем сообщений Protobuf.
Путь к файлу, содержащему строку формата для результирующего набора (для формата Template)
Строка формата результирующего набора (для формата Template)
Путь к файлу, содержащему строку формата для строк (для формата Template)
Строка формата строк (для формата Template)
Разделитель строк (для формата Template)
Настраиваемое представление значения NULL для формата TSV
Задаёт максимально допустимое число ошибок при чтении из текстовых форматов (CSV, TSV и т. д.).
Значение по умолчанию — 0.
Всегда используйте его вместе с input_format_allow_errors_ratio.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей.
Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.
Задаёт максимально допустимую долю ошибок при чтении данных в текстовых форматах (CSV, TSV и т. д.).
Доля ошибок задаётся числом с плавающей точкой в диапазоне от 0 до 1.
Значение по умолчанию — 0.
Всегда используйте его вместе с input_format_allow_errors_num.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей.
Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.
Разрешает операции seek (или чтение диапазонов) при чтении входных форматов ORC, Parquet и Arrow.
Если параметр включен и источник это поддерживает (например, локальный файл, S3, HTTP с поддержкой диапазонов и известным размером),
ClickHouse может читать только нужные диапазоны байтов и использовать меньше памяти.
Если параметр отключен или источник не поддерживает seek (например, размер файла неизвестен или поток не поддерживает seek),
некоторые средства чтения могут переключиться на загрузку всего файла в память.
Включено по умолчанию.
Разрешает отсутствие столбцов при чтении входных форматов Arrow
Игнорирует регистр при сопоставлении столбцов Arrow со столбцами ClickHouse.
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Arrow
Для формата Avro/AvroConfluent: если поле не найдено в схеме, использовать значение по умолчанию вместо выдачи ошибки
Для формата Avro/AvroConfluent: использовать значение по умолчанию, если передан null, а столбец не имеет типа Nullable
Читать типы данных в бинарном формате вместо названий типов во входном формате RowBinaryWithNamesAndTypes
Максимальное количество узлов типа при декодировании бинарных типов (не глубина, а общее число). Map(String, UInt32) = 3 узла. Защищает от вредоносного ввода. 0 = без ограничений.
Считывать значения типа данных JSON как значения String, содержащие JSON, во входном формате RowBinary.
Пропускать поля с неподдерживаемыми типами при определении схемы для формата BSON.
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата CapnProto
Определяет режим сопоставления имён столбцов при ингестии данных в различных форматах (включая, помимо прочего, JSONEachRow, CSVWithNames, JSONColumns, BSONEachRow, RowBinaryWithNames).
Поддерживаемые режимы:
- match_case: сопоставление с учётом регистра
- ignore_case: регистронезависимое сопоставление
- auto: сначала пытается сопоставить с учётом регистра, а если это не удаётся — регистронезависимо.
Если эта опция включена и соединение неожиданно закрывается, все оставшиеся в буфере данные будут разобраны и обработаны, а не считаться ошибкой
Включение этой опции отключает параллельный разбор и делает дедупликацию невозможной
Если задано значение true, \r допускается в конце строки, если за ним не следует
Игнорировать лишние столбцы во входных CSV-данных (если в файле столбцов больше, чем ожидается) и считать отсутствующие поля во входных CSV-данных значениями по умолчанию
Разрешает использовать пробелы и символы табуляции(\t) в качестве разделителей полей в строках CSV
При чтении Array из CSV предполагается, что его элементы были сериализованы во вложенном CSV, а затем помещены в строку. Example: ”[""Hello"", ""world"", ""42"""" TV""]”. Скобки вокруг массива можно не указывать.
Если задано значение true, отдельные столбцы, записанные в формате CSV, могут быть десериализованы в столбец Tuple.
Автоматически определяет заголовок с именами и типами в формате CSV
Считать пустые поля во входных CSV-данных значениями по умолчанию.
Рассматривать вставляемые значения enum в форматах CSV как индексы enum
Пропускать указанное число строк в начале данных в формате CSV
Пропускать пустые строки в конце в формате CSV
Удаляет пробелы и символы табуляции (\t) в начале и в конце CSV-строк
Если включено, при определении схемы ClickHouse будет пытаться определять числа в строковых полях.
Это может быть полезно, если данные CSV содержат числа UInt64 в кавычках.
По умолчанию отключено.
Интерпретирует кортежи во входных данных, заключённые в кавычки, как значение типа String.
Использовать дополнительные настройки и эвристики для определения схемы в формате CSV
Разрешает использовать значение по умолчанию для столбца, если десериализация поля CSV завершилась ошибкой из-за некорректного значения
Игнорирует лишние столбцы во входных данных CustomSeparated (если файл содержит больше столбцов, чем ожидается) и обрабатывает отсутствующие поля во входных данных CustomSeparated как значения по умолчанию
Автоматически определять заголовок с именами и типами в формате CustomSeparated
Пропускать пустые строки в конце в формате CustomSeparated
При выполнении запросов INSERT пропущенные значения входных столбцов заменяются значениями по умолчанию соответствующих столбцов. Этот параметр применяется к форматам JSONEachRow (и другим JSON-форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native, а также к форматам с суффиксами WithNames/WithNamesAndTypes.
Когда этот параметр включен, с сервера клиенту отправляются расширенные метаданные таблицы. Это требует дополнительных вычислительных ресурсов на сервере и может снизить производительность.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Принудительно инициализирует пропущенные поля значениями NULL
input_format_hive_text_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных Hive Text (если в файле столбцов больше, чем ожидается) и считать отсутствующие поля во входных данных Hive Text значениями по умолчанию
input_format_hive_text_collection_items_delimiter
Разделитель между элементами коллекций (Array или Map) в формате Hive Text File
input_format_hive_text_fields_delimiter
Разделитель полей в Hive Text File
input_format_hive_text_map_keys_delimiter
Разделитель между ключом и значением в паре map в Hive Text File
Включает или отключает вставку JSON-данных с вложенными объектами.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
См. также:
При десериализации IPv4 при ошибке преобразования будут использоваться значения по умолчанию вместо генерации исключения.
По умолчанию отключено.
При десериализации IPv6 при ошибке преобразования будут использоваться значения по умолчанию вместо генерации исключения.
По умолчанию отключено.
Разрешает переменное число столбцов в строках входных форматов JSONCompact/JSONCompactEachRow.
Лишние столбцы в строках, где столбцов больше, чем ожидается, игнорируются, а отсутствующим столбцам присваиваются значения по умолчанию.
По умолчанию отключено.
Подставляет значения по умолчанию для отсутствующих элементов в объекте JSON при обработке именованного кортежа.
Этот параметр работает, только если включен параметр input_format_json_named_tuples_as_objects.
Включен по умолчанию.
Если параметр включен, пустые поля во входном JSON заменяются значениями по умолчанию. Для сложных выражений со значениями по умолчанию также должен быть включен параметр input_format_defaults_for_omitted_fields.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Игнорирует неизвестные ключи в объекте JSON для именованных кортежей.
Включено по умолчанию.
Игнорировать лишние поля и не разбирать их. При включении этого параметра исключения для строк JSON с некорректным форматом или дублирующимися полями могут не генерироваться
Если параметр включен, при определении схемы ClickHouse будет использовать тип Array(Dynamic) для JSON-массивов со значениями разных типов данных.
Пример:
SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=1;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');
┌─name─┬─type───────────┐
│ a │ Array(Dynamic) │
└──────┴────────────────┘
SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=0;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');
┌─name─┬─type─────────────────────────────────────────────────────────────┐
│ a │ Tuple(Nullable(Int64), Nullable(String), Array(Nullable(Int64))) │
└──────┴──────────────────────────────────────────────────────────────────┘
Включено по умолчанию.
Позволяет использовать тип String для JSON-ключей, которые в выборке данных при автоматическом определении схемы содержат только Null/{}/[].
В JSON-форматах любое значение можно прочитать как String, и благодаря этому можно избежать ошибок вида Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps при автоматическом определении схемы,
используя тип String для ключей с неизвестными типами.
Пример:
SET input_format_json_infer_incomplete_types_as_strings = 1, input_format_json_try_infer_named_tuples_from_objects = 1;
DESCRIBE format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
SELECT * FROM format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
Результат:
┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj │ Tuple(a Array(Nullable(Int64)), b Nullable(String), c Nullable(String), d Nullable(String), e Array(Nullable(String))) │ │ │ │ │ │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘
┌─obj────────────────────────────┐
│ ([1,2,3],'hello',NULL,'{}',[]) │
└────────────────────────────────┘
Включено по умолчанию.
Десериализует столбцы типа Map как JSON-массивы кортежей.
По умолчанию отключено.
Максимальная глубина поля в JSON. Это не жёсткое ограничение, и оно не обязано соблюдаться в точности.
Разбирать столбцы с именованными кортежами как объекты JSON.
Включено по умолчанию.
Разрешает разбирать JSON-массивы как строки во входных JSON-форматах.
Пример:
SET input_format_json_read_arrays_as_strings = 1;
SELECT arr, toTypeName(arr), JSONExtractArrayRaw(arr)[3] from format(JSONEachRow, 'arr String', '{"arr" : [1, "Hello", [1,2,3]]}');
Результат:
┌─arr───────────────────┬─toTypeName(arr)─┬─arrayElement(JSONExtractArrayRaw(arr), 3)─┐
│ [1, "Hello", [1,2,3]] │ String │ [1,2,3] │
└───────────────────────┴─────────────────┴───────────────────────────────────────────┘
Включено по умолчанию.
Разрешает разбирать логические значения как числа во входных JSON-форматах.
Включено по умолчанию.
Разрешает считывать булевы значения как строки во входных JSON-форматах.
Включено по умолчанию.
Разрешает разбирать числа как строки во входных JSON-форматах.
Включено по умолчанию.
Разрешает парсинг объектов JSON как строк в JSON-форматах ввода.
Пример:
SET input_format_json_read_objects_as_strings = 1;
CREATE TABLE test (id UInt64, obj String, date Date) ENGINE=Memory();
INSERT INTO test FORMAT JSONEachRow {"id" : 1, "obj" : {"a" : 1, "b" : "Hello"}, "date" : "2020-01-01"};
SELECT * FROM test;
Результат:
┌─id─┬─obj──────────────────────┬───────date─┐
│ 1 │ {"a" : 1, "b" : "Hello"} │ 2020-01-01 │
└────┴──────────────────────────┴────────────┘
Включено по умолчанию.
Генерирует исключение, если строка JSON содержит некорректную escape-последовательность во входных JSON-форматах. Если параметр отключен, некорректные escape-последовательности останутся в данных как есть.
Включено по умолчанию.
Если включено, то при определении схемы ClickHouse будет пытаться определять именованный Tuple из объектов JSON.
Получившийся именованный Tuple будет содержать все элементы из всех соответствующих объектов JSON в выборке данных.
Пример:
SET input_format_json_try_infer_named_tuples_from_objects = 1;
DESC format(JSONEachRow, '{"obj" : {"a" : 42, "b" : "Hello"}}, {"obj" : {"a" : 43, "c" : [1, 2, 3]}}, {"obj" : {"d" : {"e" : 42}}}')
Результат:
┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj │ Tuple(a Nullable(Int64), b Nullable(String), c Array(Nullable(Int64)), d Tuple(e Nullable(Int64))) │ │ │ │ │ │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘
Включено по умолчанию.
Если включено, при определении схемы ClickHouse будет пытаться определять числа из строковых полей.
Это может быть полезно, если данные JSON содержат числа UInt64 в кавычках.
По умолчанию отключено.
Использовать тип String вместо исключения при неоднозначных путях в объектах JSON во время определения именованных кортежей
Для входных форматов JSON/JSONCompact/JSONColumnsWithMetadata, если этот параметр установлен в 1,
типы из метаданных во входных данных будут сравниваться с типами соответствующих столбцов таблицы.
Включён по умолчанию.
Ограничивает размер блоков в байтах, формируемых при разборе данных во входных форматах. Используется во входных форматах на основе строк, когда блок формируется на стороне ClickHouse.
0 означает отсутствие ограничения в байтах.
Ограничивает максимальное время ожидания в миллисекундах перед выдачей блока при разборе данных в построчных входных форматах. 0 означает отсутствие ограничения.
Этот параметр работает только при включенном input_format_connection_handling. Установка значения также отключает параллельный разбор и делает дедупликацию невозможной.
Для стриминговых вставок также необходимо задать min_insert_block_size_rows=0 и min_insert_block_size_bytes=0. В противном случае разобранные блоки все равно могут накапливаться в памяти на этапе укрупнения блоков до достижения этих порогов, что мешает своевременной вставке.
Пример: стриминг недавних изменений из Википедии в ClickHouse
clickhouse-client --query 'CREATE TABLE wikipedia_edits (data JSON)'
curl -sS --globoff -H 'Accept: application/json' --no-buffer \
'https://stream.wikimedia.org/v2/stream/recentchange' \
| clickhouse-client \
--query 'INSERT INTO wikipedia_edits FORMAT JSONAsObject' \
--input_format_max_block_wait_ms 1000 \
--input_format_connection_handling 1 \
--min_insert_block_size_rows 0 \
--min_insert_block_size_bytes 0
Максимальный объём данных в байтах, считываемых для автоматического определения схемы.
Максимальное количество строк данных, считываемых при автоматическом определении схемы.
Количество столбцов во вставляемых данных MsgPack. Используется для автоматического определения схемы по данным.
Сопоставлять по именам столбцы таблицы из дампа MySQL и столбцы таблицы ClickHouse
Имя таблицы в дампе MySQL, из которой считываются данные
Разрешить преобразование типов в формате ввода Native
Читать типы данных в бинарном формате вместо имен типов во входном формате Native
Включает или отключает инициализацию полей со значением NULL значениями по умолчанию, если тип данных этих полей не Nullable.
Если тип столбца не Nullable и этот параметр отключен, вставка NULL вызывает исключение. Если тип столбца — Nullable, значения NULL вставляются как есть независимо от этого параметра.
Этот параметр применяется к большинству входных форматов.
Для сложных выражений со значениями по умолчанию также должен быть включен input_format_defaults_for_omitted_fields.
Возможные значения:
- 0 — Вставка
NULL в столбец, не допускающий NULL, вызывает исключение.
- 1 — Поля со значением
NULL инициализируются значениями столбца по умолчанию.
Разрешать отсутствие столбцов при чтении входных данных в формате ORC
Игнорировать регистр при сопоставлении столбцов ORC со столбцами ClickHouse.
Обрабатывать столбцы ORC, закодированные словарём, как столбцы LowCardinality при чтении файлов ORC.
При чтении файлов ORC пропускает целые stripe или группы строк на основании выражений WHERE/PREWHERE, статистики min/max или bloom filter в метаданных ORC.
Название часового пояса для считывателя строк ORC; по умолчанию для считывателя строк ORC используется GMT.
Размер батча при чтении сегментов ORC.
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата ORC
Использует более быструю реализацию декодера ORC.
Включает или отключает параллельный разбор форматов данных с сохранением порядка строк. Поддерживается только для форматов TabSeparated (TSV), TSKV, CSV и JSONEachRow.
Возможные значения:
- 1 — Включено.
- 0 — Отключено.
Используйте парсер гео-столбцов для преобразования Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon
Разрешает отсутствующие столбцы при чтении данных в формате Parquet
При чтении файлов Parquet пропускать целые группы строк по выражениям WHERE и bloom filter в метаданных Parquet.
Игнорировать регистр при сопоставлении столбцов Parquet со столбцами ClickHouse.
При чтении файлов Parquet разбирать JSON-столбцы как JSON-столбцы ClickHouse.
Включает предзагрузку групп строк при парсинге Parquet. В настоящее время предзагрузка поддерживается только при однопоточном парсинге.
При чтении файлов Parquet пропускает целые группы строк на основе выражений WHERE/PREWHERE и статистики min/max из метаданных Parquet.
Минимальное число байтов при локальном чтении из файла, необходимое для выполнения seek вместо чтения с пропуском во входном формате Parquet
Определяет тип данных, используемый при определении схемы для временных меток Parquet с isAdjustedToUTC=false. Если true: DateTime64(…, ‘UTC’), если false: DateTime64(…). Ни один из вариантов не является полностью корректным, поскольку в ClickHouse нет типа данных для локального времени на часах. Как ни парадоксально, вариант true, вероятно, менее ошибочен, потому что форматирование временной метки UTC как String даст корректное представление локального времени.
Максимальный размер блока для ридера Parquet.
Примерный лимит памяти для ридера Parquet v3. Ограничивает количество групп строк или столбцов, которые можно читать параллельно. При чтении нескольких файлов в одном запросе лимит распространяется на общее использование памяти для всех этих файлов.
Более агрессивно планирует операции предварительного чтения, если использование памяти ниже порога. Может быть полезно, например, если по сети нужно считывать много небольших bloom-фильтров.
input_format_parquet_page_filter_push_down
Пропускать страницы по минимальным/максимальным значениям из индекса столбца.
Средний размер в байтах блока, выдаваемого ридером Parquet
Не переупорядочивать строки при чтении из файлов Parquet. Не рекомендуется, так как порядок строк обычно не гарантируется, а другие части конвейера выполнения запроса могут его нарушить. Вместо этого используйте ORDER BY _row_number.
Пропускать столбцы с неподдерживаемыми типами при автоматическом определении схемы для формата Parquet
Небольшое изменение логики чтения страниц из файла Parquet, когда фильтрация страниц не используется.
Проверять контрольные суммы страниц при чтении файлов Parquet.
Включает обёртки Google для обычных невложенных столбцов, например google.protobuf.StringValue ‘str’ для столбца String ‘str’. Для столбцов с типом Nullable пустые обёртки распознаются как значения по умолчанию, а отсутствующие — как NULL
Указывает, какое поле protobuf oneof было найдено, задавая значение enum в специальном столбце
Пропускать поля с неподдерживаемыми типами при автоматическом определении схемы для формата Protobuf
Путь к файлу, используемому для записи ошибок при чтении текстовых форматов (CSV, TSV).
Включает или отключает пропуск дополнительных данных при вставке.
При записи данных ClickHouse генерирует исключение, если входные данные содержат столбцы, которых нет в целевой таблице. Если пропуск включен, ClickHouse не вставляет дополнительные данные и не генерирует исключение.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Если включено, ClickHouse будет пытаться автоматически определять тип Date по строковым полям при автоматическом определении схемы для текстовых форматов. Если все поля столбца во входных данных были успешно разобраны как даты, результирующий тип будет Date; если хотя бы одно поле не удалось разобрать как дату, результирующий тип будет String.
Включено по умолчанию.
Если включено, ClickHouse будет пытаться определять тип DateTime64 для строковых полей при автоматическом определении схемы для текстовых форматов. Если все значения в столбце входных данных были успешно разобраны как дата и время, результирующим типом будет DateTime64; если хотя бы одно значение не удалось разобрать как дату и время, результирующим типом будет String.
Включено по умолчанию.
Когда включен параметр input_format_try_infer_datetimes, автоматически определяется только тип DateTime64, но не типы DateTime
Пытаться определять числа с плавающей точкой в экспоненциальной записи при автоматическом определении схемы в текстовых форматах (кроме JSON, где числа в экспоненциальной записи определяются всегда)
Если включено, ClickHouse будет пытаться определять целые числа вместо чисел с плавающей точкой при автоматическом определении схемы для текстовых форматов. Если все числа в столбце входных данных являются целыми, результирующим типом будет Int64, а если хотя бы одно число является числом с плавающей точкой, результирующим типом будет Float64.
Включено по умолчанию.
Если включено, ClickHouse будет пытаться определять тип Variant при автоматическом определении схемы для текстовых форматов, когда для элементов столбца/массива возможно более одного типа.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Игнорировать лишние столбцы во входных данных TSV (если в файле столбцов больше, чем ожидается) и трактовать отсутствующие поля во входных данных TSV как значения по умолчанию
Если задано значение true, функция file будет читать формат TSV с окончаниями строк \r\n вместо \n.
Автоматически определять в формате TSV заголовок с именами и типами
Обрабатывать пустые поля во входных данных TSV как значения по умолчанию.
Рассматривать значения enum, вставляемые в форматах TSV, как индексы enum.
Пропускать указанное число строк в начале данных в формате TSV
Пропускать пустые строки в конце в формате TSV
Использовать дополнительные настройки и эвристики для автоматического определения схемы в формате TSV
Для формата Values: при разборе и интерпретации выражений с использованием шаблона проверяйте фактический тип литерала, чтобы избежать возможных проблем с переполнением и потерей точности.
Для формата Values: если поле не удалось разобрать стриминговым парсером, запускается SQL-парсер, определяется шаблон SQL-выражения, затем предпринимается попытка разобрать все строки по этому шаблону, после чего выражение интерпретируется для всех строк.
Для формата Values: если поле не удалось разобрать стриминговым парсером, запустить SQL-парсер и попытаться интерпретировать его как SQL-выражение.
Включает или отключает проверку порядка столбцов при вставке данных.
Чтобы повысить производительность вставки, рекомендуем отключить эту проверку, если вы уверены, что порядок столбцов во входных данных совпадает с порядком столбцов в целевой таблице.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Управляет тем, должен ли парсер формата проверять, соответствуют ли типы данных во входных данных типам данных целевой таблицы.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
insert_distributed_one_random_shard
Включает или отключает случайную вставку в один из сегментов таблицы Distributed, когда распределённый ключ отсутствует.
По умолчанию при вставке данных в таблицу Distributed с более чем одним сегментом сервер ClickHouse отклоняет любой запрос на вставку, если распределённый ключ не задан. Когда insert_distributed_one_random_shard = 1, вставки разрешаются, и данные случайным образом направляются в один из всех сегментов.
Возможные значения:
- 0 — Вставка отклоняется, если сегментов несколько и распределённый ключ не задан.
- 1 — Вставка выполняется случайным образом в один из всех доступных сегментов, если распределённый ключ не задан.
Позволяет выбирать различные форматы вывода для текстового представления типов interval.
Возможные значения:
-
kusto - формат вывода в стиле KQL.
ClickHouse выводит интервалы в формате KQL. Например, toIntervalDay(2) будет отформатирован как 2.00:00:00. Обратите внимание, что для типов interval переменной длины (то есть IntervalMonth и IntervalYear) учитывается среднее количество секунд в интервале.
-
numeric - числовой формат вывода.
ClickHouse выводит интервалы в виде их числового представления. Например, toIntervalDay(2) будет отформатирован как 2.
См. также:
into_outfile_create_parent_directories
Автоматически создаёт родительские каталоги при использовании INTO OUTFILE, если они ещё не существуют.
json_type_escape_dots_in_keys
Если параметр включен, точки в ключах JSON будут экранироваться при парсинге.
max_dynamic_subcolumns_in_json_type_parsing
Максимальное количество динамических подстолбцов, которое может быть создано в каждом столбце при парсинге JSON-столбца.
Позволяет управлять количеством динамических подстолбцов при парсинге независимо от динамических параметров, указанных в типе данных.
Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (без сжатия)
Записывает значения Date как обычные 16-битные числа (при обратном чтении — как UInt16) вместо преобразования в 32-битный тип Arrow DATE32 (при обратном чтении — как Date32).
Использовать тип Arrow FIXED_SIZE_BINARY вместо Binary для столбцов FixedString.
Включить вывод типа LowCardinality как типа Dictionary в Arrow
Использовать тип Arrow String вместо Binary для столбцов String
Выводит типы, для которых нет преобразования, в виде необработанных бинарных данных. Если false, для таких типов будет возникать исключение UNKNOWN_TYPE.
Всегда использовать 64-битные целочисленные индексы для словаря в формате Arrow
Использовать знаковые целые числа для индексов словарей в формате Arrow
Кодек сжатия, используемый при выводе. Возможные значения: ‘null’, ‘deflate’, ‘snappy’, ‘zstd’.
Для формата вывода AvroConfluent: имя subject, под которым схема регистрируется в Confluent Schema Registry. Обязательно при записи в формате вывода AvroConfluent.
Максимальное количество строк в файле (если это допускается хранилищем)
Для формата Avro: шаблон регулярного выражения для выбора столбцов String, которые следует интерпретировать как строки AVRO.
Интервал синхронизации, в байтах.
Записывать типы данных в бинарном формате вместо имён типов в выходном формате RowBinaryWithNamesAndTypes
Записывает значения типа данных JSON в виде значений JSON String в выходном формате RowBinary.
Использовать тип BSON String вместо Binary для столбцов типа String.
Уровень сжатия по умолчанию, если вывод запроса сжат. Настройка применяется, когда запрос SELECT использует INTO OUTFILE или при записи в табличные функции file, url, hdfs, s3 или azureBlobStorage.
Возможные значения: от 1 до 22
Может использоваться, если для сжатия вывода выбран метод zstd. Если значение больше 0, эта настройка явно задаёт размер окна сжатия (степень 2) и включает режим дальнего действия для сжатия zstd. Это может помочь добиться лучшего коэффициента сжатия.
Возможные значения: неотрицательные числа. Обратите внимание, что если значение слишком маленькое или слишком большое, zstdlib сгенерирует исключение. Типичные значения — от 20 (размер окна = 1MB) до 30 (размер окна = 1GB).
Если задано значение true, в формате CSV в качестве окончания строки будет использоваться \r\n вместо \n.
Если установлено значение true, то Tuple в формате CSV сериализуются в отдельные столбцы (то есть их вложенность теряется)
Выводить конечные нули при отображении значений Decimal. Например, 1.230000 вместо 1.23.
По умолчанию отключено.
Включает вывод всех строк в виде JSON-массива в формате JSONEachRow.
Возможные значения:
- 1 — ClickHouse выводит все строки как массив, где каждая строка имеет формат
JSONEachRow.
- 0 — ClickHouse выводит каждую строку отдельно в формате
JSONEachRow.
Пример запроса с включённой настройкой
Запрос:
SET output_format_json_array_of_rows = 1;
SELECT number FROM numbers(3) FORMAT JSONEachRow;
Результат:
[
{"number":"0"},
{"number":"1"},
{"number":"2"}
]
Пример запроса с отключённым параметром
Запрос:
SET output_format_json_array_of_rows = 0;
SELECT number FROM numbers(3) FORMAT JSONEachRow;
Результат:
{"number":"0"}
{"number":"1"}
{"number":"2"}
Управляет экранированием прямых слешей при выводе строк в формате JSON. Это сделано для совместимости с JavaScript. Не путайте с обратными слешами, которые экранируются всегда.
Включено по умолчанию.
Сериализует столбцы типа Map как JSON-массивы из кортежей.
По умолчанию отключена.
Сериализует столбцы именованных Tuple как объекты JSON.
Включено по умолчанию.
Эта настройка определяет, как вложенные структуры, такие как Tuple, Map и Array, отображаются в массиве data при использовании формата вывода JSON.
Например, вместо такого вывода:
"data":
[
{
"tuple": {"a":1,"b":2,"c":3},
"array": [1,2,3],
"map": {"a":1,"b":2,"c":3}
}
],
Вывод будет иметь следующий формат:
"data":
[
{
"tuple": {
"a": 1,
"b": 2,
"c": 3
},
"array": [
1,
2,
3
],
"map": {
"a": 1,
"b": 2,
"c": 3
}
}
],
Включено по умолчанию.
Управляет заключением в кавычки 64-битных чисел с плавающей запятой при выводе в форматах JSON*.
По умолчанию отключено.
Управляет тем, будут ли 64-битные и более крупные целые числа (например, UInt64 или Int128) заключаться в кавычки при выводе в формате JSON.
По умолчанию такие целые числа заключаются в кавычки. Такое поведение совместимо с большинством реализаций JavaScript.
Возможные значения:
- 0 — Целые числа выводятся без кавычек.
- 1 — Целые числа заключаются в кавычки.
Управляет тем, будут ли десятичные числа заключаться в кавычки в выходных JSON-форматах.
По умолчанию отключено.
Включает вывод значений +nan, -nan, +inf, -inf в формате вывода JSON.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Пример
Рассмотрим следующую таблицу account_orders:
┌─id─┬─name───┬─duration─┬─period─┬─area─┐
│ 1 │ Andrew │ 20 │ 0 │ 400 │
│ 2 │ John │ 40 │ 0 │ 0 │
│ 3 │ Bob │ 15 │ 0 │ -100 │
└────┴────────┴──────────┴────────┴──────┘
Когда output_format_json_quote_denormals = 0, запрос возвращает значения null на выходе:
SELECT area/period FROM account_orders FORMAT JSON;
{
"meta":
[
{
"name": "divide(area, period)",
"type": "Float64"
}
],
"data":
[
{
"divide(area, period)": null
},
{
"divide(area, period)": null
},
{
"divide(area, period)": null
}
],
"rows": 3,
"statistics":
{
"elapsed": 0.003648093,
"rows_read": 3,
"bytes_read": 24
}
}
Когда output_format_json_quote_denormals = 1, запрос возвращает:
{
"meta":
[
{
"name": "divide(area, period)",
"type": "Float64"
}
],
"data":
[
{
"divide(area, period)": "inf"
},
{
"divide(area, period)": "-nan"
},
{
"divide(area, period)": "-inf"
}
],
"rows": 3,
"statistics":
{
"elapsed": 0.000070241,
"rows_read": 3,
"bytes_read": 24
}
}
Пропускать пары «ключ-значение» со значением NULL при сериализации столбцов именованных Tuple как объектов JSON. Применяется только если output_format_json_named_tuples_as_objects имеет значение true.
Управляет проверкой последовательностей UTF-8 в форматах вывода JSON; не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, так как в них UTF-8 проверяется всегда.
По умолчанию отключено.
Если включено, экранирует специальные символы в Markdown.
Common Mark определяет следующие специальные символы, которые можно экранировать с помощью :
! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Определяет способ вывода UUID в формате MsgPack.
Записывает типы данных в бинарном формате вместо имён типов в формате вывода Native
Записывает данные столбцов JSON и Dynamic в плоском формате (все типы и пути представлены как отдельные подстолбцы).
Записывает данные JSON-столбца как столбец String, содержащий JSON-строки, вместо стандартной нативной JSON-сериализации.
Размер блока сжатия в байтах для выходного формата ORC.
Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (без сжатия)
Для строкового столбца в формате вывода ORC: если число различных значений превышает эту долю от общего числа строк, не равных NULL, кодирование с использованием словаря отключается. В противном случае кодирование с использованием словаря включается
Целевой шаг индексации строк в формате вывода ORC
Использовать тип ORC String вместо Binary для столбцов String
Название часового пояса для ORC writer; по умолчанию ORC writer использует часовой пояс GMT.
Включает или отключает параллельное форматирование данных. Поддерживается только для форматов TSV, TSKV, CSV и JSONEachRow.
Возможные значения:
- 1 — Включено.
- 0 — Отключено.
Проверяйте размер страницы через каждые N строк. Рассмотрите возможность уменьшить это значение, если средний размер значений в столбцах превышает несколько КБ.
Примерное число битов для каждого отдельного значения в bloom-фильтрах Parquet. Оценочные уровни ложноположительных срабатываний:
- 6 бит — 10%
- 10.5 бит — 1%
- 16.9 бит — 0.1%
- 26.4 бит — 0.01%
- 41 бит — 0.001%
Определяет, где в файле Parquet размещаются bloom-фильтры. Bloom-фильтры будут записываться группами приблизительно такого размера. В частности:
- если 0, bloom-фильтры каждой группы строк записываются сразу после группы строк,
- если значение больше общего размера всех bloom-фильтров, bloom-фильтры для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
- в противном случае bloom-фильтры будут накапливаться в памяти и записываться, когда их общий размер превысит это значение.
Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (без сжатия)
output_format_parquet_data_page_size
Целевой размер страницы в байтах, до сжатия.
Записывает значения Date как обычные 16-битные числа (при обратном чтении — UInt16) вместо преобразования в 32-битный тип Parquet DATE (при обратном чтении — Date32).
Записывает значения DateTime как сырую Unix-временную метку (при чтении — UInt32) вместо преобразования в миллисекунды (при чтении — DateTime64(3)).
Записывать Enum с использованием физического типа Parquet: BYTE_ARRAY и логического типа: ENUM
Использует тип Parquet FIXED_LEN_BYTE_ARRAY вместо Binary для столбцов FixedString.
Позволяет записывать сведения о гео-столбцах в метаданные Parquet и кодировать столбцы в формате WKB.
Если размер словаря превышает указанное количество байт, используется кодирование без словаря. Установите значение 0, чтобы отключить кодирование с использованием словаря.
Выполнять кодирование в формате Parquet в нескольких потоках.
Целевой размер группы строк в строках.
Целевой размер группы строк в байтах до сжатия.
Использовать тип Parquet String вместо Binary для столбцов String.
Записывать bloom-фильтры в файлы Parquet.
Добавляет контрольные суммы CRC32 в заголовки страниц Parquet.
output_format_parquet_write_page_index
Записывает индекс столбца и индекс смещений (то есть статистику по каждой странице данных, которую можно использовать для pushdown фильтров при чтении) в файлы Parquet.
Использовать ANSI-последовательности экранирования в форматах Pretty. 0 — отключено, 1 — включено, ‘auto’ — включено при выводе в терминал.
Отображает имена столбцов в нижнем колонтитуле, если в таблице много строк.
Возможные значения:
Пример
Запрос:
SELECT *, toTypeName(*) FROM (SELECT * FROM system.numbers LIMIT 1000);
Результат:
┌─number─┬─toTypeName(number)─┐
1. │ 0 │ UInt64 │
2. │ 1 │ UInt64 │
3. │ 2 │ UInt64 │
...
999. │ 998 │ UInt64 │
1000. │ 999 │ UInt64 │
└─number─┴─toTypeName(number)─┘
Задает минимальное количество строк, при котором отображается нижний колонтитул с именами столбцов, если включена настройка output_format_pretty_display_footer_column_names.
Если параметр включен и таблица широкая, но короткая, формат Pretty будет выводить её так же, как формат Vertical.
Подробную настройку этого поведения см. в output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width.
Переключение на формат Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если количество строк во фрагменте не превышает указанное значение.
Переход на формат Vertical (см. output_format_pretty_fallback_to_vertical) выполняется, только если количество столбцов больше указанного значения.
Переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) произойдёт только в том случае, если суммарная длина столбцов в таблице не меньше указанного значения или если хотя бы одно значение содержит символ новой строки.
Если данные в форматах Pretty поступают несколькими фрагментами, даже с задержкой, и при этом следующий фрагмент имеет ту же ширину столбцов, что и предыдущий, используются ANSI-последовательности экранирования, чтобы вернуться к предыдущей строке и перезаписать нижний колонтитул предыдущего фрагмента, продолжив его данными из нового фрагмента. Это делает вывод визуально более приятным.
0 — отключено, 1 — включено, ‘auto’ — включено при выводе в терминал.
Кодировка символов для вывода границ таблицы. Доступные кодировки: ASCII, UTF-8 (по умолчанию).
Если параметр включен и вывод осуществляется в терминал, цифры в разрядах тысяч, миллионов и т. д. будут подчеркнуты.
Если настройка включена и выводится в терминал, конечные пробелы выделяются серым цветом и подчеркиванием.
Если имя столбца слишком длинное, оно будет обрезано до этой длины.
Имя столбца будет обрезано, если его длина превышает output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.
Минимальное количество символов, на которое нужно сократить имя столбца, если оно слишком длинное.
Имя столбца будет обрезано, если его длина превышает output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.
Максимальная ширина дополнения для всех значений в столбце в форматах Pretty.
Ограничение на количество строк для форматов Pretty.
Максимальная ширина отображаемого значения в форматах Pretty. Если ширина больше, значение будет обрезано.
Значение 0 означает, что обрезка не выполняется никогда.
Обрезайте значения (см. настройку output_format_pretty_max_value_width) только в том случае, если это не одиночное значение в block. В противном случае выводите его целиком, что полезно для запроса SHOW CREATE TABLE.
Если включено, форматы Pretty будут отображать многострочные поля внутри ячеек таблицы, сохраняя её границы.
Если нет, они будут отображаться как есть, что может привести к искажению таблицы (при этом в отключенном состоянии многострочные значения будет проще копировать и вставлять).
Управляет тем, выводятся ли именованные кортежи в формате Pretty в виде красиво отформатированных объектов JSON.
Добавляет номера строк перед каждой строкой в выходном формате Pretty
Выводить справа от таблицы подсказку с удобочитаемым числом, если блок содержит одно число, превышающее это значение (кроме 0)
Ожидает следующий блок в течение указанного числа миллисекунд и перед записью объединяет его с предыдущим.
Это позволяет избежать слишком частого вывода слишком маленьких блоков, сохраняя при этом возможность потокового отображения данных.
Выводить ожидающий блок в форматах Pretty, если с момента предыдущего вывода прошло больше указанного количества миллисекунд.
При сериализации столбцов с типом Nullable с использованием обёрток Google значения по умолчанию сериализуются как пустые обёртки. Если параметр отключён, значения по умолчанию и значения NULL не сериализуются
Путь к файлу, в который будет сохранена автоматически сгенерированная схема в формате Cap’n Proto или Protobuf.
Включать имена столбцов в запрос INSERT
Максимальное количество строк в одном операторе INSERT.
Заключать имена столбцов в символы ```
Имя таблицы в выходном INSERT-запросе
Использовать оператор REPLACE вместо INSERT
Удаляет завершающие null-байты из значений FixedString в текстовых форматах вывода. Например, toFixedString('John', 8) выводится как John вместо John\0\0\0\0.
Если задано значение true, окончание строки в формате TSV будет \r\n вместо \n.
Если значение равно true, экранирует ’ как ”, в противном случае используется '
Выводит статистику о количестве прочитанных строк, байтов и затраченном времени в подходящих форматах вывода.
Включено по умолчанию
Использовать более точный (но более медленный) алгоритм разбора чисел с плавающей запятой
Список имён столбцов и типов, используемых в качестве подсказок при определении схемы для форматов без схемы.
Пример:
Запрос:
desc format(JSONEachRow, '{"x" : 1, "y" : "String", "z" : "0.0.0.0" }') settings schema_inference_hints='x UInt8, z IPv4';
Результат:
x UInt8
y Nullable(String)
z IPv4
Если schema_inference_hints отформатирован неправильно или содержит опечатку, неверный тип данных и т. п., то schema_inference_hints будет полностью проигнорирован.
schema_inference_make_columns_nullable
Управляет тем, будут ли типы, определённые при определении схемы, иметь тип Nullable.
Возможные значения:
- 0 - тип, определённый при определении схемы, никогда не будет
Nullable (используйте input_format_null_as_default, чтобы указать, что делать со значениями NULL в этом случае),
- 1 - все типы, определённые при определении схемы, будут
Nullable,
- 2 or
auto - тип, определённый при определении схемы, будет Nullable только если столбец содержит NULL в образце, разбираемом во время определения схемы, или если метаданные файла содержат информацию о допустимости NULL для столбца,
- 3 - допустимость
NULL для типа, определённого при определении схемы, будет соответствовать метаданным файла, если формат её поддерживает (например, Parquet); в противном случае тип всегда будет Nullable (например, CSV).
schema_inference_make_json_columns_nullable
Управляет тем, будут ли автоматически определённые типы JSON делаться Nullable при определении схемы.
Если этот параметр включён вместе с schema_inference_make_columns_nullable, автоматически определённый тип JSON будет Nullable.
Режим определения схемы. ‘default’ — предполагается, что все файлы имеют одинаковую схему и её можно определить по любому файлу; ‘union’ — файлы могут иметь разные схемы, и итоговая схема должна представлять собой объединение схем всех файлов
show_create_query_identifier_quoting_rule
Задает правило заключения идентификаторов в кавычки в запросе SHOW CREATE
show_create_query_identifier_quoting_style
Задает стиль заключения идентификаторов в кавычки в запросе SHOW CREATE
type_json_allow_duplicated_key_with_literal_and_nested_object
Если включено, разрешается разбирать JSON-документы вида {"a" : 42, "a" : {"b" : 42}}, где ключ дублируется, но одно из его вхождений является вложенным объектом.
type_json_skip_duplicated_paths
Если включено, при разборе объекта JSON в тип JSON дублирующиеся пути будут игнорироваться, и вместо исключени будет вставлен только первый
type_json_skip_invalid_typed_paths
Если параметр включен, поля со значениями, которые невозможно привести к объявленному типу в столбцах с типом JSON и типизированными путями, пропускаются вместо генерации ошибки. Пропущенные поля считаются отсутствующими, и для них используются значения по умолчанию/NULL в соответствии с определением типизированного пути.
Этот параметр применяется только к столбцам с типом JSON (например, JSON(a Int64, b String)), где для определённых путей объявлены типы. Он не применяется к обычным JSON input formats, таким как JSONEachRow, при вставке в обычные типизированные столбцы.
Возможные значения:
- 0 — Отключено (ошибка при несоответствии типов).
- 1 — Включено (поле пропускается при несоответствии типов).
type_json_use_partial_match_to_skip_paths_by_regexp
Если включено, то при разборе объекта JSON в тип JSON для пропуска пути регулярным выражениям, указанным с помощью SKIP REGEXP, будет достаточно частичного совпадения. Если отключено, потребуется полное совпадение.
validate_experimental_and_suspicious_types_inside_nested_types
Проверяет использование экспериментальных и подозрительных типов во вложенных типах, таких как Array/Map/Tuple Последнее изменение 10 июня 2026 г.