La función url crea una tabla a partir de una URL con el format y la estructura especificados.
La función url puede utilizarse en consultas SELECT e INSERT sobre datos de tablas URL.
url(URL [,format] [,structure] [,headers])
| Parámetro | Descripción |
|---|
URL | Dirección del servidor HTTP o HTTPS entre comillas simples, que puede aceptar peticiones GET o POST (para consultas SELECT o INSERT, respectivamente). Tipo: String. |
format | Format de los datos. Tipo: String. |
structure | Structure de la tabla en el formato 'UserID UInt64, Name String'. Determina los nombres de las columnas y sus tipos. Tipo: String. |
headers | Encabezados en el formato 'headers('key1'='value1', 'key2'='value2')'. Puede configurar encabezados para la llamada HTTP. |
Una tabla con el formato y la estructura especificados, y con datos de la URL indicada.
Obtener las primeras 3 líneas de una tabla que contiene columnas de tipo String y UInt32 desde un servidor HTTP que responde en formato CSV.
SELECT * FROM url('http://127.0.0.1:12345/', CSV, 'column1 String, column2 UInt32', headers('Accept'='text/csv; charset=utf-8')) LIMIT 3;
Insertar datos de una URL en una tabla:
CREATE TABLE test_table (column1 String, column2 UInt32) ENGINE=Memory;
INSERT INTO FUNCTION url('http://127.0.0.1:8123/?query=INSERT+INTO+test_table+FORMAT+CSV', 'CSV', 'column1 String, column2 UInt32') VALUES ('http interface', 42);
SELECT * FROM test_table;
Los patrones entre { } se utilizan para generar un conjunto de segmentos o para especificar direcciones de failover. Para ver los tipos de patrones admitidos y ejemplos, consulte la descripción de la función remote.
El carácter | dentro de los patrones se utiliza para especificar direcciones de failover. Se recorren en el mismo orden en que aparecen en el patrón. El número de direcciones generadas está limitado por la configuración glob_expansion_max_elements.
_path — Ruta de la URL. Tipo: LowCardinality(String).
_file — Nombre del recurso de la URL. Tipo: LowCardinality(String).
_size — Tamaño del recurso en bytes. Tipo: Nullable(UInt64). Si se desconoce el tamaño, el valor es NULL.
_time — Fecha y hora de la última modificación del archivo. Tipo: Nullable(DateTime). Si se desconoce la hora, el valor es NULL.
_headers - Encabezados de la respuesta HTTP. Tipo: Map(LowCardinality(String), LowCardinality(String)).
configuración use_hive_partitioning
Cuando la configuración use_hive_partitioning se establece en 1, ClickHouse detecta el particionamiento al estilo Hive en la ruta (/name=value/) y permite usar las columnas de partición como columnas virtuales en la consulta. Estas columnas virtuales tendrán los mismos nombres que en la ruta particionada.
Ejemplo
Uso de una columna virtual creada con particionamiento al estilo Hive
SELECT * FROM url('http://data/path/date=*/country=*/code=*/*.parquet') WHERE date > '2020-01-01' AND country = 'Netherlands' AND code = 42;
Resolución de URL relativas
La configuración url_base permite pasar una URL relativa a la función url. Cuando se establece url_base y el argumento de la función es una referencia relativa, esta se resuelve con respecto a la URL base según RFC 3986.
Las reglas de resolución son:
- Relativa a la ruta (p. ej.,
data.csv): se combina con la ruta de la URL base; todo lo que aparece después de la última / de la ruta base se reemplaza. La barra diagonal final importa: https://example.com/dir/ + data.csv da https://example.com/dir/data.csv, pero https://example.com/dir + data.csv da https://example.com/data.csv. Los segmentos de punto (./ y ../) se normalizan.
- Relativa al host (p. ej.,
/test/data.csv): se resuelve usando el esquema y el host de la URL base.
- Relativa al esquema (p. ej.,
//other.com/test/data.csv): se resuelve usando el esquema de la URL base.
- Solo cadena de consulta (p. ej.,
?x=1): se añade a la ruta base completa y reemplaza cualquier cadena de consulta o fragmento existente.
- Solo fragmento (p. ej.,
#frag): se añade a la URL base, conserva la cadena de consulta y reemplaza cualquier fragmento existente.
- Vacía: devuelve la URL base sin fragmento.
- URL absoluta: se pasa sin cambios;
url_base se ignora.
Ejemplo
SET url_base = 'https://raw.githubusercontent.com/ClickHouse/ClickHouse/master/';
SELECT * FROM url('tests/queries/0_stateless/data_csv/data.csv', CSV) LIMIT 3;
Configuración de almacenamiento
- engine_url_skip_empty_files - permite omitir archivos vacíos durante la lectura. Desactivado de forma predeterminada.
- enable_url_encoding - permite activar/desactivar la codificación y decodificación de la ruta en el URI. Activado de forma predeterminada.
- url_base - URL base para resolver las URL relativas que se pasan a la función
url.
La función url requiere el permiso CREATE TEMPORARY TABLE. Por lo tanto, no funcionará para los usuarios con la opción readonly = 1. Se requiere como mínimo readonly = 2.
Última modificación el 10 de junio de 2026