Saltar al contenido principal
Esta es una extensión de la función de tabla paimon. Permite procesar archivos de Apache Paimon en paralelo desde varios nodos de un clúster especificado. En el nodo iniciador, crea una conexión con todos los nodos del clúster y distribuye dinámicamente cada archivo. En el nodo worker, consulta al iniciador cuál es la siguiente tarea que debe procesar y la procesa. Esto se repite hasta que se hayan completado todas las tareas.

Sintaxis

paimonS3Cluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

paimonAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])

paimonHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])

Argumentos

  • cluster_name — Nombre del clúster que se utiliza para construir un conjunto de direcciones y parámetros de conexión para servidores remotos y locales.
  • La descripción del resto de los argumentos coincide con la de los argumentos de la función de tabla paimon equivalente.
  • Se puede usar un parámetro opcional, extra_credentials, para pasar un role_arn para el acceso basado en roles en ClickHouse Cloud. Consulta Secure S3 para ver los pasos de configuración.
Valor devuelto Una tabla con la estructura especificada para leer datos del clúster desde la tabla Paimon especificada.

Columnas virtuales

  • _path — Ruta del archivo. Tipo: LowCardinality(String).
  • _file — Nombre del archivo. Tipo: LowCardinality(String).
  • _size — Tamaño del archivo en bytes. Tipo: Nullable(UInt64). Si se desconoce el tamaño del archivo, el valor es NULL.
  • _time — Fecha y hora de la última modificación del archivo. Tipo: Nullable(DateTime). Si se desconoce la hora, el valor es NULL.
  • _etag — El etag del archivo. Tipo: LowCardinality(String). Si se desconoce el etag, el valor es NULL.
Véase también
Última modificación el 10 de junio de 2026