메인 콘텐츠로 건너뛰기
이 함수는 paimon 테이블 함수의 확장 기능입니다. 지정된 클러스터의 여러 노드에서 Apache Paimon 파일을 병렬로 처리할 수 있습니다. initiator에서는 클러스터의 모든 노드에 연결을 생성하고 각 파일을 동적으로 분배합니다. worker 노드에서는 initiator에 다음으로 처리할 작업을 요청해 처리합니다. 이 과정은 모든 작업이 완료될 때까지 반복됩니다.

구문

paimonS3Cluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

paimonAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])

paimonHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])

인수

  • cluster_name — 원격 및 로컬 서버의 주소 집합과 연결 매개변수를 구성하는 데 사용되는 클러스터의 이름입니다.
  • 다른 모든 인수에 대한 설명은 해당 paimon 테이블 함수의 인수 설명과 동일합니다.
  • 선택적 extra_credentials 매개변수는 ClickHouse Cloud에서 역할 기반 접근을 위해 role_arn을 전달하는 데 사용할 수 있습니다. 구성 단계는 Secure S3를 참조하십시오.
반환 값 지정된 Paimon 테이블에서 클러스터의 데이터를 읽기 위한, 지정된 구조의 테이블입니다.

가상 컬럼

  • _path — 파일 경로입니다. 유형: LowCardinality(String).
  • _file — 파일 이름입니다. 유형: LowCardinality(String).
  • _size — 파일 크기(바이트)입니다. 유형: Nullable(UInt64). 파일 크기를 알 수 없으면 값은 NULL입니다.
  • _time — 파일의 마지막 수정 시각입니다. 유형: Nullable(DateTime). 시각을 알 수 없으면 값은 NULL입니다.
  • _etag — 파일의 etag입니다. 유형: LowCardinality(String). etag를 알 수 없으면 값은 NULL입니다.
관련 항목
마지막 수정일 2026년 6월 10일