跳转到主要内容
你可以在这里加入私有预览候补名单。
BigQuery ClickPipe 提供了一种完全托管且具备高弹性的方式,可将 BigQuery 中的数据摄取到 ClickHouse Cloud。在私有预览阶段,它支持 initial load 复制方法,帮助你批量加载 BigQuery 数据集,以便进行探索和原型验证。未来将支持 CDC (变更数据捕获) ;在此之前,我们建议你在 initial load 完成后,使用 Google Cloud Storage ClickPipe 持续将 BigQuery 导出的数据同步到 ClickHouse Cloud。 BigQuery ClickPipes 既可通过 ClickPipes UI 手动部署和管理,也可通过 OpenAPITerraform 以编程方式进行部署和管理。

前提条件

  • 您必须具备在 GCP 项目中管理服务账号IAM roles 的权限,或者获得管理员协助。我们建议按照官方文档创建一个专用服务账号,并仅授予所需的最小权限
  • 初始加载过程需要用户提供一个 Google Cloud Storage (GCS) 存储桶用于暂存。我们建议按照官方文档为您的 ClickPipe 创建一个专用存储桶。未来,该中间存储桶将由 ClickPipes 提供并管理。
1

选择数据源

1. 在 ClickHouse Cloud 中,从主导航菜单选择 Data sources,然后点击 Create ClickPipe2. 点击 BigQuery 卡片。
2

设置你的 ClickPipe 连接

要设置新的 ClickPipe,你需要提供连接并验证 BigQuery 数据仓库所需的信息,以及一个用于暂存的 GCS 存储桶。1. 上传你为 ClickPipes 创建的服务账号 .json 密钥文件。确保该服务账号具备所需的最小权限集 permissions2. 选择 Replication method。在私有预览阶段,当前唯一支持的选项是 仅初始加载3. 提供初始加载期间用于暂存数据的 GCS 存储桶路径。4. 点击 Next 进行验证。
3

配置你的 ClickPipe

根据 BigQuery 数据集的大小,或你想同步的表的总大小,你可能需要调整 ClickPipe 的默认摄取设置。
4

配置表

1. 选择要将 BigQuery 表复制到的 ClickHouse 数据库。你可以选择现有数据库,也可以新建数据库。2. 选择要复制的表,以及可选的列。只有该服务账号有权访问的数据集才会显示在列表中。3. 对于每个选中的表,请务必在 Advanced settings > Use a custom sorting key 下定义自定义排序键。未来,系统将根据上游数据库中现有的聚类键或分区键自动推断排序键。
必须为复制表定义 排序键,以优化 ClickHouse 中的查询性能。否则,排序键将被设置为 tuple(),这意味着不会创建主索引,ClickHouse 将对该表上的所有查询执行全表扫描。
5

配置权限

最后,你可以为内部 ClickPipes 用户配置权限。Permissions: ClickPipes 会创建一个专用用户,用于将数据写入目标表。你可以为该内部用户选择自定义角色,或以下预定义角色之一:
  • Full access:对集群具有完全访问权限。如果你要将 materialized views 或字典与目标表配合使用,则需要此权限。
  • Only destination:仅具有向目标表插入数据的权限。
6

完成设置

点击 Create ClickPipe 完成设置。随后你将被重定向到概览页面,在那里可以查看初始加载的进度,并点击查看 BigQuery ClickPipes 的详细信息。
最后修改于 2026年6月10日