跳转到主要内容
这些教程适用于任何 ClickHouse 部署方式,包括 ClickHouse Cloud
我们提供了丰富的资源,帮助您快速上手并了解 ClickHouse 的工作原理: 此外,示例数据集也是学习 ClickHouse 的绝佳方式, 可以帮助您掌握重要的技术和技巧,并了解如何充分利用 ClickHouse 的众多强大 函数。示例数据集包括:
页面描述
亚马逊客户评价超过 1.5 亿条亚马逊产品客户评价
AMPLab Big Data Benchmark用于比较数据仓库解决方案性能的基准数据集。
使用 ClickHouse 分析 Stack Overflow 数据使用 ClickHouse 分析 Stack Overflow 数据
匿名化网站分析由两个表组成的数据集,包含匿名化的网站分析数据,表名为 hits 和 visits
布朗大学基准测试一项面向机器生成日志数据的新分析基准测试
COVID-19 开放数据COVID-19 Open-Data 是一个大型开源数据库,涵盖 COVID-19 流行病学数据以及人口统计、经济和政府应对等相关因素
DBpedia 数据集包含来自 Wikipedia 的 100 万篇文章及其嵌入向量的数据集
环境传感器数据来自 Sensor.Community 的超过 200 亿条记录的数据;该平台是一个由贡献者驱动、用于创建开放环境数据的全球传感器网络。
Foursquare 地点数据包含超过 1 亿条记录的数据集,涵盖地图上各类地点的信息,例如商店、餐厅、公园、游乐场和纪念碑。
使用蜂窝基站数据集的 Geo data了解如何将 OpenCelliD 数据加载到 ClickHouse、将 Apache Superset 连接到 ClickHouse,并基于这些数据构建仪表板
GitHub 事件数据集包含 GitHub 自 2011 年至 2020 年 12 月 6 日期间所有事件的数据集,共有 31 亿条记录。
Hacker News 数据集包含 2800 万行 Hacker News 数据的数据集。
Hacker News 向量搜索数据集包含 2800 多万个 Hacker News 帖子及其嵌入向量的数据集
LAION 5B 数据集包含来自 LAION 5B 数据集的 1 亿个向量的数据集
Laion-400M 数据集包含 4 亿张配有英文图片说明文字的图像的数据集
纽约公共图书馆 “What’s on the Menu?” 数据集包含 130 万条历史记录的数据集,收录了酒店、餐厅和咖啡馆的菜单,以及菜品及其价格。
纽约出租车数据自 2009 年以来纽约市数十亿条出租车和租赁车辆 (Uber、Lyft 等) 行程数据
NOAA 全球历史气候网络过去 120 年的 25 亿行气候数据
NYPD 投诉数据5 步摄取并查询制表符分隔值数据
OnTime包含航空公司航班准点率表现的数据集
Star Schema Benchmark (SSB, 2009)Star Schema Benchmark (SSB) 数据集及其查询
台湾历史天气数据集过去 128 年间的 1.31 亿行天气观测数据
来自 Criteo 的 TB 级点击日志来自 Criteo 的 1 TB 点击日志
英国房地产价格数据集了解如何使用 projections 提升常用查询的性能。该英国房地产数据集包含英格兰和威尔士的房地产成交价格数据
TPC-DS (2012)TPC-DS 基准测试数据集及其查询。
TPC-H (1999)TPC-H 基准测试数据集及其查询。
WikiStat探索包含 0.5 万亿条记录的 WikiStat 数据集。
使用 GitHub 数据在 ClickHouse 中编写查询包含 ClickHouse 仓库中所有提交和变更的数据集
YouTube 点踩数据集YouTube 视频点踩数据集合。
最后修改于 2026年6月10日