Saltar al contenido principal
Estos tutoriales funcionan con cualquier implementación de ClickHouse, incluida ClickHouse Cloud.
Disponemos de muchos recursos para ayudarte a empezar y a entender cómo funciona ClickHouse: Además, los conjuntos de datos de ejemplo son una excelente forma de trabajar con ClickHouse, aprender técnicas y trucos importantes, y ver cómo sacar partido de las numerosas y potentes funciones de ClickHouse. Los conjuntos de datos de ejemplo incluyen:
PáginaDescripción
Reseñas de clientes de AmazonMás de 150 M de reseñas de clientes sobre productos de Amazon.
AMPLab Big Data BenchmarkUn conjunto de datos de benchmark utilizado para comparar el rendimiento de soluciones de almacenamiento de datos.
Análisis de datos de Stack Overflow con ClickHouseAnálisis de datos de Stack Overflow con ClickHouse
Analítica web anonimizadaConjunto de datos formado por dos tablas que contienen datos anonimizados de analítica web con hits y visits
Benchmark de la Universidad de BrownUn nuevo benchmark analítico para datos de logs generados por máquinas
Datos abiertos sobre la COVID-19COVID-19 Open-Data es una gran base de datos de código abierto sobre datos epidemiológicos de la COVID-19 y factores relacionados, como la demografía, la economía y las respuestas gubernamentales
conjunto de datos de DBpediaConjunto de datos con 1 millón de artículos de Wikipedia y sus embeddings vectoriales
Datos de sensores ambientalesMás de 20 mil millones de registros de datos de Sensor.Community, una red global de sensores basada en contribuciones de la comunidad que crea Open Environmental Data.
Lugares de FoursquareConjunto de datos con más de 100 millones de registros que contienen información sobre lugares en un mapa, como tiendas, restaurantes, parques, zonas de juegos y monumentos.
Datos geográficos con el conjunto de datos de torres de telefonía móvilAprende a cargar datos de OpenCelliD en ClickHouse, conectar Apache Superset a ClickHouse y crear un dashboard basado en esos datos
Conjunto de datos de eventos de GitHubConjunto de datos que contiene todos los eventos de GitHub desde 2011 hasta el 6 de diciembre de 2020, con un total de 3.100 millones de registros.
Hacker News datasetConjunto de datos con 28 millones de filas de Hacker News.
Conjunto de datos de búsqueda vectorial de Hacker NewsConjunto de datos con más de 28 millones de publicaciones de Hacker News y sus embeddings vectoriales
Conjunto de datos LAION 5BConjunto de datos con 100 millones de vectores del conjunto de datos LAION 5B
Conjunto de datos LAION-400MConjunto de datos con 400 millones de imágenes con descripciones en inglés
Conjunto de datos “What’s on the Menu?” de la Biblioteca Pública de Nueva YorkConjunto de datos que contiene 1,3 millones de registros históricos sobre los menús de hoteles, restaurantes y cafeterías, con los platos y sus precios.
Datos de taxis de Nueva YorkDatos de miles de millones de trayectos en taxi y vehículos de transporte con conductor (Uber, Lyft, etc.) con origen en la ciudad de Nueva York desde 2009
NOAA Global Historical Climatology Network2,5 mil millones de filas de datos climáticos de los últimos 120 años
datos de denuncias del NYPDIngeste y consulte datos en formato de valores separados por tabulaciones en 5 pasos
OnTimeConjunto de datos que contiene información sobre la puntualidad de los vuelos de aerolíneas
Star Schema Benchmark (SSB, 2009)El conjunto de datos y las consultas de Star Schema Benchmark (SSB)
Conjuntos de datos meteorológicos históricos de Taiwán131 millones de filas de datos de observación meteorológica de los últimos 128 años
Registros de clics de Criteo de un terabyteUn terabyte de registros de clics de Criteo
El conjunto de datos de precios de viviendas del Reino UnidoAprende a usar proyecciones para mejorar el rendimiento de las consultas que ejecutas con frecuencia con el conjunto de datos inmobiliarios del Reino Unido, que contiene datos sobre los precios pagados por bienes inmuebles en Inglaterra y Gales
TPC-DS (2012)El conjunto de datos y las consultas del benchmark TPC-DS.
TPC-H (1999)El conjunto de datos y las consultas del benchmark TPC-H.
WikiStatExplora el conjunto de datos WikiStat, que contiene 500 mil millones de registros.
Escribir consultas en ClickHouse con datos de GitHubConjunto de datos que contiene todos los commits y cambios del repositorio de ClickHouse
Conjunto de datos de “No me gusta” de YouTubeUna colección de “No me gusta” de videos de YouTube.
Última modificación el 10 de junio de 2026