| Reseñas de clientes de Amazon | Más de 150 M de reseñas de clientes sobre productos de Amazon. |
| AMPLab Big Data Benchmark | Un conjunto de datos de benchmark utilizado para comparar el rendimiento de soluciones de almacenamiento de datos. |
| Análisis de datos de Stack Overflow con ClickHouse | Análisis de datos de Stack Overflow con ClickHouse |
| Analítica web anonimizada | Conjunto de datos formado por dos tablas que contienen datos anonimizados de analítica web con hits y visits |
| Benchmark de la Universidad de Brown | Un nuevo benchmark analítico para datos de logs generados por máquinas |
| Datos abiertos sobre la COVID-19 | COVID-19 Open-Data es una gran base de datos de código abierto sobre datos epidemiológicos de la COVID-19 y factores relacionados, como la demografía, la economía y las respuestas gubernamentales |
| conjunto de datos de DBpedia | Conjunto de datos con 1 millón de artículos de Wikipedia y sus embeddings vectoriales |
| Datos de sensores ambientales | Más de 20 mil millones de registros de datos de Sensor.Community, una red global de sensores basada en contribuciones de la comunidad que crea Open Environmental Data. |
| Lugares de Foursquare | Conjunto de datos con más de 100 millones de registros que contienen información sobre lugares en un mapa, como tiendas, restaurantes, parques, zonas de juegos y monumentos. |
| Datos geográficos con el conjunto de datos de torres de telefonía móvil | Aprende a cargar datos de OpenCelliD en ClickHouse, conectar Apache Superset a ClickHouse y crear un dashboard basado en esos datos |
| Conjunto de datos de eventos de GitHub | Conjunto de datos que contiene todos los eventos de GitHub desde 2011 hasta el 6 de diciembre de 2020, con un total de 3.100 millones de registros. |
| Hacker News dataset | Conjunto de datos con 28 millones de filas de Hacker News. |
| Conjunto de datos de búsqueda vectorial de Hacker News | Conjunto de datos con más de 28 millones de publicaciones de Hacker News y sus embeddings vectoriales |
| Conjunto de datos LAION 5B | Conjunto de datos con 100 millones de vectores del conjunto de datos LAION 5B |
| Conjunto de datos LAION-400M | Conjunto de datos con 400 millones de imágenes con descripciones en inglés |
| Conjunto de datos “What’s on the Menu?” de la Biblioteca Pública de Nueva York | Conjunto de datos que contiene 1,3 millones de registros históricos sobre los menús de hoteles, restaurantes y cafeterías, con los platos y sus precios. |
| Datos de taxis de Nueva York | Datos de miles de millones de trayectos en taxi y vehículos de transporte con conductor (Uber, Lyft, etc.) con origen en la ciudad de Nueva York desde 2009 |
| NOAA Global Historical Climatology Network | 2,5 mil millones de filas de datos climáticos de los últimos 120 años |
| datos de denuncias del NYPD | Ingeste y consulte datos en formato de valores separados por tabulaciones en 5 pasos |
| OnTime | Conjunto de datos que contiene información sobre la puntualidad de los vuelos de aerolíneas |
| Star Schema Benchmark (SSB, 2009) | El conjunto de datos y las consultas de Star Schema Benchmark (SSB) |
| Conjuntos de datos meteorológicos históricos de Taiwán | 131 millones de filas de datos de observación meteorológica de los últimos 128 años |
| Registros de clics de Criteo de un terabyte | Un terabyte de registros de clics de Criteo |
| El conjunto de datos de precios de viviendas del Reino Unido | Aprende a usar proyecciones para mejorar el rendimiento de las consultas que ejecutas con frecuencia con el conjunto de datos inmobiliarios del Reino Unido, que contiene datos sobre los precios pagados por bienes inmuebles en Inglaterra y Gales |
| TPC-DS (2012) | El conjunto de datos y las consultas del benchmark TPC-DS. |
| TPC-H (1999) | El conjunto de datos y las consultas del benchmark TPC-H. |
| WikiStat | Explora el conjunto de datos WikiStat, que contiene 500 mil millones de registros. |
| Escribir consultas en ClickHouse con datos de GitHub | Conjunto de datos que contiene todos los commits y cambios del repositorio de ClickHouse |
| Conjunto de datos de “No me gusta” de YouTube | Una colección de “No me gusta” de videos de YouTube. |