| Отзывы покупателей Amazon | Более 150 млн отзывов покупателей о товарах Amazon |
| AMPLab Big Data Benchmark | Бенчмарк-набор данных, используемый для сравнения производительности решений для хранилищ данных. |
| Анализ данных Stack Overflow в ClickHouse | Анализ данных Stack Overflow в ClickHouse |
| Анонимизированная веб-аналитика | Набор данных из двух таблиц с анонимизированными данными веб-аналитики: hits и visits |
| Бенчмарк Университета Брауна | Новый аналитический бенчмарк для машинно-генерируемых лог-данных |
| Открытые данные о COVID-19 | COVID-19 Open-Data — это крупная база эпидемиологических данных о COVID-19 с открытым исходным кодом, а также связанных факторов, таких как демография, экономика и меры реагирования правительств |
| набор данных DBpedia | Набор данных, содержащий 1 миллион статей из Википедии и их векторные представления |
| Данные с датчиков окружающей среды | Более 20 миллиардов записей из Sensor.Community — глобальной сети датчиков, созданной сообществом участников и формирующей открытые экологические данные. |
| Места Foursquare | Набор данных, содержащий более 100 миллионов записей с информацией об объектах на карте: магазинах, ресторанах, парках, детских площадках и памятниках. |
| Геоданные на основе набора данных о вышках сотовой связи | Узнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель мониторинга на основе этих данных |
| Набор данных с событиями GitHub | Набор данных, содержащий все события GitHub с 2011 года по 6 декабря 2020 года; его объём составляет 3,1 млрд записей. |
| Hacker News dataset | Набор данных, содержащий 28 миллионов строк из Hacker News. |
| Набор данных Hacker News для векторного поиска | Набор данных, содержащий более 28 миллионов публикаций Hacker News & их векторные представления |
| Набор данных LAION 5B | Набор данных со 100 миллионами векторов из датасета LAION 5B |
| Датасет Laion-400M | Датасет, содержащий 400 миллионов изображений с англоязычными подписями |
| Датасет New York Public Library “What’s on the Menu?” | Набор данных, содержащий 1,3 миллиона записей с историческими данными о меню отелей, ресторанов и кафе, включая блюда и их цены. |
| Данные о такси Нью-Йорка | Данные о миллиардах поездок на такси и арендованных автомобилях с водителем (Uber, Lyft и т. д.), совершённых в Нью-Йорке с 2009 года |
| NOAA Global Historical Climatology Network | 2,5 миллиарда строк климатических данных за последние 120 лет |
| Данные о жалобах в NYPD | Приём данных в формате Tab Separated Value и выполнение запросов к ним за 5 шагов |
| OnTime | Набор данных о пунктуальности авиарейсов |
| Star Schema Benchmark (SSB, 2009) | Набор данных и запросы для Star Schema Benchmark (SSB) |
| Исторические наборы данных о погоде на Тайване | 131 миллион строк данных метеонаблюдений за последние 128 лет |
| Терабайт данных о кликах от Criteo | Терабайт данных о кликах от Criteo |
| Набор данных о ценах на недвижимость в Великобритании | Узнайте, как использовать проекции для повышения производительности часто выполняемых запросов к набору данных о недвижимости в Великобритании, содержащему данные о ценах на недвижимость в Англии и Уэльсе |
| TPC-DS (2012) | Набор данных и запросы бенчмарка TPC-DS. |
| TPC-H (1999) | Набор данных и запросы бенчмарка TPC-H. |
| WikiStat | Изучите набор данных WikiStat, содержащий 0,5 триллиона записей. |
| Написание запросов в ClickHouse на основе данных GitHub | Набор данных, содержащий все коммиты и изменения в репозитории ClickHouse |
| Набор данных YouTube о дизлайках | Подборка дизлайков к видео на YouTube. |