Добавленный в: v1.1.0
Возвращает массив приблизительно наиболее часто встречающихся значений и числа их вхождений в указанном столбце.
Результирующий массив сортируется по убыванию приблизительной частоты значений (а не по самим значениям).
Эта функция не гарантирует точный результат.
В некоторых ситуациях возможны ошибки, и она может возвращать частые значения, которые не являются наиболее частыми.
Синтаксис
approx_top_k(N[, reserved])(column)
Псевдонимы: approx_top_count
Параметры
N — Количество возвращаемых элементов. Значение по умолчанию: 10. Максимальное значение N = 65536. UInt64
reserved — Необязательный параметр. Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат будет приблизительным. Значение по умолчанию: N * 3. UInt64
Аргументы
column — Имя столбца, для которого нужно найти наиболее часто встречающиеся значения. String
Возвращаемое значение
Возвращает массив приблизительно наиболее часто встречающихся значений и числа их вхождений, отсортированный по убыванию приблизительной частоты. Array
Примеры
Пример использования
SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘
См. также
Последнее изменение 10 июня 2026 г.