approx_top_k

Добавленный в: v1.1.0 Возвращает массив приблизительно наиболее часто встречающихся значений и числа их вхождений в указанном столбце. Результирующий массив сортируется по убыванию приблизительной частоты значений (а не по самим значениям). Эта функция не гарантирует точный результат. В некоторых ситуациях возможны ошибки, и она может возвращать частые значения, которые не являются наиболее частыми. Синтаксис

approx_top_k(N[, reserved])(column)

Псевдонимы: approx_top_count Параметры

N — Количество возвращаемых элементов. Значение по умолчанию: 10. Максимальное значение N = 65536. UInt64
reserved — Необязательный параметр. Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат будет приблизительным. Значение по умолчанию: N * 3. UInt64

Аргументы

column — Имя столбца, для которого нужно найти наиболее часто встречающиеся значения. String

Возвращаемое значение Возвращает массив приблизительно наиболее часто встречающихся значений и числа их вхождений, отсортированный по убыванию приблизительной частоты. Array Примеры Пример использования

Query

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

Response

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

См. также

​approx_top_k

approx_top_k