Агрегатные функции

ClickHouse поддерживает все стандартные агрегатные функции SQL (sum, avg, min, max, count), а также широкий набор других агрегатных функций.

Страница	Описание
aggThrow	Эту функцию можно использовать для проверки гарантий безопасности относительно исключений. При создании она будет выбрасывать исключение с заданной вероятностью.
analysisOfVariance	Предоставляет статистический критерий для однофакторного дисперсионного анализа (ANOVA). Это критерий для нескольких групп нормально распределённых наблюдений, позволяющий проверить, одинаковы ли их средние значения.
any	Выбирает первое встретившееся значение столбца.
anyHeavy	Выбирает часто встречающееся значение с помощью алгоритма heavy hitters. Если существует значение, которое встречается более чем в половине случаев в каждом потоке выполнения запроса, именно оно возвращается. Как правило, результат является недетерминированным.
anyLast	Выбирает последнее встреченное значение в столбце.
approx_top_k	Возвращает массив приблизительно самых часто встречающихся значений в указанном столбце и соответствующих им количеств.
approx_top_sum	Возвращает массив приблизительно наиболее часто встречающихся значений и количеств их вхождений в указанном столбце.
argMax	Вычисляет значение `arg`, соответствующее максимальному значению `val`.
argMin	Вычисляет значение `arg` для минимального значения `val`. Если существует несколько строк с одинаковым значением `val`, являющимся максимальным, то то, какое из соответствующих значений `arg` будет возвращено, не определено (недетерминированно).
groupArrayArray	Объединяет массивы в один более крупный массив массивов.
argAndMax	Вычисляет значения `arg` и `val`, соответствующие максимальному значению `val`. Если существует несколько строк с одинаковым максимальным значением `val`, выбор возвращаемых связанных значений `arg` и `val` является недетерминированным.
argAndMin	Вычисляет значения `arg` и `val` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то заранее не определено, какие из соответствующих `arg` и `val` будут возвращены.
avg	Вычисляет арифметическое среднее.
avgWeighted	Вычисляет взвешенное среднее арифметическое.
boundingRatio	Агрегатная функция, вычисляющая наклон между крайней левой и крайней правой точками в группе значений.
categoricalInformationValue	Вычисляет значение `(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0)))` для каждой категории.
contingency	Функция `contingency` вычисляет коэффициент сопряжённости — показатель, который измеряет степень связи между двумя столбцами в таблице. Вычисление аналогично функции `cramersV`, но использует другой знаменатель под знаком квадратного корня.
corr	Вычисляет коэффициент корреляции Пирсона.
corrMatrix	Вычисляет корреляционную матрицу для N переменных.
corrStable	Вычисляет коэффициент корреляции Пирсона, но при этом использует численно устойчивый алгоритм.
count	Подсчитывает количество строк или значений, не равных NULL.
covarPop	Вычисляет ковариацию по генеральной совокупности
covarPopMatrix	Возвращает матрицу генеральной ковариации для N переменных.
covarPopStable	Вычисляет ковариацию генеральной совокупности
covarSamp	Вычисляет значение `Σ((x - x̅)(y - y̅)) / (n - 1)`
covarSampMatrix	Возвращает выборочную ковариационную матрицу для N переменных.
covarSampStable	Аналогична covarSamp, но работает медленнее, обеспечивая меньшую вычислительную погрешность.
cramersV	Значение функции `cramersV` принимает значения от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только в том случае, если каждое значение полностью определяется другим. Его можно интерпретировать как степень связи между двумя переменными, выраженную в процентах от их максимально возможной изменчивости.
cramersVBiasCorrected	Вычисляет V Крамера с поправкой на смещение.
deltaSum	Вычисляет сумму разностей между последовательными строками.
deltaSumTimestamp	Складывает разности между последовательными строками. Отрицательные разности игнорируются.
entropy	Вычисляет энтропию Шеннона для столбца значений.
estimateCompressionRatio	Оценивает коэффициент сжатия указанного столбца без фактического выполнения сжатия.
exponentialMovingAverage	Вычисляет экспоненциальное скользящее среднее значений для заданного интервала времени.
exponentialTimeDecayedAvg	Возвращает экспоненциально сглаженное взвешенное скользящее среднее значений временного ряда в момент `t`.
exponentialTimeDecayedCount	Возвращает суммарное экспоненциальное затухание на временном ряду в момент времени с индексом `t`.
exponentialTimeDecayedMax	Возвращает максимум значений экспоненциально сглаженного скользящего среднего во временных точках `t` и `t-1`.
exponentialTimeDecayedSum	Возвращает сумму значений экспоненциально сглаженного скользящего среднего временного ряда в момент времени с индексом `t`.
first_value	Это псевдоним функции `any`, введённый для совместимости с оконными функциями, в которых иногда требуется обрабатывать значения `NULL` (по умолчанию все агрегатные функции ClickHouse игнорируют значения `NULL`).
flameGraph	Агрегатная функция, строящая flamegraph по списку стек-трейсов.
groupArray	Создаёт массив значений аргументов. Значения могут добавляться в массив в произвольном порядке; порядок не определён.
groupArrayInsertAt	Вставляет значение в массив на указанную позицию.
groupArrayIntersect	Возвращает пересечение заданных массивов (все элементы, которые присутствуют во всех этих массивах).
groupArrayLast	Создает массив из последних значений аргумента.
groupArrayMovingAvg	Вычисляет скользящее среднее по входным значениям.
groupArrayMovingSum	Вычисляет скользящую сумму входных значений.
groupArraySample	Создает массив выборки значений аргументов. Размер результирующего массива ограничен `max_size` элементами. Значения аргументов выбираются и добавляются в массив случайным образом.
timeSeriesGroupArray	Сортирует временные ряды по метке времени по возрастанию.
groupArraySorted	Возвращает массив из первых N элементов в порядке возрастания.
groupBitAnd	Выполняет побитовую операцию `AND` над рядом чисел.
groupBitmap	Bitmap- или агрегатные вычисления по столбцу беззнаковых целых чисел возвращают кардинальность типа UInt64; при добавлении суффикса -State возвращается объект bitmap
groupBitmapAnd	Выполняет операцию AND над bitmap-столбцом, возвращает мощность результирующего множества типа UInt64; при использовании суффикса -State возвращает объект bitmap.
groupBitmapOr	Вычисляет побитовое OR битмап-столбца, возвращает кардинальность в виде значения типа UInt64; если добавить суффикс -State, то возвращает объект битмапа. Эквивалентно `groupBitmapMerge`.
groupBitmapXor	Вычисляет XOR bitmap-столбца и возвращает кардинальность в виде значения типа UInt64; при использовании с суффиксом -State возвращает объект bitmap
groupBitOr	Выполняет побитовое `OR` над последовательностью чисел.
groupBitXor	Применяет операцию побитового `XOR` к последовательности чисел.
groupUniqArray	Создаёт массив из различных значений аргументов.
intervalLengthSum	Вычисляет суммарную длину объединения всех интервалов (отрезков на числовой прямой).
kolmogorovSmirnovTest	Применяет критерий Колмогорова–Смирнова к выборкам из двух генеральных совокупностей.
kurtPop	Вычисляет эксцесс последовательности.
kurtSamp	Вычисляет выборочный коэффициент эксцесса для последовательности.
largestTriangleThreeBuckets	Применяет алгоритм Largest-Triangle-Three-Buckets к исходным данным.
last_value	Выбирает последнее встреченное значение, аналогично `anyLast`, но допускает значение NULL.
mannWhitneyUTest	Применяет ранговый критерий Манна–Уитни к выборкам из двух генеральных совокупностей.
max	Агрегатная функция, вычисляющая максимальное значение по группе значений.
maxIntersections	Агрегатная функция, вычисляющая максимальное количество одновременных пересечений интервалов в группе (если все интервалы пересекаются хотя бы один раз).
maxIntersectionsPosition	Агрегатная функция, вычисляющая позиции вхождений функции maxIntersections.
maxMap	Вычисляет максимум из массива `value` по ключам, заданным в массиве `key`.
meanZTest	Применяет z‑критерий для проверки равенства средних по выборкам из двух генеральных совокупностей.
median	Функции `median` являются псевдонимами соответствующих функций `quantile`. Они вычисляют медиану выборки числовых данных.
min	Агрегатная функция, вычисляющая минимум в группе значений.
minMap	Вычисляет минимум массива `value` по ключам, указанным в массиве `key`.
quantile	Вычисляет приближённый квантиль последовательности числовых данных.
quantileBFloat16	Вычисляет приблизительный квантиль выборки, состоящей из чисел типа bfloat16.
quantileDD	Вычисляет приближенный квантиль выборки с гарантированной относительной погрешностью.
quantileDeterministic	Вычисляет приблизительный квантиль последовательности числовых данных.
Функции quantileExact	Функции quantileExact, quantileExactLow, quantileExactHigh, quantileExactExclusive, quantileExactInclusive
quantileExactWeighted	Точно вычисляет квантиль последовательности числовых данных с учётом веса каждого элемента.
quantileGK	Вычисляет квантиль для числовой последовательности данных по алгоритму Гринвальда–Кханны.
quantileExactWeightedInterpolated	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учетом веса каждого элемента.
quantileInterpolatedWeighted	Вычисляет квантиль по последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
Функции quantiles	quantiles, quantilesExactExclusive, quantilesExactInclusive, quantilesGK
quantileTDigest	Вычисляет приближённый квантиль последовательности числовых данных с использованием алгоритма t-digest.
quantileTDigestWeighted	Вычисляет приблизительный квантиль последовательности числовых данных с помощью алгоритма t-digest.
quantileTiming	Вычисляет квантиль последовательности числовых данных с заданной точностью.
quantileTimingWeighted	Вычисляет квантиль числовой последовательности данных с заданной точностью, учитывая вес каждого элемента последовательности.
rankCorr	Вычисляет коэффициент ранговой корреляции.
simpleLinearRegression	Выполняет простую одномерную линейную регрессию.
singleValueOrNull	Агрегатная функция `singleValueOrNull` используется для реализации операторов подзапросов, например `x = ALL (SELECT ...)`. Она проверяет, что в данных существует ровно одно уникальное значение, отличное от NULL.
skewPop	Вычисляет коэффициент асимметрии последовательности.
skewSamp	Вычисляет выборочную асимметрию последовательности.
sparkbar	Функция строит частотную гистограмму для значений `x` и их частоты повторения `y` на интервале `[min_x, max_x]`.
stddevPop	Результат равен квадратному корню из varPop.
stddevPopStable	Результат равен квадратному корню varPop. В отличие от stddevPop, эта функция использует численно устойчивый алгоритм.
stddevSamp	Результат равен квадратному корню из varSamp.
stddevSampStable	Результат равен квадратному корню от varSamp. В отличие от varSamp, эта функция использует численно устойчивый алгоритм.
stochasticLinearRegression	Эта функция реализует стохастическую линейную регрессию. Она поддерживает настройку шага обучения, коэффициента L2-регуляризации, размера мини-батча и предоставляет несколько методов обновления весов (Adam, простой SGD, Momentum, Nesterov).
stochasticLogisticRegression	Эта функция реализует стохастическую логистическую регрессию. Она может использоваться для задачи бинарной классификации, поддерживает те же настраиваемые параметры, что и stochasticLinearRegression, и работает аналогичным образом.
studentTTest	Применяет t-критерий Стьюдента к выборкам из двух генеральных совокупностей.
studentTTestOneSample	Применяет одновыборочный t-критерий Стьюдента к выборке и известному среднему значению генеральной совокупности.
sum	Вычисляет сумму. Применима только к числовым значениям.
sumCount	Вычисляет сумму чисел и одновременно считает количество строк. Функция используется оптимизатором запросов ClickHouse: если в запросе есть несколько функций `sum`, `count` или `avg`, они могут быть заменены одной функцией `sumCount` для повторного использования результатов вычислений. Необходимость явно вызывать эту функцию возникает редко.
sumKahan	Вычисляет сумму чисел с использованием алгоритма компенсированного суммирования Кахана
sumMap	Суммирует один или несколько массивов `value` в соответствии с ключами, указанными в массиве `key`. Возвращает кортеж массивов, где сначала идут ключи в отсортированном порядке, а затем значения, суммированные для соответствующих ключей без переполнения.
sumMapWithOverflow	Суммирует значения из массива `value` по ключам из массива `key`. Возвращает кортеж из двух массивов: отсортированные ключи и суммы значений для соответствующих ключей. Отличается от функции sumMap тем, что выполняет суммирование с переполнением.
sumWithOverflow	Вычисляет сумму чисел, используя для результата тот же тип данных, что и для входных параметров. Если сумма превышает максимальное значение для этого типа данных, происходит переполнение.
theilsU	Функция `theilsU` вычисляет коэффициент неопределённости U Тейла (Theils' U), величину, которая измеряет степень связи между двумя столбцами в таблице.
topK	Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце. Результирующий массив отсортирован в порядке убывания примерной частоты встречаемости значений (а не по самим значениям).
topKWeighted	Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце. Результирующий массив отсортирован по убыванию оценочной частоты значений (не по самим значениям). Кроме того, учитывается вес значения.
uniq	Вычисляет приблизительное количество уникальных значений аргумента.
uniqCombined	Вычисляет приблизительное количество различных значений аргумента.
uniqCombined64	Вычисляет приблизительное количество различных значений аргумента. Аналогична uniqCombined, но использует 64-битный хэш для всех типов данных, а не только для типа String.
uniqExact	Вычисляет точное количество уникальных значений аргумента.
uniqHLL12	Приблизительно вычисляет количество различных значений аргумента на основе алгоритма HyperLogLog.
uniqTheta	Вычисляет приблизительное количество различных значений аргумента на базе фреймворка Theta Sketch.
varPop	Вычисляет генеральную дисперсию.
varPopStable	Возвращает генеральную дисперсию. В отличие от varPop, эта функция использует численно устойчивый алгоритм. Она работает медленнее, но обеспечивает меньшую вычислительную погрешность.
varSamp	Вычисляет выборочную дисперсию набора данных.
varSampStable	Вычисляет выборочную дисперсию набора данных. В отличие от `varSamp` эта функция использует численно устойчивый алгоритм. Работает медленнее, но обеспечивает меньшую вычислительную погрешность.
welchTTest	Применяет t-критерий Уэлча к выборкам из двух генеральных совокупностей.
distinctDynamicTypes	Вычисляет список уникальных типов данных, хранящихся в столбце Dynamic.
distinctJSONPaths	Вычисляет список различных путей, хранящихся в JSON-столбце.
timeSeriesDeltaToGrid	Агрегатная функция, вычисляющая дельту в стиле PromQL по данным временных рядов на заданной сетке.
timeSeriesInstantDeltaToGrid	Агрегатная функция, вычисляющая idelta, аналогичный PromQL, по временным рядам на заданной сетке.
timeSeriesInstantRateToGrid	Агрегирующая функция, вычисляющая PromQL-подобный irate по данным временных рядов на заданной сетке.
timeSeriesLastTwoSamples	Агрегатная функция ресемплирования временных рядов для вычисления irate и idelta в стиле PromQL
timeSeriesRateToGrid	Агрегирующая функция, вычисляющая PromQL‑подобный rate по временным рядам на заданной временной сетке.
timeSeriesResampleToGridWithStaleness	Агрегатная функция, которая перерассчитывает данные временных рядов по заданной сетке.
timeSeriesDerivToGrid	Агрегатная функция, вычисляющая производную в стиле PromQL по данным временных рядов на заданной временной сетке.
timeSeriesPredictLinearToGrid	Агрегатная функция, вычисляющая линейный прогноз, аналогичный PromQL, по данным временных рядов на заданной сетке.
timeSeriesChangesToGrid	Агрегирующая функция, вычисляющая изменения, аналогичные PromQL, во временных рядах данных на заданной сетке.
timeSeriesResetsToGrid	Агрегатная функция, вычисляющая сбросы в стиле PromQL по данным временных рядов на заданной сетке.
groupConcat	Вычисляет строку, полученную конкатенацией группы строк, с необязательным разделителем между ними и необязательным ограничением на максимальное количество элементов.
quantilePrometheusHistogram	Вычисляет квантиль по гистограмме с использованием линейной интерполяции.