メインコンテンツへスキップ
ClickHouse は、標準的な SQL の集約関数 (sumavgminmaxcount) をすべてサポートしているほか、幅広い種類の集約関数も提供しています。
ページ説明
aggThrowこの関数は、例外安全性のテストに使用できます。指定された確率で、作成時に例外をスローします。
analysisOfVariance一元配置分散分析 (ANOVA 検定) のための統計的検定を提供します。これは、正規分布に従う複数の観測グループを対象に、すべてのグループの平均が同じかどうかを調べる検定です。
anyカラムで最初に見つかった値を選択します。
anyHeavyheavy hitters アルゴリズムを使用して、頻出する値を選択します。クエリ実行スレッドごとに、半数を超えて出現する値がある場合、その値が返されます。通常、結果は決定論的ではありません。
anyLastカラムで最後に見つかった値を選択します。
approx_top_k指定したカラムについて、おおよそ最も頻出する値とそのカウントの配列を返します。
approx_top_sum指定したカラムについて、おおよそ最も頻出する値とそのカウントの配列を返します。
argAndMax最大の val 値に対応する argval の値を計算します。最大値となる同じ val を持つ複数の行がある場合、対応する argval のどれが返されるかは決定論的ではありません。
argAndMin最小の val 値に対応する argval の値を計算します。最小値となる同じ val を持つ複数の行がある場合、対応する argval のどれが返されるかは決定論的ではありません。
argMax最大の val 値に対応する arg の値を計算します。
argMin最小の val 値に対応する arg の値を計算します。最小値となる同じ val を持つ複数の行がある場合、対応する arg のどれが返されるかは決定論的ではありません。
avg算術平均を計算します。
avgWeighted加重算術平均を計算します。
boundingRatio値のグループ全体にわたって、最も左の点と最も右の点の間の傾きを計算する集約関数です。
categoricalInformationValue各カテゴリについて、(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0))) の値を計算します。
contingencycontingency 関数は、テーブル内の 2 つのカラム間の関連性を表す値である連関係数を計算します。計算方法は cramersV 関数と似ていますが、平方根内の分母が異なります。
corrPearson の相関係数を計算します。
corrMatrixN 個の変数に対する相関行列を計算します。
corrStablePearson の相関係数を計算しますが、数値的に安定したアルゴリズムを使用します。
count行数、または NULL でない値の数をカウントします。
covarPop母共分散を計算します。
covarPopMatrixN 個の変数に対する母共分散行列を返します。
covarPopStable母共分散の値を計算します。
covarSampΣ((x - x̅)(y - y̅)) / (n - 1) の値を計算します。
covarSampMatrixN 個の変数に対する標本共分散行列を返します。
covarSampStablecovarSamp と似ていますが、計算誤差を抑える代わりに処理速度は低下します。
cramersVcramersV 関数の結果は 0 (変数間に関連性がないことを示す) から 1 の範囲を取り、各値がもう一方によって完全に決定される場合にのみ 1 に達します。これは、2 つの変数間の関連性を、それらの取りうる最大変動に対する割合として捉えることができます。
cramersVBiasCorrectedCramer’s V を計算しますが、バイアス補正を使用します。
deltaSum連続する行の算術差を合計します。
deltaSumTimestamp連続する行の差を加算します。差が負の場合は無視されます。
distinctDynamicTypesDynamic カラムに格納されている異なるデータ型の一覧を計算します。
distinctJSONPathsJSON カラムに格納されている異なるパスの一覧を計算します。
distinctJSONPathsAndTypesJSON に格納されている異なるパスとその型の一覧を計算します。
entropy値のカラムのシャノンエントロピーを計算します。
estimateCompressionRatio指定されたカラムを実際に圧縮せずに、その圧縮率を推定します。
exponentialMovingAverage指定した時点における値の指数移動平均を計算します。
exponentialTimeDecayedAvg時刻 t における時系列の値の、指数平滑化された加重移動平均を返します。
exponentialTimeDecayedCount時刻 t のインデックスにおける時系列の累積指数減衰を返します。
exponentialTimeDecayedMax時刻 t のインデックスにおける計算済みの指数平滑化移動平均と、t-1 におけるその値との最大値を返します。
exponentialTimeDecayedSum時刻 t のインデックスにおける時系列の指数平滑化移動平均値の合計を返します。
first_valueany のエイリアスですが、ウィンドウ関数との互換性のために導入されました。ウィンドウ関数では NULL 値を処理する必要がある場合があるためです (デフォルトでは、ClickHouse のすべての集約関数は NULL 値を無視します) 。
flameGraphスタックトレースの一覧を使ってフレームグラフを構築する集約関数です。
groupArray引数の値から配列を作成します。値は任意の (不定な) 順序で配列に追加されます。
groupArrayArray複数の配列を、それらを要素とするより大きな配列に集約します。
groupArrayInsertAt配列の指定した位置に値を挿入します。
groupArrayIntersect指定した配列の積集合を返します (指定されたすべての配列に含まれる要素を返します) 。
groupArrayLast最後の引数値から配列を作成します。
groupArrayMovingAvg入力値の移動平均を計算します。
groupArrayMovingSum入力値の移動合計を計算します。
groupArraySample引数値のサンプルから配列を作成します。結果の配列のサイズは max_size 要素に制限されます。引数の値はランダムに選択され、配列に追加されます。
groupArraySorted先頭から N 個の要素を昇順に並べた配列を返します。
groupBitAnd一連の数値に対してビット単位の AND を適用します。
groupBitmap符号なし整数カラムに対してビットマップまたは集約計算を行い、UInt64 型のカーディナリティを返します。接尾辞 -State を追加した場合は、ビットマップオブジェクトを返します。
groupBitmapAndビットマップカラムに対して AND を計算し、UInt64 型のカーディナリティを返します。接尾辞 -State を追加した場合は、ビットマップオブジェクトを返します。
groupBitmapOrビットマップカラムに対して OR を計算し、UInt64 型のカーディナリティを返します。接尾辞 -State を追加した場合は、ビットマップオブジェクトを返します。これは groupBitmapMerge と同等です。
groupBitmapXorビットマップカラムに対して XOR を計算し、UInt64 型のカーディナリティを返します。接尾辞 -State を使用した場合は、ビットマップオブジェクトを返します。
groupBitOr一連の数値に対してビット単位の OR を適用します。
groupBitXor一連の数値に対してビット単位の XOR を適用します。
groupConcat文字列のグループから連結文字列を計算します。必要に応じて区切り文字で区切ることも、要素数の上限を指定することもできます。
groupUniqArray異なる引数値から配列を作成します。
intervalLengthSumすべての範囲の和集合の長さの合計 (数値軸上の線分) を計算します。
kolmogorovSmirnovTest2 つの母集団から得たサンプルに Kolmogorov-Smirnov 検定を適用します。
kurtPop数列の尖度を計算します。
kurtSamp数列の標本尖度を計算します。
largestTriangleThreeBuckets入力データに Largest-Triangle-Three-Buckets アルゴリズムを適用します。
last_valueanyLast と同様に最後に検出された値を選択しますが、NULL を受け取ることもできます。
mannWhitneyUTest2 つの母集団から得たサンプルに Mann-Whitney の順位検定を適用します。
max値のグループ全体における最大値を計算する集約関数です。
maxIntersections区間のグループ同士が交差する最大回数を計算する集約関数です (すべての区間が少なくとも 1 回は交差する場合) 。
maxIntersectionsPositionmaxIntersections 関数が発生する位置を計算する集約関数です。
maxMapkey 配列で指定したキーに従って、value 配列から最大値を計算します。
meanZTest2 つの母集団から得たサンプルに平均 z 検定を適用します。
medianmedian* 関数は、対応する quantile* 関数の別名です。数値データのサンプルの中央値を計算します。
min値のグループ全体における最小値を計算する集約関数です。
minMapkey 配列で指定したキーに従って、value 配列から最小値を計算します。
quantile数値データ列のおおよその分位数を計算します。
quantileBFloat16bfloat16 numbers で構成されるサンプルのおおよその分位数を計算します。
quantileDD相対誤差保証付きでサンプルのおおよその分位数を計算します。
quantileDeterministic数値データ列のおおよその分位数を計算します。
quantileExact FunctionsquantileExact、quantileExactLow、quantileExactHigh、quantileExactExclusive、quantileExactInclusive 関数
quantileExactExclusive数値データ列の分位数を正確に計算します。
quantileExactHighquantileExact と同様に、数値データ列の正確な分位数を計算します。
quantileExactInclusive数値データ列の分位数を正確に計算します。
quantileExactLowquantileExact と同様に、数値データ列の正確な quantile を計算します。
quantileExactWeighted各要素の重みを考慮して、数値データ列の分位数を正確に計算します。
quantileExactWeightedInterpolated各要素の重みを考慮し、線形補間を用いて数値データ列の分位数を計算します。
quantileGKGreenwald-Khanna アルゴリズムを使用して数値データ列の分位数を計算します。
quantileInterpolatedWeighted各要素の重みを考慮し、線形補間を用いて数値データ列の分位数を計算します。
quantilePrometheusHistogram線形補間を使用してヒストグラムの分位数を計算します。
quantiles Functionsquantiles、quantilesExactExclusive、quantilesExactInclusive、quantilesGK
quantilesExactExclusive数値データ列の分位数を正確に計算します。
quantilesExactInclusive数値データ列の分位数を正確に計算します。
quantilesGKquantilesGK は quantileGK と同様に動作しますが、異なるレベルの分位数を同時に計算でき、配列を返します。
quantilesTimingWeighted指定された精度で、数値データ列の各要素の重みに応じた分位数を計算します。
quantileTDigestt-digest アルゴリズムを使用して、数値データ列のおおよその分位数を計算します。
quantileTDigestWeightedt-digest アルゴリズムを使用して、数値データ列のおおよその分位数を計算します。
quantileTiming指定された精度で、数値データ列の分位数を計算します。
quantileTimingWeighted指定された精度で、数値データ列の各要素の重みに応じた分位数を計算します。
rankCorr順位相関係数を計算します。
simpleLinearRegression単純な (1 次元の) 線形回帰を実行します。
singleValueOrNull集約関数 singleValueOrNull は、x = ALL (SELECT ...) などのサブクエリ演算子を実装するために使用されます。データ内に NULL ではない一意の値が 1 つだけ存在するかどうかを確認します。
skewPopデータ列の歪度を計算します。
skewSampデータ列の標本歪度を計算します。
sparkbarこの関数は、値 x とそれらの値の出現頻度 y について、区間 [min_x, max_x] にわたる度数ヒストグラムを描画します。
stddevPop結果は varPop の平方根に等しくなります。
stddevPopStable結果は varPop の平方根に等しくなります。stddevPop とは異なり、この関数は数値的に安定したアルゴリズムを使用します。
stddevSamp結果は varSamp の平方根に等しくなります。
stddevSampStable結果は varSamp の平方根に等しくなります。stddevSamp とは異なり、この関数は数値的に安定したアルゴリズムを使用します。
stochasticLinearRegressionこの関数は確率的線形回帰を実装します。学習率、L2 正則化係数、ミニバッチサイズのカスタムパラメータに対応し、重みを更新するためのいくつかの手法 (Adam、単純な SGD、Momentum、Nesterov) を備えています。
stochasticLogisticRegressionこの関数は確率的ロジスティック回帰を実装します。二値分類問題に使用でき、stochasticLinearRegression と同じカスタムパラメータをサポートし、同様に動作します。
studentTTest2 つの母集団からのサンプルにスチューデントの t 検定を適用します。
studentTTestOneSample1 つのサンプルと既知の母平均に対して 1 標本スチューデントの t 検定を適用します。
sum合計を計算します。数値に対してのみ機能します。
sumCount数値の合計を計算すると同時に、行数もカウントします。この関数は ClickHouse クエリオプティマイザで使用されます。クエリ内に複数の sumcount、または avg 関数がある場合、それらを 1 つの sumCount 関数に置き換えて計算を再利用できます。この関数を明示的に使用する必要があることはほとんどありません。
sumKahanKahan の補償和アルゴリズムを使用して数値の合計を計算します。
sumMapkey 配列で指定されたキーに従って、1 つ以上の value 配列の合計を計算します。配列のタプルを返します。最初にソート順のキー、その後に対応するキーごとにオーバーフローなしで合計された値が続きます。
sumMapWithOverflowkey 配列で指定されたキーに従って、value 配列の合計を計算します。2 つの配列からなるタプルを返します。ソート順のキーと、対応するキーごとに合計された値です。オーバーフローありで加算を行う点が sumMap 関数と異なります。
sumWithOverflow入力パラメータと同じデータ型を結果に使用して、数値の合計を計算します。合計がこのデータ型の最大値を超えた場合は、オーバーフローありで計算されます。
theilsUtheilsU 関数は、テーブル内の 2 つのカラム間の関連性を測る値である Theils’ U 不確実性係数を計算します。
timeSeriesChangesToGrid指定されたグリッド上で、時系列データに対する PromQL 風の変化量を計算する集約関数です。
timeSeriesDeltaToGrid指定したグリッド上の時系列データに対して、PromQL の delta に相当する計算を行う集約関数です。
timeSeriesDerivToGrid指定したグリッド上の時系列データに対して、PromQL の deriv に相当する計算を行う集約関数です。
timeSeriesGroupArray時系列を timestamp の昇順でソートします。
timeSeriesInstantDeltaToGrid指定したグリッド上の時系列データに対して、PromQL の idelta に相当する計算を行う集約関数です。
timeSeriesInstantRateToGrid指定したグリッド上の時系列データに対して、PromQL の irate に相当する計算を行う集約関数です。
timeSeriesLastTwoSamplesPromQL の irate および idelta の計算に向けて時系列データを再サンプリングする集約関数です。
timeSeriesPredictLinearToGrid指定したグリッド上の時系列データに対して、PromQL の線形予測に相当する計算を行う集約関数です。
timeSeriesRateToGrid指定したグリッド上の時系列データに対して、PromQL の rate に相当する計算を行う集約関数です。
timeSeriesResampleToGridWithStaleness時系列データを指定したグリッドに再サンプリングする集約関数です。
timeSeriesResetsToGrid指定したグリッド上の時系列データに対して、PromQL の resets に相当する計算を行う集約関数です。
topK指定したカラムでおおよそ最も頻出する値の配列を返します。結果の配列は、値そのものではなく、各値のおおよその出現頻度の降順でソートされます。
topKWeighted指定したカラムでおおよそ最も頻出する値の配列を返します。結果の配列は、値そのものではなく、各値のおおよその出現頻度の降順でソートされます。さらに、値の重みも考慮されます。
uniq引数の異なる値のおおよその数を計算します。
uniqCombined引数の異なる値のおおよその数を計算します。
uniqCombined64引数の異なる値のおおよその数を計算します。uniqCombined と同じですが、String データ型だけでなく、すべてのデータ型に 64 ビットの hash を使用します。
uniqExact引数の異なる値の正確な数を計算します。
uniqHLL12HyperLogLog アルゴリズムを使用して、引数の異なる値のおおよその数を計算します。
uniqThetaTheta Sketch Framework を使用して、引数の異なる値のおおよその数を計算します。
varPop母分散を計算します。
varPopStable母分散を返します。varPop とは異なり、この関数は数値的に安定したアルゴリズムを使用します。処理速度は遅くなりますが、計算誤差を抑えられます。
varSampデータセットの標本分散を計算します。
varSampStableデータセットの標本分散を計算します。varSamp とは異なり、この関数は数値的に安定したアルゴリズムを使用します。処理速度は遅くなりますが、計算誤差を抑えられます。
welchTTest2 つの母集団からのサンプルに対して Welch の t 検定を適用します。
最終更新日 2026年6月10日