Эмпири́ческое распределе́ние, распределение выборки, распределение вероятностей, которое определяется по выборке для оценивания истинного распределения. Пусть результаты наблюдений X1,…,Xn – взаимно независимые и одинаково распределённые случайные величины с функцией распределенияF(x) и пусть X(1)<X(2)<⋯<X(n) – соответствующий вариационный ряд. Эмпирическим распределением, соответствующим X1,…,Xn, называется дискретное распределение, приписывающее каждому значению Xkвероятность1/n. Функция эмпирического распределения Fn(x) называется эмпирической функцией распределения, является ступенчатой функцией со скачками, кратными 1/n, в точках, определяемых величинами X(1),…,X(n):Fn(x)=⎩⎨⎧0,x≤X(1),nk,X(k)<x≤X(k+1),1≤k≤n−1,1,x>X(n).При фиксированных значениях X1,…,Xn функция F^n(x) обладает всеми свойствами обычной функции распределения. При каждом фиксированном действительном x функция F^n(x) является случайной величиной как функция X1,…,Xn. Таким образом, эмпирическое распределение, соответствующее выборке X1,…,Xn, задаётся семейством случайных величин F^n(x), зависящих от действительного параметра x. При этом для фиксированного xEF^n(x)=F(x),DF^n(x)=n1F(x)[1−F(x)]иP{F^n(x)=nk}=Cnk[F(x)]k[1−F(x)]n−k.В соответствии с законом больших чисел F^n(x)→PF(x), n→∞, при каждом x. Это означает, что F^n(x) – несмещённая и состоятельная оценка функции распределения F(x). Функция эмпирического распределения равномерно по x сходится с вероятностью 1 к F(x) при n→∞, или еслиDn=xsup∣F^n(x)−F(x)∣,тоP{n→∞limDn}=1(теорема Гливенко – Кантелли).
Величина Dn служит мерой близости F^n(x) к F(x). А. Н. Колмогоров (1933) нашёл предельное распределение: для непрерывной функцииF(x)n→∞limP{nDn<z}=K(z)=n=−∞∑+∞(−1)ke−2k2z2,z>0.Если F(x) неизвестна, то для проверки гипотезы о том, что эта функция есть заданная непрерывная функция F0(x), применяются критерии, основанные на статистиках типа Dn (см. критерий Колмогорова, критерий Колмогорова – Смирнова, непараметрические методы статистики).
Моменты и любые другие характеристики эмпирического распределения называются выборочными (эмпирическими) моментами и характеристиками, например:
X=n1∑k=1nXk – выборочное среднее,
s2=n1∑k=1n(Xk−X)2 – выборочная дисперсия,
α^r=n1∑k=1nXkr – выборочный момент r-го порядка,
Выборочные характеристики служат статистическими оценками соответствующих характеристик исходного распределения.