Дисперсия
Диспе́рсия в теории вероятностей, мера отклонения случайной величины от её математического ожидания , определяемая равенством:
Свойства дисперсии:
если – действительное число, то
в частности .
Когда говорят о дисперсии случайной величины , всегда предполагают, что существует математическое ожидание ; при этом дисперсия может существовать (т. е. быть конечной) или не существовать (т. е. быть бесконечной). В современной теории вероятностей математическое ожидание случайной величины определяется через интеграл Лебега по пространству элементарных событий. Однако важную роль играют формулы, выражающие математическое ожидание различных функций от случайной величины через распределение этой случайной величины на множестве действительных чисел (см. в статье Математическое ожидание). Для дисперсии эти формулы имеют вид:
для дискретной случайной величины , принимающей не более чем счётное число различных значений с вероятностями ;
для случайной величины , имеющей плотность распределения вероятностей ;
в общем случае, где – функция распределения случайной величины и интеграл понимается в смысле Лебега – Стилтьеса или Римана – Стилтьеса.
Дисперсия не является единственной мыслимой мерой отклонения случайной величины от её математического ожидания. Возможны другие меры отклонения, устроенные по тому же принципу, например , и т. д., а также меры отклонения, основанные на квантилях. Особая важность дисперсии объясняется главным образом той ролью, которую играет это понятие для предельных теорем. Грубо говоря, оказывается, что если знать математическое ожидание и дисперсию суммы большого числа случайных величин, то можно полностью определить закон распределения этой суммы: он оказывается нормальным (приблизительно) с соответствующими параметрами.
Таким образом, важнейшие свойства дисперсии связаны с выражением для дисперсии суммы случайных величин :
где
обозначает ковариацию случайных величин и. Если случайные величины попарно независимы, то . Поэтому для попарно независимых случайных величин
Обратное утверждение неверно: из (2) не следует независимость. Однако, как правило, применение формулы (2) базируется на независимости случайных величин. Строго говоря, для справедливости (2) достаточно лишь, чтобы , т. е. чтобы случайные величины были попарно некоррелированы.
Применения понятия дисперсии развиваются по следующим двум направлениям. Во-первых, применения в области предельных теорем теории вероятностей. Если последовательность случайных величин обладает тем свойством, что при , то для любого при
(см. Неравенство Чебышёва), т. е. практически при больших случайная величина совпадает с неслучайной величиной . Развитие этих соображений приводит к доказательству закона больших чисел, к доказательству состоятельности оценок в математической статистике, а также к иным применениям, в которых устанавливается сходимость по вероятности случайных величин. Другое применение в области предельных теорем связано с понятием нормировки. Нормировка случайной величины производится путём вычитания математического ожидания и деления на среднее квадратичное отклонение , иными словами, рассматривается величина . Нормировка последовательности случайных величин обычно необходима для получения сходящейся последовательности законов распределения, в частности сходимости к нормальному закону с параметрами и . Во-вторых, применение понятия дисперсии в математической статистике при обработке выборок. Если смотреть на случайную величину как на реализацию случайного эксперимента, то произвольное изменение шкалы отсчёта приведёт к преобразованию случайной величины в величину , где – любое действительное число, – положительное число. Поэтому часто имеет смысл рассматривать не один теоретический закон распределения случайной величины , а тип законов, т. е. семейство законов распределения вида , зависящих по крайней мере от двух параметров и . Если , , то , . Поэтому параметры теоретического закона имеют следующий смысл: и . Отсюда вытекает способ определения этих параметров по выборке.