Нормальное распределение
Норма́льное распределе́ние (распределение Гаусса), одно из важнейших распределений вероятностей. Термин «нормальное распределение», принадлежащий К. Пирсону (более старые названия – закон Гаусса, распределение Гаусса – Лапласа), применяют как по отношению к распределениям вероятностей случайных величин, так и по отношению к совместным распределениям вероятностей нескольких случайных величин (т. е. к распределениям конечномерных случайных векторов), а также случайных элементов и случайных процессов. Общее определение нормального распределения сводится к одномерному случаю.
Распределение вероятностей случайной величины называется нормальным, если оно имеет плотность вероятности
Семейство нормальных распределений (*) зависит, таким образом, от двух параметров – и . При этом математическое ожидание равно , дисперсия равна , а характеристическая функция имеет вид
Кривая (см. рис.) нормального распределения симметрична относительно ординаты, проходящей через точку , и имеет в этой точке единственный максимум, равный . С уменьшением кривая нормального распределения становится всё более островершинной. Изменение при постоянном не меняет форму кривой, а вызывает лишь её смещение по оси абсцисс. Площадь, заключённая под кривой нормального распределения, всегда равна единице. При , соответствующая функция распределения равна
В общем случае функция распределения нормального распределения может быть вычислена по формуле , где . Для функции (и нескольких её производных) составлены обширные таблицы (см., например, Таблицы нормального интеграла… 1960, Большев. 1983 и статью Интеграл вероятности). Для нормального распределения вероятность неравенства , равная , убывает весьма быстро с ростом (см. таблицу).
Вероятность неравенства для нормального распределения
Вероятность | |
Во многих практических вопросах при рассмотрении нормального распределения пренебрегают поэтому возможностью отклонений от , превышающих , – т. н. правило трёх сигма (соответствующая вероятность, как видно из таблицы, меньше ). Вероятное отклонение для нормального распределения равно .
Нормальное распределение встречается в большом числе приложений. Издавна известны попытки объяснения этого обстоятельства. Теоретическое обоснование исключительной роли нормального распределения дают предельные теоремы теории вероятностей (см. также теорема Муавра – Лапласа, теорема Ляпунова). Качественно соответствующий результат может быть объяснён следующим образом: нормальное распределение служит хорошим приближением каждый раз, когда рассматриваемая случайная величина представляет собой сумму большого числа независимых случайных величин, максимальная из которых мала по сравнению со всей суммой (см. Центральная предельная теорема).
Нормальное распределение может появляться также как точное решение некоторых задач (в рамках принятой математической модели явления). Так обстоит дело в теории случайных процессов (в одной из основных моделей броуновского движения). Классические примеры возникновения нормального распределения как точного принадлежат К. Ф. Гауссу (закон распределения ошибок наблюдения) и Дж. Максвеллу (закон распределения скоростей молекул) (см. также Независимость, Характеризационные теоремы).
Распределение случайного вектора в или совместное распределение случайных величин называется нормальным (многомерным нормальным), если при любом фиксированном скалярное произведение или имеет нормальное распределение, или равно константе (как иногда говорят, имеет нормальное распределение с дисперсией, равной нулю). Для случайных элементов со значениями из какого-либо векторного пространства это определение сохраняется с заменой на любой элемент сопряжённого пространства и скалярного произведения на линейный функционал . Совместное распределение нескольких случайных величин имеет характеристическую функцию
где
– неотрицательно определённая квадратичная форма и – ковариационная матрица вектора . В случае положительной определённости соответствующее нормальное распределение имеет плотность вероятности
где – квадратичная форма, обратная , параметры равны математическим ожиданиям соответственно, а постоянная
Общее количество параметров, задающих нормальное распределение, равно
и быстро растёт с ростом (оно равно при , равно при и при ). Многомерное нормальное распределение служит основной моделью многомерного статистического анализа. Оно используется также в теории случайных процессов (где рассматриваются нормальные распределения в бесконечномерных пространствах, см. Случайный элемент, а также мера Винера, Винеровский процесс, Гауссовский процесс).
Из важных свойств нормального распределения необходимо отметить следующие. Сумма независимых случайных величин и , имеющих нормальные распределения, имеет нормальное распределение; обратно, если имеет нормальное распределение и и независимы, то и имеют нормальные распределения (теорема Крамера). Это свойство обладает определённой «устойчивостью»: если распределение «близко» к нормальному, то и распределения и «близки» к нормальным. С нормальным распределением связаны некоторые другие важные распределения (см. Логарифмически-нормальное распределение, Нецентральное распределение хи-квадрат, распределение Стьюдента, распределение Уишарта, z-распределение Фишера, Хотеллинга -распределение, Распределение хи-квадрат). Для приближённого представления распределений, близких к нормальному, широко применяются ряды типа рядов Эджворта и рядов Грама – Шарлье.
О вопросах, связанных с оценкой параметров нормального распределения по результатам наблюдений, см. статью Несмёщенная оценка. О проверке гипотезы нормальности см. Непараметрические методы математической статистики. См. также Вероятностная бумага.