Закон больших чисел
Зако́н больши́х чи́сел, общий принцип, в силу которого совместное действие случайных факторов приводит при некоторых весьма общих условиях к результату, почти не зависящему от случая. Сближение частоты наступления случайного события с его вероятностью при возрастании числа испытаний (подмеченное сначала, по-видимому, на азартных играх) может служить первым примером действия этого принципа.
На рубеже 17 и 18 вв. Я. Бернулли (Bernoulli. 1713) доказал теорему, утверждающую, что в последовательности независимых испытаний, в каждом из которых вероятность наступления некоторого события имеет одно и то же значение , , верно соотношение:
при любом и ; здесь – число появлений события в первых испытаниях, – частота появлений. Эта теорема Бернулли была распространена С. Д. Пуассоном (Poisson. 1839) на случай последовательности независимых испытаний, где вероятность появления события может зависеть от номера испытания. Пусть эта вероятность для -го испытания равна , , и пусть
Тогда теорема Пуассона утверждает, что
при любом и . Первое строгое доказательство этой теоремы было дано П. Л. Чебышёвым (1846, см. Чебышев. 1947), метод которого полностью отличен от метода Пуассона и основан на некоторых экстремальных соображениях; С. Д. Пуассон выводил (2) из приближённой формулы для указанной вероятности, основанной на использовании закона Гаусса и в то время еще строго не обоснованной. У С. Д. Пуассона впервые встречается и термин «закон больших чисел», которым он назвал свое обобщение теоремы Бернулли.
Естественное дальнейшее обобщение теорем Бернулли и Пуассона возникает, если заметить, что случайные величины можно представить в виде суммы
независимых случайных величин, где , если появляется в -м испытании, и – в противном случае. При этом математическое ожидание (совпадающее со средним арифметическим математических ожиданий ) равно для случая Бернулли и для случая Пуассона. Другими словами, в обоих случаях рассматривается отклонение среднего арифметического величин от среднего арифметического их математических ожиданий.
В работе П. Л. Чебышёва «О средних величинах» (1867) было установлено, что для независимых случайных величин соотношение
(при любом и ) верно при весьма общих предположениях. П. Л. Чебышёв предполагал, что математические ожидания все ограничены одной и той же постоянной, хотя из его доказательства видно, что достаточно требования ограниченности дисперсий , , или даже требования
Таким образом, П. Л. Чебышёв показал возможность широкого обобщения теоремы Бернулли. А. А. Марков отметил возможность дальнейших обобщений и предложил применять название «закон больших чисел» ко всей совокупности обобщений теоремы Бернулли [и в частности, к (3)]. Метод Чебышёва основан на точном установлении общих свойств математических ожиданий и на использовании т. н. неравенства Чебышёва [для вероятности (3) оно дает оценку вида
эту границу можно заменить более точной, разумеется, при более значительных ограничениях, см. Неравенство Бернштейна]. Последующие доказательства различных форм закона больших чисел в той или иной степени являются развитием метода Чебышёва. Применяя надлежащее «урезание» случайных величин (замену их вспомогательными величинами ; именно: , если и , если , где – некоторые постоянные), А. А. Марков распространил закон больших чисел на случаи, когда дисперсии слагаемых не существуют. Например, он показал, что (3) имеет место, если при некоторых постоянных и и всех
Аналогично доказывается теорема Xинчина (1929): если имеют одинаковые законы распределения и существует, то закон больших чисел (3) выполняется.
Для сумм независимых случайных величин можно сформулировать более или менее окончательный вариант закона больших чисел. Для этого целесообразно перейти на более общую точку зрения, связанную с понятием предельного постоянства последовательности случайных величин. Случайные величины последовательности называются предельно постоянными, если существует такая последовательность постоянных , что при любом и
(т. е. сходится к нулю «по вероятности»; если (4) выполняется с каким-либо , то оно выполняется и с , где – медиана случайной величины ). Далее, вместо последовательности независимых случайных величин можно взять т. н. схему серий:
случайных величин (первый индекс – номер серии, второй – номер величины внутри серии). Случайные величины каждой отдельной серии предполагаются взаимно независимыми. Схему последовательности легко свести к схеме серий, полагая , .
Пусть
Тогда общая форма вопроса о применимости закона больших чисел для сумм независимых случайных величин такова: при каких условиях суммы предельно постоянны?
Ответ на этот вопрос дал А. Н. Колмогоров (1928). Допустим, не ограничивая общности, что медианы величин равны нулю. Пусть при и при . Тогда одновременное выполнение двух условий:
и
необходимо и достаточно для предельного постоянства сумм . В качестве можно взять . Достаточность этих условий легко доказывается методом Чебышёва. Если математические ожидания существуют, то легко указать дополнительные условия, при которых можно выбрать , что приводит к необходимым и достаточным условиям закона больших чисел в классической формулировке (3). Для последовательности независимых одинаково распределенных величин эти условия сводятся, в соответствии с указанной теоремой Хинчина, к существованию математического ожидания. В то же время для предельного постоянства средних арифметических в этом случае необходимо и достаточно условие
Легко привести примеры, когда условие (5) не выполняется. Так, оно не выполняется, если все имеют распределение Коши с плотностью (которой соответствует характеристическая функция . Здесь средние арифметические имеют характеристическую функцию и, следовательно, имеют при любом то же самое распределение, что и отдельные слагаемые.
В числе наиболее важных примеров, где закон больших чисел не имеет места, следует отметить примеры, связанные с временами возвращения в случайных блужданиях. Например, в симметричном блуждании Бернулли время до -го возвращения в исходную точку есть сумма независимых случайных величин , где – время до 1-го возвращения, – время между 1-м и 2-м возвращениями и т. д. Распределение величины сходится при к невырожденному предельному закону с плотностью
и равной нулю при . Таким образом, в этом случае распределение среднего арифметического величин , т. е. размещается, грубо говоря, на отрезке длины порядка [в то время как в случае применимости закона больших чисел оно сосредоточивается на отрезках длины ].
Применимость закона больших чисел к суммам зависимых величин (и в его классической формулировке, и в более общих) связана в первую очередь с неограниченным убыванием зависимости между случайными величинами и при увеличении разности их номеров, т. е. . Впервые соответствующие теоремы были доказаны А. А. Марковым для величин, связанных в цепь Маркова (1907). Именно, пусть принимают конечное число значений и связаны в однородную цепь Маркова, причем все вероятности перехода за один шаг положительны. Здесь неограниченное убывание зависимости между и при проявляется в том, что условное распределение при фиксированном значении стремится при к пределу, не зависящему от выбранного значения (эргодическая теорема Маркова). Как следствие этого утверждения выводится закон больших чисел: сначала устанавливается, что при
где ; отсюда же вытекает, что при
Более общий случай охватывается условиями С. Н. Бернштейна: если , , где – некоторая постоянная, – коэффициент корреляции, – функция, стремящаяся к нулю при , то к величинам применим закон больших чисел (3). Для стационарных в широком смысле последовательностей условие на корреляцию можно несколько ослабить, заменив его условием
где .
Предыдущие результаты можно обобщить в различных направлениях. Во-первых, всюду выше рассматривалась сходимость «по вероятности». Рассматривают и другие типы сходимости: с вероятностью единица, в среднем квадратичном и т. п. (в действительности многие из указанных выше условий обеспечивают сходимость в среднем квадратичном, из которой вытекает сходимость по вероятности). Случай сходимости с вероятностью единица, ввиду его важности, выделяется особым названием «усиленного закона больших чисел».
Далее, многие теоремы переносятся с соответствующими изменениями на случайные векторы со значениями из евклидовых пространств любой размерности, из гильбертова пространства, из некоторых банаховых пространств. Так, например, если – последовательность независимых, одинаково распределенных случайных векторов со значениями из сепарабельного банахова пространства и если ( – норма ) существует, то
при любом и .
Рассматриваемый в наиболее общей форме закон больших чисел оказывается тесно связанным с эргодическими теоремами. Разумеется, многие теоремы переносятся и на случай средних , где – случайный процесс, зависящий от непрерывного параметра (см., например, Лоэв. 1962).
Наконец, вместо сумм случайных величин можно рассмотреть другие симметрические функции от них. Это было сделано А. Я. Хинчиным (1951–1955) в связи с обоснованием некоторых выводов статистической механики (Хинчин. 1955). Результат А. Я. Хинчина можно пояснить следующим частным примером. Пусть – координаты точки, равномерно распределенной на поверхности сферы
Тогда для широкого класса симметрических функций имеет место закон больших чисел в том смысле, что их значения при оказываются предельно постоянными [это близко к замечанию П. Леви (1925) о том, что достаточно регулярные функции очень большого числа переменных почти постоянны в большей части области определения].
В большинстве старых руководств приводились обширные статистические данные, иллюстрирующие закон больших чисел (см., например, Марков. 1924, Uspensky. 1937).