Непараметрические методы математической статистики
Непараметри́ческие ме́тоды математи́ческой стати́стики, методы, не предполагающие знания функционального вида теоретического распределения. Название «непараметрические методы» подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений), и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений.
Одним из непараметрических методов является критерий Колмогорова проверки согласованности теоретических и эмпирических распределений. Пусть взаимно независимые случайные величины (выборка объёма ) имеют теоретическую функцию распределения и пусть – эмпирическая функция распределения, построенная по наблюдениям над этими случайными величинами ( является несмещённой и состоятельной оценкой для ). Пусть – наибольшее по абсолютной величине значение разности . Случайная величина имеет, в случае непрерывности , функцию распределения , не зависящую от и стремящуюся при возрастании к пределу
Отсюда при достаточно больших для вероятности неравенства получается приближённое выражение
функция табулирована. Её значения для некоторых приведены в таблице.
Таблица значений функции | ||||||
0,57 | 0,71 | 0,83 | 1,02 | 1,36 | 1,63 | |
0,10 | 0,30 | 0,50 | 0,75 | 0,95 | 0.99 |
Равенство используется для проверки гипотезы о том, что теоретическим распределением является распределение с заданной непрерывной функцией распределения : сначала по результатам наблюдений находят значение величины а затем по формуле вычисляют вероятность получить отклонение от , большее или равное наблюдённому. Если указанная вероятность достаточно мала, точнее – равна наперёд заданному малому положительному числу , то в соответствии с общими принципами проверки статистических гипотез проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, что для двух независимых выборок объёмов и соответствующие (непрерывные) теоретические функции распределения одинаковы (гипотеза однородности двух выборок). При этом вместо формулы пользуются тем, что вероятность неравенства
имеет пределом , где есть наибольшее по абсолютной величине значение разности . Приведённые примеры относятся к непараметрическим методам, основанным на разностях теоретических и эмпирических или двух эмпирических функций распределения.
Значительное место в современной математической статистике занимают непараметрические методы, в которых используются не сами эмпирические функции распределения, а некоторые функции от порядковых статистик – членов вариационного ряда. Если используются порядковые номера результатов наблюдений (они называются рангами), то такие непараметрические методы называются ранговыми, они, как правило, являются критериями однородности. Например, пусть и – взаимно независимые элементы двух выборок с непрерывными функциями распределения. Для проверки гипотезы о том, что эти функции распределения одинаковы, можно использовать ранговый критерий, основанный на значениях функций
где – ранги случайных величин , в общем вариационном ряду и , а – одна из возможных перестановок чисел . Выбор перестановки может быть осуществлён оптимальным образом.