Выборочный метод
Вы́борочный ме́тод, статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку. Математическая теория выборочного метода опирается на два важных раздела математической статистики – теорию выбора из конечной совокупности и теорию выбора из бесконечной совокупности. Основное отличие выборочных методов для конечной и бесконечной совокупностей заключается в том, что в первом случае выборочный метод применяется, как правило, к объектам неслучайной, детерминированной природы (например, число дефектных изделий в данной партии готовой продукции не является случайной величиной: это число – неизвестная постоянная, которую и надлежит оценить по выборочным данным). Во втором случае выборочный метод обычно применяется для изучения свойств случайных объектов (например, для исследования свойств непрерывно распределённых случайных ошибок измерений, каждое из которых теоретически может быть истолковано как реализация одного из бесконечного множества возможных результатов).
Выбор из конечной совокупности и его теория являются основой статистических методов контроля качества и часто применяются в социологических исследованиях. Согласно теории вероятностей, выборка будет правильно отражать свойства всей совокупности, если выбор производится случайно, т. е. так, что любая из возможных выборок заданного объёма из совокупности объёма (число таких выборок равно ) имеет одинаковую вероятность быть фактически выбранной.
На практике наиболее часто используется выбор без возвращения (бесповторная выборка), когда каждый отобранный объект перед выбором следующих объектов в исследуемую совокупность не возвращается (такой выбор применяется, например, для определения выигрышных лотерейных билетов, при статистическом контроле качества, а также при демографических исследованиях). Выбор с возвращением (выборка с повторением) рассматривается обычно лишь в теоретических исследованиях (примером выбора с возвращением их является регистрация числа частиц, коснувшихся в течение данного времени стенок сосуда, внутри которого совершается броуновское движение). Если , то повторный и бесповторный выборы дают практически эквивалентные результаты.
Свойства совокупности, исследуемые выборочным методом, могут быть качественными и количественными. В первом случае задача выборочного обследования заключается в определении количества объектов совокупности, обладающих какими-либо признаками (например, при статистическом контроле часто интересуются количеством дефектных изделий в партии объёма ). Оценкой для служит отношение , где – число объектов с данным признаком в выборке объёма . В случае количественного признака имеют дело с определением среднего значения совокупности . Оценкой для является выборочное среднее
где – те значения из исследуемой совокупности , которые принадлежат выборке. С математической точки зрения первый случай – частная разновидность второго, которая имеет место, когда величин равны , а остальные равны ; в этой ситуации и .
В математической теории выборочных методов оценка среднего значения занимает центральное место потому, что она служит основой количественного описания изменчивости признака внутри совокупности, так как за характеристику изменчивости обычно принимают дисперсию
представляющую собой среднее значение квадратов отклонений от их среднего значения . В случае изучения качественного признака
О точности оценок и судят по их дисперсиямкоторые в терминах дисперсии конечной совокупности выражаются в виде отношений (в случае выборок с повторением) и (в случае бесповторных выборок). Так как во многих практически интересных задачах случайные величины и при приближённо подчиняются нормальному распределению, то отклонения от и от , превышающие по абсолютной величине и соответственно, могут при осуществиться в среднем приблизительно в одном случае из двадцати.
Более полную информацию о распределении количественного признака в данной совокупности можно получить с помощью эмпирического распределения этого признака в выборке.
Выбор из бесконечной совокупности. В математической статистике результаты каких-либо однородных наблюдений (чаще всего независимых) принято называть выборкой даже в том случае, когда эти результаты не соответствуют понятию выборки с повторениями или без повторений из конечной совокупности. Например, результаты измерений углов на местности, подверженные независимым непрерывно распределённым случайным ошибкам, часто называют выборкой из бесконечной совокупности. Предполагается, что принципиально можно осуществить любое число таких наблюдений. Полученные фактически результаты считают выборкой из бесконечного множества возможных результатов, называемого генеральной совокупностью. Понятие генеральной совокупности не является логически безупречным и необходимым. Для решения практических задач нужна не сама бесконечная генеральная совокупность, а лишь те или иные характеристики, которые ей ставятся в соответствие. Эти характеристики с точки зрения теории вероятностей являются числовыми или функциональными характеристиками некоторого распределения вероятностей, а элементы выборки – случайными величинами, подчиняющимися этому распределению. Такое истолкование позволяет распространить на выборочные оценки общую теорию статистических оценок. По этой причине, например, в вероятностной теории обработки наблюдений понятие бесконечной генеральной совокупности заменяется понятием распределения вероятностей, содержащего неизвестные параметры. Результаты наблюдений трактуются как экспериментально наблюдаемые значения случайных величин, подчиняющихся этому распределению. Цель обработки – вычисление по результатам наблюдений в том или ином смысле оптимальных статистических оценок для неизвестных параметров распределения.
Выше речь шла о выборочном обследовании одной совокупности каких-либо объектов. Однако практическое применение выборочного метода часто осуществляется во многих однородных совокупностях (например, при оценке доли бракованных изделий в нескольких партиях готовой продукции). В этой ситуации объектом изучения является не одно число , а несколько неизвестных чисел . Пусть, например, все обследуемые партии готовой продукции содержат изделий, причем – количества дефектных изделий в этих партиях, а – соответствующие количества дефектных изделий, обнаруженные в выборках объёма . Согласно условию т. н. бездефектной приёмки партия с номером передаётся потребителю, если , в противном случае она бракуется. Предположим, что контроль изделий сопряжён с их уничтожением, и поэтому потребитель либо получает партию объёма (при ), либо партию объёма с количеством дефектных изделий (при ), причём значения (а, значит, и их сумма) известны, а значение неизвестно. Отношение называют долей пропущенного брака, а его математическое ожидание – средней долей пропущенного брака. Задача математической статистики заключается в оценке по значениям , зафиксированным в результате применения выборочного метода. Если значения можно трактовать как реализации независимых одинаково распределённых случайных величин с известным законом распределения , то согласно формуле Бейеса статистическая оценка среднего числа пропущенных дефектных изделий в принятых партиях выражается формулой
причём
где
Поэтому оценка
средней доли пропущенного брака в принятых партиях удовлетворяет неравенству
где – число принятых партий, а – количество тех забракованных партий, в выборках из которых обнаружено ровно одно дефектное изделие.