Репрезентативность выборки
Репрезентати́вность вы́борки (англ. representativeness sample), свойства выборки, позволяющие использовать её количественные характеристики (среднее арифметическое, доля положительных ответов, дисперсия и др.) для оценки аналогичных характеристик генеральной совокупности с заданной точностью и вероятностью. Также может интерпретироваться как оценка достоверности результатов выборочного исследования и/или использоваться при сравнении результатов выборочных исследований, проводимых в различных условиях, разными методами или в разное время.
Статистическое обоснование репрезентативности применяется к вероятностным (статистическим) выборкам – простым (случайным), стратифицированным, гнездовым (кластеризованным), многоступенчатым. Оно обеспечивается оцениванием случайной ошибки выборки для наиболее важных с точки зрения целей исследования переменных. Нестатистическое обоснование репрезентативности применяется к целевым выборкам – квотным, «основного массива», «снежного кома» и др.
Метод формирования репрезентативной выборки при опросах населения впервые представлен английским профессором А. Л. Боули (Bowly) в 1906 г. в Королевском статистическом обществе. В 1930 г. Дж. Гэллап опубликовал в журнале Editor & Publisher одну из первых своих работ – «Новый метод определения интереса читателей догадки исключает», – посвящённую выборочному методу, который в дальнейшем активно использовался в проведении опросов, включая президентские выборы в США.
Активное обсуждение репрезентативности выборки началось в профессиональных социологических кругах в 1936 г. после неожиданного провала электорального исследования, проводившегося журналом Literary Digest с 1916 г., как правило, с большим успехом. Получив в 1936 г. от своих читателей более 2 млн ответов, журнал предсказал Ф. Рузвельту 42,9 % голосов избирателей и поражение на выборах, в то время как он победил, получив 62,5 %. И к 1938 г., потеряв бóльшую часть своей аудитории и проиграв вследствие этого конкурентную борьбу, журнал был вынужденно продан другому издательству.
В 1965 г. вышла книга Л. Киша «Выборка исследования», в которой, в частности, рассматривались методы отбора респондентов внутри домохозяйств. Первые выборочные опросы населения в СССР в 1960–1965 гг. проводил Институт общественного мнения газеты «Комсомольская правда» под руководством Б. А. Грушина, выборки для которого разрабатывали Е. С. Петренко и С. В. Чесноков.
Высокая степень репрезентативности социальных исследований расценивается как заказчиками исследований, так и их исполнителями (социологическими, маркетинговыми, медиаметрическими и другими агентствами) в качестве подтверждения качества полученных результатов, которое может привести к заключению или разрыву многолетних миллионных договоров на маркетинговые, рекламные и политические исследования. В социальных науках репрезентативность чаще всего оценивается в опросных исследованиях, однако выборочные методы сбора данных не исключены и в других исследовательских областях. Ограниченно применение в сферах деятельности, где фиксируются «сплошные» данные: демография, миграция, право, занятость, экономика, финансы, внешняя торговля, связь, транспорт, строительство, медицина и др.
Репрезентативность выборки связана в первую очередь с объёмом и структурой генеральной совокупности, а также с методами отбора респондентов. Она может точно измеряться только в тех случаях, когда результаты изучаемого процесса становятся известными, например когда заканчиваются выборы президента страны. После того как выборы завершены, репрезентативность можно оценить как разность между результатами выборов и результатами опроса, выраженными, например, в процентах. В случае президентских выборов 1936 г. разность предсказания и результата выборов для Рузвельта оказалась 42,9 % − 62,5 % = −19,6 %, что составило вероятность 19,6/42,9 = 0,457, или 45,7 % от предсказания.
Если речь идёт не о президентских, а о парламентских выборах, точные результаты можно получить только для каждого места в парламенте, в то время как для предсказания распределения мест между партиями необходимо проводить значительно более объёмные исследования, каждое из которых должно быть репрезентативно для определённого региона.
Если же исследование проводится для предсказания результатов, которые не станут точно известными никогда или, по крайней мере, не вскоре, можно использовать интервальную оценку рассматриваемого параметра генеральной совокупности, например математического ожидания или вероятности. Для этого по выборке вычисляется значение соответствующей характеристики, в частности среднего арифметического для математического ожидания или вероятности для доли определённого значения. И для вычисленного значения строится доверительный интервал с заданной доверительной вероятностью, равной чаще всего 0,95 (95 %); однако также можно использовать и такие вероятности, как 0,99; 0,995 или 0,9. Доверительная вероятность интерпретируется как вероятность, с которой значение параметра генеральной совокупности попадёт в доверительный интервал. Тем не менее чем выше доверительная вероятность, тем более длинным (и менее точным) становится доверительный интервал.
Например, если на крупном предприятии по выборке из 100 человек (n = 100) измерялось время (в минутах), необходимое для обеда работников в столовой (х = 25'; s = 10'); и использовались доверительная вероятность 95 % (1-α = 0,95), а также соответствующий ей доверительный коэффициент = 1,96, то доверительный интервал примет вид:
Р(25' − 1,96) = 0,95 или P(23' < µ < 27') ≈ 0,95. Достоверность выборки в данном случае заключается в том, что 95 % служащих смогут потратить на обед от 23 до 27 мин. Или, иными словами, ошибка выборки Δ не превысит ±2 мин с вероятностью 95 %.
Однако это имеет смысл только в том случае, когда выборка априорно репрезентативна; другими словами, когда выборка имеет определённую структуру и/или извлечена из генеральной совокупности с использованием одного из предназначенных для этого методов. Например, определение численности и структуры генеральной совокупности, которая может быть, например, небольшой и конкретной (например, студенты одного факультета) или практически бесконечной (владельцы мобильных телефонов в городе). Или формирование выборки, позволяющей воспроизвести структуру, близкую к структуре генеральной совокупности, включая определение объёма выборки.
Нерепрезентативность выборки обычно понимается как отклонение значений её характеристик от характеристик генеральной совокупности, для определения которых проводилось выборочное исследование. Обычно выделяют две составляющие ошибки выборки, одну из которых называют систематической, а другую случайной.
Систематические ошибки обычно связывают с ошибками проектирования выборки, в частности отбора измеряемых объектов, а также ошибками инструментария исследования. Нередко их сложно обнаружить и ещё сложнее измерить. Для этого проводятся специальные методологические исследования и применяются специальные процедуры тестирования выборки и измерительных шкал. Систематические ошибки могут быть определены в случае, если со временем становится известным истинное распределение признака в генеральной совокупности (например, результаты выборов), или в результате скрупулёзного анализа артефактов, обнаруженных при анализе данных.
Случайные ошибки связаны с вероятностным характером процедур извлечения выборки из генеральной совокупности и ошибками измерения, не имеющими систематического характера. Ошибки такого рода неустранимы, но подчиняются статистическим законам и, соответственно, поддаются контролю. Важнейшее свойство случайных ошибок состоит в том, что они, в отличие от систематических, уменьшаются с увеличением объёма выборки. Следовательно, увеличивая объём выборки, их можно свести к допустимому пределу и тем самым обеспечить желательную степень точности результатов исследования.