Метод группировок
Ме́тод группиро́вок, метод обработки и анализа статистических данных, при котором изучаемая совокупность явлений разделяется на однородные по отдельным признакам группы и подгруппы и каждая из них характеризуется системой статистических показателей. С помощью метода группировок решаются следующие задачи: выделение социально-экономических типов явлений; изучение структуры явления; выявление взаимосвязи и взаимозависимости между явлениями и признаками, их характеризующими. В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.
Типологическая группировка представляет собой разбиение разнородной совокупности единиц на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений (см., например, таблицу 1).
Таблица 1. Распределение численности работников органов государственной власти и местного самоуправления Центрального федерального округа РФ по ветвям власти (на конец 2004)
Органы государственной власти и местного | Численность работников | |
Всего, тыс. человек | Удельный вес, % к итогу | |
Законодательные | 6,0 | 1,9 |
Исполнительные | 259,3 | 84,1 |
Судебные и прокуратура | 41,5 | 13,5 |
Другие государственные органы | 1,5 | 0,5 |
Итого | 308,3 | 100,0 |
Структурной является группировка, предназначенная для изучения состава и структуры однородной совокупности по какому-либо изменяющемуся признаку (см., например, таблицу 2).
Таблица 2. Группировка областей Центрального федерального округа РФ по величине среднемесячной номинальной начисленной заработной платы работающих в экономике (2004)
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. | Число областей, | Среднемесячная номинальная начисленная заработная плата работающих в экономике, % к итогу | Среднегодовая численность занятых в экономике, % к итогу | Среднедушевые денежные расходы и сбережения в месяц, % к итогу |
4–4,8 тыс. | 43,8 | 38,9 | 43,3 | 40,8 |
4,8–5,6 тыс. | 37,5 | 39,1 | 38,8 | 37,9 |
5,6–6,4 тыс. | 18,7 | 22,0 | 17,9 | 21,3 |
Итого | 100,0 | 100,0 | 100,0 | 100,0 |
Аналитическая группировка выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими (см., например, таблицу 3).
Таблица 3. Группировка областей Центрального федерального округа РФ по объёму промышленной продукции (2004)
Объём | Число | Объём промышленной | Среднегодовая численность | Инвестиции в основной | |||
Всего | В среднем | Всего | В среднем | Всего | В среднем | ||
25–80 | 12 | 608 | 50,7 | 6,8 | 0,567 | 155 | 12,9 |
80–135 | 3 | 343 | 114,3 | 2,0 | 0,667 | 64 | 21,3 |
135–190 | 1 | 186 | 186,0 | 0,6 | 0,600 | 26 | 26,0 |
Итого | 16 | 1137 | 71,1 | 9,4 | 0,588 | 245 | 15,3 |
По способу построения группировки бывают простые и комбинированные. В простой группировке группы образованы только по одному признаку; в комбинированной разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании. Комбинированные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам (см., например, таблицу 4).
Таблица 4. Группировка административно-территориальных единиц Центрального федерального округа РФ по индексу численности населения и индексу объёма промышленного производства (2004)
Группы административно- | Подгруппы административно- | Число административно- |
98,8–99,4
| 103–110 | 14 |
99,4–100,0 Итого по группе | 103–110 | 2 |
Итого по подгруппам | 103–110 | 16 |
Всего |
| 18 |
Построение статистических группировок включает ряд этапов: выбор группировочного признака, определение числа групп, расчёт ширины интервала группировки, определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.
Группировочным называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные, так и качественные признаки.
Число групп зависит от задач статистического исследования и вида признака, положенного в основание группировки. В случае построения группировки единиц наблюдения по количественному признаку особое внимание обращают на объём совокупности и степень вариации группировочного признака. При небольшом объёме совокупности обычно не образуется большое количество групп, т. к. группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления. При образовании числа групп определяется размах вариации признака (R), который позволяет оценить разброс значений признака между крайними его значениями – максимальным (Xmax) и минимальным (Xmin) – и рассчитывается по формуле:
.
Чем больше размах вариации признака, положенного в основание группировки, тем большее число групп может быть образовано. Выделение большого числа групп позволяет, с одной стороны, точнее воспроизвести характер исследуемого объекта, однако, с другой стороны, затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп исходят не только из степени вариации признака, но и из особенностей объекта, показателей, его характеризующих, и цели исследования.
Важный этап построения статистической группировки – определение границ интервалов. Нижней границей интервала называется наименьшее значение признака в интервале, верхней границей – его наибольшее значение. Интервалы группировки классифицируются следующим образом:
1. В зависимости от величины интервалы бывают равными и неравными. Неравные, в свою очередь, подразделяются на возрастающие, убывающие, произвольные, специализированные.
2. В зависимости от наличия границ интервалы могут быть открытыми и закрытыми.
Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерно и его вариация проявляется в сравнительно узких границах. Ширина равного интервала определяется по формуле:
где n – число групп.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то используется группировка с неравными интервалами. Они могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупностей, равных интервалов. Также неравные интервалы могут быть возрастающими или убывающими в арифметической или геометрической прогрессии.
Специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Такие интервалы, не являющиеся ни возрастающими, ни убывающими, называют произвольными, см. таблицу 5.
Таблица 5. Распределение населения по величине среднедушевых денежных доходов в 2021 г., %
Среднедушевые денежные доходы населения в месяц, руб. | Доля населения |
До 7 тыс. | 2,7 |
7,1–10 тыс. | 4,6 |
10,1–27 тыс. | 37,0 |
27,1–45 тыс. | 26,0 |
45,1–60 тыс. | 11,6 |
60,1–100 тыс. | 12,5 |
свыше 100 тыс. | 5,6 |
У закрытых интервалов имеются обе границы – и верхняя, и нижняя; у открытых – указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (человек): до 50, 50–100, 100–150, 150 и более.