Статистика
Стати́стика (от лат. status – состояние, положение вещей), наука, которая разрабатывает конкретные методы оценки параметров массовых явлений, тенденций их развития или гипотез о наличии взаимосвязей между ними на основе фактов; практическая деятельность по сбору, анализу, интерпретации, представлению и организации статистических данных; массивы эмпирических данных по какому-нибудь предмету.
История статистики
Статистика зародилась и развивалась как инструмент для решения практических вопросов, связанных с запросами государства, общества и экономики. Главной причиной была потребность государства в данных о населении, урожаях и доходах для целей налогообложения и организации других государственных повинностей, таких как формирование армии. Имеются свидетельства о существовании практики сбора статистических данных для государственных нужд в Древнем Китае [Ю. Э. Янсон писал о том, что «первая перепись относится к XXIII веку до Р. Х.» (Янсон. 1886. С. 7)], Ассирии и в других древних государствах. Первоначально эти задачи решались с помощью примитивных методов. Например, считается, что персидский правитель Дарий, указав своему войску на некоторое место, приказал, чтобы каждый воин, проходя мимо, положил туда камень, и судил о величине армии по высоте образовавшегося холма (Геродот. 1972. IV. 92). Если эта информация соответствует действительности, то её можно считать свидетельством не только разработки методов сбора данных, но и визуализации результатов.
С ростом государственных потребностей в данных статистическая деятельность развивалась и постепенно превратилась в рутинную функцию государственных органов. В Древней Греции уже был систематический учёт численности населения. В Древнем Риме в 6 в. до н. э. учреждения Сервия Туллия проводили цензы (перепись граждан с оценкой их имущества), а также делали записи рождений и смертей и составляли списки совершеннолетних; осуществлявших подобные переписи служащих, или цензоров, уже можно считать профессиональными статистиками (Янсон. 1886. С. 8). Термин «census» до сих пор применяется в английском языке для обозначения понятия «перепись». Статистическое учреждение США, ответственное за проведение переписей населения и сбор других статистических данных, по-английски называется Bureau of the Census.
Происхождение термина «статистика» является предметом дискуссий. Широко распространено мнение, что он произошёл от латинского status (ситуация, состояние дел); в позднелатинском языке тот же термин означал «государство». По другой версии, термин происходит от итальянских слов stato (государство) или statista (человек, который занимается делами государства). Первое использование слова «статистика» встречается в работе итальянского историка Джироламо Гилини (1589–1668), который в одной из своих работ ссылается на «отчёт о гражданской, политической, статистической и военной науке» (Ghilini G. Teatro d'huomini letterati aperto dall'Abbate Girolamo Ghilini. Venetia, 1647. Vol. 1. P. 122). Об этом направлении принято говорить как об «описательной школе статистики», истоки которой можно проследить начиная с Аристотеля через итальянских и других авторов до германских университетов 17–18 вв., когда оно достигло своей кульминации. Термин «статистика» в этом понимании был достаточно широко распространён (например, его использовал У. Шекспир в «Гамлете»), но он употреблялся в другом, отличном от современного понимания смысле – для обозначения науки об описании политического устройства государств без упора на использование для этих целей каких-либо числовых методов или обобщений.
С накоплением фактических данных о населении, богатстве, доходах возникла потребность в их осмыслении и систематизации на основе численных данных, и это привело к возникновению в 17 в. школы политической арифметики. Основоположника данной школы – У. Петти – К. Маркс называл «в некотором роде изобретателем статистики» (Маркс. 1960. С. 282). Вместе с тем развитие этого направления сводилось в основном к исследованию статистических показателей и в значительно меньшей степени – к разработке методов сбора и обработки первичных данных и выявлению формальных статистических зависимостей.
Использование статистических методов для систематизации и анализа массовых данных не ограничивались только государственным устройством и экономикой. Например, составление таблиц продолжительности жизни проводилось для целей страхования, а основанные на статистических подходах арифметические методы для устранения ошибок измерений использовались в астрономии и механике в 18–19 вв. такими великими учёными, как К. Ф. Гаусс. Статистика сыграла существенную роль в развитии медицины, общественной гигиены, а также биологии, метеорологии, физики и др. В 19 в. развитию статистической методологии способствовали труды Ф. Гальтона, К. Пирсона, У. К. Митчелла, У. С. Госсета (писал под псевдонимом Стьюдент), внёсших значительный вклад в разработку математической статистики. Ф. Гальтон применял статистические методы к проблеме наследственности. К. Пирсон разрабатывал вопросы теории количественной оценки связи (теории корреляции). Статистические методы оказались настолько универсальными, что ныне можно говорить о статистике как о методологической науке, достижения которой широко используются практически во всех областях знаний, основанных на изучении эмпирических фактов.
Одним из важнейших моментов, определяющих успех в использовании статистики для решения практических задач, является наличие надёжных первичных данных. Исторически процесс сбора и первоначальной обработки данных развивался в направлении увеличения охвата, и на определённом этапе это привело к организации регулярных массовых сплошных наблюдений, или переписей, во многих предметных областях (переписи населения, скота, предприятий и т. д.). Переписи проводятся до сих пор, но они слишком дороги и трудоёмки, чтобы быть единственным источником информации. В 1-й половине 20 в. произошло развитие выборочных методов статистического наблюдения; в частности, У. С. Госсет разработал теорию малой выборки. Ныне большинство первичных данных во всём мире собирается с помощью несплошного наблюдения. Методы сбора статистических данных продолжают совершенствоваться, развитие компьютерных технологий оказывает всё более усиливающееся влияние на статистику, и с течением времени этот процесс будет усиливаться.
Развитие статистики в России
Развитие статистики в России проходило и проходит в рамках общемировых тенденций. Первые переписи земель и населения с постоянно усложнявшейся программой проводились ещё в Киевской Руси (9–12 вв.). При Петре I были проведены обширные реформы, которые коснулись почти всех направлений жизни страны, в том числе и статистики. Реформа налоговой системы Петра была связана с появлением новой единицы – «души» мужского пола, что потребовало проведения подушной переписи населения – ревизии. Первая ревизия была объявлена 26 ноября (7 декабря) 1718 г., её проводила армия. В начале 18 в. в России зародился и текущий учёт населения, в 1-й половине 18 в. уже проводились переписи рабочих фабрик и мануфактур.
1802 г. принято считать годом возникновения российской государственной статистики, поскольку именно тогда была введена официальная статистическая отчётность вновь образованных министерств. В 1811 г. в составе Департамента исполнительной полиции Министерства внутренних дел было сформировано самостоятельное структурное подразделение – Статистическое отделение, которое возглавил профессор К. Ф. Герман, будущий академик. С тех пор государственная статистика многократно реорганизовывалась и развивалась.
Особое место в истории российской статистики принадлежит земской статистике. При земствах, органах местного самоуправления, с середины 1870-х гг. были созданы специальные статистические бюро. Земские статистики собирали и разрабатывали обширный статистический материал, который использовался для глубоких экономических и социальных исследований пореформенной России. Работа земской статистики характеризовалась не только сбором и разработкой статистических данных, но и развитием статистической методологии.
К началу 20 в. российская статистика по праву занимала место в ряду мировых лидеров. Один из первых Всемирных статистических конгрессов проводился в 1872 г. в Санкт-Петербурге, а в 1897 г. Россия принимала сессию Международного статистического института.
В советский период на государственную статистику была возложена несвойственная ей функция контроля за выполнением государственных планов, наложившая сильный отпечаток на деятельность советской статистики. С переходом к рыночной экономике государственная статистика России вернулась к выполнению традиционных для статистической службы функций по обеспечению общества статистическими данными.
Российская академическая школа статистики (особенно математической в лице П. Л. Чебышёва, А. А. Маркова, А. М. Ляпунова) известна во всём мире. Особое место занимают работы советского академика А. Н. Колмогорова, которые поставили современную математическую статистику на прочную аксиоматическую основу.
Статистика как современная дисциплина
Статистика имеет несколько основных направлений, объединившихся в современную дисциплину:
теорию вероятностей, первоначально формализованную примерно в середине 17 в. в попытках предсказывать результаты азартных игр, а затем поставленную на прочную математическую основу с помощью аксиом Колмогорова;
разработку методов наблюдения за эмпирическими событиями, их количественной оценки и преобразования полученной информации в формализованные статистические данные (здесь необходимо отметить проблему проектирования адекватных статистических показателей, адаптированных к задачам каждого конкретного исследования, а также необходимых классификаторов и других статистических инструментов);
разработку методов извлечения полезной информации из этих данных, а также использования полученной информации для решения конкретных вопросов прогнозирования, принятия решений и т. д.
Научный метод называется статистическим, если он связывает факты, определённого рода гипотезы и методы их проверки: эмпирические факты должны быть описаны и структурированы в виде наборов данных, а гипотезы и методы их проверки сформулированы в терминах теории вероятностей и математической статистики.
Статистика тесно связана с прикладной математикой, однако разделом математики не является. В математике превалирует дедуктивный подход, а статистика, по сути, индуктивна – в ней суждения о свойствах явления в целом делаются на основе анализа параметров отдельных единиц, входящих в генеральную совокупность. В то же время теория вероятностей основана на системе аксиом и является математической дисциплиной.
Статистика в высшей степени междисциплинарна; универсальные статистические методы находят применение практически во всех научных областях, а исследовательские вопросы из различных сфер науки мотивируют разработку новых статистических методов и теорий. Статистика имеет дело с эмпирическими событиями, которые обусловлены набором факторов, в том числе с отраслевой спецификой. На практике большинство статистических исследований осуществляются в привязке к конкретным отраслям знаний, условиям места и времени. Универсальные статистические методы применяются в рамках экономической статистики, статистики занятости и безработицы, демографической статистики, медицинской статистики и т. д.
Сбор и обработка статистической информации является сложным и трудоёмким процессом, во многом определяющим адекватность конечных результатов статистической деятельности. Статистические данные могут собираться силами государственной статистики или другими производителями, преследующими коммерческие, научные или какие-либо другие цели. Методы, применяемые различными производителями статистических данных, зависят от целей их работы, статуса и наличия ресурсов и существенно различаются. Государственные статистические органы, например, могут проводить основанные на сплошном наблюдении переписи, в то время как в бизнес-статистике и социологии превалируют выборочные обследования. В некоторых областях, таких как медицина, фармакология или агрономия, практикуются статистические эксперименты. При сборе и обработке статистических данных широко применяются компьютерная техника и соответствующие технологии.
Массивы данных могут изначально формироваться в статистических целях (материалы переписей, выборочных обследований) или, например, в целях управления (данные административных регистров), однако последние также могут быть использованы для статистических исследований при условии их соответствия определённым требованиям. В связи с этим в статистике растёт роль т. н. больших данных, таких как информация, собираемая операторами сотовой связи, системами космического наблюдения или поисковыми системами сети интернет. Объёмы этих данных очень велики и постоянно расширяются. Вероятно, со временем роль больших данных в обеспечении пользователей исходной статистической информацией будет и дальше усиливаться, однако их использование должно учитывать ограничения методологического и правового характера.