Пространственная эконометрика
Простра́нственная экономе́трика, часть эконометрики, включающая модели, предназначенные для учёта пространственного взаимодействия между географическими единицами (страны, регионы и т. д.).
Датой рождения пространственной эконометрики считается 1979 г., когда вышла книга Ж. Палинка (род. 1930), отца-основателя этой дисциплины, и Л. Классена (1920–1992) «Пространственная эконометрика» (Klaassen. 1979), в которой были изложены её основы. При этом термин «пространственная эконометрика» был введён в научный оборот немного раньше – в 1974 г., на ежегодной конференции голландской статистической ассоциации. С тех пор эта область на пересечении эконометрики, географии, политических наук активно развивается. Большой вклад в становление и развитие пространственной эконометрики внесли Л. Анселин (род. 1953), И. Пруха (род. 1947), М. Фишер (род. 1947), Дж. Арбия (род. 1958), Д. Гриффитс (род. 1948) и другие, история развития пространственной эконометрики описана в статье Л. Анселина (Anselin. 2010).
Основную идею пространственной эконометрики отражает первый закон географии, сформулированный У. Тоблером (1930–2018): «…всё связано со всем остальным, но близкое связано больше, чем отдалённое» («everything is related to everything else, but near things are more related than distant things») (Tobler. 1970. P. 236). В качестве объектов, для которых изучаются, моделируются, прогнозируются различные показатели, могут выступать страны, регионы одной или нескольких стран, города, фирмы и т. п.
Близость двух объектов измеряется с помощью расстояния между ними, причём это расстояние может быть определено различными способами. Например, если рассматриваются несколько регионов, то расстояние между каждой парой из них можно измерить с помощью фактического расстояния (как евклидово расстояние между центрами их столиц или как расстояние по автодорогам между центрами столиц) или как время на автомобиле, необходимое для того, чтобы попасть из одной столицы в другую (это может быть иной вид транспорта, например поезд или самолёт), или как величину торговых потоков между регионами и ещё очень многими способами.
С помощью расстояния между изучаемыми объектами можно определить множество соседей для конкретного региона, т. е. объекты, расстояние от которых до рассматриваемого объекта отличается от нуля. Здесь также используются различные способы – например, для выбранного региона можно считать соседями: 1) все регионы с общей границей; или 2) регионы, расположенные от рассматриваемого региона на расстоянии не более 500 км (это число можно легко поменять); или 3) 5 регионов, ближе всего расположенных к рассматриваемому (число регионов можно варьировать); или 4) все регионы страны, в которую входит регион.
При моделировании интересующих исследователя показателей (например, уровня безработицы в регионах, прибыли фирм) необходимо учитывать влияние соседей и каналы, через которые это влияние осуществляется. Например, каналы межрегионального влияния включают миграционные потоки, пассажирские потоки, потоки капиталов, товаров, диффузию инноваций и т. д. (Абрё. 2008; Коломак, 2010). Если использовать эконометрические модели и соответствующее влияние соседей не учитывать, то возникнет проблема смещения оценок, связанная с пропуском существенной переменной (omitted variable bias), если их влияние учитывать слишком детально, вводя множество дополнительных переменных, то соответствующие модели будет невозможно оценить. Компромиссом является отражение взаимного влияния рассматриваемых объектов с помощью взвешивающей матрицы , где – число рассматриваемых объектов. Эта матрица обладает следующими свойствами: 1) , т. е. диагональные элементы взвешивающей матрицы равны нулю, поскольку эта матрица отражает влияние всех остальных регионов на рассматриваемый; 2) – условие неотрицательности; 3) – условие нормировки. Тем соседям, что расположены ближе к рассматриваемому объекту согласно выбранному расстоянию, приписываются бо́льшие веса.
С помощью взвешивающей матрицы можно вычислить пространственный лаг для переменной (например, темп экономического роста или уровень безработицы), измеренный для рассматриваемых объектов, по формуле: , – это средневзвешенное значение показателя в соседних регионах.
Рассмотрим пример (Демидова. 2021) взвешивающей матрицы для 6 регионов Уральского федерального округа (Челябинской, Курганской, Свердловской, Тюменской областей, Ханты-Мансийского, Ямало-Ненецкого автономных округов), карта расположения границ этих регионов приведена на рисунке.
Взаимодействие с остальными российскими регионами для простоты не учитывается. Если соседями считаются только регионы с общей границей и влияние соседей каждого региона считается одинаковым (что соответствует равенству ненулевых весов в каждой строке), то взвешивающая матрица, называемая граничной, имеет вид:
.
Пусть – это уровень региональной безработицы, тогда, по данным Росстата (Регионы России. Социально-экономические показатели, 2021), для этих 6 регионов , а пространственный лаг – это средний уровень безработицы в соседних регионах. Например, в Челябинской области уровень безработицы 5,1 %, а средний уровень безработицы в соседних регионах 6 %.
С помощью граничной матрицы, построенной с учётом географических расстояний между объектами (чаще всего – регионами), можно установить, является ли расположение этих объектов по рассматриваемому показателю случайным или имеет место пространственная зависимость.
Наиболее популярными показателями для выявления пространственной зависимости (по некоторому показателю ) являются:
Если статистически не отличается от 0, то расположение регионов не является случайным (по рассматриваемому показателю ). Если , то говорят о положительной пространственной автокорреляции, регионы кластеризуются, а если , то говорят об отрицательной пространственной автокорреляции. В случае индекса Гири его значение сравнивается с ( соответствует положительной пространственной автокорреляции, а – отрицательной). Более детальная информация о кластерах может быть получена с помощью индекса Гетиса – Орда. Если , то имеют место кластеры регионов с большими значениями рассматриваемого показателя, а если , то кластеры регионов с малыми значениями соответствующего показателя. Кроме глобальных, для каждого региона можно рассчитать также локальные индексы Морана, Гири и Гетиса – Орда (Л. Анселин в своей статье 1995 назвал эти показатели LISA – local indicators of spatial association) и выделить локальные кластеры.
Ещё одним популярным инструментом для выявления пространственной зависимости объектов (чаще всего регионов) является график Морана. Фактически это диаграмма рассеяния с точками , где – центрированное и нормированное значение рассматриваемого показателя для -го региона, а – средневзвешенное значение этого показателя в соседних регионах. Оси координат делят все регионы на четыре части (ортанта). Точки, расположенные в первом ортанте, соответствуют регионам, в которых значение рассматриваемого показателя выше среднего, и окружены они регионами, в которых значение рассматриваемого показателя выше среднего; расположенные во втором ортанте – регионам, в которых значение рассматриваемого показателя ниже среднего, а окружены они регионами, в которых значение рассматриваемого показателя выше среднего; расположенные в третьем ортанте – регионам, в которых значение рассматриваемого показателя ниже среднего, и окружены они регионами, в которых значение рассматриваемого показателя ниже среднего; расположенные в четвёртом ортанте – регионам, в которых значение рассматриваемого показателя выше среднего, а окружены они регионами, в которых значение рассматриваемого показателя ниже среднего. Если большинство точек расположено в первом и третьем ортантах, то имеет место кластеризация.
Если перечисленные выше показатели свидетельствуют о пространственной зависимости, то при моделировании интересующих исследователя показателей следует учитывать пространственные факторы. Проще всего это сделать с помощью включения в модель пространственных лагов зависимой и независимой (объясняющей) переменных. Основные пространственно-эконометрические модели аналогичны по функциональной форме и названию моделям временны́х рядов, только временны́е лаги в моделях заменяются на пространственные, например на .
Основные пространственно-эконометрические модели:
(spatial autoregressive model – модель пространственной авторегрессии):
(с пространственным лагом зависимой переменной , – коэффициент пространственной автокорреляции);
(spatial lag model – модели с пространственными лагами объясняющих переменных):
;
(spatial Durbin model – пространственная модель Дарбина):
(с пространственными лагами зависимой и объясняющих переменных);
(spatial Durbin error model – модель Дарбина с пространственной зависимостью в ошибках):
;
(spatial error model – модель с пространственной зависимостью в ошибках):
.
Эти модели оцениваются с помощью метода максимального правдоподобия или обобщённого метода моментов.
Результаты оценки моделей с пространственным лагом зависимой переменной в правой части интерпретируются с помощью предельных эффектов, которые, например, для пространственной модели Дарбина вычисляются следующим образом (Демидова. 2021):
,
где – единичная матрица.
Элемент матрицы показывает, как изменится показатель в регионе при изменении переменной в регионе на одну единицу измерения.
, называются прямыми эффектами, а называются косвенными эффектами, или спилловерами.
Поскольку предельных эффектов очень много ( прямых и косвенных), то обычно вычисляют и интерпретируют средние предельные эффекты:
[ (average direct effect, средний прямой эффект) показывает, как изменение переменной влияет на изменение переменной в этом регионе (например, как инвестиции в регионе влияют на экономический рост в выбранном регионе)];
[ (average indirect effect, средний косвенный эффект) показывает, как изменение переменной в соседних регионах влияет на изменение переменной в выбранном регионе (например, как инвестиции в соседних регионах влияют на экономический рост в выбранном регионе)];
[ (average total effect, средний общий эффект)].
Если в моделях без пространственного лага зависимой переменной значимы коэффициенты при пространственных лагах объясняющих переменных, то говорят о локальных спилловерах (только от соседей). Если же значим коэффициент пространственной автокорреляции, то говорят о глобальных спилловерах (LeSage. 2014), поскольку, например, для -моделей:
т. е. при изменении переменной изменение зависимой переменной обусловливается изменениями в самом рассматриваемом регионе (слагаемое ), спилловеров от соседних регионов (слагаемое ), спилловеров от соседей соседних регионов (или соседей второго порядка, слагаемое и т. д.
В традиционных учебниках по эконометрике разделу «Пространственная эконометрика» обычно уделяется мало внимания [см., например, (Грин. 2016. Раздел 11.7)], однако существуют специальные учебники, посвящённые этой дисциплине (LeSage. 2009; Arbia. 2014; Elhorst. 2014).
Опытные исследователи предостерегают от механического применения пространственно-эконометрических моделей (Journal of Regional Science, 2012. Vol. 52. № 2), иногда необходимо использовать более гибкие функциональные формы моделей или более детальный анализ, например непараметрические модели, байесовский анализ. В некоторых случаях необходимо предварительное разбиение регионов или других рассматриваемых объектов на несколько групп, для которых могут наблюдаться различные пространственные зависимости. Например, как показано в работе (Коломак. 2010), для западных регионов России имеют место положительные спилловеры, а для восточных – отрицательные (это связано с большими расстояниями, низкой плотностью экономической активности и недостаточной развитостью инфраструктуры). Информация об исследованиях, в которых пространственно-эконометрические модели применяются к российским региональным данным, содержится в обзорной статье (Демидова. 2021).