Пространственно-эконометрические модели
Простра́нственно-эконометри́ческие моде́ли, экономико-математические модели, позволяющие учитывать пространственную зависимость между географическими единицами.
Поскольку для оценки некоторых линейных регрессионных моделей используются наблюдения для таких объектов, как страны, регионы и т. д., имеющие общие границы, потоки товаров, услуг и т. п., необходимо принимать во внимание влияние регионов друг на друга. Однако если учитывать это влияние слишком детально, придётся вводить в модель чрезмерно много параметров, что затруднит её оценивание. В то же время, если это влияние не учитывать, может возникнуть проблема смещения оценок коэффициентов вследствие пропуска существенных переменных (англ. omitted variable bias). Компромиссом является использование пространственно-эконометрических моделей, в которых влияние других регионов отражается за счёт включения пространственных лагов зависимой и/или объясняющих (независимых) переменных, при этом количество оцениваемых параметров увеличивается незначительно.
По форме пространственно-эконометрические модели аналогичны моделям временных рядов (см. таблицу), только временные лаги в них заменяются на пространственные, т. е., например, вместо используется , где – взвешивающая матрица.
Аналогии между моделями временных рядов и пространственно-эконометрическими моделями.
Модели временных рядов | Пространственно-эконометрические модели ( – матрица объясняющих переменных) |
– авторегрессионная модель | или – пространственно-авторегрессионная модель (англ. spatial autoregression model, SAR) |
– модель с автокорреляцией в ошибках | – пространственная модель с автокорреляцией в ошибках (англ. spatial error model, SEM) |
– модель с распределёнными лагами | – модель с пространственными лагами объясняющих переменных (англ. spatial lag model, SLX) |
– авторегрессионная модель с распределёнными лагами | – пространственная модель Дарбина с пространственными лагами зависимой и объясняющих переменных (англ. spatial lag model, SDM) |
Анализ необходимости включения в модели пространственных лагов обычно начинается с вычисления индикаторов пространственной зависимости – индексов Морана, Гири, Гетиса – Орда. Если соответствующая зависимость выявлена, то для выбора конкретной спецификации модели используют 2 основных подхода.
Первый подход (Simple diagnostic ... 1996) состоит в оценке линейной модели , сохранении остатков этой регрессии и проверке гипотез:
(т. е. пространственная зависимость в ошибках регрессии отсутствует) при альтернативной гипотезе (т. е. это модель SEM). Проверка гипотез осуществляется с помощью теста Лагранжа путём вычисления тестовой статистики:
(т. е. пространственный лаг зависимой переменной отсутствует) при альтернативной гипотезе (т. е. это модель SAR). Проверка гипотез осуществляется с помощью теста Лагранжа путём вычисления тестовой статистики
При втором подходе (Elhorst. 2014; LeSage. 2009; Kelejian. 2010) оценивается наиболее общая модель (англ. general nesting spatial model, GNS):
затем с помощью теста Лагранжа или Вальда проверяются гипотезы:
(тогда модель сводится к SDM);
(тогда модель сводится к SLX);
(тогда модель сводится к SAR);
(тогда модель сводится к линейной регрессионной модели);
(тогда модель сводится к SEM).
Если среди объясняющих переменных встречается лаг зависимой переменной, то возникает проблема эндогенности, поскольку этот лаг коррелирует с ошибками регрессии. В этом случае параметры модели оцениваются с помощью метода максимального правдоподобия (обычно при предположении, что ошибки имеют нормальное распределение) или с помощью обобщённого метода моментов.
В целях интерпретации результатов оценивания моделей для каждого из объясняющих факторов вычисляют предельные эффекты . Эти эффекты показывают, какие изменения произойдут в регионе при изменении фактора в -м регионе.
Если , то соответствующие предельные эффекты называются прямыми; если – то косвенными, или спилловерами. Например, если – уровень безработицы в регионе (в процентах), а – валовой региональный продукт (ВРП) на душу населения (в тысячах рублей), то прямой эффект показывает, на сколько процентных пунктов изменится безработица в регионе при увеличении ВРП на душу населения в этом регионе на 1 тыс. руб. Косвенный эффект показывает, на сколько процентных пунктов изменится безработица в регионе при увеличении ВРП на душу населения в регионе на 1 тыс. руб.
Для наиболее общей пространственной модели Дарбина, которую также можно переписать в следующем виде:
предельные эффекты вычисляются по формуле:
Эта матрица для каждой переменной имеет размер . Диагональные элементы матрицы являются прямыми эффектами, а внедиагональные – косвенными. Поскольку прямых и косвенных эффектов очень много, то обычно для каждой переменной вычисляют:
средние прямые предельные эффекты (англ. average direct effect);
средние косвенные предельные эффекты (англ. average indirect effect);
общие предельные эффекты (англ. average total effect).
Пример более детальной интерпретации предельных эффектов приведён в исследовании О. А. Демидовой «Методы пространственной эконометрики и оценка эффективности государственных программ» (Демидова. 2021). Алгоритм проверки значимости предельных эффектов описан также и в работе Дж. П. Элхорста «Пространственная эконометрика: от перекрёстных данных к пространственным панелям» (Elhorst. 2014. P. 24–25).