Научные теории, концепции, гипотезы, модели

Пространственная эконометрика

Простра́нственная экономе́трика, часть , включающая модели, предназначенные для учёта пространственного взаимодействия между географическими единицами (страны, регионы и т. д.).

Датой рождения пространственной эконометрики считается 1979 г., когда вышла книга Ж. Палинка (род. 1930), отца-основателя этой дисциплины, и Л. Классена (1920–1992) «Пространственная эконометрика» (), в которой были изложены её основы. При этом термин «пространственная эконометрика» был введён в научный оборот немного раньше – в 1974 г., на ежегодной конференции голландской статистической ассоциации. С тех пор эта область на пересечении эконометрики, , активно развивается. Большой вклад в становление и развитие пространственной эконометрики внесли Л. Анселин (род. 1953), И. Пруха (род. 1947), М. Фишер (род. 1947), Дж. Арбия (род. 1958), Д. Гриффитс (род. 1948) и другие, история развития пространственной эконометрики описана в статье Л. Анселина ().

Основную идею пространственной эконометрики отражает первый закон географии, сформулированный У. Тоблером (1930–2018): «…всё связано со всем остальным, но близкое связано больше, чем отдалённое» («everything is related to everything else, but near things are more related than distant things») ( P. 236). В качестве объектов, для которых изучаются, моделируются, прогнозируются различные показатели, могут выступать страны, регионы одной или нескольких стран, города, фирмы и т. п.

Близость двух объектов измеряется с помощью между ними, причём это расстояние может быть определено различными способами. Например, если рассматриваются несколько регионов, то расстояние между каждой парой из них можно измерить с помощью фактического расстояния (как между центрами их или как расстояние по автодорогам между центрами столиц) или как время на автомобиле, необходимое для того, чтобы попасть из одной столицы в другую (это может быть иной вид транспорта, например поезд или самолёт), или как величину между регионами и ещё очень многими способами.

С помощью расстояния между изучаемыми объектами можно определить множество соседей для конкретного региона, т. е. объекты, расстояние от которых до рассматриваемого объекта отличается от нуля. Здесь также используются различные способы – например, для выбранного региона можно считать соседями: 1) все регионы с общей границей; или 2) регионы, расположенные от рассматриваемого региона на расстоянии не более 500 км (это число можно легко поменять); или 3) 5 регионов, ближе всего расположенных к рассматриваемому (число регионов можно варьировать); или 4) все регионы страны, в которую входит регион.

При моделировании интересующих исследователя показателей (например, уровня в регионах, фирм) необходимо учитывать влияние соседей и каналы, через которые это влияние осуществляется. Например, каналы межрегионального влияния включают , пассажирские потоки, , , и т. д. (Абрё. 2008; ). Если использовать эконометрические модели и соответствующее влияние соседей не учитывать, то возникнет проблема , связанная с пропуском существенной переменной (omitted variable bias), если их влияние учитывать слишком детально, вводя множество дополнительных переменных, то соответствующие модели будет невозможно оценить. Компромиссом является отражение взаимного влияния рассматриваемых объектов с помощью W=(wij),i,j=1,,nW=(w_{ij} ),i,j=1,…,n, где nn – число рассматриваемых объектов. Эта матрица обладает следующими свойствами: 1) wii=0w_{ii}=0, т. е. диагональные элементы взвешивающей матрицы равны нулю, поскольку эта матрица отражает влияние всех остальных регионов на рассматриваемый; 2) wij0w_{ij}≥0 – условие неотрицательности; 3) j=1nwij=1∑_{j=1}^nw_{ij} =1 – условие нормировки. Тем соседям, что расположены ближе к рассматриваемому объекту согласно выбранному расстоянию, приписываются бо́льшие веса.

С помощью взвешивающей матрицы можно вычислить WYWY для переменной Y=(Y1,,Yn)Y=(Y_1,…,Y_n )' (например, темп или уровень безработицы), измеренный для рассматриваемых nn объектов, по формуле: (WY)i=j=1nwijYj(WY)_i=∑_{j=1}^n w_{ij} Y_j, i=1,,ni=1,…,n – это средневзвешенное значение показателя YY в соседних регионах.

Рассмотрим пример () взвешивающей матрицы для 6 регионов Уральского федерального округа (Челябинской, Курганской, Свердловской, Тюменской областей, Ханты-Мансийского, Ямало-Ненецкого автономных округов), карта расположения границ этих регионов приведена на рисунке.

Уральский федеральный округУральский федеральный округ.

Взаимодействие с остальными российскими регионами для простоты не учитывается. Если соседями считаются только регионы с общей границей и влияние соседей каждого региона считается одинаковым (что соответствует равенству ненулевых весов в каждой строке), то взвешивающая матрица, называемая граничной, имеет вид:

W=(01/21/20001/301/31/3001/41/401/41/4001/31/301/30001/31/301/3000010)W = \left( \begin{array}{cccccc} 0 & 1/2 & 1/2 & 0&0&0\\ 1/3 & 0 & 1/3 & 1/3&0&0\\ 1/4 & 1/4 &0 & 1/4&1/4&0\\ 0 & 1/3 & 1/3 & 0&1/3&0\\ 0 & 0 & 1/3 &1/3&0&1/3\\ 0 & 0 & 0 & 0&1&0 \end{array} \right).

Пусть YY – это уровень региональной безработицы, тогда, по данным (), для этих 6 регионов Y=(5.1;7.8;4.2;4.1;2.5;1.9)Y=(5.1;7.8; 4.2; 4.1; 2.5; 1.9)', а пространственный лаг WY=(6;4.47;4.88;4.83;3.4;2.5)WY=(6; 4.47; 4.88; 4.83; 3.4; 2.5)' – это средний уровень безработицы в соседних регионах. Например, в Челябинской области уровень безработицы 5,1 %, а средний уровень безработицы в соседних регионах 6 %.

С помощью граничной матрицы, построенной с учётом географических расстояний между объектами (чаще всего – регионами), можно установить, является ли расположение этих объектов по рассматриваемому показателю случайным или имеет место пространственная зависимость.

Наиболее популярными показателями для выявления пространственной зависимости (по некоторому показателю YY) являются:

  • I(Y)=i,j=1nwij(YiYˉ)(YjYˉ))in(YiYˉ)2,1<I(Y)<1I(Y)=\frac{∑_{i,j=1}^n w_{ij} (Y_i-\bar{Y})(Y_j-\bar{Y}))}{∑_i^n(Y_i-\bar{Y})^2 },-1<I(Y)<1,

  • С(Y)=(n1)i,j=1nwij(YiYj)22ni=1n(YiYˉ)2,0<C(Y)<2С(Y)=\frac{(n-1)∑_{i,j=1}^n w_{ij} (Y_i-Y_j)^2}{2n∑_{i=1}^n(Y_i-\bar{Y})^2}, 0<C(Y)<2,

  • G(Y)=i,j=1nwijYiYji,j=1nYiYjG(Y)=\frac{\sum_{i,j=1}^n w_{ij}Y_i Y_j}{\sum_{i,j=1}^n Y_i Y_j}.

Если II статистически не отличается от 0, то расположение регионов не является случайным (по рассматриваемому показателю YY). Если I>0I>0, то говорят о положительной , регионы , а если I<0I<0, то говорят об отрицательной пространственной автокорреляции. В случае индекса Гири его значение сравнивается с 11 (C<1C<1 соответствует положительной пространственной автокорреляции, а C>1C>1 – отрицательной). Более детальная информация о кластерах может быть получена с помощью индекса Гетиса – Орда. Если G>0G>0, то имеют место кластеры регионов с большими значениями рассматриваемого показателя, а если G<0G<0, то кластеры регионов с малыми значениями соответствующего показателя. Кроме глобальных, для каждого региона можно рассчитать также локальные индексы Морана, Гири и Гетиса – Орда (Л. Анселин в своей статье 1995 назвал эти показатели LISA – ) и выделить локальные кластеры.

Ещё одним популярным инструментом для выявления пространственной зависимости объектов (чаще всего регионов) является . Фактически это диаграмма рассеяния с точками (Yi~;WYi~),i=1,,n(\tilde{Y _i};W\tilde{Y _i}),i=1,…,n, где Yi~\tilde{Y _i} – центрированное и нормированное значение рассматриваемого показателя для ii-го региона, а WYi~W\tilde{Y _i} – средневзвешенное значение этого показателя в соседних регионах. Оси координат делят все регионы на четыре части (ортанта). Точки, расположенные в первом ортанте, соответствуют регионам, в которых значение рассматриваемого показателя выше среднего, и окружены они регионами, в которых значение рассматриваемого показателя выше среднего; расположенные во втором ортанте – регионам, в которых значение рассматриваемого показателя ниже среднего, а окружены они регионами, в которых значение рассматриваемого показателя выше среднего; расположенные в третьем ортанте – регионам, в которых значение рассматриваемого показателя ниже среднего, и окружены они регионами, в которых значение рассматриваемого показателя ниже среднего; расположенные в четвёртом ортанте – регионам, в которых значение рассматриваемого показателя выше среднего, а окружены они регионами, в которых значение рассматриваемого показателя ниже среднего. Если большинство точек расположено в первом и третьем ортантах, то имеет место кластеризация.

Если перечисленные выше показатели свидетельствуют о пространственной зависимости, то при моделировании интересующих исследователя показателей следует учитывать пространственные факторы. Проще всего это сделать с помощью включения в модель пространственных лагов и . Основные пространственно-эконометрические модели аналогичны по функциональной форме и названию , только временны́е лаги в моделях заменяются на пространственные, например Yt1Y_{t-1} на WYWY.

Основные :

SARSAR (spatial autoregressive model – модель пространственной авторегрессии):

 Y=Xβ+ρWY+εY=Xβ+ρWY +ε (с пространственным лагом зависимой переменной WYWY, ρ\rho – коэффициент пространственной автокорреляции);

SLXSLX (spatial lag model – модели с пространственными лагами объясняющих переменных):

 Y=Xβ+WXθ+εY=Xβ+WXθ+ε;

SDMSDM (spatial Durbin model – пространственная модель Дарбина):

 Y=Xβ+ρWY+WXθ+εY=Xβ+ρWY+WXθ+ε (с пространственными лагами зависимой и объясняющих переменных);

SDEMSDEM (spatial Durbin error model – модель Дарбина с пространственной зависимостью в ошибках):

Y=Xβ+WXθ+ε,ε=λWε+uY=Xβ+WXθ+ε,ε=λWε+u;

SEMSEM (spatial error model – модель с пространственной зависимостью в ошибках):

Y=Xβ+ε,ε=λWε+uY=Xβ+ε,ε=λWε+u.

Эти модели оцениваются с помощью или .

Результаты оценки моделей с пространственным лагом зависимой переменной в правой части интерпретируются с помощью предельных эффектов, которые, например, для пространственной модели Дарбина вычисляются следующим образом ():

(E(Y))/(Xm)=(E(Y1)Xm1E(Y1)XmnE(Yn)Xm1E(Yn)Xmn)=(IρW)1(βmI+Wθm)=(IρW)1(βmw12θmw1nθmw21θmβmwn1θmβm)=S(Xm)(∂E(Y))/(∂X_m )=\left(\begin{array}{ccc} \frac{∂E(Y_1)}{∂X_{m1}}&⋯&\frac{∂E(Y_1)}{∂X_{mn}}\\ ⋮&⋱&⋮\\ \frac{∂E(Y_n)}{∂X_{m1}}&⋯&\frac{∂E(Y_n)}{∂X_{mn}}\end{array}\right)=(I-ρW)^{-1} (β_m I+Wθ_m)=(I-ρW)^{-1} \left(\begin{array}{cccc} \beta_m & w_{12}\theta_m&⋯&w_{1n}\theta_m\\ w_{21}\theta_m& \beta_m&&⋮\\ ⋮&&⋱\\ w_{n1}\theta_m&⋯&&\beta_m\end{array}\right)=S(X_m),

где II – единичная матрица.

Элемент sijs_{ij}матрицы SS показывает, как изменится показатель YY в регионе ii при изменении переменной Xm,m=1,...,kX_m, m=1,...,k в регионе jj на одну единицу измерения.

siis_{ii}, i=1,...ni=1, ...n называются прямыми эффектами, а sij,ijs_{ij}, i\neq j называются косвенными эффектами, или спилловерами.

Поскольку предельных эффектов очень много (nn прямых и n2nn^2-n косвенных), то обычно вычисляют и интерпретируют средние предельные эффекты:

ADE(Xm)=1ni=1nsiiADE(X_m )=\frac{1}n ∑_{i=1}^n s_{ii}  [ADEADE (average direct effect, средний прямой эффект) показывает, как изменение переменной XmX_m влияет на изменение переменной YY в этом регионе (например, как в регионе влияют на экономический рост в выбранном регионе)];

AIE(Xm)=1ni=1,ijnsijAIE(X_m )=\frac1n ∑_{i=1,i≠j}^ns_{ij} [AIEAIE (average indirect effect, средний косвенный эффект) показывает, как изменение переменной XmX_m в соседних регионах влияет на изменение переменной в выбранном регионе (например, как инвестиции в соседних регионах влияют на экономический рост в выбранном регионе)];

ATE(Xm)=1ni=1nsijATE(X_m )=\frac1n ∑_{i=1}^ns_{ij} [ATEATE (average total effect, средний общий эффект)].

Если в моделях без пространственного лага зависимой переменной значимы коэффициенты θ\theta при пространственных лагах объясняющих переменных, то говорят о локальных спилловерах (только от соседей). Если же значим коэффициент ρ\rho пространственной автокорреляции, то говорят о глобальных спилловерах (), поскольку, например, для SARSAR-моделей:

E(Y)Xm=(IρW)1βm=βmI+ρWβm+ρ2W2βm+,\frac{∂E(Y)}{∂X_m }=(I-ρW)^{-1} β_m=β_m I+ρWβ_m+ρ^2 W^2 β_m+⋯,

т. е. при изменении переменной XmX_m изменение зависимой переменной YY обусловливается изменениями в самом рассматриваемом регионе (слагаемое βmI\beta_mI), спилловеров от соседних регионов (слагаемое ρWβmρWβ_m), спилловеров от соседей соседних регионов (или соседей второго порядка, слагаемое ρ2W2βm)ρ^2 W^2 β_m) и т. д.

В традиционных учебниках по эконометрике разделу «Пространственная эконометрика» обычно уделяется мало внимания [см., например, (. Раздел 11.7)], однако существуют специальные учебники, посвящённые этой дисциплине (; ; ).

Опытные исследователи предостерегают от механического применения пространственно-эконометрических моделей (Journal of Regional Science, 2012. Vol. 52. № 2), иногда необходимо использовать более гибкие функциональные формы моделей или более детальный анализ, например , . В некоторых случаях необходимо предварительное разбиение регионов или других рассматриваемых объектов на несколько групп, для которых могут наблюдаться различные пространственные зависимости. Например, как показано в работе (), для западных регионов России имеют место положительные спилловеры, а для восточных – отрицательные (это связано с большими расстояниями, низкой плотностью экономической активности и недостаточной развитостью инфраструктуры). Информация об исследованиях, в которых пространственно-эконометрические модели применяются к российским региональным данным, содержится в обзорной статье ().

  • Экономико-математические методы
  • Эконометрика