Географически взвешенная регрессия
Географи́чески взве́шенная регре́ссия (англ. geographically weighted regression), метод пространственной эконометрики, использующийся для моделирования пространственных взаимоотношений между статистическими данными. Метод активно используется в экономической географии. Географически взвешенная регрессия (ГВР) впервые упоминается в статье 1996 г. (Brunsdon. 1996) и является расширением классического регрессионного анализа на данные, имеющие пространственную структуру.
В отличие от классической модели линейной регрессии, в географически взвешенной регрессии коэффициенты могут меняться для разных географических регионов (пространств, территорий). Классическая модель линейной регрессии, оценки которой находятся методом наименьших квадратов, не учитывает факт того, что характер зависимости между переменными может меняться при переходе от одной группы территорий к другой. ГВР позволяет решить проблему неэффективности оценок коэффициентов линейной регрессии, вызванной пространственной гетерогенностью (нестационарностью).
Уравнение ГВР задаётся следующим образом:
,
где – зависимая переменная, – индекс, обозначающий определённую территорию,
– число регрессоров, – коэффициенты регрессии, – объясняющие переменные, – случайная ошибка.
Оценка вектора коэффициентов вычисляется следующим образом:
Таким образом, отличие от оценки методом наименьших квадратов заключается в наличии матрицы пространственных весов . Коэффициенты матрицы рассчитываются на основе одной из ядерных функций (как правило, нормального или экспоненциального распределений), которая придаёт больший вес территориям, находящимся ближе друг к другу в пространстве, чем более удалённым. Таким образом, матрица пространственных весов для географически взвешенной регрессии строится в той же логике, что и при проблеме пространственной автокорреляции, которая приводит к смещённым оценкам коэффициентов при использовании обычного метода наименьших квадратов. Как следствие, весовые коэффициенты в матрице оказываются обратно пропорциональны расстоянию между исследуемыми территориями.