Локальные индикаторы пространственной зависимости
Лока́льные индика́торы простра́нственной зави́симости (англ. local indicators of spatial association, LISA), статистические критерии, позволяющие определить зависимость между показателями рассматриваемых географических единиц и соседних для них географических единиц. Впервые введены Л. Анселином (Anselin. 1995). Используются для выявления того, является ли рассматриваемая группа объектов (обычно регионов) случайно расположенной относительно рассматриваемого показателя , наряду с показателями глобальных кластеров – индексами Морана, Гири, Гетиса – Орда (Демидова. 2021).
Локальный индекс Морана
Локальный индекс Морана для каждого из регионов определяется следующим образом (Fischer, Wang, 2011, р. 27):
где обозначает множество соседей региона , – среднее значение рассматриваемого показателя в соседних для региона наблюдений, – элемент взвешивающей матрицы, – число регионов.
С помощью локального индекса Морана можно проверить гипотезу (т. е. соседние с -м регионы расположены случайным образом по рассматриваемому показателю) при альтернативной гипотезе:
(т. е. регион расположен в локальном кластере)
или
(если у региона наблюдается высокое значение рассматриваемого показателя , то у соседних регионов соответствующие показатели являются низкими, и наоборот).
Эти гипотезы проверяются с помощью тестовой статистики , где для стран с большим числом регионов (в том числе России). Для этой статистики известны математическое ожидание и некоторые моменты, в том числе дисперсия (Fischer, Wang, 2010, р. 28). Но точный закон соответствующего распределения тестовой статистики неизвестен, его приходится восстанавливать с помощью симуляций (это успешно реализовано во многих статистических пакетах) и вычислять p-значение (англ. p-value) для проверяемой гипотезы. При большом числе наблюдений часто в качестве аппроксимирующего используется нормальное распределение. Соответствующая процедура выбора между нулевой и альтернативной гипотезами имеет некоторые особенности (критическое значение p-value зависит от количества наблюдений n), а именно при выбранном уровне значимости (например, 0,05) правило выбора между нулевой и альтернативной гипотезами имеет вид: если p-value, то гипотеза о случайном характере распределения регионов в окрестности -го региона отвергается.
Локальные индексы Гири и Гетиса – Орда
Локальный индекс Гири для каждого из регионов используется аналогично локальному индексу Морана и определяется по формуле (Fischer, Wang, 2010, р. 29):
Локальные индексы Гетиса – Орда для каждого из регионов и расстояния определяются следующим образом (Fischer, Wang, 2010, р. 27):
где , если расстояние между регионами и больше , и , если расстояние между регионами и не превышает . Отличие этих индексов состоит во включении или невключении в суммы показателя для самого региона .
С помощью локальных индексов Гетиса – Орда для каждого региона можно проверить гипотезу (т. е. регион не входит в локальный кластер по рассматриваемому показателю) при альтернативной гипотезе:
(регион входит в локальный кластер с большими значениями рассматриваемого показателя, их часто называют hot spots)
или
(регион входит в локальный кластер с малыми значениями рассматриваемого показателя, их часто называют cold spots).
Алгоритм проверки соответствующей гипотезы с помощью -статистики совпадает с описанным выше для локального индекса Морана (в этом случае также основная гипотеза отвергается, если p-value).
Локальные индикаторы пространственной зависимости могут быть использованы для выявления локальных очагов нестационарности.