Пространственная автокорреляция
Простра́нственная автокорреля́ция, зависимость между показателями рассматриваемых географических единиц и соседних для них географических единиц. В некоторой группе регионов наблюдается пространственная автокорреляция по выбранному показателю , если расположение регионов по этому показателю не является случайным, а имеет место одна из следующих зависимостей:
Регионы с бо́льшим значением выбранного показателя располагаются рядом с регионами также с бо́льшим значением этого показателя, а регионы с малым значением выбранного показателя окружены регионами также с малым значением этого показателя, т. е. существуют кластеры регионов с бо́льшими значениями выбранного показателя и кластеры регионов с малыми значениями выбранного показателя.
Регионы с бо́льшим значением выбранного показателя окружены регионами с малым значением этого показателя, а регионы с малым значением выбранного показателя окружены регионами с бо́льшим значением этого показателя.
В первом случае говорят о положительной пространственной автокорреляции, а во втором случае – об отрицательной пространственной автокорреляции.
Самыми распространёнными показателями, которые используют для выявления пространственной автокорреляции, являются индекс Морана, рассчитываемый по формуле:
и индекс Гетиса – Орда, рассчитываемый по формуле
где – элементы нормированной по строкам взвешивающей матрицы .
С помощью индекса Морана тестируется гипотеза о том, что расположение регионов является случайным по выбранному показателю, против одной из альтернативных гипотез: о положительной пространственной автокорреляции (т. е. о кластеризации регионов по выбранному показателю) или об отрицательной пространственной автокорреляции (т. е. о рассредоточении регионов по выбранному показателю).
С помощью индекса Гетиса – Орда проверяется гипотеза только о наличии или отсутствии положительной автокорреляции (т. е. о наличии кластеров), однако возможно получение более детальной информации о самих кластерах, если они выявлены, а именно – основная гипотеза состоит в отсутствии кластеров, а альтернативная гипотеза – в доминировании кластеров с бо́льшим значением рассматриваемого показателя или кластеров с малым значением рассматриваемого показателя.