В статистике I Морана — это мера пространственной автокорреляции, разработанная Патриком Альфредом Пирсом Мораном . [1] [2] Пространственная автокорреляция характеризуется корреляцией в сигнале между близлежащими точками в пространстве. Пространственная автокорреляция сложнее одномерной автокорреляции , поскольку пространственная корреляция является многомерной (т. е. 2 или 3 измерения пространства) и многонаправленной.
Глобальный Мораня
Глобальный индекс Морана I является мерой общей кластеризации пространственных данных. Он определяется как
где
— число пространственных единиц, индексированных и ;
представляет собой интересующую нас переменную;
является средним значением ;
являются элементами матрицы пространственных весов с нулями на диагонали (т.е. );
и является суммой всех (т.е. ).
Определение матрицы пространственных весов
Значение может в значительной степени зависеть от предположений, встроенных в матрицу пространственных весов . Матрица необходима, поскольку для решения проблемы пространственной автокорреляции, а также для моделирования пространственного взаимодействия нам необходимо наложить структуру, ограничивающую количество рассматриваемых соседей. Это связано с первым законом географии Тоблера , который гласит, что Все зависит от всего остального, но более близкие вещи — в большей степени — другими словами, закон подразумевает функцию затухания пространственного расстояния , так что, хотя все наблюдения оказывают влияние на все другие наблюдения, после некоторого порогового расстояния этим влиянием можно пренебречь.
Идея состоит в том, чтобы построить матрицу, которая точно отражает ваши предположения о конкретном рассматриваемом пространственном явлении. Обычный подход заключается в том, чтобы присвоить вес 1, если две зоны являются соседями, и 0 в противном случае, хотя определение «соседей» может варьироваться. Другой распространенный подход может заключаться в том, чтобы присвоить вес 1 ближайшим соседям, и 0 в противном случае. Альтернативой является использование функции затухания расстояния для назначения весов. Иногда длина общего ребра используется для назначения различных весов соседям. Выбор матрицы пространственных весов должен руководствоваться теорией о рассматриваемом явлении. Значение весьма чувствительно к весам и может влиять на выводы, которые вы делаете о явлении, особенно при использовании расстояний.
Ожидаемое значение
Ожидаемое значение индекса Морана I при нулевой гипотезе об отсутствии пространственной автокорреляции равно
Нулевое распределение, используемое для этого ожидания, заключается в том, что входные данные переставляются перестановкой, выбранной равномерно случайным образом (и ожидание зависит от выбора перестановки).
При больших размерах выборки (т. е. когда N стремится к бесконечности) ожидаемое значение стремится к нулю.
Его дисперсия равна
где
[3]
Значения, значительно ниже -1/(N-1), указывают на отрицательную пространственную автокорреляцию, а значения, значительно выше -1/(N-1), указывают на положительную пространственную автокорреляцию. Для проверки статистических гипотез значения I Морана можно преобразовать в z-оценки .
Значения I лежат в диапазоне от и [4] , где и — соответствующие минимальные и максимальные собственные значения матрицы весов. Для нормализованной по строке матрицы .
I Морана обратно пропорционален C Гири , но не идентичен. I Морана является мерой глобальной пространственной автокорреляции, тогда как C Гири более чувствителен к локальной пространственной автокорреляции.
Местный Мораня
Глобальный пространственный автокорреляционный анализ дает только одну статистику для обобщения всей исследуемой области. Другими словами, глобальный анализ предполагает однородность. Если это предположение не выполняется, то наличие только одной статистики не имеет смысла, поскольку статистика должна различаться в пространстве.
Более того, даже если нет глобальной автокорреляции или кластеризации, мы все равно можем найти кластеры на локальном уровне, используя локальный пространственный автокорреляционный анализ. Тот факт, что I Морана является суммой отдельных перекрестных произведений , используется «локальными индикаторами пространственной ассоциации» (LISA) для оценки кластеризации в этих отдельных единицах путем вычисления локального I Морана для каждой пространственной единицы и оценки статистической значимости для каждого I i . Из уравнения глобального I Морана мы можем получить:
где:
затем,
I — глобальный индекс Морана I, измеряющий глобальную автокорреляцию, I i — локальный, а N — количество единиц анализа на карте.
LISA можно рассчитать в GeoDa и ArcGIS Pro , которые используют локальный индекс Морана I , [5] [6], предложенный Люком Анселином в 1995 году. [7]
^ Моран, ПАП (1950). «Заметки о непрерывных стохастических явлениях». Biometrika . 37 (1): 17–23. doi :10.2307/2332142. JSTOR 2332142. PMID 15420245.
^ Ли, Хонгфей; Колдер, Кэтрин А .; Кресси, Ноэль (2007). «За пределами Морана I : Тестирование пространственной зависимости на основе пространственной авторегрессионной модели». Географический анализ . 39 (4): 357–375. doi :10.1111/j.1538-4632.2007.00708.x.
^ Клифф и Орд (1981), Пространственные процессы, Лондон
^ де Йонг, П., Шпренгер, К. и ван Вин, Ф., 1984. Об экстремальных значениях I Морана и c Гири. Географический анализ, 16(1), стр. 17-24.
^ Анселин, Люк (2005). «Изучение пространственных данных с помощью GeoDa: рабочая тетрадь» (PDF) . Лаборатория пространственного анализа. стр. 138.
^ "Анализ кластеров и выбросов (Anselin Local Moran's I) (Пространственная статистика)". ESRI . Получено 28 мая 2024 г. .
^ Анселин, Люк (1995). «Локальные индикаторы пространственной ассоциации — LISA». Географический анализ . 27 (2): 93–115. doi : 10.1111/j.1538-4632.1995.tb00338.x .
^ Гетис, Артур (3 сентября 2010 г.). «Анализ пространственной ассоциации с использованием статистики расстояний». Географический анализ . 24 (3): 189–206. doi : 10.1111/j.1538-4632.1992.tb00261.x .
^ Хельбих, М.; Лейтнер, М.; Капуста, Н.Д. (2012). «Геопространственное исследование лития в питьевой воде и смертности от самоубийств». Int J Health Geogr . 11 (1): 19. doi : 10.1186/1476-072X-11-19 . PMC 3441892. PMID 22695110 .
^ Грив, Джек (2011). «Региональный анализ скорости сокращения в письменном стандартном американском английском». Международный журнал корпусной лингвистики . 16 (4): 514–546. doi :10.1075/ijcl.16.4.04gri.
^ Alvioli, M.; Marchesini, I.; Reichenbach, P.; Rossi, M.; Ardizzone, F.; Fiorucci, F.; Guzzetti, F. (2016). «Автоматическое разграничение геоморфологических наклонных единиц с помощью r.slopeunits v1.0 и их оптимизация для моделирования восприимчивости к оползням». Geoscientific Model Development . 9 : 3975–3991. doi : 10.5194/gmd-9-3975-2016 .