Проблема границ в анализе — это явление, при котором географические закономерности различаются формой и расположением границ, которые проводятся в административных или измерительных целях. Проблема границ возникает из-за потери соседей в анализах, которые зависят от значений соседей. В то время как географические явления измеряются и анализируются в пределах определенной единицы, идентичные пространственные данные могут казаться либо рассеянными, либо сгруппированными в зависимости от границы, размещенной вокруг данных. При анализе с точечными данными дисперсия оценивается как зависящая от границы. При анализе с площадными данными статистика должна интерпретироваться на основе границы.
В пространственном анализе четыре основные проблемы мешают точной оценке статистического параметра: проблема границы, проблема масштаба, проблема шаблона (или пространственная автокорреляция ) и проблема изменяемой площадной единицы . [1] Проблема границы возникает из-за потери соседей в анализах, которые зависят от значений соседей. В то время как географические явления измеряются и анализируются в пределах определенной единицы, идентичные пространственные данные могут казаться либо рассеянными, либо сгруппированными в зависимости от границы, размещенной вокруг данных. В анализе с точечными данными дисперсия оценивается как зависящая от границы. В анализе с площадными данными статистика должна интерпретироваться на основе границы.
В географических исследованиях рассматриваются два типа территорий в отношении границы: территория, окруженная фиксированными естественными границами (например, береговыми линиями или ручьями), за пределами которых соседей нет, [2] или территория, включенная в более крупный регион, определенный произвольными искусственными границами (например, граница загрязнения воздуха в модельных исследованиях или городская граница в миграции населения). [3] В области, изолированной естественными границами, пространственный процесс прерывается на границах. Напротив, если исследуемая территория очерчена искусственными границами, процесс продолжается за пределами этой территории.
Если пространственный процесс в области происходит за пределами исследуемой области или имеет взаимодействие с соседями за пределами искусственных границ, наиболее распространенным подходом является пренебрежение влиянием границ и предположение, что процесс происходит во внутренней области. Однако такой подход приводит к существенной проблеме неверной спецификации модели. [4]
То есть, для целей измерения или управления проводятся географические границы, но сами по себе границы могут приводить к различным пространственным моделям в географических явлениях. [5] Сообщалось, что разница в способе проведения границы существенно влияет на идентификацию пространственного распределения и оценку статистических параметров пространственного процесса. [6] [7] [8] [9] Разница во многом основана на том факте, что пространственные процессы, как правило, не ограничены или нечетко ограничены, [10] но процессы выражаются в данных, наложенных в пределах границ для целей анализа. [11] Хотя проблема границ обсуждалась в отношении искусственных и произвольных границ, влияние границ также происходит в соответствии с естественными границами, пока игнорируется, что свойства на участках на естественной границе, таких как потоки, вероятно, будут отличаться от свойств на участках внутри границы. [12]
Проблема границ возникает не только в отношении горизонтальных границ, но и в отношении вертикальных границ, проведенных в соответствии с разграничениями высот или глубин (Пинеда, 1993). Например, биоразнообразие, такое как плотность видов растений и животных, высоко вблизи поверхности, поэтому, если одинаково разделенная высота или глубина используется в качестве пространственной единицы, то более вероятно, что будет обнаружено меньшее количество видов растений и животных по мере увеличения высоты или глубины.
При проведении границы вокруг исследуемой области возникают два типа проблем в измерении и анализе. [7] Первый — это эффект края . [13] Этот эффект возникает из-за незнания взаимозависимостей, которые возникают за пределами ограниченной области. [13] Гриффит [14] [8] и Гриффит и Амрхейн [15] выделили проблемы в соответствии с эффектом края. Типичным примером является трансграничное влияние, такое как трансграничные рабочие места, услуги и другие ресурсы, расположенные в соседнем муниципалитете. [16]
Второй эффект формы , который возникает из-за искусственной формы, очерченной границей. В качестве иллюстрации эффекта искусственной формы анализ точечного рисунка имеет тенденцию обеспечивать более высокие уровни кластеризации для идентичного точечного рисунка в пределах более вытянутой единицы. [7] Аналогичным образом, форма может влиять на взаимодействие и поток между пространственными сущностями. [17] [18] [19] Например, форма может влиять на измерение потоков отправления-назначения, поскольку они часто регистрируются, когда они пересекают искусственную границу. Из-за эффекта, установленного границей, информация о форме и площади используется для оценки расстояний поездок из обследований, [20] или для определения местонахождения счетчиков трафика, станций опроса транспорта или систем мониторинга трафика. [21] С той же точки зрения Теобальд (2001; извлечено из [5] ) утверждал, что меры разрастания городов должны учитывать взаимозависимости и взаимодействия с близлежащими сельскими районами.
В пространственном анализе проблема границ обсуждалась вместе с проблемой изменяемой ареальной единицы (MAUP), поскольку MAUP связана с произвольной географической единицей, а единица определяется границей. [22] Для административных целей данные для политических показателей обычно агрегируются в более крупных единицах (или единицах переписи), таких как переписные участки, школьные округа, муниципалитеты и округа. [23] [24] Искусственные единицы служат целям налогообложения и предоставления услуг. Например, муниципалитеты могут эффективно реагировать на потребности населения в своих юрисдикциях. Однако в таких пространственно агрегированных единицах пространственные вариации подробных социальных переменных не могут быть идентифицированы. Проблема отмечается, когда измеряется средняя степень переменной и ее неравномерное распределение по пространству. [5]
Было предложено несколько стратегий для решения проблем географических границ в измерениях и анализе. [25] [26] Чтобы определить эффективность стратегий, Гриффит рассмотрел традиционные методы, которые были разработаны для смягчения краевых эффектов: [8] игнорирование эффектов, проведение картирования тора, построение эмпирической буферной зоны, построение искусственной буферной зоны, экстраполяция в буферную зону, использование поправочного коэффициента и т. д. Первый метод (т. е. игнорирование краевых эффектов) предполагает бесконечную поверхность, на которой краевые эффекты не возникают. Фактически, этот подход использовался традиционными географическими теориями (например, теорией центрального места ). Его главный недостаток заключается в том, что эмпирические явления происходят в пределах конечной области, поэтому бесконечная и однородная поверхность нереалистична. [15] Остальные пять подходов схожи в том, что они пытались произвести несмещенную оценку параметров, то есть предоставить среду, с помощью которой устраняются краевые эффекты. [8] (Он назвал эти операционные решения в отличие от статистических решений , которые будут обсуждаться ниже.) В частности, методы нацелены на сбор данных за пределами границы исследуемой области и соответствуют более крупной модели, то есть картированию области или выходу за пределы исследуемой области. [27] [26] Однако с помощью анализа моделирования Гриффит и Амрхейн определили неадекватность такой выходящей за пределы техники. [15] Более того, эта техника может привести к проблемам, связанным со статистикой большой площади, то есть к экологической ошибке. Расширяя границу исследуемой области, можно игнорировать микромасштабные изменения внутри границы.
В качестве альтернатив операционным решениям Гриффит рассмотрел три метода коррекции (т. е. статистические решения ) для устранения смещения, вызванного границей, из вывода. [8] Они (1) основаны на обобщенной теории наименьших квадратов , (2) используют фиктивные переменные и структуру регрессии (как способ создания буферной зоны), и (3) рассматривают проблему границы как проблему пропущенных значений. Однако эти методы требуют довольно строгих предположений о процессе, представляющем интерес. [28] Например, решение в соответствии с обобщенной теорией наименьших квадратов использует моделирование временных рядов, которому требуется произвольная матрица преобразования для соответствия многонаправленным зависимостям и множественным граничным единицам, обнаруженным в географических данных. [14] Мартин также утверждал, что некоторые из основных предположений статистических методов нереалистичны или неоправданно строги. [29] Более того, сам Гриффит (1985) также определил неполноценность методов с помощью имитационного анализа. [30]
Как особенно применимо с использованием технологий ГИС, [31] [32] возможным решением для решения как краевых, так и формальных эффектов является переоценка пространственного или процесса при повторных случайных реализациях границы. Это решение обеспечивает экспериментальное распределение, которое может быть подвергнуто статистическим тестам. [7] Таким образом, эта стратегия проверяет чувствительность результата оценки в соответствии с изменениями в предположениях о границе. С помощью инструментов ГИС границы могут систематически манипулироваться. Затем инструменты проводят измерение и анализ пространственного процесса в таких дифференцированных границах. Соответственно, такой анализ чувствительности позволяет оценить надежность и устойчивость локальных мер, которые определены в пределах искусственных границ. [33] Между тем, изменения в предположениях о границе относятся не только к изменению или наклону углов границы, но также к дифференциации между границей и внутренними областями при проверке и рассмотрении возможности того, что изолированные точки сбора данных, близкие к границе, могут показывать большие дисперсии.