Пространственная описательная статистика

Пространственная описательная статистика находится на стыке пространственной статистики и описательной статистики ; эти методы используются для различных целей в географии , в частности, при количественном анализе данных с использованием географических информационных систем (ГИС) .

Типы пространственных данных

Простейшими формами пространственных данных являются сеточные данные , в которых скалярная величина измеряется для каждой точки в регулярной сетке точек, и наборы точек , в которых наблюдается набор координат (например, точек на плоскости). Примером сеточных данных может служить спутниковый снимок плотности леса, оцифрованный на сетке. Примером набора точек могут служить координаты широты/долготы всех вязов на определенном участке земли. Более сложные формы данных включают в себя отмеченные наборы точек и пространственные временные ряды.

Меры пространственной центральной тенденции

Среднее значение множества точек по координатам — это центроид , который решает ту же вариационную задачу на плоскости (или в многомерном евклидовом пространстве ), которую решает знакомое нам среднее значение на действительной прямой — то есть центроид имеет наименьшее возможное среднеквадратичное расстояние до всех точек множества.

Меры пространственной дисперсии

Дисперсия фиксирует степень, в которой точки в наборе точек отделены друг от друга. Для большинства приложений пространственная дисперсия должна быть количественно определена способом, инвариантным к вращениям и отражениям. Несколько простых мер пространственной дисперсии для набора точек могут быть определены с использованием ковариационной матрицы координат точек. След , определитель и наибольшее собственное значение ковариационной матрицы могут использоваться в качестве мер пространственной дисперсии.

Мерой пространственной дисперсии, не основанной на ковариационной матрице, является среднее расстояние между ближайшими соседями. [1]

Меры пространственной однородности

Однородный набор точек на плоскости — это набор, который распределен таким образом, что в любой круглой области заданной области встречается примерно одинаковое количество точек. Набор точек, не обладающий однородностью, может быть пространственно сгруппирован в определенном пространственном масштабе. Простая вероятностная модель для пространственно однородных точек — это процесс Пуассона на плоскости с постоянной функцией интенсивности.

РиплиКиЛфункции

Функции Рипли K и L, введенные Брайаном Д. Рипли [2], являются тесно связанными описательными статистиками для обнаружения отклонений от пространственной однородности. Функция K (технически ее оценка на основе выборки) определяется как

К ^ ( т ) = λ 1 я дж я ( г я дж < т ) н , {\displaystyle {\widehat {K}}(t)=\lambda ^{-1}\sum _{i\neq j}{\frac {I(d_{ij}<t)}{n}},}

где d ij — евклидово расстояние между i и j точками в наборе данных из n точек, t — радиус поиска, λ — средняя плотность точек (обычно оценивается как n / A , где A — площадь области, содержащей все точки), а Iиндикаторная функция (т. е. 1, если ее операнд истинен, 0 в противном случае). [3] В 2 измерениях, если точки приблизительно однородны, должно быть приблизительно равно π t 2 . К ^ ( т ) {\displaystyle {\widehat {K}}(t)}

Для анализа данных обычно используется стабилизированная дисперсией функция Рипли К , называемая функцией L. Примерная версия функции L определяется как

Л ^ ( т ) = ( К ^ ( т ) π ) 1 / 2 . {\displaystyle {\widehat {L}}(t)=\left({\frac {{\widehat {K}}(t)}{\pi }}\right)^{1/2}.}

Для приблизительно однородных данных функция L имеет ожидаемое значение t , а ее дисперсия приблизительно постоянна по t . Обычный график представляет собой график зависимости от t , который будет приблизительно следовать горизонтальной нулевой оси с постоянной дисперсией, если данные следуют однородному процессу Пуассона. т Л ^ ( т ) {\displaystyle t-{\widehat {L}}(t)}

Используя функцию Рипли К , можно определить, имеют ли точки случайный, рассеянный или кластерный характер распределения в определенном масштабе. [4]

Смотрите также

Ссылки

  1. ^ Кларк, Филипп; Эванс, Фрэнсис (1954). «Расстояние до ближайшего соседа как мера пространственных отношений в популяциях». Экология . 35 (4): 445–453. doi :10.2307/1931034. JSTOR  1931034.
  2. ^ Рипли, Б. Д. (1976). «Анализ второго порядка стационарных точечных процессов». Журнал прикладной вероятности . 13 (2): 255–266. doi : 10.2307/3212829 . JSTOR  3212829.
  3. ^ Диксон, Филип М. (2002). "Функция Рипли K" (PDF) . В El-Shaarawi, Abdel H.; Piegorsch, Walter W. (ред.). Энциклопедия метрики окружающей среды . John Wiley & Sons. стр. 1796–1803. ISBN 978-0-471-89997-6. Получено 25 апреля 2014 г. .
  4. ^ Wilschut, LI; Laudisoit, A.; Hughes, NK; Addink, EA; de Jong, SM; Heesterbeek, JAP; Reijniers, J.; Eagle, S.; Dubyanskiy, VM; Begon, M. (2015). «Пространственные закономерности распределения хозяев чумы: анализ точечных закономерностей нор больших песчанок в Казахстане». Журнал биогеографии . 42 (7): 1281–1292. doi :10.1111/jbi.12534. PMC 4737218. PMID  26877580 . 
Взято с "https://en.wikipedia.org/w/index.php?title=Пространственная_описательная_статистика&oldid=1238220031"