Вариограмма

Функция пространственной статистики

В пространственной статистике теоретическая вариограмма , обозначаемая , представляет собой функцию, описывающую степень пространственной зависимости пространственного случайного поля или стохастического процесса . Полувариограмма — это половина вариограммы. 2 γ ( с 1 , с 2 ) {\displaystyle 2\гамма (\mathbf {s} _{1},\mathbf {s} _{2})} З ( с ) {\displaystyle Z(\mathbf {s})} γ ( с 1 , с 2 ) {\displaystyle \гамма (\mathbf {s} _{1},\mathbf {s} _{2})}

Схематизация вариограммы. Точки представляют собой измеренные точки данных (наблюдаемые), а кривая представляет собой используемую модельную функцию (эмпирическую). Range обозначает искомый диапазон, sill — значение плато, достигнутое при максимальном диапазоне, nugget — эффект nugget.

Например, в золотодобыче вариограмма даст меру того, насколько два образца, взятых из района добычи, будут отличаться по процентному содержанию золота в зависимости от расстояния между этими образцами. Образцы, взятые далеко друг от друга, будут отличаться больше, чем образцы, взятые близко друг к другу.

Определение

Полувариограмма была впервые определена Матероном (1963) как половина средней квадратичной разницы между функцией и переведенной копией функции, разделенной на расстоянии . [ 1] [2] Формально γ ( час ) {\displaystyle \гамма (ч)} час {\displaystyle ч}

γ ( час ) = 1 2 В [ ф ( М + час ) ф ( М ) ] 2 г М , {\displaystyle \gamma (h)={\frac {1}{2}}\iiint _{V}\left[f(M+h)-f(M)\right]^{2}dM,}

где — точка в геометрическом поле , а — значение в этой точке. Тройной интеграл — это расстояние разделения (например, в метрах или км), представляющее интерес. Например, значение может представлять содержание железа в почве в некотором месте (с географическими координатами широты, долготы и высоты) в некоторой области с элементом объема . Чтобы получить полувариограмму для заданного , будут отобраны все пары точек на этом точном расстоянии. На практике невозможно выполнить отбор везде, поэтому вместо этого используется эмпирическая вариограмма. М {\displaystyle М} В {\displaystyle V} ф ( М ) {\displaystyle f(M)} час {\displaystyle ч} ф ( М ) {\displaystyle f(M)} М {\displaystyle М} В {\displaystyle V} г В {\displaystyle dV} γ ( час ) {\displaystyle \гамма (ч)}

Вариограмма в два раза больше полувариограммы и может быть определена по-другому, как дисперсия разницы между значениями поля в двух местах ( и , обратите внимание на изменение обозначений с на на и на ) по реализациям поля (Cressie 1993): с 1 {\displaystyle \mathbf {s} _{1}} с 2 {\displaystyle \mathbf {s} _{2}} М {\displaystyle М} с {\displaystyle \mathbf {s} } ф {\displaystyle f} З {\displaystyle Z}

2 γ ( с 1 , с 2 ) = вар ( З ( с 1 ) З ( с 2 ) ) = Э [ ( ( З ( с 1 ) З ( с 2 ) ) Э [ З ( с 1 ) З ( с 2 ) ] ) 2 ] . {\displaystyle 2\гамма (\mathbf {s} _{1},\mathbf {s} _{2})={\text{var}}\left(Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2})\right)=E\left[((Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2}))-E[Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2})])^{2}\right].}

Если пространственное случайное поле имеет постоянное среднее значение , это эквивалентно ожиданию квадратичного приращения значений между местоположениями и (Wackernagel 2003) (где и являются точками в пространстве и, возможно, во времени): μ {\displaystyle \мю} с 1 {\displaystyle \mathbf {s} _{1}} с 2 {\displaystyle s_{2}} с 1 {\displaystyle \mathbf {s} _{1}} с 2 {\displaystyle \mathbf {s} _{2}}

2 γ ( с 1 , с 2 ) = Э [ ( З ( с 1 ) З ( с 2 ) ) 2 ] . {\displaystyle 2\gamma (\mathbf {s} _{1},\mathbf {s} _{2})=E\left[\left(Z(\mathbf {s} _{1})-Z( \mathbf {s} _{2})\right)^{2}\right].}

В случае стационарного процесса вариограмму и полувариограмму можно представить как функцию только разницы между местоположениями с помощью следующего соотношения (Cressie 1993): γ с ( час ) = γ ( 0 , 0 + час ) {\displaystyle \gamma _{s}(h)=\gamma (0,0+h)} час = с 2 с 1 {\displaystyle h=\mathbf {s} _{2}-\mathbf {s} _{1}}

γ ( с 1 , с 2 ) = γ с ( с 2 с 1 ) . {\displaystyle \gamma (\mathbf {s} _{1},\mathbf {s} _{2}) = \gamma _{s}(\mathbf {s} _{2}-\mathbf {s} _ {1}).}

Если процесс к тому же изотропен , то вариограмма и полувариограмма могут быть представлены только функцией расстояния (Cressie 1993): γ я ( час ) := γ с ( час е 1 ) {\displaystyle \gamma _{i}(h):=\gamma _{s}(he_{1})} час = с 2 с 1 {\displaystyle h=\|\mathbf {s} _{2}-\mathbf {s} _{1}\|}

γ ( с 1 , с 2 ) = γ я ( час ) . {\displaystyle \gamma (\mathbf {s} _{1},\mathbf {s} _{2}) = \gamma _{i}(h).}

Индексы или обычно не пишутся. Термины используются для всех трех форм функции. Более того, термин «вариограмма» иногда используется для обозначения полувариограммы, а символ иногда используется для вариограммы, что вносит некоторую путаницу. [3] я {\displaystyle я} с {\displaystyle с} γ {\displaystyle \гамма}

Характеристики

Согласно (Cressie 1993, Chiles and Delfiner 1999, Wackernagel 2003) теоретическая вариограмма имеет следующие свойства:

  • Полувариограмма неотрицательна , так как представляет собой математическое ожидание квадрата. γ ( с 1 , с 2 ) 0 {\displaystyle \gamma (\mathbf {s} _{1},\mathbf {s} _{2})\geq 0}
  • Полувариограмма на расстоянии 0 всегда равна 0, так как . γ ( с 1 , с 1 ) = γ я ( 0 ) = Э ( ( З ( с 1 ) З ( с 1 ) ) 2 ) = 0 {\displaystyle \gamma (\mathbf {s} _{1},\mathbf {s} _{1})=\gamma _{i}(0)=E\left((Z(\mathbf {s} _ {1})-Z(\mathbf {s} _{1}))^{2}\right)=0} З ( с 1 ) З ( с 1 ) = 0 {\displaystyle Z(\mathbf {s} _{1})-Z(\mathbf {s} _{1})=0}
  • Функция является полувариограммой тогда и только тогда, когда она является условно отрицательно определенной функцией, то есть для всех весов, подчиняющихся условию и местоположений, она имеет место: ж 1 , , ж Н {\displaystyle w_{1},\ldots,w_{N}} я = 1 Н ж я = 0 {\displaystyle \sum _{i=1}^{N}w_{i}=0} с 1 , , с Н {\displaystyle s_{1},\ldots ,s_{N}}
я = 1 Н дж = 1 Н ж я γ ( с я , с дж ) ж дж 0 {\displaystyle \sum _{i=1}^{N}\sum _{j=1}^{N}w_{i} \gamma (\mathbf {s} _{i},\mathbf {s} _ {j})w_{j}\leq 0}
что соответствует тому факту, что дисперсия задается отрицательным значением этой двойной суммы и должна быть неотрицательной. [ оспариваетсяобсудить ] в а г ( Х ) {\displaystyle var(X)} Х = я = 1 Н ж я З ( х я ) {\displaystyle X=\sum _{i=1}^{N}w_{i}Z(x_{i})}
  • Если ковариационная функция стационарного процесса существует, то она связана с вариограммой соотношением

    2 γ ( с 1 , с 2 ) = С ( с 1 , с 1 ) + С ( с 2 , с 2 ) 2 С ( с 1 , с 2 ) {\displaystyle 2\гамма (\mathbf {s} _{1},\mathbf {s} _{2})=C(\mathbf {s} _{1},\mathbf {s} _{1})+C(\mathbf {s} _{2},\mathbf {s} _{2})-2C(\mathbf {s} _{1},\mathbf {s} _{2})}

  • Если стационарное случайное поле не имеет пространственной зависимости (т.е. если ), то полувариограмма является константой всюду, за исключением начала координат, где она равна нулю. С ( час ) = 0 {\displaystyle C(h)=0} час 0 {\displaystyle h\not =0} в а г ( З ( с ) ) {\displaystyle var(Z(\mathbf {s}))}
  • γ ( с 1 , с 2 ) = Э [ | З ( с 1 ) З ( с 2 ) | 2 ] = γ ( с 2 , с 1 ) {\displaystyle \gamma (\mathbf {s} _{1},\mathbf {s} _{2})=E\left[|Z(\mathbf {s} _{1})-Z(\mathbf { s} _{2})|^{2}\right]=\gamma (\mathbf {s} _{2},\mathbf {s} _{1})} является симметричной функцией.
  • Следовательно, — четная функция . γ с ( час ) = γ с ( час ) {\displaystyle \gamma _{s}(h)=\gamma _{s}(-h)}
  • Если случайное поле стационарно и эргодично , то соответствует дисперсии поля. Предел полувариограммы также называется ее порогом . лим час γ с ( час ) = в а г ( З ( с ) ) {\displaystyle \lim _{h\to \infty }\gamma _{s}(h)=var(Z(\mathbf {s} ))}
  • В результате полувариограмма может быть прерывистой только в начале координат. Высота скачка в начале координат иногда называется самородком или эффектом самородка.

Параметры

Подводя итог, можно сказать, что для описания вариограмм часто используются следующие параметры:

  • Самородок : высота скачка полувариограммы на разрыве в начале координат. н {\displaystyle n}
  • порог : предел вариограммы, стремящийся к бесконечности расстояний запаздывания. с {\displaystyle с}
  • диапазон : Расстояние, на котором разница вариограммы от порога становится незначительной. В моделях с фиксированным порогом это расстояние, на котором он впервые достигается; для моделей с асимптотическим порогом это обычно принимается как расстояние, на котором полудисперсия впервые достигает 95% порога. г {\displaystyle r}

Эмпирическая вариограмма

Как правило, для измеренных данных необходима эмпирическая вариограмма , поскольку информация об образце доступна не для каждого местоположения. Например, информация об образце может быть концентрацией железа в образцах почвы или интенсивностью пикселей на камере. Каждая часть информации об образце имеет координаты для 2D-пространства образца, где и являются географическими координатами. В случае железа в почве пространство образца может быть 3-мерным. Если также есть временная изменчивость (например, содержание фосфора в озере), то может быть 4-мерным вектором . В случае, когда измерения имеют разные единицы (например, расстояние и время), то к каждому можно применить коэффициент масштабирования, чтобы получить модифицированное евклидово расстояние. [4] З {\displaystyle Z} с = ( х , у ) {\displaystyle \mathbf {s} =(x,y)} х {\displaystyle x} у {\displaystyle у} с {\displaystyle \mathbf {s} } ( х , у , з , т ) {\displaystyle (x,y,z,t)} Б {\displaystyle Б}

Образцы наблюдений обозначены . Образцы могут быть взяты в разных местах. Это даст набор образцов в местах . Обычно графики показывают значения полувариограммы как функцию разделения точек выборки . В случае эмпирической полувариограммы используются интервалы расстояния разделения, а не точные расстояния, и обычно предполагаются изотропные условия (т. е. это только функция и не зависит от других переменных, таких как положение центра). Затем эмпирическая полувариограмма может быть рассчитана для каждого интервала: З ( с я ) = з я {\displaystyle Z(\mathbf {s} _{i})=z_{i}} k {\displaystyle k} z 1 , , z k {\displaystyle z_{1},\ldots ,z_{k}} s 1 , , s k {\displaystyle \mathbf {s} _{1},\ldots ,\mathbf {s} _{k}} h {\displaystyle h} h ± δ {\displaystyle h\pm \delta } γ {\displaystyle \gamma } h {\displaystyle h} γ ^ ( h ± δ ) {\displaystyle {\hat {\gamma }}(h\pm \delta )}

γ ^ ( h ± δ ) := 1 2 | N ( h ± δ ) | ( i , j ) N ( h ± δ ) | z i z j | 2 {\displaystyle {\hat {\gamma }}(h\pm \delta ):={\frac {1}{2|N(h\pm \delta )|}}\sum _{(i,j)\in N(h\pm \delta )}|z_{i}-z_{j}|^{2}}

Или, другими словами, каждая пара точек, разделенных (плюс или минус некоторый диапазон допуска ширины бина ), находится. Они образуют набор точек . Количество этих точек в этом бине равно . Затем для каждой пары точек находится квадрат разницы в наблюдении (например, содержание образца почвы или интенсивность пикселей) ( ). Эти квадраты разностей складываются и нормализуются натуральным числом . По определению результат делится на 2 для полувариограммы при этом разделении. h {\displaystyle h} δ {\displaystyle \delta } N ( h ± δ ) { ( s i , s j ) : | s i , s j | = h ± δ ; i , j = 1 , , N } {\displaystyle N(h\pm \delta )\equiv \{(\mathbf {s} _{i},\mathbf {s} _{j}):|\mathbf {s} _{i},\mathbf {s} _{j}|=h\pm \delta ;i,j=1,\ldots ,N\}} | N ( h ± δ ) | {\displaystyle |N(h\pm \delta )|} i , j {\displaystyle i,j} | z i z j | 2 {\displaystyle |z_{i}-z_{j}|^{2}} | N ( h ± δ ) | {\displaystyle |N(h\pm \delta )|}

Для скорости вычислений нужны только уникальные пары точек. Например, для 2 наблюдений пары [ ], взятые из местоположений с разделением только [ ], должны быть рассмотрены, так как пары [ ] не предоставляют никакой дополнительной информации. ( z a , z b ) , ( z c , z d ) {\displaystyle (z_{a},z_{b}),(z_{c},z_{d})} h ± δ {\displaystyle h\pm \delta } ( z a , z b ) , ( z c , z d ) {\displaystyle (z_{a},z_{b}),(z_{c},z_{d})} ( z b , z a ) , ( z d , z c ) {\displaystyle (z_{b},z_{a}),(z_{d},z_{c})}

Модели вариограмм

Эмпирическая вариограмма не может быть вычислена на каждом расстоянии лага , и из-за вариации в оценке не гарантируется, что это будет допустимая вариограмма, как определено выше. Однако некоторые геостатистические методы, такие как кригинг, требуют допустимых полувариограмм. В прикладной геостатистике эмпирические вариограммы, таким образом, часто аппроксимируются функцией модели, что обеспечивает достоверность (Chiles&Delfiner 1999). Вот некоторые важные модели (Chiles&Delfiner 1999, Cressie 1993): h {\displaystyle h}

  • Модель экспоненциальной вариограммы
    γ ( h ) = ( s n ) ( 1 exp ( h / ( r a ) ) ) + n 1 ( 0 , ) ( h ) . {\displaystyle \gamma (h)=(s-n)(1-\exp(-h/(ra)))+n1_{(0,\infty )}(h).}
  • Модель сферической вариограммы
    γ ( h ) = ( s n ) ( ( 3 h 2 r h 3 2 r 3 ) 1 ( 0 , r ) ( h ) + 1 [ r , ) ( h ) ) + n 1 ( 0 , ) ( h ) . {\displaystyle \gamma (h)=(s-n)\left(\left({\frac {3h}{2r}}-{\frac {h^{3}}{2r^{3}}}\right)1_{(0,r)}(h)+1_{[r,\infty )}(h)\right)+n1_{(0,\infty )}(h).}
  • Модель гауссовой вариограммы
    γ ( h ) = ( s n ) ( 1 exp ( h 2 r 2 a ) ) + n 1 ( 0 , ) ( h ) . {\displaystyle \gamma (h)=(s-n)\left(1-\exp \left(-{\frac {h^{2}}{r^{2}a}}\right)\right)+n1_{(0,\infty )}(h).}

Параметр имеет разные значения в разных источниках из-за неоднозначности определения диапазона. Например, это значение, используемое в (Chiles&Delfiner 1999). Функция равна 1, если и 0 в противном случае. a {\displaystyle a} a = 1 / 3 {\displaystyle a=1/3} 1 A ( h ) {\displaystyle 1_{A}(h)} h A {\displaystyle h\in A}

Обсуждение

В геостатистике для описания пространственной или временной корреляции наблюдений используются три функции : коррелограмма , ковариация и полувариограмма . Последняя также более просто называется вариограммой .

Вариограмма является ключевой функцией в геостатистике, поскольку она будет использоваться для подгонки модели временной/ пространственной корреляции наблюдаемого явления. Таким образом, проводится различие между экспериментальной вариограммой , которая является визуализацией возможной пространственной/временной корреляции, и моделью вариограммы , которая далее используется для определения весов функции кригинга . Обратите внимание, что экспериментальная вариограмма является эмпирической оценкой ковариации гауссовского процесса . Как таковая, она может не быть положительно определенной и, следовательно, не может напрямую использоваться в кригинге без ограничений или дальнейшей обработки. Это объясняет, почему используется только ограниченное количество моделей вариограмм: чаще всего это линейная, сферическая, гауссова и экспоненциальная модели.

Приложения

Эмпирическая вариограмма используется в геостатистике в качестве первой оценки модели вариограммы, необходимой для пространственной интерполяции методом кригинга .

  • Для определения критериев совпадения спутниковых и наземных измерений использовались эмпирические вариограммы пространственно-временной изменчивости усредненного по столбу углекислого газа . [4]
  • Были рассчитаны эмпирические вариограммы для плотности неоднородного материала (Гилсокарбон). [5]
  • Эмпирические вариограммы рассчитываются на основе наблюдений за сильными колебаниями грунта в результате землетрясений . [6] Эти модели используются для оценки сейсмического риска и потерь пространственно-распределенной инфраструктуры. [7]

Квадратный член в вариограмме, например , можно заменить различными степенями: Мадограмма определяется с помощью абсолютной разности , , а родограмма определяется с помощью квадратного корня абсолютной разности, . Оценки, основанные на этих более низких степенях, считаются более устойчивыми к выбросам . Их можно обобщить как «вариограмму порядка α », ( Z ( s 1 ) Z ( s 2 ) ) 2 {\displaystyle (Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2}))^{2}} | Z ( s 1 ) Z ( s 2 ) | {\displaystyle |Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2})|} | Z ( s 1 ) Z ( s 2 ) | 0.5 {\displaystyle |Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2})|^{0.5}}

2 γ ( s 1 , s 2 ) = E [ | Z ( s 1 ) Z ( s 2 ) | α ] {\displaystyle 2\gamma (\mathbf {s} _{1},\mathbf {s} _{2})=E\left[\left|Z(\mathbf {s} _{1})-Z(\mathbf {s} _{2})\right|^{\alpha }\right]} ,

где вариограмма имеет порядок 2, мадограмма — это вариограмма порядка 1, а родограмма — это вариограмма порядка 0,5. [8]

Когда вариограмма используется для описания корреляции различных переменных, она называется кросс-вариограммой . Кросс-вариограммы используются в ко-кригинге . Если переменная является бинарной или представляет классы значений, то говорят об индикаторных вариограммах . Индикаторные вариограммы используются в индикаторном кригинге .

Ссылки

  1. ^ Матерон, Жорж (1963). «Принципы геостатистики». Экономическая геология . 58 (8): 1246– 1266. doi :10.2113/gsecongeo.58.8.1246. ISSN  1554-0774.
  2. ^ Форд, Дэвид. «Эмпирическая вариограмма» (PDF) . Faculty.washington.edu/edford . Получено 31 октября 2017 г. .
  3. ^ Бахмайер, Мартин; Бэкес, Маттиас (24.02.2008). «Вариограмма или полувариограмма? Понимание дисперсий в вариограмме». Precision Agriculture . 9 (3). Springer Science and Business Media LLC: 173– 175. doi :10.1007/s11119-008-9056-2. ISSN  1385-2256.
  4. ^ ab Nguyen, H.; Osterman, G.; Wunch, D.; O'Dell, C.; Mandrake, L.; Wennberg, P.; Fisher, B.; Castano, R. (2014). "Метод совмещения спутниковых данных XCO2 с наземными данными и его применение к ACOS-GOSAT и TCCON". Atmospheric Measurement Techniques . 7 (8): 2631– 2644. Bibcode :2014AMT.....7.2631N. doi : 10.5194/amt-7-2631-2014 . ISSN  1867-8548.
  5. ^ Arregui Mena, JD; et al. (2018). «Характеристика пространственной изменчивости свойств материалов Gilsocarbon и NBG-18 с использованием случайных полей». Journal of Nuclear Materials . 511 : 91–108 . Bibcode : 2018JNuM..511...91A. doi : 10.1016/j.jnucmat.2018.09.008 .
  6. ^ Schiappapietra, Erika; Douglas, John (апрель 2020 г.). «Моделирование пространственной корреляции движения грунта при землетрясениях: выводы из литературы, данные о последовательности землетрясений в Центральной Италии 2016–2017 гг. и моделирование движения грунта». Earth-Science Reviews . 203 : 103139. Bibcode : 2020ESRv..20303139S. doi : 10.1016/j.earscirev.2020.103139.
  7. ^ Соколов, Владимир; Венцель, Фридеманн (2011-07-25). «Влияние пространственной корреляции сильных движений грунта на неопределенность в оценке потерь от землетрясений». Earthquake Engineering & Structural Dynamics . 40 (9): 993– 1009. doi :10.1002/eqe.1074.
  8. ^ Олеа, Рикардо А. (1991). Геостатистический глоссарий и многоязычный словарь . Oxford University Press. С. 47, 67, 81. ISBN 9780195066890.

Дальнейшее чтение

  • Кресси, Н., 1993, Статистика пространственных данных, Wiley Interscience.
  • Чайлз, Дж. П., П. Делфинер, 1999, Геостатистика, Моделирование пространственной неопределенности, Wiley-Interscience.
  • Вакернагель, Х., 2003, Многомерная геостатистика, Springer.
  • Берроу, П.А. и Макдоннелл, Р.А., 1998, Принципы географических информационных систем.
  • Изобель Кларк, 1979, Практическая геостатистика, Издательство прикладной науки.
  • Кларк, И., 1979, Практическая геостатистика , Издательство прикладной науки.
  • Дэвид, М., 1978, Геостатистическая оценка запасов руды , Elsevier Publishing.
  • Хальд, А., 1952, Статистическая теория и ее инженерные приложения , John Wiley & Sons, Нью-Йорк.
  • Журнал, АГ и Хейбрегтс, Ч. Дж., 1978 Горная геостатистика , Academic Press.
  • Гласс, Х.Дж., 2003, Метод оценки качества вариограммы, Журнал Южноафриканского института горного дела и металлургии.
  • AI-GEOSTATS: образовательный ресурс по геостатистике и пространственной статистике
  • Геостатистика: Лекция Рудольфа Дуттера в Венском техническом университете
Retrieved from "https://en.wikipedia.org/w/index.php?title=Variogram&oldid=1254040134"