Среднее абсолютное отклонение ( AAD ) набора данных — это среднее значение абсолютных отклонений от центральной точки . Это сводная статистика статистической дисперсии или изменчивости. В общем виде центральная точка может быть средним значением , медианой , модой или результатом любой другой меры центральной тенденции или любого справочного значения, связанного с данным набором данных. AAD включает среднее абсолютное отклонение и медианное абсолютное отклонение (оба сокращенно обозначаются как MAD ).
Несколько мер статистической дисперсии определяются в терминах абсолютного отклонения. Термин «среднее абсолютное отклонение» не определяет однозначно меру статистической дисперсии , поскольку существует несколько мер, которые можно использовать для измерения абсолютных отклонений, и существует несколько мер центральной тенденции , которые также можно использовать. Таким образом, для однозначной идентификации абсолютного отклонения необходимо указать как меру отклонения, так и меру центральной тенденции. В статистической литературе пока не принята стандартная нотация, поскольку и среднее абсолютное отклонение вокруг среднего, и медианное абсолютное отклонение вокруг медианы обозначаются в литературе их инициалами «MAD», что может привести к путанице, поскольку они, как правило, имеют значения, значительно отличающиеся друг от друга.
Среднее абсолютное отклонение набора X = { x 1 , x 2 , …, x n } равно
Выбор меры центральной тенденции, , оказывает заметное влияние на значение среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:
Мера центральной тенденции | Среднее абсолютное отклонение |
---|---|
Среднее арифметическое = 5 | |
Медиана = 3 | |
Режим = 2 |
Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», является средним значением абсолютных отклонений данных вокруг среднего значения данных: среднее (абсолютное) расстояние от среднего значения. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме относительно указанной центральной точки (см. выше).
MAD было предложено использовать вместо стандартного отклонения , поскольку оно лучше соответствует реальной жизни. [1] Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение , оно может быть полезным в школьном обучении. [2] [3]
Точность прогноза этого метода очень тесно связана с методом средней квадратичной ошибки (MSE), который является просто средней квадратичной ошибкой прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, поскольку его и легче вычислять (избегая необходимости возведения в квадрат) [4] , и легче понимать. [5]
Для нормального распределения отношение среднего абсолютного отклонения от среднего к стандартному отклонению равно . Таким образом, если X — нормально распределенная случайная величина с ожидаемым значением 0, то, см. Geary (1935): [6] Другими словами, для нормального распределения среднее абсолютное отклонение составляет около 0,8 от стандартного отклонения. Однако внутривыборочные измерения дают значения отношения среднего среднего отклонения к стандартному отклонению для заданной гауссовой выборки n со следующими пределами: , со смещением для малых n . [7]
Среднее абсолютное отклонение от среднего значения меньше или равно стандартному отклонению ; один из способов доказательства этого факта основан на неравенстве Йенсена .
Неравенство Йенсена имеет вид , где φ — выпуклая функция, отсюда следует, что:
Поскольку обе части положительны, а квадратный корень является монотонно возрастающей функцией в положительной области:
Общий случай этого утверждения см. в неравенстве Гёльдера .
Медиана — это точка, относительно которой среднее отклонение минимизируется. Медиана MAD предлагает прямую меру масштаба случайной величины вокруг ее медианы
Это оценка максимального правдоподобия параметра масштаба распределения Лапласа .
Поскольку медиана минимизирует среднее абсолютное расстояние, то имеем . Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.
Используя общую дисперсионную функцию, Хабиб (2011) определил MAD относительно медианы как, где индикаторная функция равна
Это представление позволяет получить среднеарифметические коэффициенты корреляции. [ необходима ссылка ]
Хотя в принципе в качестве центральной точки для медианного абсолютного отклонения можно взять среднее значение или любую другую центральную точку, чаще всего вместо этого берется медианное значение.
Медианное абсолютное отклонение (также MAD) — это медиана абсолютного отклонения от медианы . Это надежная оценка дисперсии .
Для примера {2, 2, 3, 4, 14}: 3 — это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1, 11}) с медианой 1, в данном случае не затронутой значением выброса 14, поэтому абсолютное отклонение медианы равно 1.
Для симметричного распределения медианное абсолютное отклонение равно половине межквартильного размаха .
Максимальное абсолютное отклонение вокруг произвольной точки — это максимум абсолютных отклонений выборки от этой точки. Хотя это и не является строго мерой центральной тенденции, максимальное абсолютное отклонение можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше , с , где — максимум выборки .
Меры статистической дисперсии, полученные из абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: Медиана — это мера центральной тенденции, наиболее связанная с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:
This section needs expansion. You can help by adding to it. (March 2009) |
Среднее абсолютное отклонение выборки является смещенной оценкой среднего абсолютного отклонения генеральной совокупности. Для того чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно быть равно абсолютному отклонению генеральной совокупности. Однако это не так. Для генеральной совокупности 1,2,3 как абсолютное отклонение генеральной совокупности относительно медианы, так и абсолютное отклонение генеральной совокупности относительно среднего значения равны 2/3. Среднее значение всех абсолютных отклонений выборки относительно среднего значения размера 3, которые можно извлечь из генеральной совокупности, равно 44/81, в то время как среднее значение всех абсолютных отклонений выборки относительно медианы равно 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.
Однако этот аргумент основан на понятии средней несмещенности. Каждая мера местоположения имеет свою собственную форму несмещенности (см. запись о смещенной оценке ). Соответствующая форма несмещенности здесь — медианная несмещенность.
{{cite web}}
: CS1 maint: bot: original URL status unknown (link){{cite book}}
: CS1 maint: multiple names: authors list (link)часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
значение MAD легче интерпретировать.