Среднее абсолютное отклонение

Сводная статистика изменчивости

Среднее абсолютное отклонение ( AAD ) набора данных — это среднее значение абсолютных отклонений от центральной точки . Это сводная статистика статистической дисперсии или изменчивости. В общем виде центральная точка может быть средним значением , медианой , модой или результатом любой другой меры центральной тенденции или любого справочного значения, связанного с данным набором данных. AAD включает среднее абсолютное отклонение и медианное абсолютное отклонение (оба сокращенно обозначаются как MAD ).

Меры рассеивания

Несколько мер статистической дисперсии определяются в терминах абсолютного отклонения. Термин «среднее абсолютное отклонение» не определяет однозначно меру статистической дисперсии , поскольку существует несколько мер, которые можно использовать для измерения абсолютных отклонений, и существует несколько мер центральной тенденции , которые также можно использовать. Таким образом, для однозначной идентификации абсолютного отклонения необходимо указать как меру отклонения, так и меру центральной тенденции. В статистической литературе пока не принята стандартная нотация, поскольку и среднее абсолютное отклонение вокруг среднего, и медианное абсолютное отклонение вокруг медианы обозначаются в литературе их инициалами «MAD», что может привести к путанице, поскольку они, как правило, имеют значения, значительно отличающиеся друг от друга.

Среднее абсолютное отклонение вокруг центральной точки

Среднее абсолютное отклонение набора X  = { x 1 , x 2 , …, x n } равно 1 н я = 1 н | х я м ( Х ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}

Выбор меры центральной тенденции, , оказывает заметное влияние на значение среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}: м ( Х ) {\displaystyle m(X)}

Мера центральной тенденции м ( Х ) {\displaystyle m(X)} Среднее абсолютное отклонение
Среднее арифметическое = 5 | 2 5 | + | 2 5 | + | 3 5 | + | 4 5 | + | 14 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3,6}
Медиана = 3 | 2 3 | + | 2 3 | + | 3 3 | + | 4 3 | + | 14 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2,8}
Режим = 2 | 2 2 | + | 2 2 | + | 3 2 | + | 4 2 | + | 14 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3,0}

Среднее абсолютное отклонение от среднего значения

Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», является средним значением абсолютных отклонений данных вокруг среднего значения данных: среднее (абсолютное) расстояние от среднего значения. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме относительно указанной центральной точки (см. выше).

MAD было предложено использовать вместо стандартного отклонения , поскольку оно лучше соответствует реальной жизни. [1] Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение , оно может быть полезным в школьном обучении. [2] [3]

Точность прогноза этого метода очень тесно связана с методом средней квадратичной ошибки (MSE), который является просто средней квадратичной ошибкой прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, поскольку его и легче вычислять (избегая необходимости возведения в квадрат) [4] , и легче понимать. [5]

Для нормального распределения отношение среднего абсолютного отклонения от среднего к стандартному отклонению равно . Таким образом, если X — нормально распределенная случайная величина с ожидаемым значением 0, то, см. Geary (1935): [6] Другими словами, для нормального распределения среднее абсолютное отклонение составляет около 0,8 от стандартного отклонения. Однако внутривыборочные измерения дают значения отношения среднего среднего отклонения к стандартному отклонению для заданной гауссовой выборки n со следующими пределами: , со смещением для малых n . [7] 2 / π = 0,79788456 {\textstyle {\sqrt {2/\pi }}=0,79788456\ldots } ж = Э | Х | Э ( Х 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}}={\sqrt {\frac {2}{\pi }}}.} ж н [ 0 , 1 ] {\displaystyle w_{n}\in [0,1]}

Среднее абсолютное отклонение от среднего значения меньше или равно стандартному отклонению ; один из способов доказательства этого факта основан на неравенстве Йенсена .

Доказательство

Неравенство Йенсена имеет вид , где φ — выпуклая функция, отсюда следует, что: φ ( Э [ И ] ) Э [ φ ( И ) ] {\displaystyle \varphi \left(\mathbb {E} [Y]\right)\leq \mathbb {E} \left[\varphi (Y)\right]} И = | Х μ | {\displaystyle Y=\vert X-\mu \vert } ( Э | Х μ | ) 2 Э ( | Х μ | 2 ) {\displaystyle \left(\mathbb {E} |X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)} ( Э | Х μ | ) 2 Вар ( Х ) {\displaystyle \left(\mathbb {E} |X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Поскольку обе части положительны, а квадратный корень является монотонно возрастающей функцией в положительной области: Э ( | Х μ | ) Вар ( Х ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}

Общий случай этого утверждения см. в неравенстве Гёльдера .

Среднее абсолютное отклонение вокруг медианы

Медиана — это точка, относительно которой среднее отклонение минимизируется. Медиана MAD предлагает прямую меру масштаба случайной величины вокруг ее медианы Д мед = Э | Х медиана | {\displaystyle D_{\text{med}}=E|X-{\text{median}}|}

Это оценка максимального правдоподобия параметра масштаба распределения Лапласа . б {\displaystyle б}

Поскольку медиана минимизирует среднее абсолютное расстояние, то имеем . Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа. Д мед Д иметь в виду {\displaystyle D_{\text{med}}\leq D_{\text{mean}}}

Используя общую дисперсионную функцию, Хабиб (2011) определил MAD относительно медианы как, где индикаторная функция равна Д мед = Э | Х медиана | = 2 Ков ( Х , я О ) {\displaystyle D_{\text{med}}=E|X-{\text{median}}|=2\operatorname {Cov} (X,I_{O})} I O := { 1 if  x > median , 0 otherwise . {\displaystyle \mathbf {I} _{O}:={\begin{cases}1&{\text{if }}x>{\text{median}},\\0&{\text{otherwise}}.\end{cases}}}

Это представление позволяет получить среднеарифметические коэффициенты корреляции. [ необходима ссылка ]

Медианное абсолютное отклонение вокруг центральной точки

Хотя в принципе в качестве центральной точки для медианного абсолютного отклонения можно взять среднее значение или любую другую центральную точку, чаще всего вместо этого берется медианное значение.

Среднее абсолютное отклонение вокруг медианы

Медианное абсолютное отклонение (также MAD) — это медиана абсолютного отклонения от медианы . Это надежная оценка дисперсии .

Для примера {2, 2, 3, 4, 14}: 3 — это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1, 11}) с медианой 1, в данном случае не затронутой значением выброса 14, поэтому абсолютное отклонение медианы равно 1.

Для симметричного распределения медианное абсолютное отклонение равно половине межквартильного размаха .

Максимальное абсолютное отклонение

Максимальное абсолютное отклонение вокруг произвольной точки — это максимум абсолютных отклонений выборки от этой точки. Хотя это и не является строго мерой центральной тенденции, максимальное абсолютное отклонение можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше , с , где — максимум выборки . m ( X ) = max ( X ) {\displaystyle m(X)=\max(X)} max ( X ) {\displaystyle \max(X)}

Минимизация

Меры статистической дисперсии, полученные из абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: Медиана — это мера центральной тенденции, наиболее связанная с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:

Оценка

Среднее абсолютное отклонение выборки является смещенной оценкой среднего абсолютного отклонения генеральной совокупности. Для того чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно быть равно абсолютному отклонению генеральной совокупности. Однако это не так. Для генеральной совокупности 1,2,3 как абсолютное отклонение генеральной совокупности относительно медианы, так и абсолютное отклонение генеральной совокупности относительно среднего значения равны 2/3. Среднее значение всех абсолютных отклонений выборки относительно среднего значения размера 3, которые можно извлечь из генеральной совокупности, равно 44/81, в то время как среднее значение всех абсолютных отклонений выборки относительно медианы равно 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.

Однако этот аргумент основан на понятии средней несмещенности. Каждая мера местоположения имеет свою собственную форму несмещенности (см. запись о смещенной оценке ). Соответствующая форма несмещенности здесь — медианная несмещенность.

Смотрите также

Ссылки

  1. ^ Талеб, Нассим Николас (2014). «Какая научная идея готова к отставке?». Edge . Архивировано из оригинала 2014-01-16 . Получено 2014-01-16 .{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  2. ^ Кадер, Гэри (март 1999). «Means and MADS». Преподавание математики в средней школе . 4 (6): 398–403. Архивировано из оригинала 2013-05-18 . Получено 20 февраля 2013 .
  3. ^ Франклин, Кристин, Гари Кадер, Дениз Мьюборн, Джерри Морено, Рокси Пек , Майк Перри и Ричард Шеффер (2007). Руководство по оценке и обучению в области статистического образования (PDF) . Американская статистическая ассоциация. ISBN 978-0-9791747-1-1. Архивировано (PDF) из оригинала 2013-03-07 . Получено 2013-02-20 .{{cite book}}: CS1 maint: multiple names: authors list (link)
  4. ^ Нахмиас, Стивен; Олсен, Тава Леннон (2015), Анализ производства и операций (7-е изд.), Waveland Press, стр. 62, ISBN 9781478628248MAD часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
  5. ^ Штадтлер, Хартмут; Кильгер, Кристоф; Мейр, Герберт, ред. (2014), Управление цепочками поставок и перспективное планирование: концепции, модели, программное обеспечение и практические примеры, Springer Texts in Business and Economics (5-е изд.), Springer, стр. 143, ISBN 9783642553097, значение MAD легче интерпретировать.
  6. ^ Гири, RC (1935). Отношение среднего отклонения к стандартному отклонению как тест нормальности. Biometrika, 27(3/4), 310–332.
  7. См. также статьи Гири 1936 и 1946 годов: Гири, Р. К. (1936). Моменты отношения среднего отклонения к стандартному отклонению для нормальных выборок. Biometrika, 28(3/4), 295–307 и Гири, Р. К. (1947). Тестирование на нормальность. Biometrika, 34(3/4), 209–242.
  • Преимущества среднего абсолютного отклонения
Retrieved from "https://en.wikipedia.org/w/index.php?title=Average_absolute_deviation&oldid=1248749015"