Отклонение (статистика)

Разница между наблюдаемым значением переменной и ее контрольным значением
График стандартного отклонения случайного распределения

В математике и статистике отклонение служит мерой количественной оценки несоответствия между наблюдаемым значением переменной и другим обозначенным значением , часто средним значением этой переменной. Отклонения относительно выборочного среднего и среднего значения совокупности (или « истинного значения ») называются ошибками и остатками соответственно. Знак отклонения сообщает направление этого различия: отклонение положительно, когда наблюдаемое значение превышает опорное значение. Абсолютное значение отклонения указывает размер или величину различия. В данной выборке имеется столько отклонений, сколько точек выборки . Сводные статистические данные могут быть получены из набора отклонений, таких как стандартное отклонение и среднее абсолютное отклонение , меры дисперсии , и среднее знаковое отклонение , мера смещения. [1]

Отклонение каждой точки данных вычисляется путем вычитания среднего значения набора данных из индивидуальной точки данных. Математически отклонение d точки данных x в наборе данных относительно среднего значения m определяется разностью:

г = х м {\displaystyle d=xm}

Этот расчет представляет собой «расстояние» точки данных от среднего значения и предоставляет информацию о том, насколько индивидуальные значения отличаются от среднего. Положительные отклонения указывают на значения выше среднего, тогда как отрицательные отклонения указывают на значения ниже среднего. [1]

Сумма квадратов отклонений является ключевым компонентом в расчете дисперсии , другой меры разброса или дисперсии набора данных. Дисперсия вычисляется путем усреднения квадратов отклонений. Отклонение является фундаментальной концепцией в понимании распределения и изменчивости точек данных в статистическом анализе. [1]

Типы

Отклонение, представляющее собой разницу между наблюдаемым значением и истинным значением интересующей величины (где истинное значение обозначает ожидаемое значение, например, среднее значение совокупности), является ошибкой. [2]

Знаковые отклонения

Отклонение, которое является разницей между наблюдаемым значением и оценкой истинного значения (например, выборочным средним), является остатком . Эти концепции применимы к данным на уровнях интервала и отношения измерения. [3]

Беззнаковое или абсолютное отклонение

  • Абсолютное отклонение в статистике — это метрика, которая измеряет общую разницу между отдельными точками данных и центральным значением, обычно средним или медианой набора данных. Она определяется путем взятия абсолютного значения разницы между каждой точкой данных и центральным значением, а затем усреднения этих абсолютных разниц. [4] Формула выражается следующим образом:

Д я = | х я м ( Х ) | , {\displaystyle D_{i}=|x_{i}-m(X)|,} где


Среднее абсолютное отклонение (AAD) в статистике — это мера дисперсии или разброса набора точек данных вокруг центрального значения, обычно среднего или медианы. Оно рассчитывается путем взятия среднего значения абсолютных разностей между каждой точкой данных и выбранным центральным значением. AAD обеспечивает меру типичной величины отклонений от центрального значения в наборе данных, давая представление об общей изменчивости данных. [5]

Наименьшее абсолютное отклонение (LAD) — статистический метод, используемый в регрессионном анализе для оценки коэффициентов линейной модели. В отличие от более распространенного метода наименьших квадратов, который минимизирует сумму квадратов вертикальных расстояний (остатков) между наблюдаемыми и прогнозируемыми значениями, метод LAD минимизирует сумму абсолютных вертикальных расстояний.

В контексте линейной регрессии, если ( x 1 , y 1 ), ( x 2 , y 2 ), ... — это точки данных, а a и b — это коэффициенты, которые необходимо оценить для линейной модели.

у = б + ( а х ) {\displaystyle y=b+(a*x)}

наименьшие абсолютные оценки отклонения ( a и b ) получаются путем минимизации суммы.

Метод LAD менее чувствителен к выбросам по сравнению с методом наименьших квадратов, что делает его надежным методом регрессии при наличии перекошенных или тяжелохвостовых остаточных распределений. [6]

Сводная статистика

Среднее знаковое отклонение

Для несмещенной оценки среднее значение отклонений со знаком по всему набору всех наблюдений от ненаблюдаемого значения параметра популяции усредняется на сколь угодно большом количестве выборок. Однако по построению среднее значение отклонений со знаком значений от выборочного среднего значения всегда равно нулю, хотя среднее отклонение со знаком от другой меры центральной тенденции, такой как выборочная медиана, не обязательно должно быть равно нулю.

Среднее знаковое отклонение — это статистическая мера, используемая для оценки среднего отклонения набора значений от центральной точки, обычно среднего. Она рассчитывается путем взятия среднего арифметического знаковых разностей между каждой точкой данных и средним значением набора данных.

Термин «со знаком» указывает на то, что отклонения рассматриваются с соответствующими знаками, то есть выше или ниже среднего. Положительные отклонения (выше среднего) и отрицательные отклонения (ниже среднего) включены в расчет. Среднее отклонение со знаком дает меру среднего расстояния и направления точек данных от среднего, предлагая понимание общей тенденции и распределения данных. [3]

Дисперсия

В качестве меры статистической дисперсии используются статистики распределения отклонений .

Распределение с различными стандартными отклонениями отражает различные степени дисперсии среди точек данных. Первое стандартное отклонение от среднего значения в нормальном распределении охватывает приблизительно 68% данных. Второе стандартное отклонение от среднего значения в нормальном распределении охватывает большую часть данных, охватывая приблизительно 95% наблюдений.
  • Стандартное отклонение — это широко используемая мера распространения или дисперсии набора данных. Она количественно определяет среднюю величину вариации или отклонения отдельных точек данных от среднего значения набора данных. Она использует квадратичные отклонения и имеет желаемые свойства. Стандартное отклонение чувствительно к экстремальным значениям, что делает его неустойчивым . [ 7]
  • Среднее абсолютное отклонение — это мера дисперсии в наборе данных, которая меньше подвержена влиянию экстремальных значений. Она рассчитывается путем нахождения абсолютной разницы между каждой точкой данных и средним значением, суммирования этих абсолютных разностей и последующего деления на количество наблюдений. Эта метрика обеспечивает более надежную оценку изменчивости по сравнению со стандартным отклонением. [8]
  • Медианное абсолютное отклонение — это надежная статистика, которая использует медиану, а не среднее значение, для измерения разброса набора данных. Она рассчитывается путем нахождения абсолютной разницы между каждой точкой данных и медианой, а затем вычисления медианы этих абсолютных разностей. Это делает медианное абсолютное отклонение менее чувствительным к выбросам, предлагая надежную альтернативу стандартному отклонению. [9]
  • Максимальное абсолютное отклонение — это простая мера максимальной разницы между любой отдельной точкой данных и средним значением набора данных. Однако она крайне ненадежна, поскольку на нее может непропорционально влиять одно экстремальное значение. Эта метрика может не обеспечивать надежной меры дисперсии при работе с наборами данных, содержащими выбросы. [8]

Нормализация

Отклонения, которые измеряют разницу между наблюдаемыми значениями и некоторой точкой отсчета, по своей сути несут единицы, соответствующие используемой шкале измерений. Например, если измеряются длины, отклонения будут выражены в таких единицах, как метры или футы. Чтобы сделать отклонения безразмерными и облегчить сравнения между различными наборами данных, можно сделать их безразмерными .

Один из распространенных методов заключается в делении отклонений на меру масштаба ( статистическую дисперсию ), при этом для стандартизации используется стандартное отклонение генеральной совокупности, а для стьюдентизации — стандартное отклонение выборки (например, стьюдентизированный остаток ).

Другой подход к безразмерности фокусируется на масштабировании по местоположению, а не по дисперсии. Процентное отклонение представляет собой иллюстрацию этого метода, рассчитанного как разница между наблюдаемым значением и принятым значением, деленная на принятое значение, а затем умноженная на 100%. Масштабируя отклонение на основе принятого значения, этот метод позволяет выражать отклонения в процентном отношении, предоставляя четкую перспективу относительной разницы между наблюдаемыми и принятыми значениями. Оба метода безразмерности служат цели сделать отклонения сопоставимыми и интерпретируемыми за пределами конкретных единиц измерения. [10]

Примеры

В одном примере проводится ряд измерений скорости звука в определенной среде. Принятое или ожидаемое значение скорости звука в этой среде, основанное на теоретических расчетах, составляет 343 метра в секунду.

Теперь, во время эксперимента, разные исследователи проводят несколько измерений. Исследователь А измеряет скорость звука как 340 метров в секунду, что приводит к отклонению на −3 метра в секунду от ожидаемого значения. Исследователь Б, с другой стороны, измеряет скорость как 345 метров в секунду, что приводит к отклонению на +2 метра в секунду.

В этом научном контексте отклонение помогает количественно оценить, насколько отдельные измерения отличаются от теоретически предсказанного или принятого значения. Оно дает представление о точности и достоверности экспериментальных результатов, позволяя исследователям оценить надежность своих данных и потенциально выявить факторы, способствующие расхождениям.

В другом примере предположим, что химическая реакция должна дать 100 граммов определенного соединения на основе стехиометрии. Однако в реальном лабораторном эксперименте проводится несколько испытаний с различными условиями.

В испытании 1 фактический выход составляет 95 граммов, что приводит к отклонению на −5 граммов от ожидаемого выхода. В испытании 2 фактический выход составляет 102 грамма, что приводит к отклонению на +2 грамма. Эти отклонения от ожидаемого значения предоставляют ценную информацию об эффективности и воспроизводимости химической реакции в различных условиях.

Ученые могут анализировать эти отклонения, чтобы оптимизировать условия реакции, выявить потенциальные источники ошибок и улучшить общий выход и надежность процесса. Концепция отклонения имеет решающее значение для оценки точности экспериментальных результатов и принятия обоснованных решений для улучшения результатов научных экспериментов.

Смотрите также

Ссылки

  1. ^ abc Ли, Донг Кю; Ин, Джунён; Ли, Сансок (2015). «Стандартное отклонение и стандартная ошибка среднего». Корейский журнал анестезиологии . 68 (3): 220. doi : 10.4097/kjae.2015.68.3.220 . ISSN  2005-6419. PMC  4452664 .
  2. ^ Ливингстон, Эдвард Х. (июнь 2004 г.). «Среднее значение и стандартное отклонение: что все это значит?». Журнал хирургических исследований . 119 (2): 117– 123. doi :10.1016/j.jss.2004.02.008. ISSN  0022-4804.
  3. ^ ab Dodge, Yadolah, ed. (2003-08-07). Оксфордский словарь статистических терминов. Oxford University Press, Оксфорд. ISBN 978-0-19-850994-3.
  4. ^ Конно, Хироши; Кошизука, Томоюки (1 октября 2005 г.). «Модель среднего-абсолютного отклонения». Операции IIE . 37 (10): 893–900 . doi : 10.1080/07408170591007786. ISSN  0740-817X.
  5. ^ Pham-Gia, T.; Hung, TL (2001-10-01). "Среднее и медианное абсолютные отклонения". Математическое и компьютерное моделирование . 34 (7): 921– 936. doi :10.1016/S0895-7177(01)00109-1. ISSN  0895-7177.
  6. ^ Чэнь, Кани; Ин, Чжилян (1996-04-01). «Контрпример к гипотезе о полосе Холла-Веллнера». Анналы статистики . 24 (2). doi : 10.1214/aos/1032894456 . ISSN  0090-5364.
  7. ^ "2. Среднее и стандартное отклонение | The BMJ". The BMJ | The BMJ: ведущий общемедицинский журнал. Исследования. Образование. Комментарий . 2020-10-28 . Получено 2022-11-02 .
  8. ^ ab Pham-Gia, T.; Hung, TL (2001-10-01). "Среднее и медианное абсолютные отклонения". Математическое и компьютерное моделирование . 34 (7): 921– 936. doi :10.1016/S0895-7177(01)00109-1. ISSN  0895-7177.
  9. ^ Джонс, Алан Р. (2018-10-09). Вероятность, статистика и другие пугающие вещи. Routledge. стр. 73. ISBN 978-1-351-66138-6.
  10. ^ Фридман, Дэвид; Пизани, Роберт; Первес, Роджер (2007). Статистика (4-е изд.). Нью-Йорк: Norton. ISBN 978-0-393-93043-6.
Взято с "https://en.wikipedia.org/w/index.php?title=Отклонение_(статистика)&oldid=1257261380#Беззнаковое_или_абсолютное_отклонение"