В математике и статистике отклонение служит мерой количественной оценки несоответствия между наблюдаемым значением переменной и другим обозначенным значением , часто средним значением этой переменной. Отклонения относительно выборочного среднего и среднего значения совокупности (или « истинного значения ») называются ошибками и остатками соответственно. Знак отклонения сообщает направление этого различия: отклонение положительно, когда наблюдаемое значение превышает опорное значение. Абсолютное значение отклонения указывает размер или величину различия. В данной выборке имеется столько отклонений, сколько точек выборки . Сводные статистические данные могут быть получены из набора отклонений, таких как стандартное отклонение и среднее абсолютное отклонение , меры дисперсии , и среднее знаковое отклонение , мера смещения. [1]
Отклонение каждой точки данных вычисляется путем вычитания среднего значения набора данных из индивидуальной точки данных. Математически отклонение d точки данных x в наборе данных относительно среднего значения m определяется разностью:
Этот расчет представляет собой «расстояние» точки данных от среднего значения и предоставляет информацию о том, насколько индивидуальные значения отличаются от среднего. Положительные отклонения указывают на значения выше среднего, тогда как отрицательные отклонения указывают на значения ниже среднего. [1]
Сумма квадратов отклонений является ключевым компонентом в расчете дисперсии , другой меры разброса или дисперсии набора данных. Дисперсия вычисляется путем усреднения квадратов отклонений. Отклонение является фундаментальной концепцией в понимании распределения и изменчивости точек данных в статистическом анализе. [1]
Отклонение, представляющее собой разницу между наблюдаемым значением и истинным значением интересующей величины (где истинное значение обозначает ожидаемое значение, например, среднее значение совокупности), является ошибкой. [2]
Отклонение, которое является разницей между наблюдаемым значением и оценкой истинного значения (например, выборочным средним), является остатком . Эти концепции применимы к данным на уровнях интервала и отношения измерения. [3]
где
Среднее абсолютное отклонение (AAD) в статистике — это мера дисперсии или разброса набора точек данных вокруг центрального значения, обычно среднего или медианы. Оно рассчитывается путем взятия среднего значения абсолютных разностей между каждой точкой данных и выбранным центральным значением. AAD обеспечивает меру типичной величины отклонений от центрального значения в наборе данных, давая представление об общей изменчивости данных. [5]
Наименьшее абсолютное отклонение (LAD) — статистический метод, используемый в регрессионном анализе для оценки коэффициентов линейной модели. В отличие от более распространенного метода наименьших квадратов, который минимизирует сумму квадратов вертикальных расстояний (остатков) между наблюдаемыми и прогнозируемыми значениями, метод LAD минимизирует сумму абсолютных вертикальных расстояний.
В контексте линейной регрессии, если ( x 1 , y 1 ), ( x 2 , y 2 ), ... — это точки данных, а a и b — это коэффициенты, которые необходимо оценить для линейной модели.
наименьшие абсолютные оценки отклонения ( a и b ) получаются путем минимизации суммы.
Метод LAD менее чувствителен к выбросам по сравнению с методом наименьших квадратов, что делает его надежным методом регрессии при наличии перекошенных или тяжелохвостовых остаточных распределений. [6]
Для несмещенной оценки среднее значение отклонений со знаком по всему набору всех наблюдений от ненаблюдаемого значения параметра популяции усредняется на сколь угодно большом количестве выборок. Однако по построению среднее значение отклонений со знаком значений от выборочного среднего значения всегда равно нулю, хотя среднее отклонение со знаком от другой меры центральной тенденции, такой как выборочная медиана, не обязательно должно быть равно нулю.
Среднее знаковое отклонение — это статистическая мера, используемая для оценки среднего отклонения набора значений от центральной точки, обычно среднего. Она рассчитывается путем взятия среднего арифметического знаковых разностей между каждой точкой данных и средним значением набора данных.
Термин «со знаком» указывает на то, что отклонения рассматриваются с соответствующими знаками, то есть выше или ниже среднего. Положительные отклонения (выше среднего) и отрицательные отклонения (ниже среднего) включены в расчет. Среднее отклонение со знаком дает меру среднего расстояния и направления точек данных от среднего, предлагая понимание общей тенденции и распределения данных. [3]
В качестве меры статистической дисперсии используются статистики распределения отклонений .
Отклонения, которые измеряют разницу между наблюдаемыми значениями и некоторой точкой отсчета, по своей сути несут единицы, соответствующие используемой шкале измерений. Например, если измеряются длины, отклонения будут выражены в таких единицах, как метры или футы. Чтобы сделать отклонения безразмерными и облегчить сравнения между различными наборами данных, можно сделать их безразмерными .
Один из распространенных методов заключается в делении отклонений на меру масштаба ( статистическую дисперсию ), при этом для стандартизации используется стандартное отклонение генеральной совокупности, а для стьюдентизации — стандартное отклонение выборки (например, стьюдентизированный остаток ).
Другой подход к безразмерности фокусируется на масштабировании по местоположению, а не по дисперсии. Процентное отклонение представляет собой иллюстрацию этого метода, рассчитанного как разница между наблюдаемым значением и принятым значением, деленная на принятое значение, а затем умноженная на 100%. Масштабируя отклонение на основе принятого значения, этот метод позволяет выражать отклонения в процентном отношении, предоставляя четкую перспективу относительной разницы между наблюдаемыми и принятыми значениями. Оба метода безразмерности служат цели сделать отклонения сопоставимыми и интерпретируемыми за пределами конкретных единиц измерения. [10]
В одном примере проводится ряд измерений скорости звука в определенной среде. Принятое или ожидаемое значение скорости звука в этой среде, основанное на теоретических расчетах, составляет 343 метра в секунду.
Теперь, во время эксперимента, разные исследователи проводят несколько измерений. Исследователь А измеряет скорость звука как 340 метров в секунду, что приводит к отклонению на −3 метра в секунду от ожидаемого значения. Исследователь Б, с другой стороны, измеряет скорость как 345 метров в секунду, что приводит к отклонению на +2 метра в секунду.
В этом научном контексте отклонение помогает количественно оценить, насколько отдельные измерения отличаются от теоретически предсказанного или принятого значения. Оно дает представление о точности и достоверности экспериментальных результатов, позволяя исследователям оценить надежность своих данных и потенциально выявить факторы, способствующие расхождениям.
В другом примере предположим, что химическая реакция должна дать 100 граммов определенного соединения на основе стехиометрии. Однако в реальном лабораторном эксперименте проводится несколько испытаний с различными условиями.
В испытании 1 фактический выход составляет 95 граммов, что приводит к отклонению на −5 граммов от ожидаемого выхода. В испытании 2 фактический выход составляет 102 грамма, что приводит к отклонению на +2 грамма. Эти отклонения от ожидаемого значения предоставляют ценную информацию об эффективности и воспроизводимости химической реакции в различных условиях.
Ученые могут анализировать эти отклонения, чтобы оптимизировать условия реакции, выявить потенциальные источники ошибок и улучшить общий выход и надежность процесса. Концепция отклонения имеет решающее значение для оценки точности экспериментальных результатов и принятия обоснованных решений для улучшения результатов научных экспериментов.