Среднее арифметическое

Тип среднего арифметического набора чисел

В математике и статистике среднее арифметическое ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k / arr-ith- MET -ik ), арифметическое среднее или просто среднее или среднее (когда контекст ясен) — это сумма набора чисел, деленная на количество чисел в наборе. [1] Набор часто представляет собой набор результатов эксперимента , наблюдательного исследования или опроса . Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других типов средних, таких как геометрическое и гармоническое .

Помимо математики и статистики, среднее арифметическое часто используется в экономике , антропологии , истории и почти в каждой академической области в той или иной степени. Например, доход на душу населения — это среднее арифметическое дохода населения страны.

Хотя среднее арифметическое часто используется для сообщения о центральных тенденциях , оно не является надежной статистикой : на него сильно влияют выбросы (значения, намного большие или меньшие, чем большинство других). Для асимметричных распределений , таких как распределение доходов , при котором доходы нескольких людей существенно выше, чем у большинства людей, среднее арифметическое может не совпадать с представлением человека о «середине». В этом случае надежная статистика, такая как медиана , может обеспечить лучшее описание центральной тенденции.

Определение

Среднее арифметическое набора наблюдаемых данных равно сумме числовых значений каждого наблюдения, деленной на общее число наблюдений. Символически, для набора данных, состоящего из значений , среднее арифметическое определяется по формуле: х 1 , , х н {\displaystyle x_{1},\точки ,x_{n}}

х ¯ = 1 н ( я = 1 н х я ) = х 1 + х 2 + + х н н {\displaystyle {\bar {x}}={\frac {1}{n}}\left(\sum _{i=1}^{n}{x_{i}}\right)={\frac {x_{1}+x_{2}+\dots +x_{n}}{n}}} [2]

(Для объяснения оператора суммирования см. суммирование .)

Проще говоря, формула для среднего арифметического выглядит так:

Сумма всех чисел в данных Общее количество чисел в данных {\displaystyle {\frac {\text{Общее количество всех чисел в данных}}{\text{Общее количество чисел в данных}}}}

Например, если ежемесячная заработная плата сотрудников составляет , то среднее арифметическое равно: 10 {\displaystyle 10} { 2500 , 2700 , 2400 , 2300 , 2550 , 2650 , 2750 , 2450 , 2600 , 2400 } {\displaystyle \{2500,2700,2400,2300,2550,2650,2750,2450,2600,2400\}}

2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400 10 = 2530 {\displaystyle {\frac {2500+2700+2400+2300+2550+2650+2750+2450+2600+2400}{10}}=2530}

Если набор данных представляет собой статистическую совокупность (т. е. состоит из всех возможных наблюдений, а не только из их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . Если набор данных представляет собой статистическую выборку (подмножество совокупности), то оно называется средним значением выборки (что для набора данных обозначается как ). μ {\displaystyle \мю} Х {\displaystyle X} Х ¯ {\displaystyle {\overline {X}}}

Среднее арифметическое может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое является выпуклой комбинацией (то есть ее коэффициенты в сумме дают ), его можно определить в выпуклом пространстве , а не только в векторном пространстве. 1 {\displaystyle 1}

История

Статистик Черчилль Эйзенхарт , старший научный сотрудник Национального бюро стандартов США , подробно проследил историю среднего арифметического. В современную эпоху его начали использовать как способ объединения различных наблюдений, которые должны быть идентичны, но не были такими, как оценки направления магнитного севера. В 1635 году математик Генри Геллибранд описал как «среднее» среднюю точку между самым низким и самым высоким числом, не совсем среднее арифметическое. В 1668 году человек, известный как «DB», был процитирован в « Трудах Королевского общества», описывая «взятие среднего» из пяти значений: [3]

В этой таблице он [капитан Стурми] отмечает, что наибольшая разница составляет 14 минут; и поэтому, принимая среднее значение за истинное отклонение, он приходит к выводу, что оно составляет всего 1 градус 27 минут.

—  БД стр. 726

Мотивирующие свойства

Среднее арифметическое имеет несколько свойств, которые делают его интересным, особенно как меру центральной тенденции. К ним относятся:

  • Если числа имеют среднее значение , то . Поскольку — это расстояние от заданного числа до среднего значения, один из способов интерпретации этого свойства — сказать, что числа слева от среднего значения уравновешиваются числами справа. Среднее значение — это единственное число, для которого остатки ( отклонения от оценки) в сумме равны нулю. Это также можно интерпретировать как утверждение, что среднее значение является трансляционно инвариантным в том смысле, что для любого действительного числа , . х 1 , , х н {\displaystyle x_{1},\dotsc ,x_{n}} х ¯ {\displaystyle {\bar {x}}} ( х 1 х ¯ ) + + ( х н х ¯ ) = 0 {\displaystyle (x_{1}-{\bar {x}})+\dotsb +(x_{n}-{\bar {x}})=0} х я х ¯ {\displaystyle x_{i}-{\bar {x}}} а {\displaystyle а} х + а ¯ = х ¯ + а {\displaystyle {\overline {x+a}}={\bar {x}}+a}
  • Если требуется использовать одно число в качестве «типичного» значения для набора известных чисел , то наилучшим образом с этой задачей справляется среднее арифметическое чисел, поскольку оно минимизирует сумму квадратов отклонений от типичного значения: сумму . Выборочное среднее также является наилучшим одиночным предиктором, поскольку оно имеет наименьшую среднеквадратичную ошибку . [4] Если требуется среднее арифметическое совокупности чисел, то его несмещенной оценкой является среднее арифметическое выборки, взятой из совокупности. х 1 , , х н {\displaystyle x_{1},\dotsc ,x_{n}} ( х я х ¯ ) 2 {\displaystyle (x_{i}-{\bar {x}})^{2}}
  • Среднее арифметическое не зависит от масштаба единиц измерения, в том смысле, что Так, например, вычисление среднего значения литров и последующее преобразование в галлоны равнозначно первоначальному преобразованию в галлоны и последующему вычислению среднего значения. Это также называется однородностью первого порядка . в среднем ( с а 1 , , с а н ) = с в среднем ( а 1 , , а н ) . {\displaystyle {\text{avg}}(ca_{1},\cdots ,ca_{n})=c\cdot {\text{avg}}(a_{1},\cdots ,a_{n}).}

Дополнительные свойства

  • Среднее арифметическое выборки всегда находится между наибольшим и наименьшим значениями в этой выборке.
  • Среднее арифметическое любого количества групп чисел одинакового размера представляет собой среднее арифметическое средних арифметических значений каждой группы.

Контраст с медианой

Среднее арифметическое можно противопоставить медиане . Медиана определяется таким образом, что не более половины значений больше нее и не более половины меньше ее. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим выборку данных . Среднее равно , как и медиана. Однако, когда мы рассматриваем выборку, которая не может быть организована для увеличения арифметически, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое равно , в то время как медиана равна . Среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства. { 1 , 2 , 3 , 4 } {\displaystyle \{1,2,3,4\}} 2.5 {\displaystyle 2.5} { 1 , 2 , 4 , 8 , 16 } {\displaystyle \{1,2,4,8,16\}} 6.2 {\displaystyle 6.2} 4 {\displaystyle 4}

Существуют приложения этого явления во многих областях. Например, с 1980-х годов медианный доход в Соединенных Штатах рос медленнее, чем арифметическое среднее дохода. [5]

Обобщения

Средневзвешенное значение

Средневзвешенное значение, или средневзвешенное значение, — это среднее значение, в котором некоторые точки данных имеют больший вес, чем другие, поскольку им придается больший вес при расчете. [6] Например, среднее арифметическое и равно , или эквивалентно . Напротив, средневзвешенное значение, в котором первое число получает, например, в два раза больший вес, чем второе (возможно, потому что предполагается, что оно появляется в два раза чаще в общей популяции, из которой были отобраны эти числа), будет рассчитано как . Здесь веса, которые обязательно в сумме равны единице, равны и , причем первое в два раза больше второго. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как особый случай средневзвешенного, в котором все веса равны одному и тому же числу ( в приведенном выше примере и в ситуации с усредняемыми числами). 3 {\displaystyle 3} 5 {\displaystyle 5} 3 + 5 2 = 4 {\displaystyle {\frac {3+5}{2}}=4} 3 1 2 + 5 1 2 = 4 {\displaystyle 3\cdot {\frac {1}{2}}+5\cdot {\frac {1}{2}}=4} 3 2 3 + 5 1 3 = 11 3 {\displaystyle 3\cdot {\frac {2}{3}}+5\cdot {\frac {1}{3}}={\frac {11}{3}}} 2 3 {\displaystyle {\frac {2}{3}}} 1 3 {\displaystyle {\frac {1}{3}}} 1 2 {\displaystyle {\frac {1}{2}}} 1 н {\displaystyle {\frac {1}{n}}} n {\displaystyle n}

Непрерывные распределения вероятностей

Сравнение двух логнормальных распределений с одинаковой медианой, но разной асимметрией , приводящее к различным средним значениям и модам

Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений можно описать путем интегрирования непрерывного распределения вероятностей по этому диапазону, даже когда наивная вероятность для выборочного числа, принимающего одно определенное значение из бесконечного множества, равна нулю. В этом контексте аналог взвешенного среднего, в котором существует бесконечно много возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее широко встречающееся распределение вероятностей называется нормальным распределением ; оно обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но и медиану, упомянутую выше, и моду (три M [7] ), равны. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения.

Углы

Особая осторожность необходима при использовании циклических данных, таких как фазы или углы . Взятие среднего арифметического 1° и 359° дает результат 180 ° . Это неверно по двум причинам:

  • Во-первых, угловые измерения определяются только до аддитивной константы 360° ( или , если измерение в радианах ). Таким образом, их можно было бы легко назвать 1° и -1°, или 361° и 719°, поскольку каждое из них дает разное среднее значение. 2 π {\displaystyle 2\pi } τ {\displaystyle \tau }
  • Во-вторых, в этой ситуации 0° (или 360°) является геометрически лучшим средним значением: вокруг него наблюдается меньшая дисперсия (точки находятся на расстоянии 1° от него и на расстоянии 179° от 180°, предполагаемого среднего значения).

В общем случае такое упущение приведет к тому, что среднее значение будет искусственно смещено к середине числового диапазона. Решение этой проблемы заключается в использовании формулировки оптимизации (то есть, определить среднее значение как центральную точку: точку, относительно которой имеется наименьшая дисперсия) и переопределить разницу как модульное расстояние (то есть, расстояние на окружности: так, модульное расстояние между 1° и 359° равно 2°, а не 358°).

Доказательство неравенства AM–GM без слов : PR
диаметр окружности с центром в точке O; ее радиус AO — среднее арифметическое a и b . Используя теорему о среднем геометрическом , высота GQ треугольника PGR — среднее геометрическое . Для любого отношения a : b , AO ≥ GQ.

Символы и кодировка

Среднее арифметическое часто обозначается чертой ( винкулумом или макроном ), как в [4] . x ¯ {\displaystyle {\bar {x}}}

Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может не отображать символ «x̄» правильно. Например, HTML- символ «x̄» объединяет два кода — базовую букву «x» плюс код для строки выше (̄ или ¯). [8]

В некоторых форматах документов (например, PDF ) символ может быть заменен символом «¢» ( цент ) при копировании в текстовый редактор, например Microsoft Word .

Смотрите также

Геометрическое доказательство без слов того, что max  ( a , b ) > среднеквадратичное ( RMS ) или среднее квадратичное ( QM ) > среднее арифметическое ( AM ) > среднее геометрическое ( GM ) > среднее гармоническое ( HM ) > min  ( a , b ) двух различных положительных чисел a и b [примечание 1]

Примечания

  1. ^ Если AC = a и BC = b . OC = AM точек a и b , и радиус r = QO = OG.
    Используя теорему Пифагора , QC² = QO² + OC² ∴ QC = √ QO² + OC² = QM .
    Используя теорему Пифагора, OC² = OG² + GC² ∴ GC = √ OC² − OG² = GM .
    Используя подобные треугольники , ХК/ГК = ГК/ОК ∴ ХК = GC²/ОК = ГМ .

Ссылки

  1. ^ Якобс, Гарольд Р. (1994). Математика: Человеческое начинание (третье изд.). WH Freeman . стр. 547. ISBN 0-7167-2426-X.
  2. ^ Weisstein, Eric W. "Среднее арифметическое". mathworld.wolfram.com . Получено 21 августа 2020 г. .
  3. ^ Эйзенхарт, Черчилль (24 августа 1971 г.). «Развитие концепции наилучшего среднего значения набора измерений от античности до наших дней» (PDF) . Президентское обращение, 131-е ежегодное собрание Американской статистической ассоциации, Университет штата Колорадо. стр.  68–69 .
  4. ^ ab Medhi, Jyotiprasad (1992). Статистические методы: вводный текст. New Age International. стр.  53–58 . ISBN 9788122404197.
  5. ^ Кругман, Пол (4 июня 2014 г.) [осень 1992 г.]. «Богатые, правые и факты: деконструкция дебатов о распределении доходов». The American Prospect .
  6. ^ "Mean | математика". Encyclopedia Britannica . Получено 21 августа 2020 г.
  7. ^ Thinkmap Visual Thesaurus (30 июня 2010 г.). «Три M статистики: мода, медиана, среднее значение 30 июня 2010 г.». www.visualthesaurus.com . Получено 3 декабря 2018 г.
  8. ^ "Notes on Unicode for Stat Symbols". www.personal.psu.edu . Архивировано из оригинала 31 марта 2022 г. Получено 14 октября 2018 г.

Дальнейшее чтение

  • Хафф, Даррелл (1993). Как лгать с помощью статистики . WW Norton. ISBN 978-0-393-31072-6.
  • Расчеты и сравнения среднего арифметического и среднего геометрического двух чисел
  • Вычислить среднее арифметическое ряда чисел на fxSolver
Retrieved from "https://en.wikipedia.org/w/index.php?title=Arithmetic_mean&oldid=1263871197"