В математике среднее геометрическое — это среднее или усредненное значение , которое указывает на центральную тенденцию конечного набора положительных действительных чисел , используя произведение их значений (в отличие от среднего арифметического, которое использует их сумму). Среднее геометрическое чисел — это корень n -й степени из их произведения , т. е. для набора чисел a 1 , a 2 , ..., a n среднее геометрическое определяется как
Когда набор чисел и их среднее геометрическое отображаются в логарифмическом масштабе , среднее геометрическое преобразуется в среднее арифметическое, поэтому среднее геометрическое можно эквивалентно вычислить, взяв натуральный логарифм каждого числа, найдя среднее арифметическое логарифмов, а затем вернув результат в линейный масштаб с помощью экспоненциальной функции ,
Среднее геометрическое двух чисел равно квадратному корню из их произведения, например, для чисел и среднее геометрическое равно . Среднее геометрическое трех чисел равно кубическому корню из их произведения, например, для чисел , , и , среднее геометрическое равно .
Геометрическое среднее полезно всякий раз, когда усредняемые величины объединяются мультипликативно, например, темпы роста населения или процентные ставки финансовых инвестиций. Предположим, например, что человек инвестирует 1000 долларов и достигает годовой доходности +10%, −12%, +90%, −30% и +25%, что дает окончательное значение 1609 долларов. Средний процентный рост является геометрическим средним годовых коэффициентов роста (1,10, 0,88, 1,90, 0,70, 1,25), а именно 1,0998, годовой средний рост 9,98%. Среднее арифметическое этих годовых доходностей — 16,6% годовых — не является значимым средним, поскольку темпы роста не объединяются аддитивно.
Геометрическое среднее можно понять в терминах геометрии . Геометрическое среднее двух чисел и есть длина одной стороны квадрата , площадь которого равна площади прямоугольника со сторонами длиной и . Аналогично, геометрическое среднее трех чисел , , и есть длина одного ребра куба , объем которого такой же, как у прямоугольного параллелепипеда со сторонами, длины которых равны трем данным числам.
Среднее геометрическое является одним из трех классических средних значений Пифагора , вместе со средним арифметическим и средним гармоническим . Для всех положительных наборов данных, содержащих хотя бы одну пару неравных значений, среднее гармоническое всегда является наименьшим из трех средних, в то время как среднее арифметическое всегда является наибольшим из трех, а среднее геометрическое всегда находится между ними (см. Неравенство средних арифметических и геометрических .)
Среднее геометрическое набора данных определяется по формуле:
То есть, корень n- й степени из произведения элементов. Например, для произведение равно , а среднее геометрическое равно корню четвертой степени из 24, приблизительно 2,213.
Геометрическое среднее также можно выразить как экспоненту арифметического среднего логарифмов. [4] Используя логарифмические тождества для преобразования формулы, умножения можно выразить как сумму, а степень — как умножение:
Когда
с
Иногда это называют логарифмическим средним (не путать со средним логарифмическим ). Это просто арифметическое среднее логарифмически преобразованных значений (т. е. арифметическое среднее по логарифмической шкале), использующее возведение в степень для возврата к исходной шкале, т. е. это обобщенное f-среднее с . Логарифм с любым основанием может быть использован вместо натурального логарифма. Например, геометрическое среднее , , , и можно вычислить с помощью логарифмов по основанию 2:
В связи с вышесказанным можно заметить, что для данной выборки точек геометрическое среднее является минимизатором
тогда как среднее арифметическое является минимизатором
Таким образом, среднее геометрическое представляет собой сводку выборок, показатель степени которых наилучшим образом соответствует показателям степеней выборок (в смысле наименьших квадратов).
В компьютерных реализациях наивное умножение многих чисел может привести к арифметическому переполнению или потере значимости . Вычисление геометрического среднего с использованием логарифмов — один из способов избежать этой проблемы.
Геометрическое среднее набора данных меньше арифметического среднего набора данных, если только все элементы набора данных не равны, в этом случае геометрическое и арифметическое средние равны. Это позволяет определить арифметико -геометрическое среднее , пересечение двух, которое всегда лежит между ними.
Среднее геометрическое также является средним арифметико-гармоническим в том смысле, что если определены две последовательности ( ) и ( ):
и
где — гармоническое среднее предыдущих значений двух последовательностей, тогда и будут сходиться к геометрическому среднему и . Последовательности сходятся к общему пределу, и геометрическое среднее сохраняется:
Замена среднего арифметического и гармонического парой обобщенных средних значений противоположных конечных показателей даёт тот же результат.
Геометрическое среднее непустого набора данных положительных чисел всегда не больше их арифметического среднего. Равенство достигается только тогда, когда все числа в наборе данных равны; в противном случае геометрическое среднее меньше. Например, геометрическое среднее чисел 2 и 3 равно 2,45, в то время как их арифметическое среднее равно 2,5. В частности, это означает, что когда набор неидентичных чисел подвергается спреду, сохраняющему среднее , — то есть элементы набора «разносятся» дальше друг от друга, оставляя арифметическое среднее неизменным, — их геометрическое среднее уменьшается. [5]
Если — положительная непрерывная действительная функция, то ее геометрическое среднее на этом интервале равно
Например, взятие функции тождества по единичному интервалу показывает, что среднее геометрическое положительных чисел от 0 до 1 равно .
Среднее геометрическое больше подходит, чем среднее арифметическое , для описания пропорционального роста, как экспоненциального роста (постоянный пропорциональный рост), так и переменного роста; в бизнесе среднее геометрическое темпов роста известно как среднегодовой темп роста (CAGR). Среднее геометрическое темпа роста за периоды дает эквивалентный постоянный темп роста, который даст ту же окончательную сумму.
В качестве примера предположим, что апельсиновое дерево дает 100 апельсинов в один год, а затем 180, 210 и 300 в последующие годы, при темпах роста 80%, 16,7% и 42,9% соответственно. Использование среднего арифметического вычисляет (линейный) средний рост в 46,5% (рассчитанный по ). Однако, если применить его к начальному урожаю 100 апельсинов, годовой рост в 46,5% дает 314 апельсинов после трех лет роста, а не наблюдаемые 300. Линейное среднее завышает темп роста.
Вместо этого, используя геометрическое среднее, средний годовой прирост составляет приблизительно 44,2% (рассчитано по ). Начиная с урожая в 100 апельсинов с годовым ростом в 44,2%, получаем ожидаемый урожай в 300 апельсинов через три года.
Для определения средней скорости роста не обязательно брать произведение измеренных скоростей роста на каждом шаге. Пусть величина будет задана как последовательность , где — число шагов от начального до конечного состояния. Скорость роста между последовательными измерениями и равна . Тогда геометрическое среднее этих скоростей роста равно просто:
Основное свойство геометрического среднего, которое не выполняется для любого другого среднего, заключается в том, что для двух последовательностей одинаковой длины
Это делает геометрическое среднее единственным правильным средним значением при усреднении нормализованных результатов; то есть результатов, которые представлены как отношения к контрольным значениям. [6] Это имеет место при представлении производительности компьютера по отношению к контрольному компьютеру или при вычислении одного среднего индекса из нескольких разнородных источников (например, ожидаемая продолжительность жизни, годы обучения и детская смертность). В этом сценарии использование арифметического или гармонического среднего изменит рейтинг результатов в зависимости от того, что используется в качестве контрольного значения. Например, возьмем следующее сравнение времени выполнения компьютерных программ:
Таблица 1
Компьютер А | Компьютер Б | Компьютер С | |
---|---|---|---|
Программа 1 | 1 | 10 | 20 |
Программа 2 | 1000 | 100 | 20 |
Среднее арифметическое | 500,5 | 55 | 20 |
Геометрическое среднее | 31.622 . . . | 31.622 . . . | 20 |
Гармоническое среднее | 1.998 . . . | 18.182 . . . | 20 |
Арифметические и геометрические средние "согласны", что компьютер C самый быстрый. Однако, представив соответствующим образом нормализованные значения и используя среднее арифметическое, мы можем показать, что любой из двух других компьютеров самый быстрый. Нормализация по результату A дает A как самый быстрый компьютер согласно среднему арифметическому:
Таблица 2
Компьютер А | Компьютер Б | Компьютер С | |
---|---|---|---|
Программа 1 | 1 | 10 | 20 |
Программа 2 | 1 | 0.1 | 0,02 |
Среднее арифметическое | 1 | 5.05 | 10.01 |
Геометрическое среднее | 1 | 1 | 0,632 . . . |
Гармоническое среднее | 1 | 0,198 . . . | 0,039 . . . |
в то время как нормализация по результату B делает B самым быстрым компьютером согласно среднему арифметическому, но A самым быстрым согласно среднему гармоническому:
Таблица 3
Компьютер А | Компьютер Б | Компьютер С | |
---|---|---|---|
Программа 1 | 0.1 | 1 | 2 |
Программа 2 | 10 | 1 | 0.2 |
Среднее арифметическое | 5.05 | 1 | 1.1 |
Геометрическое среднее | 1 | 1 | 0,632 |
Гармоническое среднее | 0,198 . . . | 1 | 0,363 . . . |
и нормализация по результату C дает C как самый быстрый компьютер согласно среднему арифметическому, но A как самый быстрый согласно среднему гармоническому:
Таблица 4
Компьютер А | Компьютер Б | Компьютер С | |
---|---|---|---|
Программа 1 | 0,05 | 0,5 | 1 |
Программа 2 | 50 | 5 | 1 |
Среднее арифметическое | 25.025 | 2.75 | 1 |
Геометрическое среднее | 1.581 . . . | 1.581 . . . | 1 |
Гармоническое среднее | 0,099 . . . | 0,909 . . . | 1 |
Во всех случаях рейтинг, полученный с помощью геометрического среднего, остается таким же, как и рейтинг, полученный с помощью ненормализованных значений.
Однако это рассуждение было подвергнуто сомнению. [7] Предоставление согласованных результатов не всегда равнозначно предоставлению правильных результатов. В общем, более строго назначать веса каждой из программ, вычислять средневзвешенное время выполнения (используя среднее арифметическое), а затем нормализовать этот результат для одного из компьютеров. Три таблицы выше просто дают разный вес каждой из программ, объясняя непоследовательные результаты арифметических и гармонических средних (таблица 4 дает равный вес обеим программам, таблица 2 дает вес 1/1000 второй программе, а таблица 3 дает вес 1/100 второй программе и 1/10 первой). Использования геометрического среднего для агрегирования показателей производительности следует по возможности избегать, поскольку умножение времени выполнения не имеет физического смысла, в отличие от сложения времен, как в случае среднего арифметического. Метрики, которые обратно пропорциональны времени (ускорение, IPC ), следует усреднять с использованием среднего гармонического.
Геометрическое среднее может быть получено из обобщенного среднего как его предел, стремящийся к нулю. Аналогично это возможно для взвешенного геометрического среднего.
Геометрическое среднее время от времени использовалось для расчета финансовых индексов (усреднение производилось по компонентам индекса). Например, в прошлом индекс FT 30 использовал геометрическое среднее. [8] Оно также используется при расчете ИПЦ [9] и недавно введенной " RPIJ " мере инфляции в Соединенном Королевстве и в Европейском Союзе.
Это приводит к занижению изменений в индексе по сравнению с использованием среднего арифметического. [8]
Хотя геометрическое среднее сравнительно редко использовалось при расчете социальной статистики, начиная с 2010 года Индекс развития человеческого потенциала ООН перешел на этот режим расчета на том основании, что он лучше отражает незаменимый характер собираемых и сравниваемых статистических данных:
Не все значения, используемые для вычисления ИРЧП (индекса развития человеческого потенциала) , нормализованы; некоторые из них вместо этого имеют форму . Это делает выбор геометрического среднего менее очевидным, чем можно было бы ожидать из раздела «Свойства» выше.
Равномерно распределенный эквивалентный доход благосостояния, связанный с индексом Аткинсона с параметром неприятия неравенства 1,0, является просто геометрическим средним доходов. Для значений, отличных от единицы, эквивалентное значение представляет собой норму Lp, деленную на количество элементов, где p равно единице минус параметр неприятия неравенства.
В случае прямоугольного треугольника его высота — это длина линии, перпендикулярно проведенной от гипотенузы к его вершине 90°. Представив, что эта линия делит гипотенузу на два сегмента, среднее геометрическое длин этих сегментов — это длина высоты. Это свойство известно как теорема о среднем геометрическом .
В эллипсе малая полуось — это геометрическое среднее максимального и минимального расстояний эллипса от фокуса ; это также геометрическое среднее большой полуоси и полуширокой прямой . Большая полуось эллипса — это геометрическое среднее расстояния от центра до любого из фокусов и расстояния от центра до любой из директрис .
Другой способ представить это так:
Рассмотрим окружность с радиусом . Теперь возьмем две диаметрально противоположные точки на окружности и приложим давление с обоих концов, чтобы деформировать ее в эллипс с большой и малой полуосями длин и .
Поскольку площадь круга и эллипса остается неизменной, имеем:
Радиус окружности представляет собой среднее геометрическое большой и малой полуосей эллипса, образованного деформацией окружности.
Расстояние до горизонта сферы (без учета эффекта атмосферной рефракции при наличии атмосферы) равно среднему геометрическому расстоянию до ближайшей точки сферы и расстоянию до самой дальней точки сферы .
Геометрическое среднее используется как в приближении квадратуры круга С.А. Рамануджана [11] , так и в построении гептадекагона со «средними пропорциональными» [12] .
Геометрическое среднее использовалось при выборе компромиссного соотношения сторон в кино и видео: при наличии двух соотношений сторон их геометрическое среднее обеспечивает компромисс между ними, искажая или обрезая оба в некотором смысле одинаково. Конкретно, два прямоугольника равной площади (с одинаковым центром и параллельными сторонами) с разными соотношениями сторон пересекаются в прямоугольнике, соотношение сторон которого является геометрическим средним, а их оболочка (наименьший прямоугольник, содержащий их оба) также имеет соотношение сторон их геометрического среднего.
При выборе соотношения сторон 16:9 SMPTE , балансируя 2,35 и 4:3, геометрическое среднее равно , и таким образом ... было выбрано. Это было обнаружено эмпирическим путем Кернсом Пауэрсом, который вырезал прямоугольники с равными площадями и формировал их так, чтобы они соответствовали каждому из популярных соотношений сторон. При наложении с совмещением их центральных точек он обнаружил, что все эти прямоугольники с соотношением сторон помещаются во внешний прямоугольник с соотношением сторон 1,77:1, и все они также покрывают меньший общий внутренний прямоугольник с тем же соотношением сторон 1,77:1. [13] Значение, найденное Пауэрсом, является в точности геометрическим средним крайних соотношений сторон, 4:3 (1,33:1) и CinemaScope (2,35:1), что по совпадению близко к ( ). Промежуточные соотношения не оказывают никакого влияния на результат, только два крайних соотношения.
Применение того же метода среднего геометрического к 16:9 и 4:3 приблизительно дает соотношение сторон 14:9 ( ...), которое также используется в качестве компромисса между этими соотношениями. [14] В этом случае 14:9 является в точности средним арифметическим и , поскольку 14 является средним между 16 и 12, в то время как точное среднее геометрическое равно , но два разных средних , арифметическое и геометрическое, приблизительно равны, поскольку оба числа достаточно близки друг к другу (разница менее 2%).
Среднее геометрическое также используется для расчета форматов бумаги серий B и C. Формат имеет площадь, которая является средним геометрическим площадей и . Например, площадь бумаги формата B1 равна , поскольку она является средним геометрическим площадей бумаги формата A0 ( ) и A1 ( ) ( ) .
Тот же принцип применяется к серии C, площадь которой является средним геометрическим площадей серий A и B. Например, формат C4 имеет площадь, которая является средним геометрическим площадей A4 и B4.
Преимущество такого соотношения заключается в том, что лист формата А4 помещается в конверт формата С4, и оба они помещаются в конверт формата В4.