Среднее арифметическое - Arithmetic mean

В математике и статистике , то среднее арифметическое ( / ˌ æ г ɪ & thetas ; м ɛ т ɪ к м я п / , напряжение на первом и третьем слогах «арифметика»), или просто среднее или среднее (когда контекст ясно), представляет собой сумму набора чисел, деленную на количество чисел в коллекции. Коллекция часто представляет собой набор результатов эксперимента или наблюдательного исследования , или часто набор результатов опроса . Термин «среднее арифметическое» является предпочтительным в некоторых контекстах в области математики и статистики, поскольку она помогает отличить его от других средств , таких , как среднее геометрическое и гармоническое среднее .

Помимо математики и статистики, среднее арифметическое часто используется во многих различных областях, таких как экономика , антропология и история , и в той или иной степени оно используется почти во всех академических областях. Например, доход на душу населения - это средний арифметический доход населения страны.

Хотя среднее арифметическое часто используется для определения основных тенденций , это не надежная статистика , а это означает, что на нее сильно влияют выбросы (значения, которые намного больше или меньше, чем большинство значений). Для асимметричных распределений , таких как распределение доходов, при котором доходы нескольких людей значительно превышают доходы большинства людей, среднее арифметическое может не совпадать с понятием «среднего», а надежная статистика, такая как медиана , может дать лучшее описание. центральной тенденции.

Определение

Учитывая набор данных , то среднее арифметическое (или среднее или среднее ), обозначаемый (чтение бар ), представляет собой среднее из значений .

Среднее арифметическое - это наиболее часто используемый и понятный показатель центральной тенденции в наборе данных. В статистике термин « среднее» относится к любому из показателей центральной тенденции. Среднее арифметическое для набора наблюдаемых данных определяется как сумма числовых значений каждого и каждого наблюдения, деленная на общее количество наблюдений. Символически, если у нас есть набор данных, состоящий из значений , то среднее арифметическое определяется формулой:

(объяснение оператора суммирования см . в разделе « Суммирование» .)

Например, рассмотрим ежемесячную зарплату 10 сотрудников фирмы: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Среднее арифметическое:

Если набор данных является статистической совокупностью (т. Е. Состоит из всех возможных наблюдений, а не только их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), то мы называем статистику, полученную в результате этого вычисления, выборочным средним (которое для набора данных обозначается как ).

Среднее арифметическое может быть аналогично определено для векторов в многомерности, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (сумма коэффициентов равна 1), его можно определить в выпуклом пространстве , а не только в векторном пространстве.

Мотивирующие свойства

Среднее арифметическое имеет несколько свойств, которые делают его полезным, особенно в качестве меры центральной тенденции. Это включает:

  • Если числа имеют среднее значение , то . Поскольку это расстояние от данного числа до среднего, один из способов интерпретировать это свойство - сказать, что числа слева от среднего уравновешиваются числами справа от среднего. Среднее значение - это единственное число, для которого сумма остатков (отклонений от оценки) равна нулю.
  • Если требуется использовать одно число в качестве "типичного" значения для набора известных чисел , то лучше всего это делает среднее арифметическое чисел в смысле минимизации суммы квадратов отклонений от типичного значения: суммы оф . (Отсюда следует, что выборочное среднее также является лучшим единичным предиктором в том смысле, что имеет наименьшую среднеквадратическую ошибку .) Если требуется среднее арифметическое совокупности чисел, то несмещенная оценка его является средним арифметическим. выборки, взятой из населения.

Контраст с медианой

Среднее арифметическое может быть сопоставлено с медианой . Медиана определяется таким образом, что не более половины значений больше и не более половины меньше медианы. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных . Среднее значение равно медиане. Однако, когда мы рассматриваем выборку, которая не может быть организована так, чтобы увеличиваться арифметически, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое составляет 6,2, а медиана - 4. В общем, среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства из них.

У этого явления есть приложения во многих областях. Например, с 1980-х годов средний доход в США увеличивался медленнее, чем среднее арифметическое дохода.

Обобщения

Средневзвешенное

Средневзвешенное или средневзвешенное значение - это среднее значение, при котором одни точки данных имеют больший вес, чем другие, поскольку им придается больший вес в расчетах. Например, среднее арифметическое и есть , или эквивалентно . Напротив, средневзвешенное значение, при котором первое число получает, например, вдвое больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в генеральной совокупности, из которой были взяты эти числа), будет рассчитываться как . Здесь веса, которые обязательно составляют единицу, равны и , причем первые в два раза больше, чем последние. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай средневзвешенного значения, в котором все веса равны друг другу (равны в приведенном выше примере и равны в ситуации с усреднением чисел).

Непрерывные распределения вероятностей

Сравнение двух лог-нормальных распределений с равными медианы , но разные перекос , в результате различных средств и способов

Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений может быть описана путем интегрирования непрерывное распределение вероятностей по всей этой области, даже если наивная вероятность для образца числа принимает одно определенное значение из бесконечного числа равно нуль. Аналог средневзвешенного значения в этом контексте, в котором существует бесконечное количество возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее распространенное распределение вероятностей называется нормальным распределением ; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но также вышеупомянутую медиану и моду (три M), равны друг другу. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения .

Углы

Особую осторожность следует проявлять при использовании циклических данных, таких как фазы или углы . Наивное взятие среднего арифметического 1 ° и 359 ° дает результат 180 °. Это неверно по двум причинам:

  • Во-первых, угловые измерения определяются только до аддитивной постоянной 360 ° (или 2π, если измерения в радианах ). Таким образом, можно было бы легко назвать эти 1 ° и -1 ° или 361 ° и 719 °, поскольку каждый из них дает различное среднее значение.
  • Во-вторых, в этой ситуации 0 ° (эквивалентно 360 °) является геометрически лучшим средним значением: здесь меньшая дисперсия (точки находятся на расстоянии 1 ° от него и 179 ° от 180 °, предполагаемого среднего).

В общем случае такая оплошность приведет к искусственному смещению среднего значения к середине числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации ( а именно , определить среднее значение как центральную точку: точку, относительно которой имеет наименьшую дисперсию), и переопределить разницу как модульное расстояние (то есть расстояние на окружности : поэтому модульное расстояние между 1 ° и 359 ° составляет 2 °, а не 358 °).

Доказательство без слов в неравенство арифметических и средних геометрических :
PR - представляет собой диаметр окружности с центром на О; его радиус АО является средним арифметическим из и б . Используя теорему о среднем геометрическом , высота GQ треугольника PGR является средним геометрическим . Для любого коэффициента а : Ь , АО ≥ GQ.

Символы и кодировка

Среднее арифметическое часто обозначается чертой (так называемая винкулум или макрон ), например, как ( полоса чтения ).

Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может неправильно отображать символ x. Например, символ x̄ в HTML на самом деле представляет собой комбинацию двух кодов - базовой буквы x и кода для вышеприведенной строки (& # 772; или ¯).

В некоторых текстах, таких как PDF -файлы, символ x может быть заменен символом цента (¢) ( Unicode & # 162) при копировании в текстовый процессор, такой как Microsoft Word .

Смотрите также

Геометрическое доказательство без слов , что макс  ( , б ) > корень средний квадрат ( RMS ) или квадратичное среднее ( QM ) > среднее арифметическое ( АМ ) > геометрическое среднее ( ГМ ) > гармоническое среднее ( НМ ) > мин  ( , б ) из два положительных числа a и b

использованная литература

дальнейшее чтение

внешние ссылки