Среднее значение по каждому. Определение среднего значения, вариации и формы распределения. Описательные статистики

Признаки единиц статистических совокупностей различны по своему значению, например, заработная плата рабочих одной профессии какого-либо предприятия не одинакова за один и тот же период времени, различны цены на рынке на одинаковую продукцию, урожайность сельскохозяйственных культур в хозяйствах района и т.д. Поэтому, чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, рассчитывают средние величины.
Средняя величина это обобщающая характеристика множества индивидуальных значений некоторого количественного признака.

Совокупность, изучаемая по количественному признаку, состоит из индивидуальных значений; на них оказывают влияние, как общие причины, так и индивидуальные условия. В среднем значении отклонения, характерные для индивидуальных значений, погашаются. Средняя, являясь функцией множества индивидуальных значений, представляет одним значением всю совокупность и отражает то общее, что присуще всем ее единицам.

Средняя, рассчитываемая для совокупностей, состоящих из качественно однородных единиц, называется типической средней . Например, можно рассчитать среднемесячную заработную плату работника той или иной профессиональной группы (шахтера, врача библиотекаря). Разумеется, уровни месячной заработной платы шахтеров в силу различия их квалификации, стажа работы, отработанного за месяц времени и многих других факторов отличаются друг от друга, так и от уровня средней заработной платы. Однако в среднем уровне отражены основные факторы, которые влияют на уровень заработной платы, и взаимно погашаются различия, которые возникают вследствие индивидуальных особенностей работника. Средняя заработная плата отражает типичный уровень оплаты труда для данного вида работников. Получению типической средней должен предшествовать анализ того, насколько данная совокупность качественно однородна. Если совокупность состоит их отдельных частей, следует разбить ее на типические группы (средняя температура по больнице).

Средние величины, используемые в качестве характеристик для неоднородных совокупностей, называются системными средними . Например, средняя величина валового внутреннего продукта (ВВП) на душу населения, средняя величина потребления различных групп товаров на человека и другие подобные величины, представляющие обобщающие характеристики государства как единой экономической системы.

Средняя должна вычисляться для совокупностей, состоящих из достаточно большого числа единиц. Соблюдение этого условия необходимо для того, чтобы вошел в силу закон больших чисел, в результате действия которого случайные отклонения индивидуальных величин от общей тенденции взаимно погашаются.

Виды средних и способы их вычисления

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. Однако любая средняя величина должна вычисляться так, чтобы при замене ею каждой варианты осредняемого признака не изменился итоговый, обобщающий, или, как его принято называть, определяющий показатель , который связан с осредняемым показателем. Например, при замене фактических скоростей на отдельных отрезках пути их средней скоростью не должно измениться общее расстояние, пройденное транспортным средством за одно и тоже время; при замене фактических заработных плат отдельных работников предприятия средней заработной платой не должен измениться фонд заработной платы. Следовательно, в каждом конкретном случае в зависимости от характера имеющихся данных, существует только одно истинное среднее значение показателя, адекватное свойствам и сущности изучаемого социально-экономического явления.
Наиболее часто применяются средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.
Перечисленные средние относятся к классу степенных средних и объединяются общей формулой:
,
где – среднее значение исследуемого признака;
m – показатель степени средней;
– текущее значение (варианта) осредняемого признака;
n – число признаков.
В зависимости от значения показателя степени m различают следующие виды степенных средних:
при m = -1 – средняя гармоническая ;
при m = 0 – средняя геометрическая ;
при m = 1 – средняя арифметическая ;
при m = 2 – средняя квадратическая ;
при m = 3 – средняя кубическая .
При использовании одних и тех же исходных данных, чем больше показатель степени m в вышеприведенной формуле, тем больше значение средней величины:
.
Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется правилом мажорантности средних .
Каждая из отмеченных средних может приобретать две формы: простую и взвешенную .
Простая форма средней применяется, когда средняя вычисляется по первичным (несгруппированными) данным. Взвешенная форма – при расчете средней по вторичным (сгруппированным) данным.

Средняя арифметическая

Средняя арифметическая применяется, когда объем совокупности представляет собой сумму всех индивидуальных значений варьирующего признака. Следует отметить, что если вид средней величины не указывается, подразумевается средняя арифметическая. Ее логическая формула имеет вид:

Средняя арифметическая простая рассчитывается по несгруппированным данным по формуле:
или ,
где – отдельные значения признака;
j – порядковый номер единицы наблюдения, которая характеризуется значением ;
N – число единиц наблюдения (объем совокупности).
Пример. В лекции «Сводка и группировка статистических данных» рассматривались результаты наблюдения стажа работы бригады из 10 человек. Рассчитаем средний стаж работы рабочих бригады. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

По формуле средней арифметической простой вычисляются также средние в хронологическом ряду , если интервалы времени, за которое представлены значения признака, равны.
Пример. Объем реализованной продукции за первый квартал составил 47 ден. ед., за второй 54, за третий 65 и за четвертый 58 ден. ед. Среднеквартальный оборот составляет (47+54+65+58)/4 = 56 ден. ед.
Если в хронологическом ряду приведены моментные показатели, то при вычислении средней они заменяются полусуммами значений на начало и конец периода.
Если моментов больше двух и интервалы между ними равны, то средняя вычисляется по формуле средней хронологической

,
где n- число моментов времени
В случае, когда данные сгруппированы по значениям признака (т. е. построен дискретный вариационный ряд распределения) средняя арифметическая взвешенная рассчитывается с использовании либо частот , либо частостей наблюдения конкретных значений признака , число которых (k) значительно меньше числа наблюдений (N) .
,
,
где k – количество групп вариационного ряда,
i – номер группы вариационного ряда.
Поскольку , а , получаем формулы, используемые для практических расчетов:
и
Пример. Рассчитаем средний стаж рабочих бригад по сгруппированному ряду.
а) с использованием частот:

б) с использованием частостей:

В случае, когда данные сгруппированы по интервалам , т.е. представлены в виде интервальных рядов распределения, при расчете средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале. Расчет ведется по формулам:
и
где - середина интервала: ,
где и – нижняя и верхняя границы интервалов (при условии, что верхняя граница данного интервала совпадает с нижней границей следующего интервала).

Пример. Рассчитаем среднюю арифметическую интервального вариационного ряда, построенного по результатам исследования годовой заработной платы 30 рабочих (см. лекцию «Сводка и группировка статистических данных»).
Таблица 1 – Интервальный вариационный ряд распределения.

Интервалы, грн.

Частота, чел.

Частость,

Середина интервала,

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

грн. или грн.
Средние арифметические, вычисленные на основе исходных данных и интервальных вариационных рядов, могут не совпадать из-за неравномерности распределения значений признака внутри интервалов. В этом случае для более точного вычисления средней арифметической взвешенной следует использовать не средины интервалов, а средние арифметические простые, рассчитанные для каждой группы (групповые средние ). Средняя, вычисленная по групповым средним с использованием взвешенной формулы расчета, называется общей средней .
Средняя арифметическая обладает рядом свойств.
1. Сумма отклонений вариант от средней равна нулю:
.
2. Если все значения вариант увеличиваются или уменьшаются на величину А, то и средняя величина увеличивается или уменьшается на ту же величину А:

3. Если каждую варианту увеличить или уменьшить в В раз, то средняя величина также увеличится или уменьшатся в то же количество раз:
или
4. Сумма произведений вариант на частоты равна произведению средней величины на сумму частот:

5. Если все частоты разделить или умножить на какое-либо число, то средняя арифметическая не изменится:

6) если во всех интервалах частоты равны друг другу, то средняя арифметическая взвешенная равна простой средней арифметической:
,
где k – количество групп вариационного ряда.

Использование свойств средней позволяет упростить ее вычисление.
Допустим, что все варианты (х) сначала уменьшены на одно и то же число А, а затем уменьшены в В раз. Наибольшее упрощение достигается, когда в качестве А выбирается значение середины интервала, обладающего наибольшей частотой, а в качестве В – величина интервала (для рядов с одинаковыми интервалами). Величина А называется началом отсчета, поэтому этот метод вычисления средней называется спосо бом отсчета от условного нуля или способом моментов .
После такого преобразования получим новый вариационный ряд распределения, варианты которого равны . Их средняя арифметическая, называемая моментом первого порядка, выражаетсяформулой и согласно второго и третьего свойств средней арифметической равна средней из первоначальных вариант, уменьшенной сначала на А, а потом в В раз, т. е. .
Для получения действительной средней (средней первоначального ряда)нужно момент первого порядка умножить на В и прибавить А:

Расчет средней арифметической по способу моментов иллюстрируется данными табл. 2.
Таблица 2 – Распределение работников цеха предприятия по стажу работы


Стаж работников, лет

Количество работников

Середина интервала

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Находим момент первого порядка . Затем, зная, что А=17,5, а В=5, вычисляем средний стаж работы работников цеха:
лет

Средняя гармоническая
Как было показано выше, средняя арифметическая применяется для расчета среднего значения признака в тех случаях, когда известны его варианты x и их частоты f.
Если статистическая информация не содержит частот f по отдельным вариантам x совокупности, а представлена как их произведение , применяется формула средней гармонической взвешенной . Чтобы вычислить среднюю, обозначим , откуда . Подставив эти выражения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:
,
где - объем (вес) значений признака показателя в интервале с номером i (i=1,2, …, k).

Таким образом, средняя гармоническая применяется в тех случаях, когда суммированию подлежат не сами варианты, а обратные им величины: .
В тех случаях, когда вес каждой варианты равен единице, т.е. индивидуальные значения обратного признака встречаются по одному разу, применяется средняя гармоническая простая :
,
где – отдельные варианты обратного признака, встречающиеся по одному разу;
N – число вариант.
Если по двум частям совокупности численностью и имеются средние гармонические, то общая средняя по всей совокупности рассчитывается по формуле:

и называется взвешенной гармонической средней из групповых средних .

Пример. В ходе торгов на валютной бирже за первый час работы заключены три сделки. Данные о сумме продажи гривны и курсе гривны по отношению к доллару США приведены в табл. 3 (графы 2 и 3). Определить средний курс гривны по отношению к доллару США за первый час торгов.
Таблица 3 – Данные о ходе торгов на валютной бирже

Средний курс доллара определяется отношением суммы проданных в ходе всех сделок гривен к сумме приобретенных в результате этих же сделок долларов. Итоговая сумма продажи гривны известна из графы 2 таблицы, а количество купленных в каждой сделке долларов определяется делением суммы продажи гривны к ее курсу (графа 4). Всего в ходе трех сделок куплено 22 млн. дол. Значит, средний курс гривны за один доллар составил
.
Полученное значение является реальным, т.к. замена им фактических курсов гривны в сделках не изменит итоговой суммы продаж гривны, выступающей в качестве определяющего показателя : млн. грн.
Если бы для расчета была использована средняя арифметическая, т.е. гривны, то по обменному курсу на покупку 22 млн. дол. нужно было бы затратить 110,66 млн. грн., что не соответствует действительности.

Средняя геометрическая
Средняя геометрическая используется для анализа динамики явлений и позволяет определить средний коэффициент роста. При расчете средней геометрической индивидуальные значения признака представляют собой относительные показатели динамики, построенные в виде цепных величин, как отношения каждого уровня к предыдущему.
Средняя геометрическая простая рассчитывается по формуле:
,
где – знак произведения,
N – число осредняемых величин.
Пример. Количество зарегистрированных преступлений за 4 года возросло в 1,57 раза, в т. ч. за 1-й – в 1,08 раза, за 2-й – в 1,1 раза, за 3-й – в 1,18 и за 4-й – в 1,12 раза. Тогда среднегодовой темп роста количества преступлений составляет: , т.е. число зарегистрированных преступлений ежегодно росло в среднем на 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Для расчета средней квадратической взвешенной определяем и заносим в таблицу и . Тогда средняя величина отклонений длины изделий от заданной нормы равна:

Средняя арифметическая в данном случае была бы непригодна, т.к. в результате мы получили бы нулевое отклонение.
Применение средней квадратической будет рассмотрено далее в показателях вариации.

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности варьируют под влиянием множества факторов, среди которых могут быть, как основные, так и случайные. Сущность средней в том и заключается, что в ней взаимокомпенсируются отклонения значений признака, которые обусловлены действием случайных факторов, и накапливаются (учитываются) изменения, вызванные действием основных факторов. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Основные принципы применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности в стационарных условиях (когда влияющие факторы не меняются или меняются не значительно).

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

Расчет большинства конкретных статистических показателей основан на использовании:

· средней агрегатной;

· средней степенной (гармонической, геометрической, арифметической, квадратической, кубической);

· средней хронологической (см. раздел).

Все средние, за исключением средней агрегатной, могут рассчитываться в двух вариантах - как взвешенные или невзвешенные.

Средняя агрегатная. Используется формула:

где w i = x i * f i ;

x i - i-й вариант осредняемого признака;

f i , — вес i — го варианта.

Средняя степенная. В общем виде формула для расчета:

где степень k – вид средней степенной.

Значения средних рассчитанных на основании средних степенных для одних и тех же исходных данных — не одинаковы. С увеличением показателя степени k, увеличивается и соответствующая средняя величина:

Cредняя хронологическая. Для моментного динамического ряда с равными интервалами между датами, рассчитывается по формуле:

,

где х 1 и х n значение показателя на начальную и конечную дату.

Формулы расчета степенных средних

Пример. По данным табл. 2.1 требуется рассчитать среднюю заработную плату в целом по трем предприятиям.

Таблица 2.1

Заработная плата предприятий АО

Пред приятие

Численность промышленно- производственного персонала (ППП), чел.

Месячный фонд заработной платы, руб.

Средняя заработная плата, руб.

564840

2092

332750

2750

517540

2260

Итого

1415130

Конкретная расчетная формула зависит от того, какие данные табл. 7 являются исходными. Соответственно возможны варианты: данные столбцов 1 (численность ППП) и 2 (месячный ФОТ); либо — 1 (численность ППП) и 3 (средняя ЗП); или 2 (месячный ФОТ) и 3 (средняя ЗП).

Если имеются только данные столбцов 1 и 2 . Итоги этих граф содержат необходимые величины для расчета искомой средней. Используется формула средней агрегатной:

Если имеются только данные столбцов 1 и 3 , то известен знаменатель исходного соотношения, но не известен его числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на численность ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной :

Необходимо учитывать, что вес (f i ) в отдельных случаях может представлять собой произведение двух или даже трех значений.

Кроме того, в статистической практике находит применение и средняя арифметическая невзвешенная :

где n - объем совокупности.

Эта средняя используется тогда, когда веса (f i ) отсутствую (каждый вариант признака встречается только один раз) или равны между собой.

Если имеются только данные столбцов 2 и 3. , т. е. известен числитель исходного соотношения, но не известен его знаменатель. Численность ППП каждого предприятия можно получить делением ФОТ на среднюю ЗП. Тогда расчет средней ЗП в целом по трем предприятиям проводится по формуле средней гармонической взвешенной :

При равенстве весов (f i ) расчет среднего показателя может быть произведен по средней гармонической невзвешенной:

В нашем примере использовались разные формы средних, но получили один и тот же ответ. Это обусловлено тем, что для конкретных данных каждый раз реализовывалось одно и то же исходное соотношение средней.

Средние показатели могут рассчитываться по дискретным и интервальным вариационным рядам. При этом расчет производится по средней арифметической взвешенной. Для дискретного ряда данная формула используется так же, как и в приведенном выше примере. В интервальном же ряду для расчета определяются середины интервалов.

Пример. По данным табл. 2.2 определим величину среднедушевого денежного дохода за месяц в условном регионе.

Таблица 2.2

Исходные данные (вариационный ряд)

Среднедушевой денежный доход в среднем за месяц, х, руб. Численность населения, % к итогу/
До 400 30,2
400 — 600 24,4
600 — 800 16,7
800 — 1000 10,5
1000-1200 6,5
1200 — 1600 6,7
1600 — 2000 2,7
2000 и выше 2,3
Итого 100

Тема среднего арифметического и среднего геометрического входит в программу математики 6-7 классов. Так как параграф довольно прост для понимания, его быстро проходят, и к завершению учебного года школьники его забывают. Но знания в базовой статистике нужны для сдачи ЕГЭ, а также для международных экзаменов SAT. Да и для повседневной жизни развитое аналитическое мышление никогда не помешает.

Как вычислить среднее арифметическое и среднее геометрическое чисел

Допустим, имеется ряд чисел: 11, 4, и 3. Средним арифметическим называется сумма всех чисел, поделенная на количество данных чисел. То есть в случае чисел 11, 4, 3, ответ будет 6. Как образом получается 6?

Решение: (11 + 4 + 3) / 3 = 6

В знаменателе должно стоять число, равное количеству чисел, среднее которых нужно найти. Сумма делится на 3, так как слагаемых три.

Теперь надо разобраться со средним геометрическим. Допустим, есть ряд чисел: 4, 2 и 8.

Средним геометрическим чисел называется произведение всех данных чисел, находящееся под корнем со степенью, равной количеству данных чисел.То есть в случае чисел 4, 2 и 8 ответом будет 4. Вот каким образом это получилось:

Решение: ∛(4 × 2 × 8) = 4

В обоих вариантах получились целые ответы, так как для примера были взяты специальные числа. Так происходит отнюдь не всегда. В большинстве случаев ответ приходится округлять или оставлять под корнем. Например, для чисел 11, 7 и 20 среднее арифметическое ≈ 12,67, а среднее геометрическое - ∛1540. А для чисел 6 и 5 ответы, соответственно, будут 5,5 и √30.

Может ли так произойти, что среднее арифметическое станет равным среднему геометрическому?

Конечно, может. Но только в двух случаях. Если имеется ряд чисел, состоящий только либо из единиц, либо из нулей. Примечательно также то, что ответ не зависит от их количества.

Доказательство с единицами: (1 + 1 + 1) / 3 = 3 / 3 = 1 (среднее арифметическое).

∛(1 × 1 × 1) = ∛1 = 1(среднее геометрическое).

Доказательство с нулями: (0 + 0) / 2=0 (среднее арифметическое).

√(0 × 0) = 0 (среднее геометрическое).

Другого варианта нет и быть не может.

5.1. Понятие средней величины

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.
1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.
2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.
3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.
4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;
m – показатель степени средней;
f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:


Средний возраст рассчитаем по формуле простой средней:

Сгруппируем исходные данные. Получим следующий ряд распределения:

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:
средняя гармоническая, если m = -1;
средняя геометрическая, если m –> 0;
средняя арифметическая, если m = 1;
средняя квадратическая, если m = 2;
средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 4.4.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Таблица 5.1

Виды степенных средних

Вид степенной
средней
Показатель
степени (m)
Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая 0
Арифметическая 1
Квадратическая 2
Кубическая 3

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,..., i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×...×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда

5.3. Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;
h Me – его величина;
(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

В нашем примере могут быть получены даже три медианных значения – исходя из признаков количества предприятий, объема продукции и общей суммы затрат на производство:

Таким образом, у половины предприятий уровень себестоимость единицы продукции превышает 125,19 тыс. руб., половина всего объема продукции производится с уровнем затрат на изделие больше 124,79 тыс. руб. и 50 % общей суммы затрат образуется при уровне себестоимости одного изделия выше 125,07 тыс. руб. Заметим также, что наблюдается некоторая тенденция к росту себестоимости, так как Ме 2 = 124,79 тыс. руб., а средний уровень равен 123,15 тыс. руб.

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

где Х Mo – нижнее значение модального интервала;
m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
m Mo -1 – то же для интервала, предшествующего модальному;
m Mo+1 – то же для интервала, следующего за модальным;
h – величина интервала изменения признака в группах.

Для нашего примера можно рассчитать три модальных значения исходя из признаков числа предприятий, объема продукции и суммы затрат. Во всех трех случаях модальный интервал один и тот же, так как для одного и того же интервала оказываются наибольшими и число предприятий, и объем продукции, и общая сумма затрат на производство:

Таким образом, чаще всего встречаются предприятия с уровнем себестоимости 126,75 тыс. руб., чаще всего выпускается продукция с уровнем затрат 126,69 тыс. руб., и чаще всего затраты на производство объясняются уровнем себестоимости в 123,73 тыс. руб.

5.4. Показатели вариации

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

H=X max - X min .

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

.

Показатель s, равный , называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

,

где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

.

2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

.

3. Коэффициент вариации:

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

Боярский А.Я. Теоретические исследования по статистике: Сб. Науч. Трудов.– М.: Статистика,1974. С. 19–57.

Предыдущая

Метод средних величин

3.1 Сущность и значение средних величин в статистике. Виды средних величин

Средней величиной в статистике называется обобщенная характеристика качественно однородных явлений и процессов по какому-либо варьирующему признаку, которая показывает уровень признака, отнесенный к единице совокупности. Средняя величина абстрактна, т.к. характеризует значение признака у некоторой обезличенной единицы совокупности. Сущность средней величины состоит в том, что через единичное и случайное выявляется общее и необходимое, т. е. тенденция и закономерность в развитии массовых явлений. Признаки, которые обобщают в средних величинах, присущи всем единицам совокупности . Благодаря этому средняя величина имеет большое значение для выявления закономерностей, присущих массовым явлениям и не заметных в отдельных единицах совокупности

Общие принципы применения средних величин :

    необходим обоснованный выбор единицы совокупности, для которой рассчитывается средняя величина;

    при определении средней величины нужно исходить из качественного содержания осредняемого признака, учитывать взаимосвязь исследуемых признаков, а также имеющиеся для расчета данные;

    средние величины должны рассчитываться по качественно однородным совокупностям, которые получают методом группировок, предполагающим расчёт системы обобщающих показателей;

    общие средние должны подкрепляться групповыми средними.

В зависимости от характера первичных данных, области применения и способа расчета в статистике различают следующие основные виды средних :

1) степенные средние (средняя арифметическая, гармоническая, геометрическая, средняя квадратическая и кубическая);

2) структурные (непараметрические) средние (мода и медиана).

В статистике правильную характеристику изучаемой совокупности по варьирующему признаку в каждом отдельном случае дает только вполне определенный вид средней. Вопрос о том, какой вид средней необходимо применить в отдельном случае, разрешается путем конкретного анализа изучаемой совокупности, а также исходя из принципа осмысленности результатов при суммировании или при взвешивании. Эти и другие принципы в статистике выражаютсятеорией средних .

Например, средняя арифметическая и средняя гармоническая используются для характеристики среднего значения варьирующего признака у изучаемой совокупности. Средняя геометрическая применяется только при исчислении средних темпов динамики, а средняя квадратическая только при исчислении показателей вариации.

Формулы расчёта средних величин представлены в таблице 3.1.

Таблица 3.1 – Формулы расчёта средних величин

Виды средних величин

Формулы расчёта

простая

взвешенная

1. Средняя арифметическая

2. Средняя гармоническая

3. Средняя геометрическая

4. Средняя квадратическая

Обозначения: - величины, для которых исчисляется средняя; - средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений; - частота (повторяемость индивидуальных значений признака).

Очевидно, что различные средние выводятся из общей формулы степенной средней (3.1) :

, (3.1)

при k = + 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = +2 - средняя квадратическая.

Средние величины бывают простые и взвешенные. Взвешенными средними называются величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность; в связи с этим каждый вариант приходится умножать на эту численность. «Весами» при этом выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней .

В итоге правильный выбор средней величины предполагает такую последовательность:

а) установление обобщающего показателя совокупности;

б) определение для данного обобщающего показателя математического соотношения величин;

в) замена индивидуальных значений средними величинами;

г) расчет средней с помощью соответствующего уравнения.

3.2 Средняя арифметическая и её свойства и техника исчисления. Средняя гармоническая

Средняя арифметическая – самый распространенный вид средней величины; она исчисляется в тех случаях, когда объем усредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

Важнейшие свойства средней арифметической :

1. Произведение средней на сумму частот всегда равно сумме произведений вариант (отдельных значений) на частоты.

2. Если от каждой варианты отнять (прибавить) какое-либо произвольное число, то новая средняя уменьшится (увеличится) на то же число.

3. Если каждую варианту умножить (разделить) на какое-то произвольное число, то новая средняя увеличится (уменьшится) во столько же раз

4. Если все частоты (веса) разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится.

5. Сумма отклонений отдельных вариантов от средней арифметической всегда равняется нулю.

Можно из всех значений признака вычесть произвольную постоянную величину (лучше значение серединной варианты или варианты с наибольшей частотой), полученные разности сократить на общий множитель (лучше на величину интервала), а частоты выразить частностями (в процентах) и исчисленную среднюю умножить на общий множитель и прибавить произвольную постоянную величину. Этот способ расчета средней арифметической называется способом расчета от условного нуля .

Средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000).

Средняя квадратическая применяется для измерения вариации признака в совокупности (расчета среднего квадратического отклонения).

В статистике действует правило мажорантности средних:

Х гарм. < Х геом. < Х арифм. < Х квадр. < Х куб.

3.3 Структурные средние величины (мода и медиана)

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду

Мода - наиболее типичное, чаще всего встречаемое значение признака. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Чтобы найти конкретное значение моды интервального ряда, необходимо использовать формулу (3.2)

(3.2)

где Х Мо - нижняя граница модального интервала; i Мо - величина модального интервала; f Мо - частота модального интервала; f Мо-1 - частота интервала, предшествующего модальному; f Мо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

Медиана - значение варьирующего признака, приходящееся на середину ранжированной совокупности. Дляранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 6, 7, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. четвёртая величина - 6. Дляранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10)/2= 8,5.

Т. о., для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формулам (3.3):

(если частот нет)

N Me =
(если частоты есть) (3.3)

где n - число единиц в совокупности.

Численное значение медианы интервального ряда определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.

Численное значение медианы обычно определяют по формуле (3.4)

(3.4)

где x Ме - нижняя граница медианного интервала; iМе - величина интервала; SМе -1 - накопленная частота интервала, которая предшествует медианному; fМе - частота медианного интервала.

Внутри найденного интервала расчет медианы производится также по формуле Ме = xl е, где второй множитель в правой части равенства показывает расположение медианы внутри медианного интервала, а х - длина этого интервала. Медиана делит вариационный ряд пополам по частотам. Определяют ещеквартили , которые делят вариационный ряд на 4 равновеликие по вероятности части, идецили , делящие ряд на 10 равновеликих частей.