Вторичная группировка. Формула Стерджесса. Группировка статистических данных

Распределение совокупности на группы, однородные в том или ином отношении, связано с такими действиями, как систематиза­ция, типология, классификация, группировка. Традиционно такое распределение выполняют по следующей схеме: из множества признаков, описывающих явление, выбирают группировочные, а затем совокупность делят на группы и подгруппы в соответствии со значениями этих признаков.

В каждом конкретном исследовании решаются три вопроса:

1) что взять за основу группировки;

2) сколько групп, позиций необходимо выделить;

3) как разделить группы.

Основой группировки может быть любой атрибутивный или ко­личественный признак, имеющий градации.

Промежуток изменений (область существования) признака статистической совокупности

(R=хmах - xmin)

принято называть размахом вариации. Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN

где К - число групп (интервалов); N - объем статистической со­вокупности.

Формула Стерджесса пригодна при условии, что рас­пределение единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления (процесса).

Интервалы представляют собой каркас группировки. На прак­тике их образовывают, придерживаясь трех формальных при­нципов: равности интервалов, кратности интервалов, равности частот. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы могут быть равные и неравные . Неравные интер­валы используются, если диапазон вариации признака слишком широкий и распределение значений неравномерно. Формируются они на основе принципа кратности, когда ширина каждого последу­ющего интервала в к раз больше (меньше) предыдущего. Равные интервалы целесообразно применять в тех случаях, когда вариа­ция проявляется в сравнительно узких границах и распределение является практически равномерным. Для группировок с равными интервалами величина интервала

Сравнимость статистических группировок. Вторичная группировка

Иногда возникает необходимость проведения вторичных группировок - образования новых групп на основе ранее осу­ществленной группировки. Такая необходимость может возник­нуть, если имеющиеся группировки не удовлетворяют требова­ниям проводимого анализа (несопоставимы из-за разного числа выделенных групп или неодинаковых границ интервалов). Полу­чение новых групп на основе имеющихся возможно двумя спосо­бами перегруппировки: объединением первоначальных интерва­лов (путем их укрупнения) и долевой перегруппировки (на основе закрепления за каждой группой определенной доли единиц сово­купности).

Пример:

Таблица 2 – Распределение сотрудников предприятия ив уровню дохода

Произведем перегруппировку данных, образовав новые труппы с интервалами до5, 5-10,10-20,20-30, свыше 30 тыс. руб. В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть надо взять от числа работников, т.е. . В первой группе число работающих: 16+3=20 человек. Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3=17-чел. Во вновь образованную третью группу войдут все со­трудники третьей группы и часть сотрудников, четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо, взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6)=12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12= 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел. В результате получим следующие новые группы:

Таблица 3 – Новая группировка

4 Закрепление знаний _______

1 В чем заключается процесс группировки

2 Перечислите и охарактеризуйте основные виды группировок

3 Интервал. Виды и формула

4 Формула Стерджесса

5 Перегруппировка

5 Выдача домашнего задания ______

Повторить пройденный материал

Подведение итогов занятия


План занятия №(7) 4

по учебной дисциплине «Статистика»

Группа Дата
Э2-1
Зм2-5

Тема занятия Проведение сводки статистических данных. Группировка и перегруппировка данных

Метод группировок.

Тип занятия урок совершенствования знаний

Вид занятия урок-практическая работа №1

Дидактические цели

Образовательные

знают понятие группировки, виды, цели и задачи, порядок проведения группировки, умеют проводить группировку, перегруппировку статистических данных

Развивающие

классифицируют различные виды группировок, формулируют выводы по результатам проведенной группировки

Воспитывающие

содействуют формированию профессиональной культуры.

Межпредметные связи:

Обеспечивающие дисциплины: АФХД

Обеспечиваемые дисциплины: математика

Методы обучения: практического обучения

Методическое обеспечение занятия: раздаточный материал

Литература:

1 Н.В. Толстик Статистика

2 Е.М. Ефимова Статистика

ХОД УЧЕБНОГО ЗАНЯТИЯ

Организационный момент

Работа с журналом, рапортичкой, проверка готовности группы к уроку

Изучение нового материала

1 Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называютсягруппировочными признаками.

Классификация группировок:

Структурная группировка характеризует состав однород­ной совокупности по определенным признакам. Например, состав населения региона по месту проживания, по размеру среднедушевого дохода, группировка хозяйств по объему выпущенной продук­ции, структура депозитов по срокам их привлечения.

Типологическая группировка - это распределение качес­твенно неоднородных совокупностей на классы, социально-эко­номические типы, однородные группы. Примером может служить группировка сек­торов экономики, хозяйствующих субъектов по формам собственности: государственная, федеральная, муниципальная, частная, смешанная.

Аналитические группировки предназначены для выявления зависимости между признаками.

Основой группировки может быть любой атрибутивный или ко­личественный признак.

Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой. Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN (1)

где К - число групп (интервалов);

N - объем статистической со­вокупности.

Интервалы представляют собой каркас группировки. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы групп могут быть закрытыми (когда указана ниж­няя и верхняя границы) и открытыми (когда указана только одна граница - верхняя или нижняя).

где х min , max – минимальное и максимальное значение признака

n – число групп

h – щаг интервала

Задача 1

Произведите группировку 30 магазинов одного из регионов РФ на 1.01.05, применяя метод группировок.

Таблица 1 – Исходные данные

Среднесписочная численность, чел. Товарооборот, млн. руб.

Решение :

Вкачестве группировочного признака выбираем товарооборот.

Теперь необходимо образовать 4 группы с равными интервалами. Величина интервала определяется по формуле:

где h - шаг интервала

n - число групп

Обозначим границы групп:

2100-7350 – 1-ая группа (2100+5250)

7350-12600 – 2-я группа (7350+5250)

12600-17850 – 3-ая группа (17850+5250)

17850-23100 – 4-ая группа (17850+5250)

После того, как определено число групп и группировочный признак, необходимо определить показатели, которые характеризуют группы и их величины. Показатели разноситься по группам и подсчитываются итоги.

Таблица 2 – Группировка магазинов по величине товарооборота

Таблица 3 – Группировка магазинов по величине товарооборота (% к итогу)

Вывод : из таблицы 3 видно, что преобладает группа с товарооборотом в интервале 2100-7350 – 60%.

Провести группировку коммерческих банков одного из регионов РФ на 1.01.06

Таблица 4 – Исходные данные

Номер банка Капитал Рабочие активы Уставный капитал
207,7 2,48 1,14
200,3 2,40 1,10
190,2 2,28 1,05
323,0 3,88 1,88
247,1 2,96 1,36
177,7 2,12 0,97
242,5 2,90 1,33
182,9 2,18 0,99
315,6 3,78 1,73
183,2 2,20 1,01
320,2 3,84 1,76
207,3 2,48 1,14
181,0 2,17 0,99
172,4 2,06 0,94
234,3 2,81 1,29
189,5 2,27 1,04
187,7 2,24 1,03
166,9 1,99 0,91
157,7 1,88 0,86
168,3 2,02 0,93
224,4 2,69 1,23
166,5 1,99 0,91
198,5 2,38 1,09
240,4 2,88 1,32
229,3 2,75 1,26
175,2 2,10 0,96
156,8 1,87 0,86
160,1 1,92 0,88
178,7 2,14 0,98
171,6 2,05 0,94

Решение:

В качестве группировочного признака возьмем капитал банка.

Образуем четыре группы банков с разными интервалами. Величину интервала определяем по формуле:

где h - шаг интервала

х max , x min – минимальное и максимальное значение группировочного признака

n - число групп

Теперь обозначим границы групп:

1 – я группа 156,0-197,8
2 – я группа 1297,8-239,6
3 – я группа 239,6-281,4
4 – я группа 281,4-323,2

После того, как определен группировочный признак – капитал, шаг интервала и образованы группы, мы определим показатели, которые характеризуют группы и их величины по каждой группе.

Таблица 5 –– Группировка коммерческих банков по величине капитала

Группы банков по величине капитала Число банков Капитал Активы Работающие активы
156,0-197,8 2699,5 35,48 16,25
197,8-239,6 1501,8 17,99 8,25
239,6-281,4 730,0 8,74 4,01
281,4-323,2 958,8 11,5 5,37
Итого 6157,1 73,71 33,88

Структурная группировка коммерческих банков будет иметь вид:

Таблица 6 – Группировка коммерческих банков по величине каритала (% к итогу)

Группы банков по величине капитала Число банков, % к итогу Капитал,% к итогу Активы, % к итогу Работающие активы, % к итогу
156,0-197,8 56,7 48,2 48,1 48,0
197,8-239,6 23,3 24,4 24,4 24,3
239,6-281,4 10,0 11,9 11,9 11,8
281,4-323,2 10,0 15,5 15,6 15,9
Итого

Вывод:

Из таблицы 6 видно, что в основном преобладают мелкие банки – 56,7 %, на их долю приходится 48,2% капитала. Крупные и средние банки занимают по 10%, доля их капитала составила 15,5 и 11,9 % соответственно.

Закрепление знаний

1 В чем состоит значение метода группировок в анализе статистических данных?

2 Что представляет собой группировка?

3 Виды группировок

4 Охарактеризуйте каждый вид группировки

5 Понятие интервала

6 Виды интервалов

7 Формула интервала

4 Выдача домашнего задания

Записать в тетрадь примеры количественных и качественных признаков, которые могут быть положены в основание группировки для предприятия (3-5 примеров)

Доделать практическую работу

Аналитическая группировка

Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результативный признак.

Факторные – это те признаки, которые оказывают влияние на другие связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных.

Аналитические группировки позволяют изучить многообразие связей и зависимостей между варьирующими признаками. Чтобы исследовать взаимосвязь между признаками, производится группировка единиц совокупности по факторному признаку. В каждой группе вычисляется среднее значение результативного признака. Изменение признака от группы к группе под влиянием факторного будет говорить о наличии или отсутствии связи между факторами.


Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа групп или неодинаковости границ интервалов. Для того, чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам и когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.

Рассмотрим первый способ проведения вторичной группировки.

Пример1 Пусть даны две группировки кредитов по сроку выдачи за ноябрь и декабрь (таблица 3.1, таблица 3.2).

Таблица 3.1руппировка кредитов коммерческих банков по сроку выдачи, ноябрь 2011 г. (данные условные)



Таблица 3.2 – Группировка кредитов коммерческих банков по сроку выдачи, декабрь 2011г. (данные условные)

Для удобства сравнения группировки ноябрьских и декабрьских кредитов произведем вторичную группировку ноябрьских кредитов, приняв за основу группировку декабрьских кредитов. Составим таблицу 3.3.

Таблица 3.3 – Группировка кредитов коммерческих банков по сроку выдачи, ноябрь-декабрь 2011 г. (данные условные)

Теперь можно сравнить группировки ноябрьских и декабрьских кредитов. Доля заключенных договоров по краткосрочным кредитам снизилась почти на 11 процентных пунктов, доля среднесрочных кредитов осталась без изменения, а количество долгосрочных кредитов в анализируемом периоде значительно выросло. Несмотря на эти изменения, в декабре так же, как и в ноябре, в структуре суммы выданных кредитов преобладающую долю занимали краткосрочные кредиты, затем следовали среднесрочные, а на последнем месте – долгосрочные кредиты. Для решения данного примера использовали метод объединения первоначальных интервалов.

Пример2 Имеются данные о структуре колхозов по числу дворов. Исходные данные не позволяют произвести сравнительный анализ структуры, так как в разных районах имеется разное число групп.

Структура колхозов по числу дворов

1 район 2 район
№ группы Уд. вес колхозов, % № группы Группы колхозов по числу дворов Уд. вес колхозов, %
До 100 4,3 До 50 1,0
100-200 18,3 50-70 1,0
200-300 19,5 70-100 2,0
300-500 28,2 100-150 10,0
свыше 500 29,7 150-250 18,0
250-400 21,0
400-500 23,0
свыше 500 24,0
ИТОГО 100,0 100,0

Проведем вторичную группировку колхозов второго района, приняв за основу группировку первого района, используя метод долевой перегруппировки (таблица 3.5).Таблица 3.5 – Вторичная группировка

Поясним расчеты. В первую, вновь образованную группу колхозов второго района с числом дворов до 100 войдут первые три группы колхозов, удельный вес которых равен 4% (1+1+2).Теперь надо образовать вторую группу колхозов с числом дворов от 100 до 200. В нее входит четвертая группа колхозов с числом дворов от 100 до 150, составляющая 10% общего числа колхозов, а также часть пятой группы, из которой должны перейти 50 дворов. Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно принимается, что оно должно быть пропорционально удельному весу отобранных дворов. Удельный вес 50 дворов в пятой группе равен: , или 50%.

Следовательно, в новую группу надо взять половину колхозов из пятой группы: .

Таким образом, удельный вес колхозов новой группы с числом дворов 100–200 составит 19% (10+9).

При формировании группы колхозов с числом дворов 200 – 300 видно, что в нее войдет часть пятой группы с удельным весом колхозов 9% и часть шестой группы, из которой надо добавить в третью группу 50 дворов, пропорционально которым должно быть отобрано из этой группы 7% колхозов: .Тогда группа колхозов с числом дворов 200–300 составит 16% (9+7).

Аналогично производится расчет при образовании других групп. Если наряду с удельными весами имеются абсолютные значения показателей по группам, то все расчеты показателей по вновь образованным группам ведутся в тех же соотношениях, что и численность распределения единиц. Таким образом, сравнивая оба района по числу дворов в колхозах, видно, что во втором районе оно было более дифференцировано, чем в первом районе.

Наряду с первичным группировкой в??статистике находит широкое применение вторичное группировки. Вторичным группировкой называют образование новых групп на основе ранее проведенного группировки

Вторичное группировки используют для решения различных задач, важнейшими из которых являются: 1) образование на основе группам по количественным признакам качественно однородных групп (типов) 2) приведение двух (а или более) группам с различными интервалами к единому виду с целью сопоставимости и анализа, 3) образование более укрупненных групп, в которых яснее проявляется характер распределение.

Суть этого приема заключается в получении сопоставимых данных по различным группировках, для чего: численный состав группы (по проценту) фиксируется на одном уровне во всех группировках; по всем группировках уста овлюеться также равное число групп и одинаковое содержание групповых таблиц. Сравнению и сопоставлению подлежат не абсолютные показатели по группам, а относительные величины, процентное отношениея.

Различают два способа вторичного группировки: 1) путем преобразования интервалов первичного группировки (чаще простым укрупнением интервалов) и 2) путем закрепления за каждой группой определенной части единиц совокупности (частичное перегруппировки). При использовании этих способов вторичного группировки обычно предполагают, что распределение признака внутри интервалов будет равномернымм.

Применение вторичного группировки для приведения двух группам с различными интервалами к единому виду в целях сопоставимости проиллюстрируем на следующем примере. Для этого используем данные первичного декабря упування двух районов по численности работников животноводства (табл. 37.7).

. Таблица 37. Группировка хозяйств двух районов по численности работников животноводства

Район I

Район II

группы хозяйств по

группы хозяйств по

численности работников, чел

итоге

численности работников, чел

итоге

Непосредственно данные группам двух районов несопоставимы, так как хозяйства распределены по группам с различными интервалами: 20 чел в районе I и 30 чел в районе II. Число выделенных групп также неодинаковое

Для приведения двух группам в сопоставимый вид проведем вторичное группировки. С этой целью перегруппируют материалы в группы, единые для обоих районов: возьмем интервал 40 чел (табл. 38)

Поскольку есть возможность вторичное группировки хозяйств района I осуществить способом простого укрупнения интервалов (имеет место совпадение нижних и верхних интервалов в двух группировках), используем этот спос и б для решения поставленной задачи.

Поясним последовательность расчетов. В первую группу хозяйств с численностью работников до 160 чел войдут хозяйства I и II групп

. Таблица 38. Вторичное группировки хозяйств двух районов по численности работников животноводства

Удельный вес хозяйств этих групп в общем итоге составит 16% (12 апреля). Во вторую группу хозяйств с численностью работников от 160 до 200 чел войдут хозяйства III и IV групп их удельный вес га в общей сложности составит 45% (18 27). Аналогично выполняются расчеты при образовании остальных декабрягруп.

перегруппируют хозяйства района II. Поскольку укрупнение интервалов для хозяйств района II не подходит и задачи не решает используем способ частичного перегруппировки данных первичного группировками ня.

В первую, заново созданную группу хозяйств района II с численностью работников животноводства до 160 чел, полностью войдут хозяйства первичного группировки с таким же интервалом. Удельный вес хозяйств ств этой группы составляет 88%.

Во вторую группу хозяйств вторичного группировки с численностью работников от 160 до 200 чел полностью войдут хозяйства II группы (16%) и часть хозяйств III группы. Для определения части господ дарств, которую нужно взять с III группы, необходимо ее расчленить на подгруппы с численностью работников 190 - 200, 200 - 210, 210 - 220 чел. Показатели удельного веса хозяйств в этих подгруппах определяются я пропорционально делению величины интервала. Величина интервала, которую мы рассматриваем, составляет 30 чел и делится на три равные части. Для получения нужного интервала 160 - 200 чел до величины интервала II группы (160 - 190 чел) следует добавить одну треть величины интервала III группы (190 - 220 чел) и такую??же часть хозяйств этой группыієї групи.

Итак, во вторую, заново созданную группу хозяйств, войдут 16% хозяйств второй группы и одна треть III группы - 10% (1/3-30), что составит 26% от общей численности хозяйств района II

В III группу хозяйств вторичного группировки (200 - 240 чел) войдет часть хозяйств III группы (190 - 220 чел), оставшуюся - 20% (% -30) и две трети хозяйств IV группы (220 - 250 чел) - % (% -21), то есть 34% всей численности хозяйств района I II.

Аналогичные расчеты выполняются и при образовании остальных, заново созданных групп хозяйств: 240 - 280 и более 280 чел. Как бы в табл 37 наряду с данными об удельном весе хозяйств по группам были приведены и данные об их численности, то расчеты по заново созданных группах выполнялись бы в тех же соотношениях, что и по удельному весу хоств.

После вторичного группировки первичный материал становится сравнимым, поскольку для двух районов взяты одинаковые группы по численности работников. Из данных табл 38 видно, что распределение хозяйств по численности ю работников животноводства в двух районах существенно отличается: в районе I преобладают хозяйства с численностью работников животноводства до 200 чел (61% общей численности хозяйств), в районе II - хозяйства с численностью работников животноводства - более 200 чел (66% общей численности хозяйстврств).

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

    По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка .Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.

    По способу разработки сводки делятся нацентрализованные , когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). Придецентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).

    По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация . Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

    В основу кладется качественный признак.

    Они стандартны.

    Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

    Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные , не имеющие количественного выражения (профессия, образование);

количественные : 1)дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2)непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные , которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lgN,

где N-количество элементов совокупности.

Согласно этой формуле, выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (). Он рассчитывается

где - среднее значение признака по совокупности, которое определяется по формуле;

    Е значение варьирующего признака;

    среднее квадратическое отклонение.

Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Хмах - Хmin

h= ---------------- ;

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. (0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min= 80, п= 5.

h= (Хмах - Хmin) / п;

h= (180 - 80) / 5 = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые , когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

    180 и более - исключительно - 180 входит в последний

    свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

    Суммируем верхнюю и нижнюю границу интервала и делим на 2.

    Середина 2-го интервала плюс величина интервала.

    Середина 2-го интервала минус величина интервала (для открытого).

    К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

    Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Еслиатрибутивный признак , то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основеколичественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Группировка по формам собственности в 1998 г.

    Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов.

Группировка населения России по месту проживания

за 1959-1994 гг.

    Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

50000 и более

    Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

    Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.

    Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Например, дискретный ряд.

Количество студентов

В % к итогу

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве . Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения , т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250-450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называетсясложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

    Четкость заголовков.

    Указываются единицы измерения в отдельных графах.

    Повторяющиеся термины выносятся в общие заголовки.

    Графы и строки необходимо нумеровать.

    В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.

    Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.

    В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.

    Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.

    При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.

    Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...» - отсутствуют сведения;

в) «-» - отсутствует само явление;

г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

    Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.

    Графический образ - это символические знаки, с помощью которых изображаются статистические данные.

    Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

    Экспликация графика - это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

  • Суть и виды статистических группировок.
  • Выполнение группировки по количественному признаку.
  • Ряды распределения, их виды и графическое изображение.

Суть и виды статистических группировок

В результате первой стадии статистических исследований (статистического наблюдения) получают статистическую информацию , представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование и др.).

Дальнейшая задача статистики заключается в этом, чтобы привести эти материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей совокупности фактов для того, чтобы изучить характерные черты и отличительные особенности изучаемого явления и выявить закономерности его развития. Это достигается на второй стадии статистического исследования, первой ступенью которой является статистическая сводка.

Статистическая сводка – это научно организованная обработка первичных данных в целях получения обобщающих характеристик изучаемого явления по ряду существенных для него признаков.

Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например: чтобы узнать общую численность студентов высших учебных заведений Украины достаточно сложить количество студентов всех ВУЗов на определенную дату.
Статистическая сводка включает в себя такие составляющие элементы:

  • выбор группировочных признаков (например, после переписи население можно делить на группы по признакам: пол, возраст, национальность);
  • распределение данных на части (группы и подгруппы);
  • расчет итоговых групповых данных с помощью системы статистических показателей.
  • систематизация полученных результатов в виде статистических таблиц.

Объединение отдельных единиц статистической совокупности в группы осуществляется при помощи метода группировок.

Статистическая группировка – это процесс образования однородных групп по ряду существенных признаков. Осуществляется группировка либо путем деления совокупности на отдельные части, которые характеризуются внутренней однородностью и отличаются рядом признаков, либо путем объединения отдельных единиц в группы по типовым признакам (например, группировка промышленных предприятий по форме собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме актива баланса и т.д.).

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группировочными признаками или основанием группировки . Если группировка получена по количественному признаку, она называется количественной, по качественному – атрибутивной или качественной.
На группировку в статистическом анализе возлагаются следующие функции:

  • выделение социально-экономических типов явлений;
  • изучение структуры и структурных сдвигов;
  • анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают типологические, структурные и аналитические (факторные) группировки.
Типологическая группировка – это распределение качественно разнородной совокупности на классы, социально-экономические однородные типы. К этому виду относятся группировки стран по социально-политическому устройству, предприятий – по форме собственности, населения – по месту проживания (городское и сельское).

Разделение однородной совокупности на группы с целью выявления ее внутренней структуры называется структурной группировкой. Она характеризует состав совокупности, объем (весомость) ее отдельных групп.
Таблица 1 – Группировка потребителей йогурта по возрасту

Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т.е. структурные сдвиги , что отражает закономерности их развития.

Аналитические группировки используются для исследования наличия зависимости между изучаемыми явлениями. Для этого следует данные сгруппировать по одному из признаков, вычислить в каждой группе среднее значение второго признака, а затем сопоставить изменения изучаемых признаков. Если с увеличением или уменьшением группировочного признака увеличиваются значения второго признака, то связь (прямая или обратная) между ними существует.
Таблица 2 – Группировка магазинов по численности работников (данные условные)


Численность работников, чел.

Количество магазинов

Средняя фактическая продолжительность рабочей недели, ч.

100 и более

Данные показывают, что между размером предприятия и занятостью его работников существует связь: чем больше по количеству работающих магазин, тем короче рабочая неделя.

Если группы, образованные по одному признаку, делятся затем на группы по второму и т.д. признакам, то такая группировка называется комбинированной . Например, распределив группы потребителей йогурта по полу, получим комбинированную группировку.
Таблица 3 – Группировка потребителей йогурта по возрасту и полу

Группы потребителей по возрасту, лет

Число потребителей, чел.

мужского пола

женского пола

Менее 20
20-30
30-40
40-50
50-60
Старше 60

10
40
30
10
6
4

4
17
12
6
3
1

6
23
18
4
3
3

Выполнение группировки по количественному признаку

При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки .

Интервал – количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Интервалы могут быть равные и неравные. Например: по численности работающих предприятия могут быть разбиты на группы: до 100, 100-200, 200-500, 500-1000, 1000 и более. Это объясняется тем, что изменение признака на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных – не имеет.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:

,
где ,– наибольшее и наименьшее значение признака;
к – число групп (интервалов), определяемое по формуле Стерджесса:

,

где N – число единиц совокупности.
Округление полученных в расчетах нецелых чисел производится в большую сторону.
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество групп:
Длина интервала: дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:

1 группа: 60-80
2 группа: 80-100
3 группа: 100-120
4 группа: 120-140
5 группа: 140-160
6 группа: 160-180

В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.

Интервалы групп могут быть закрытыми , когда указаны верхняя и нижняя границы (как в примере), и открытыми , когда указана лишь одна из границ. Например, интервалы «менее 60» или «180 и выше» - открытые интервалы. Для расчета показателей статистической совокупности открытые интервалы необходимо «закрыть». Для этого используют величину интервала, соседнего с «открытым». В примере получим: 40-60 и 180-200.

Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов. Для приведения группировок к сопоставимому виду используется метод вторичной группировки , который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами: 1) объединением первоначальных интервалов (т.е. их укрупнением); 2) долевой перегруппировкой.
Рассмотрим пример, данные условные.

Таблица 3 – Группировка акционеров по размеру дивидендов на одну акцию.


1-й район

№ груп-пы

Количество акционеров, %

№ груп-пы

Группы акционеров по размеру диви-дендов, грн.

Количество акционеров, %

1
2
3
4
5

1 – 4
4 – 8
8–12
12–16
16–20

18
12
40
25
5

1
2
3
4

1– 6
6–12
12–20
20–30

10
20
40
30

Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов из-за различного числа групп (5 и 4) и различной длины интервала. Взяв за основу группировку 2-го района (как более крупную), произведем вторичную группировку акционеров 1-го района.

Таблица 4 – Вторичная группировка акционеров по размеру дивидендов на 1 акцию


№ груп-пы

Группы акционеров по размеру дивидендов, %

Количество акционеров, %

1
2
3
4

1 – 6
6–12
12–20
20–30

10
20
40
30

24
46
30

18+0,5*12=24
0,5*12+40=46
25+5=30

Анализ сопоставимых данных вторичной группировки позволяет сделать вывод: акционеры второго района имеют более высокие дивиденды: (12 и выше грн. получают 40+30=70 % акционеров, а в первой – только 30 %).

Ряды распределения, их виды и графическое изображение

Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку (предыдущий пример – это ряд распределения). Он, являясь разновидностью структурной группировки, характеризует состав (или структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными (распределение населения по полу, занятости, профессии и т.д.).
Ряды, построенные по количественному признаку, - вариационными (распределение населения по стажу работы, з/п, возрасту.).

Конструктивно вариационный ряд распределения представляет собой таблицу, в первом столбце которой расположены варианты или их интервалы, во второй – частоты или (и) частости (третий столбец) . Принято варианты обозначать, частоты - , частости - .
Варианты, т.е. числовые значения количественного признака в вариационном ряду распределения, могут быть положительными или отрицательными. Так, при группировке предприятий по результатам деятельности варианты положительные (прибыль) или отрицательные (убыток).

Частоты это числа, показывающие, как часто встречаются те или варианты в данной совокупности. Сумма всех частот называется объемом совокупности и показывает число единиц совокупности, обозначается N.

Частости это частоты, выраженные в виде относительных величин: долях единицы или в процентах, рассчитываются как отношение частоты к объему совокупности. Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Для анализа совокупности вариационный ряд дополняют такими элементами, как накопленная частота, накопленная частость и плотность распределения.

Накопленная частота (Sf)показывает число единиц совокупности, у которых значение варианты не больше данной, определяется суммированием частот всех предшествующих интервалов, включая данный:

, , и т.д.

Если вместо частот использовать частости, то аналогично получим накопленные частости (Sw):

, , и т.д.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т. е. , а относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т. е. . Плотность распределения используется в рядах с неравными интервалами для приведения частот и частостей к сопоставимому виду.
Вариационные ряды в зависимости от характера вариации делят на дискретные и интервальные.
Дискретные вариационные ряды строятся на основе дискретных (прерывных) признаков. Дискретные – это признаки, варианты которых имеют только целые значения и количество их невелико. Интервальные вариационные ряды основаны на непрерывных признаках (т.е. принимающих любые значения, в том числе и дробные) или дискретных, варьирующих в широком диапазоне.

Пример построения дискретного ряда распределения . Стаж работы в годах 10 рабочих бригады характеризуются следующими данными: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Первым шагом в упорядочении первичного ряда является его ранжирование , т.е. расположение всех вариант в возрастающем или убывающем порядке.
Ранжированный ряд: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Таблица 5 – Дискретный вариационный ряд распределения рабочих по стажу работы


Стаж
работы (варианты хi)

Количество рабочих определенного стажа (частота fi)

Частости

Накопленные частоты

Накопленные частости

2
3
4
5

1
2
4
3

(1:10)*100=10
(2:10)*100=20
40
30

1
1+2=3
3+4=7
7+3=10

10
30
70
100

Пример построения интервального ряда . Имеются данные о среднемесячной з/п 30 работников, которая варьируется от 600 до 1200 грн. Построить интервальный ряд распределения.

Таблица 6 – Интервальный вариационный ряд распределения рабочих по размеру среднемесячной заработной платы

Группы рабочих по размеру з/п (интервалы вариант хi)

Количество рабочих (частоты fi)

Частости

Накопленные частоты

Накопленные частости

1) 600-700
2) 700-800
3) 800-900
4) 900-1000
5) 1000-1100
6) 1100-1200

3
6
8
9
3
1

26,7
30
10
3,3

3
3+6=9
9+8=17
26
29
30

10,0
30,0
56,7
86,7
96,7
100,0

Графически ряды распределения можно представить в виде гистограммы, кумуляты, полигона.
Интервальный вариационный ряд изображают в виде гистограммы . Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, равные длине интервала. Затем на этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами по оси ординат откладывают плотность распределения, так как в этом случае именно она дает представление о заполненности интервала. Площадь всей гистограммы численно равна сумме частот.
Пример построения гистограммы.

Если соединить середины каждого интервала отрезками прямой, то получим замкнутую фигуру в виде многоугольника, которая называется полигоном .
Полигон чаще используется для дискретных рядов. Для этого в прямоугольной системе координат строят точки с координатами (x1, f1), (x2, f2), …, (xN, fN), затем последовательно соединяют их отрезками, а из первой и последней точек опускают перпендикуляры на ось х. Полученный многоугольник является полигоном дискретного вариационного ряда.

Кумулята строится по накопленным частотам (или частостям), которые откладывают по оси у, а по оси х – варианты или верхние границы интервалов.