Социально-экономическая статистика

Метод группировки и его место в системе статистических методов

Отдельные единицы статистической совокупности объединяют­ся в группы. Группировки являются важнейшим статистическим методом обобщения данных, основой для правильного исчисления аналитических показателей.

С помощью метода группировок решаются следующие задачи:

• характеристика социально-экономических типов явлений;

« изучение структуры явления и структурных сдвигов, происхо­дящих в нем;

• определение связи и зависимости между явлениями.

В соответствии с этим статистические группировки делятся на типологические, структурные и аналитические.

Типологическая группировка — это разделение исследуемой совокуп­ности на классы, социально-экономические типы, однородные группы единиц в соответствии с изучаемыми признаками. Примером типоло­гической группировки является группировка сельскохозяйственных предприятий по формам собственности. Такие группировки широко применяются в исследовании социально-экономических явлений и процессов. Они позволяют проследить зарождение, развитие и отми­рание различных типов явлений. При проведении типологической группировки основное внимание должно быть уделено идентифика­ции типов социально-экономических явлений. Она проводится на базе глубокого теоретического анализа исследуемого явления.

Структурной называется группировка, в которой происходит раз­деление однородной совокупности на группы, характеризующие ее струк­туру по какому-либо варьирующему признаку.

Явления общественной жизни и отражающие их признаки тесно взаимосвязаны. Группировка, выявляющая взаимосвязи между изу­чаемыми явлениями и их признаками, называется аналитической группировкой.

Всю совокупность признаков можно разделить на две группы: факторные и результативные. Результативным является признак, который испытывает влияние факторных признаков. Факторными называются признаки, под воздействием которых изменяются ре­зультативные признаки. Такая взаимосвязь проявляется в том, что с изменением факторного признака систематически возрастает или убы­вает среднее значение результативного признака. Например, произ­водительность труда зависит от технического уровня предприятия: чем он выше, тем при прочих равных условиях выше производи­тельность труда занятых на предприятии. Поэтому, группируя про­мышленные предприятия, производящие одну и ту же продукцию, по техническому уровню производства (по уровню фондовооружен­ности труда) и исчисляя для каждой группы среднюю выработку товарной продукции на одного работающего, можно статистически отразить эту зависимость между факторами.

Особенности аналитической группировки состоят в следующем: во-первых, в основу группировки кладется факторный признак; во - вторых, каждая выделенная группа характеризуется средними зна­чениями результативного признака.

Аналитические группировки позволяют изучить многообразие связей и зависимости между варьирующими признаками. Преиму­щество метода аналитических группировок перед другими методами анализа связи (например, корреляционно-регрессионным) состоит в том, что он не требует соблюдения каких-либо условий для его применения, кроме одного — качественной однородности исследуе­мой совокупности.

Группировка, в которой группы образованы по одному призна­ку, называется простой. Для характеристики явления бывает недо­статочно разбить совокупность на группы по какому-либо одному признаку. В этом случае строят сложные группировки.

Сложной называется группировка, в которой разделение сово­купности на группы проводится по двум и более признакам, взятым в сочетании (комбинации). Сначала группы формируются по одно­му признаку, затем они делятся на подгруппы по другому признаку, которые в свою очередь подразделяются по третьему признаку, и т. д. Таким образом, сложные группировки дают возможность изу-

чать распределение единиц совокупности одновременно по несколь­ким признакам. Примером такой группировки может служить груп­пировка сельскохозяйственных предприятий по числу работников и стоимости основных фондов.

При построении сложной группировки возникает вопрос о пос­ледовательности разбиения единиц объекта по признакам. Как пра­вило, рекомендуется сначала проводить группировку по атрибутив­ным признакам, значения которых имеют ярко выраженные качественные различия.

Группировочным признаком называется признак, по которому про­водится разбивка единиц совокупности на отдельные группы (его ча­сто называют основанием группировки). В качестве основания груп­пировки следует использовать существенные признаки — как количественные, так и качественные. Первые имеют числовое вы­ражение (урожайность, основные фонды, денежный доход семьи и т. д.), а вторые отражают состояние совокупности (отраслевая при­надлежность предприятия, его форма собственности и организаци­онно-правовая форма, виды сельскохозяйственных угодий и др.).

После определения основания группировки следует решить воп­рос о количестве групп, на которые надо разбить исследуемую сово­купность. Число групп зависит от задач исследования и вида при­знака, положенного в основание группировки, численности совокупности, степени вариации признака.

Единицы анализируемого объекта могут быть разбиты по одно­му и тому же признаку на разное число групп. Например, при груп­пировке населения по возрасту с целью определения трудовых ре­сурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, население в трудоспособном возрасте и население старше трудоспособного воз­раста. Если анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные и годич - , ные группы.

При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, со­стояний у этого признака. Например, в случае проведения группи­ровки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка сельскохозяй­ственного производства по экономическим районам, то вся исследу­емая совокупность делится на 12 групп (именно на столько эконо­мических районов поделена территория России).

От группировок следует отличать классификацию.

Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на осно­вании какого-либо признака.

Отличительной чертой классификации является, во-первых, то, что в основе ее лежит качественный признак. Во-вторых, классифи­кации стандартны. Они устанавливаются органами государственной и международной статистики. Если в каждом конкретном исследо­вании строится своя группировка, то классификация едина для лю­бого исследования независимо от того, проводят ли его органы го­сударственной статистики или другие учреждения и ведомства (министерства, налоговые органы и т. п.); в-третьих, классификации устойчивы. Они остаются неизменными в течение длительного пе­риода. Однако если появляются новые группы единиц, их классы, разряды, то в классификации вносятся соответствующие изменения и дополнения.

Классификация, предопределяя важнейшие признаки группи­ровки единиц совокупности, является основой группировок. В ней точно определены всевозможные группы и имеются подробные ука­зания, помогающие отнести любую единицу объекта в ту или иную группу в каждом конкретном случае.

Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. Группи­ровка по количественному признаку имеет задачу отразить распре­деление единиц совокупности по этому признаку. Количество групп зависит, в первую очередь, от степени колеблемости группировоч­ного признака: чем больше его колеблемость, тем больше следует создать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании со­циально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать осо­бенности объекта и цель исследования.

При использовании электронно-вычислительных машин и пер­сональных компьютеров для обработки статистических данных груп­пировка единиц объекта проводится с помощью стандартных проце­дур. Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

п = 1 + 3,322 • lgTV,

где п — число групп;

N — число единиц совокупности.

Согласно формуле выбор числа групп зависит от объема сово­купности. Применение формулы дает хорошие результаты, если со­вокупность состоит из большого числа единиц, распределение кото­рых по признаку, положенному в основание группировки, близко к нормальному.

После определения числа групп следует определить интервалы группировки.

Интервал — это значения варьирующего признака, лежащие в опре­деленных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интер­вала называется наименьшее значение признака в интервале, а верхней границей — наибольшее значение признака в нем.

Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастаю­щие, прогрессивно убывающие, произвольные и специализирован­ные.

Если вариация признака проявляется в сравнительно узких гра­ницах и распределение носит более или менее равномерный харак­тер, то строят группировку с равными интервалами. Величина рав­ного интервала определяется по формуле

_ -*max ~ -^inin

где X/ — величина равного интервала;

Хішх и -'чпш — максимальные и минимальные значения группировоч - ного признака;

й — предполагаемое число групп.

Полученную таким образом величину округляют, она является шагом интервала.

Первые и последние интервалы количественной группировки могут быть открытыми и закрытыми. Открытые — это интервалы, у которых указана только одна граница: верхняя — у первого, ниж­няя — у последнего. Например, открытыми будут первый и после­дний интервалы в группировке населения по размеру среднедуше­вого дохода. Закрытыми называются интервалы, у которых обозна­чены обе границы.

Величина открытого интервала принимается равной величине смежного с ним интервала (т. е. первый интервал приравнивается ко второму, а последний — к предпоследнему).

При группировке по количественному признаку границы ин­тервалов могут быть обозначены по-разному. Если основанием груп­пировки служит непрерывный признак, то одно и то же его значе­ние выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница /-го интервала равна нижней границе / + 1-го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которого совпадают с границами интервалов. Для того чтобы пра­вильно отнести к той или иной группе единицу объекта, у которой значение признака совпадает с границами интервалов, можно ис­пользовать открытые интервалы. Если в основании группировки лежит дискретный признак, то нижняя граница последующего ин­тервала равна верхней границе предыдущего интервала, увеличен­ной на единицу.

Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей. Неравные интервалы могут быть прогрессивно возрастающими или убываю­щими в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, опреде­ляется следующим образом:

А, +, = hi + a,

где а — постоянное число, которое будет положительным при про­грессивно возрастающих интервалах и отрицательным—при прогрессив­но убывающих интервалах.

В геометрической прогрессии величина интервалов исчисляется по формуле

/1, + 1 = й, •q,

где q — постоянное положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убываю­щих — меньше 1.

При определении границ интервалов статистических группиро­вок исходят из того, что изменение количественного признака при­водит к появлению нового качества. В этом случае граница интер­вала устанавливается там, где происходит переход от одного качества к другому. Рамки границ зависят от условий места и времени. По­этому следует дифференцированно устанавливать границы интерва­лов для разных отраслей экономики и разных типов хозяйств. Это достигается путем использования группировок со специализирован­ными интервалами.

Специализированными называются интервалы, применяющие­ся для выделения из совокупности одних и тех же типов по одно­му и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых являются произ­вольными. Особенность данной группировки в том, что выбор числа групп и границ интервалов зависит от исследователя.

Одним из видов группировок являются ряды распределения.

Статистический ряд распределения — это упорядоченное распре­деление единиц совокупности на группы по определенному варьирую­щему признаку. Ряды распределения принято оформлять в виде ста­тистической таблицы. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам. Элементами этого ряда распределения яв­ляются значения атрибутивного признака и число случаев, относя­щихся к каждому значению. Атрибутивные ряды характеризуют со­став совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры явления.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.

Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретные значения варь­ирующего признака.

Частоты — это численности отдельных вариантов или каж­дой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределе­ния. Сумма всех частот определяет численность всей совокупности, ее объем.

Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают диск­ретные и интервальные вариационные ряды. Как известно, вариа­ция количественных признаков может быть дискретной (прерыв­ной) или непрерывной. В случае дискретной вариации величина количественного признака принимает только целые значения. Сле­довательно, дискретный вариационный ряд характеризует распреде­ление единиц совокупности по дискретному признаку.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую вели­чину. Построение интервальных вариационных рядов целесообразно, прежде всего, при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число ва­риантов дискретного признака достаточно велико.

Наглядно ряды распределения можно представить при помощи их графического изображения, позволяющего судить о форме рас­пределения. Наиболее часто для этой цели используют полигон и гистограмму.

Полигон используется при изображении дискретных вариацион­ных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжирован­ные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересече­нии абсцисс и ординат точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точ­ки (слева и справа на ломаной линии) соединить с точками на оси абсцисс. В этом случае получается многоугольник.

Гистограмма применяется для изображения интервального ва­риационного ряда. При ее построении на оси абсцисс откладывают­ся величины интервалов, а частоты изображаются прямоугольника­ми, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна часто­там. В результате мы получим гистограмму — график, на котором ряд распределения изображен в виде смежных друг с другом столби­ков. Гистограмма может быть преобразована в полигон распределе­ния, если найти середины сторон прямоугольников и затем эти точ­ки соединить прямыми линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не часто­ты, а плотность распределения признака в соответствующих ин­тервалах. Это необходимо сделать для устранения влияния величи­ны интервала на распределение и получения возможности сравнивать частоты.

Плотность распределения — это частота, рассчитанная на еди­ницу ширины интервала. Она показывает, сколько единиц в каждой группе приходится на единицу величины интервала.

Для графического изображения вариационных рядов может так­же использоваться кумулятивная кривая. При помощи кумуляты (кри­вой сумм) изображается ряд накопленных частот. Последние опре­деляются путем последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения не больше чем рассматриваемое значение.

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат — накопленные частоты, которые наносят на поле графика в виде пер­пендикуляров к оси абсцисс в верхних границах интервалов. Затем перпендикуляры соединяют и получают ломаную линию, т. е. куму - ляту.

Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда, принятой соответствен­но за единицу или за 100%, т. е. частостями. Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву.

С помощью кумулятивных кривых графически изображают про­цесс концентрации.

Построим полигон, гистограмму, кумуляту и огиву (рис. 4.1) на основании следующих данных о распределении сельского населения в России на 1 января 1998 г. по возрастным группам (млн человек).

Возраст (лет)

Численность сельского населения

Накопленная численность населения

0—10

5,2

5,2

10—20

6,7

11,9

20—30

4,8

16,7

30—40

6,0

22,7

40—50

5,4

28,1

50—60

3,5

31,6

60—70

4,4

36,0

70 и старше

3,6

39,6

Итого

39,6

На графике (рис. 4.1) представлены полигон (ломаная прямая) и гистограмма (совокупность прямоугольников) вышеуказанного рас­пределения.

Метод группировки и его место в системе статистических методов

Рис. 4.1. Полигон и гистрограмма распределения сельского населения России по возрасту

Кумулята этого распределения выглядит следующим образом (она строится на основании накопленных частот), рис. 4.2:

Огива строится таким же образом, как и кумулята, только оси абсцисс и ординат меняются местами (рис. 4.3).

Ряд распределения представляет собой простейшую группмров - ку, в которой каждая выделяемая группа характеризуется одним показателем—численностью единиц объекта, попавших в каждую группу. Построение рядов распределения является составной частью

сводной обработки данных, при которой каждая группа единиц ха­рактеризуется многими показателями. Поэтому важным моментом в построении группировки является перечень тех показателей, кото­рыми будет характеризоваться каждая группа.

Метод группировки и его место в системе статистических методов

Рис. 4.2. Кумулята распределения сельского населения России по возрасту

39,6

Метод группировки и его место в системе статистических методов

Рис. 4.3. Численность сельского населения, млн чел

Состав таких показателей формируется в соответствии с целями статистического исследования и задачами группировки. Для полу­чения обобщенной, комплексной характеристики социально-эконо­мического явления используют не отдельные показатели, а систему статистических показателей, которая предусматривает исчисление абсолютных, относительных и средних величин.

Группировки, построенные за один и тот же период, но для

разных регионов, или, наоборот, для одного региона, но за два раз­ных периода, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести такие группировки к сопоставимому виду осуществляют вторичную группировку.

Вторичная группировка — операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наи­более простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам, а также когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой из них определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц со­вокупности перейдет из старых групп в новые.

Рассмотрим первый способ проведения вторичной группировки. Например, имеются следующие данные о численности сельского населения России на 1 января 1998 г. (млн человек). Необходимо построить вторичную группировку с интервалами 0—15 лет; 15—55 лет; 55 лет и более. Эта группировка выглядит следующим образом:

Возраст (лет)

Численность

сельского

населения

Новая

группировка

Численность сельского населения

О

J.

о

5,2

0—15

8,9

10—15

3,7

15—25

5,6

15—55

20,4

25—40

8,2

40—55

6,6

55—65

4,4

55 и более

10,3

65 и более

5,9

Итого:

39,6

39,6

Более сложным является способ долевой перегруппировки. При­менение его рассмотрим на следующем примере. Имеются данные о численности сельского населения России на 1 января 1998 г. (млн человек). Построить вторичную группировку с интервалами О— 15 лет; 15—55 лет; 55 лет и более.

Возраст

Численность

Новая

Численность сельского

сельского населения

группировка

населения

0—5

2,1

0—15

8,55

5—10

3,1

15—55

20,825

10—20

6,7

20—40

10,8

40—60

8,9

55 и более

10,225

Свыше 60

8,0

Итого:

39,6

39,6

Расчет численности сельского населения по новым группам про­изводится следующим образом:

а) интервал О-15 : 51ИСС = 2.1+ 3,1+ 6,7*-^—^- = 8,55;

20-10

б) Интервал 15-55: = 6,7 • —— +10,8 + 8.9 • 5^~40 = 3,35 +10,8 +

20-10 60-40

+6,675 = 20,825;

в) интервал 55 и более: = 8,9*-^—— + 8,0 = 10,225

60-40

Проверка: 8,55 + 20,825 + 10,225 = 39,6 млн чел.

Социально-экономическая статистика

Глоссарий

Баланс народного хозяйства (balance of economy national) — вза­имосвязанная система балансовых таблиц, которую составляло ЦСУ СССР вплоть до конца 80-х годов XX столетия. БНХ харак­теризовал процесс воспроизводства совокупного общественного продукта …

Статистические показатели условий жизни, труда и отдыха

Наряду с показателями материального благосостояния жиз­ненный уровень населения характеризуют показатели, отражаю­щие общую ситуацию, обусловливающую уровень жизни. К ним относятся показатели: • состояния окружающей среды; • криминогенной обстановки; • условий труда; …

Баланс денежных доходов и расходов населения

Главным источником статистической информации о финан­совой ситуации домашних хозяйств является баланс денежных доходов и расходов населения, составляемый Госкомстатом Рос­сии ежеквартально и в целом за год. Он позволяет охарактеризо­вать кругооборот денежных …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия
+38 050 512 11 94 — гл. инженер-менеджер (продажи всего оборудования)

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Оперативная связь

Укажите свой телефон или адрес эл. почты — наш менеджер перезвонит Вам в удобное для Вас время.