Социально-экономическая статистика
Средние величины
Наиболее распространенной формой статистических показателей, используемой в социально-экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Показатель в форме средней величины выражает типичные черты однотипных явлений и дает их обобщающую характеристику по одному из варьирующих признаков. Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности могут колебаться под влиянием множества факторов, среди которых могут быть как основные, так и случайные.
Сущность средней заключается в том, что в ней взаимопогаша - ются отклонения значений признака отдельных единиц совокупности, обусловленные деятельностью случайных факторов, и учитываются изменения, вызванные действием факторов основных. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.
Типичность средней непосредственно связана с однородностью статистической совокупности. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности.
Метод средних используется в сочетании с методом группировок: если совокупность неоднородна, то общие средние должны быть заменены или дополнены групповыми средними, т. е. средними, рассчитанными по качественно однородным группам.
В статистической практике чаще всего используются следующие виды средних величин:
• средняя арифметическая;
• средняя гармоническая;
• средняя геометрическая;
• средняя квадратическая, кубическая и т. п.
Перечисленные средние объединяются в общей формуле средней
степенной (при различной величине jc):
где — средняя величина исследуемого явления;
X, — І-и вариант осредняемого признака (/ = 1, л);
fj — вес /-го варианта; к — показатель степени.
Помимо степенных средних в статистической практике используются также средние структурные, среди которых наиболее распространены мода и медиана. При осреднении уровней динамических рядов применяются различные виды средней хронологической.
Наиболее распространенным видом средних величин является средняя арифметическая, которая, как и все средние, в зависимости от характера имеющихся данных может быть простой или взвешенной.
Средняя арифметическая простая (невзвешенная) используется в случаях, когда для каждого значения признака (х) имеет место одинаковая частота (/J), т. е. одинаковое количество единиц совокупности. Формула простой средней выглядит следующим образом:
Х = (^хі)'-п >
где А', — значение признака; п — число единиц.
Следует подчеркнуть, что использовать среднюю арифметическую невзвешенную можно только тогда, когда точно установлено отсутствие весов или их равенство.
Средняя арифметическая взвешенная применяется в том случае, когда число единиц (частота) хотя бы одного значения признака отличается от других его значений.
В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы). С учетом несложного преобразования предыдущей формулы получим:
fi
X =
I f, ■
При расчете средней по интервальному вариационному ряду для
выполнения необходимых вычислений используют центры интервалов. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам, примыкающих к ним интервалов (второго и предпоследнего).
Свойства средней арифметической. Средняя арифметическая обладает некоторыми математическими свойствами, более полно раскрывающими ее сущность и в ряде случаев используемыми при ее расчетах. К ним относятся следующие свойства.
1. Сумма отклонений индивидуальных значений признака от средней арифметической равны нулю:
ХС*/“*)'.//=а
Математическое доказательство данного свойства сводится к следующему:
Х<>, -x)f, =Х*< f =luxifi =й
2. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится на это же число:
3>,±лк Ху /; Д ■->./; _-±Л 1/i X/i X./i
3. Если все варианты значений признака уменьшить или увеличить в А раз, то средняя также соответственно увеличится или уменьшится в А раз:
X(v >)-./; о;л)ххі /і,
—----------- —---- —-- ----- —х. УІ.
х/' х./;
4. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится'.
Ххг(/ : Л)^(1:Л)Х*, f, Ха-Л) (1 :Л)Х/
Исходя из данного свойства можно заключить, что в случае равенства всех весов между собой расчеты по средней арифметической взвешенной и средней арифметической простой приведут к одному и тому же результату.
5. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты.
■
Доказательство:
*£./; =Х*' fi-ХК'- y fif = 'f ■
6. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины С.
ХС*,-cf -.fi =X(-V< - x-cf - J] =£[(*, - x)±(x-C)] 2-f =
=x[(*- - x?fi +2(*/ ]■/ =
=X(-v; --Ї)2 •/; +2 (S-C)X(,, - x} f, +K-V,-cf • /, =
=Ifo -xf ■ fi 2(x~C)0+Y(x-Cf ■ /:,
Следовательно, сумма квадратов отклонений индивидуальных значений признака от произвольной величины С больше суммы квадратов их отклонений от своей средней на величину:
^(x-cf-fi или (х-С)2-^./; .
На использовании этого свойства базируется расчет центральных моментов, представляющих собой характеристики вариационного ряда при С = х :
.. Sfc-f//.
где ^ — центральный момент k-ro порядка;
к — порядок момента (центральный момент второго порядка представляет собой дисперсию).
Рассмотренные выше свойства средней арифметической дают возможность вывести следующие упрощенные формулы ее расчета:
где а — постоянная величина (условный ноль);
- и.
б) — I/f - ^ где b — постоянная величина.
Например, имеются три группы студентов разного роста.
Рост (см) |
160 |
170 |
180 |
Число студентов (чел.) |
3 |
12 |
5 |
Тогда средний рост студента будет равен:
1) по формуле (а) — условный ноль равен 150:
(160-150).3 + (170-150).12 + (180-150).5 +]50 =2j + J5() =
3+12 + 5
2) по формуле (б) — условный ноль равен 150, b = 10:
_(160- 150): 10■ 3 + (170- 150): 10 12 + (180-150): 10■ 5 | |<ц}
3 + 12 + 5
Методология расчета средней арифметической, средней геометрической, средней квадратической и средней гармонической приводится в следующей таблице.
Вид средней |
Простые (невзвешенные) средние |
Взвешенные средние |
Средняя арифметическая м |
п |
!>,/, I/ |
Средняя гармоническая (х/,) |
п |
I/, |
Ч |
||
Средняя квадратическая |
||
І I/; |
||
Средняя геометрическая (**) |
||
'{/г, ■ Г 2 - Л, |
"fY A v /' r /. r h I vrl 2 • ........................... |
В этих формулах xi — значения осредняемого признака; j) — соответствующие им частоты.
Что касается средней хронологической, то она рассчитывается в том случае, если имеются данные на определенные даты (обычно на начало месяца, квартала, года). Простая средняя хронологическая определяется по формуле
— + х2+... + хп,+ —
_ 2 2 " 1 2 xch.
п-1
Эта формула применяется в случае наличия одинаковых интервалов между данными. Если интервалы не равны, то используется взвешенная средняя хронологическая:
- X*, fi
х=-=^=-- ,
где — средняя /-го интервала;
f — величина /-го интервала.
При расчете средних величин необходимо принимать во внимание правило мажорантности средних величин. Оно заключается в том, что существуют следующие обязательные соотношения между средними величинами:
xqll>x>xg>xh.
Это правило дает возможность контролировать расчеты средних величин. Например, имеются следующие данные.
Площадь хозяйств, га |
Число хозяйств |
Xj |
Xifi |
xff |
f/x, |
logXi |
fi logXi |
2 |
3 |
4 = 3-2 |
5=4-3 |
6 = 2:3 |
7 |
CO II |
|
до 6 |
4 |
4 |
16 |
64 |
1,000 |
0,6021 |
2,4082 |
6—10 |
8 |
8 |
64 |
512 |
1,000 |
0,9031 |
7,2248 |
10—20 |
11 |
15 |
165 |
2475 |
0,733 |
1,1762 |
12,9382 |
20—30 |
13 |
25 |
325 |
8125 |
0,520 |
1,3982 |
18,1766 |
30—50 |
10 |
40 |
400 |
16000 |
0,250 |
1,6021 |
16,0210 |
свыше 50 |
4 |
60 |
240 |
14400 |
0,067 |
1,7782 |
7,1128 |
Итого: |
50 |
1210 |
41576 |
3,570 |
65,8816 |
Рассчитаем все виды средних величин для данной совокупности. Прежде всего, закроем открытые интервалы: первый интервал равен второму (т. е. 10 — 6 = 4). Это значит, что первый интервал
имеет границы от 2 до 6. Последний интервал равен предпоследнему (т. е. 50 — 30 = 20), т. е. последний интервал имеет границы от 50 до 70. Затем определим центральные значения всех интервалов, т. е. значения л:, (графа 3).
Далее рассчитаем необходимые данные для определения средних величин (графы 4 — 8). На основании этих данных определяем все виды средних (отметим, что п — объем совокупности — равен 50):
1) x=Y, xJ, In = 1210/50 = 24,2 га;
2) V =yl'E(xi2fi)/n = >/41 576/50 = ^831,52 = 28,84 га ;
3) xh=nl'£fi/xi =50/3,57 = 14,00 га;
3) logig =(£fj log*,)/и = 65,8816/50 = 1,31763 га;
отсюда xg = 20,83 га.
Проверка: xqu>x>xg>xh
28,84 > 24,2 > 20,83 > 14,0.
Для иллюстрации расчета средней хронологической возьмем следующие данные о численности работников сельскохозяйственного предприятия и ее изменении в течение года.
Дата |
Числен ность работников |
Длитель ность интервала |
Средняя численность в интервале |
Взвешенная численность в интервале |
Xi |
Г |
Xi |
х,/ |
|
1.01.1999 |
125 |
2 мес. |
121,0 |
242,0 |
1.03.1999 |
117 |
4 мес. |
132,5 |
530,0 |
1.07.1999 |
148 |
3 мес. |
144,5 |
433,5 |
1.10.1999 |
141 |
3 мес. |
139,0 |
417,0 |
1.01.2000 |
137 |
— |
— |
— |
Поскольку интервалы не равны, расчет средней хронологической проводится по взвешенной формуле
Ух,-Л 242 + 530 + 433,5 + 417,0 1622,5 Xch = =-- =------- =135,2
На практике иногда применяются так называемые структурные средние — мода и медиана.
Модой называется значение признака, которым обладает наибольшее число единиц совокупности (т. е. значение, которое наиболее часто встречается). Медиана представляет собой значение признака, которое делит изучаемую совокупность на две равные части — 50% единиц имеют значения признака меньше медианы, 50% единиц — больше медианы. К медиане примыкают аналогичные показатели — квартили, квинтили, десили, персентили. Квартили делят совокупность на четыре равные части по 25%; квинтили делят совокупность на пять равных частей по 20%; десили делят совокупность на десять равных частей по 10%; персентили — на 100 равных частей по 1% каждая.
При определении моды и медианы дискретного (прерывного) признака их значения определяются либо визуальным путем для моды (выбирается значение признака, имеющее наибольшую частоту), либо отысканием значения признака, который имеет центральный член совокупности. Например, имеются следующие данные о численности работников сельскохозяйственных предприятий.
Число работников |
5 |
7 |
10 |
12 |
15 |
20 |
Число хозяйств |
6 |
8 |
14 |
23 |
17 |
32 |
В этом случае мода равна 20 (с частотой 32), а медиана 12 (так как номера 50 и 51 совокупности имеют значение признака, равное 12). Соответственно первая квартиль равна 10 (это значение имеют
номера 25 и 26); четвертая квинтиль равна 20 (это значение имеют
номера 80 и 81); третья десиль равна 10 (поскольку номера 15 и 16 совокупности равны 10); 73-я персентиль равна 20 (так как номера 73 и 74 равны 20).
Если изучаемый признак является непрерывным, то расчет моды ведется по формуле
м0 =Х0 +J-T-. !то ~Jr~[--------------- :--- V
(/то ~Jто-1 )+(/„,о “ /то+ )
где х(1 — нижняя граница модального интервала;
d — величина модального интервала (х, — х{));
fmo> fmo -1 ’ fmo+1 — соответственно частоты модального, предмодаль - ного и послемодального интервалов.
Что касается медианы, квартилей, квинтилей, десилей и пер - сентилей, то они определяются по однородным формулам следующего вида:
,, m'Lf-'Lf-1
хл +а ——--- —------
fi
где jcq — нижняя граница интервала, в котором нахо. .ся определяемый показатель;
d — величина этого интервала (х, - х());
/ — частота этого интервала;
т — доля единиц совокупности, отделяемая искомым показателем (0,5 для медианы; 0,4 для второй квантили; 0,8 для восьмой десили и т. п.);
Y. fj — общее число единиц совокупности;
Y. fj- — накопленные частоты всех интервалов, предыдущих по отношению к данному интервалу.
Например, имеются следующие данные об урожайности зерновых (д/га).
Урожай ность |
12—14 |
14—16 |
16—18 |
18—20 |
20—22 |
22—24 |
24—26 |
Уборочная площадь |
7 |
15 |
23 |
25 |
12 |
10 |
8 |
В этом случае:
1) Л/ =18+(20-18}7- 25[~2,2---- г = 18,2667 ц/га;
’ ° V ’ (25-23>+(25-12)
2) Ме =18 + (20 -18} Ш0 ^ ~ 45 =18,4 ц/га;
„ 100 0,25-22 ,
J) первая квартиль =16 +(J8-16J------------- —------- = 16,26 ц/га;
4) третья квартиль =18 + (20 -18} —^ ^——=19,2 ц/га;
5) седьмая десиль = 20 (общая точка двух интервалов);
6) 43-й персентиль =16 +(l8 — 1 б}———=17,83 ц/га.
Экономический смысл полученных результатов заключается в следующем:
1) наибольшая часть уборочных площадей имеет урожайность 19,27 ц/га;
2) половина посевных площадей имеет урожайность свыше 18,4 ц/га, а другая половина — меньше 18,4 ц/га;
3) 25% посевных площадей имеют урожайность ниже 16,26 ц/га; и 75% посевных площадей — свыше 16,26 ц/га;
4) 60% площадей имеют урожайность менее 19,2 ц/га и 40% площадей — свыше 19,2 ц/га;
5) 70% площадей имеют урожайность менее 20 ц/га и 30% площадей — свыше 20 ц/га;
6) 43% площадей имеют урожайность менее 17,83 ц/га и 57% площадей — свыше 17,83 ц/га.
В заключение необходимо отметить, что если средняя арифметическая совпадает по величине с модой и медианой, то такое распределение называется идеальным. В экономике такое распределение встречается крайне редко.