Социально-экономическая статистика
Расчет параметров полиномов различными методами
После того как выяснен характер кривой развития, необходимо определить ее параметры. Элементарный метод определения параметра уравнения тренда, описанного полиномом или экспонентой, состоит в решении системы уравнений по известным уровням ряда динамики. Ниже приводится методология расчета параметров уравнения прямой, параболы второго порядка и экспоненты.
Уравнение прямой имеет вид: у, = а() + а, і. В связи с этим система нормальных уравнений для оценивания параметров прямой имеет вид:
|ляо+«іХ,=Ху |а0Х/ + віХ'2=Ху-г-
Решение этой системы относительно искомых параметров проводится по следующим формулам:
, ,2>Х'2-Х3>'
«Х^-ХуХ*
' »X»2-(X'f '
Аналогичная система уравнений строится для параболы второго порядка у, = а0 + t + а211'.
па0 + a^t + a2^t2 =]Гу
«0$У + а, Х'3 + *2Х;4 = ХУ'2-
Упрощенный расчет параметров уравнений заключается в переносе начала координат в середину ряда динамики. В этом случае упрощаются сами нормальные уравнения, а кроме того, уменьшаются абсолютные значения величин, участвующих в расчете. В самом деле, если до переноса начала координат t было равно 1,2,3,..., я, то после переноса — /= ... —4, —3, -2, -1,0,1,2,3,4..., если число члена ряда нечетное. Когда же число ряда четное, то /=... —5, —3, —I, 1,3,5... Следовательно, и все, у которых «р» нечетное число, равны 0. Таким образом, все члены уравнений, содержащие с такими степенями, могут быть исключены. Системы нормальных уравнений теперь упрощаются для прямой:
Uz0=£y
Для параболы второго порядка:
па0+а2^г =Ху
а, Х/2 =ХУ' fl0 Х'2+«2Х'4=Ху'2-
Решая эти системы относительно неизвестных параметров, получим величины параметров соответствующих полиномов.
Параметр <з, выражает начальную скорость роста, а коэффициент а2 — постоянную скорость изменения прироста. Если уровень явления растет с ускорением, то величина этого ускорения в среднем за изучаемый период равна 2а2 единицам.
При сглаживании ряда динамики по экспоненте (у, = а0е~а') для определения параметров применяется метод наименьших квадратов к логарифмам исходных данных. Так, для нахождения параметров экспоненты необходимо решить следующую систему уравнений-.
|ХІ8У = /,І§0о + 1§«іХг IX' |§у=|§яоХ/+|8°іХ/2-
Если £/ = 0, то параметры уравнения lg а0 и lg а,, находим по формулам
-1>1. -X^gy
Экспонента отражает постоянный относительный рост, равный e_ai единицам.
При рассмотрении квартальных или месячных данных многих социально-экономических явлений часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не меняются за длительный период. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также ряда других многочисленных факторов, которые частично являются регулируемыми. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонные колебания» или «сезонные волны», а динамический ряд в этом случае называют тренд-сезонным или просто сезонным рядом динамики.
Особенно характерны сезонные колебания для экономической деятельности сельского хозяйства, которое в подавляющей степени зависит от сезонных колебаний климата.
Сезонные колебания характеризуются специальными показателями, которые называются индексами сезонности (Q. Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются процентные отношения фактических внутригодовых уровней к постоянной и переменной их средней.
Для выявления сезонных колебаний обычно берут данные за несколько лет (не менее трех), распределенные по месяцам, используемые для того, чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года.
Индекс сезонности исчисляется различными методами. Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности рассчитываются непосредственно по эмпирическим данным без их предварительного выравнивания. Для каждого месяца определяется средняя величина уровня (у,), затем вычисляется среднемесячный уровень для всего ряда (у) и в заключение — процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда по следующей формуле:
/.,=-=-•100%.
У
Совокупность исчисленных индексов сезонности характеризует сезонную волну в изучаемом явлении. Для наглядного получения представлений о сезонной волне следует изобразить последние данные в виде линейной диаграммы. Если ряд динамики содержит определенную тенденцию в развитии, то прежде чем вычислить сезонную волну, фактические данные должны быть обработаны так, чтобы была выявлена общая тенденция. Обычно для этого прибегают к аналитическому выравниванию ряда динамики.
В общем виде формулу расчета индекса сезонности данным способом можно записать следующим образом:
А- =(Ху, : У/); и-
В значительной части рядов динамики экономических процессов между уровнями, особенно близко расположенными, существует взаимосвязь. Ее удобно представить в виде корреляционной зависимости между рядами у(, у2, Уз,..., у„ и этим же рядом, сдвинутым относительно первоначального положения на И моментов времени Уі+Л, у2+/,, Уз+av, Уп+1г Временное смещение называется сдвигом, а само явление взаимосвязи — автокорреляцией.
Автокорреляционная зависимость особенно существенна между соседними уровнями ряда динамики. Поскольку классические методы математической статистики применимы лишь в случае независимости отдельных членов ряда друг от друга, то при анализе взаимосвязанных рядов динамики важно установить наличие и степень их автокорреляции.
Различаются два вида автокорреляции:
• автокорреляция в наблюдениях за одной или более переменными;
• автокорреляция ошибок или автокорреляция в отклонениях от тренда.
Наличие последней приводит к искажению величин среднеквадратических ошибок коэффициентов регрессии, что затрудняет построение доверительных интервалов для коэффициентов ре-грессии, а также проверку их значимости.
Автокорреляцию измеряют при помощи нециклического коэффициента автокорреляции, который может рассчитываться не только между соседними уровнями, т. е. сдвинутыми на один период, но и между сдвинутыми на любое число единиц времени (L). Этот сдвиг, именуемый временным лагом, определяет и порядок коэффициентов автокорреляции. Различают коэффициенты автокорреляции первого порядка (при L= 1), второго порядка (при L = 2) и т. д. Однако наибольший интерес для исследования представляет вычисление нециклического коэффициента первого порядка, так как наиболее сильные искажения результатов анализа возникают при корреляции между исходными уровнями ряда (у,) и теми же уровнями, сдвинутыми на одну единицу времени, т. е. y,_t (или У,+і).
Тогда формулу коэффициента автокорреляции можно записать следующим образом:
У/'Уі+і“У/ -У/+1 Га >
°У|°У,.|
где сту1 и сту/+1 — среднеквадратические отклонения рядов у, и yf+1 соответственно.
Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициентов автокорреляции сопоставляется с табличным (критическим) для 5%-ного или 1%-ного уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда).
Одна из специальных таблиц, в которой определена критическая область проверяемой гипотезы (об отсутствии автокорреляции), составленная Р. Андерсеном в 1942 г., приводится ниже.
Объем выборки |
Положительные значения |
Отрицательные значения |
||
5%-ный уровень |
1%-ный уровень |
5%-ный уровень |
1%-ный уровень |
|
5 |
0,253 |
0,297 |
-0,753 |
-0,798 |
6 |
0,345 |
0,447 |
- 0,708 |
- 0,863 |
7 |
0,370 |
0,510 |
- 0,674 |
- 0,799 |
8 |
0,371 |
0,531 |
- 0,625 |
-0,764 |
9 |
0,366 |
0,533 |
- 0,593 |
- 0,737 |
10 |
0,360 |
0,525 |
-0,564 |
- 0,705 |
11 |
0,353 |
0,125 |
- 0,539 |
- 0,679 |
12 |
0,348 |
0,505 |
-0,516 |
-0,655 |
13 |
0,341 |
0,495 |
- 0,497 |
- 0,634 |
14 |
0,335 |
0,485 |
-0,479 |
-0,615 |
15 |
0,328 |
0,475 |
- 0,462 |
- 0,597 |
20 |
0,299 |
0,432 |
- 0,399 |
-0,524 |
Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда фактическое значение больше табличного, можно сделать вывод о наличии автокорреляции в ряду динамики.
Для уменьшения автокорреляции применяют различные методы. Почти все они преследуют цель исключения основной тенденции (тренда) из первоначальных данных.
Наиболее распространенным примером выявления наличия автокорреляции в отклонениях от тренда или от регрессионной модели является использование критерия Дарбина—Уотсона (d), который рассчитывается по формуле
d=^----------------- ,
п
/=1
где е,=у,- уг_,
При условии, что отклонения уровней от тенденции (так называемые остатки) случайны, значения d, лежащие в интервале 0—4, всегда будут находиться ближе к 2. Если автокорреляция положительная, то d < 2; если отрицательная, то dнаходится в интервале от 2 до 4. Следовательно, оценки, получаемые по критерию, являются не точечными, а интервальными. Их величины для трех уровней значимости а = 0,01, а = 0,025 и а = 0,05 с учетом числа наблюдений даны в специальных таблицах.
Существует ряд способов исключения или уменьшения автокорреляции (авторегрессии) в рядах динамики: а) метод включения времени в качестве дополнительного фактора; б) метод последовательных разностей; в) метод авторегрессионых преобразований.
Уровни исходных динамических рядов могут быть представлены показателями в любой форме, в том числе в логарифмической, а время всегда вводится в линейной форме. Считается, что введение фактора времени снимает основную тенденцию развития всех явлений, представленных исследуемыми рядами динамики. Доказано, что введение времени аналогично использованию отклонения фактических данных от трендов.
Введение времени в качестве дополнительной переменной — наиболее действенный способ обработки связанных рядов динамики. Во всяком случае, при линейной связи между исследуемыми рядами этот способ более точен, чем использование последовательных разностей или отклонений от трендов.
При изучении развития явления во времени часто возникает необходимость оценить степень взаимосвязи в изменениях уровней двух или более рядов динамики различного содержания, но связанных между собой. Эта задача решается методами коррелирования: 1) уровней ряда динамики; 2) отклонений фактических уравнений от тренда; 3) последовательных разностей, т. е. путем исчисления парного коэффициента корреляции.
Коррелирование уровней ряда динамики правильно показывает тесноту связи между рядами динамики лишь в том случае, если в каждом из них отсутствует автокорреляция. При этом величину коэффициента корреляции находят по формуле
ху-х-у
Г =
где х, — уровни факторного ряда динамики; у — уровни результативного ряда динамики.
Следовательно, прежде чем коррелировать ряды динамики (по уровням), необходимо проверить каждый ряд на наличие или отсутствие в них автокорреляции (при помощи коэффициента автокорреляции, описанного в предыдущем параграфе). В случае наличия автокорреляции между уровнями ряда она должна быть устранена. Рассмотрим способы ее исключения в рядах динамики.