Главная

Модели динамических рядов при прогнозировании налоговых доходов

Рассмотрим теперь прогнозные модели, которые позволяют отражать гораздо более сложную динамику, чем простая регрессия зависимой переменной на временной тренд. Речь пойдет об основах эконометрики динамических рядов. Поскольку большинство прогнозов строится с использованием временных (динамических) рядов, знать приемы моделирования динамических рядов и уметь ими пользоваться необходимо всем, кто занимается прогнозированием. Если анализ динамики временного ряда позволяет обнаружить какие-то регулярные закономерности, которые можно экстраполировать на будущее, учет этих закономерностей в модели позволит сделать прогноз более точным. Прогноз стохастического временного ряда можно в некоторых случаях улучшить за счет включения в модель авторегрессионной составляющей и скользящих средних.

Статистическая теория, на которой основаны методы моделирования динамических рядов, слишком сложна и обширна, чтобы рассматривать ее здесь. Современные программы эконометрического прогнозирования позволяют рассчитывать авторегрессионные процессы и процессы скользящих средних автоматически, так что с технической точки зрения включение подобных членов в модель никакой сложности не представляет. Гораздо труднее бывает решить, стоит ли вообще включать подобные процессы в прогнозную модель. Принять правильное решение очень важно, поскольку при необоснованном включении авторегрессионных зависимостей и процессов скользящих средних модель может выдавать бессмысленные результаты.

Для применения этой методологии необходимо прежде всего установить, является ли интересующий нас временной ряд стационарным. Дело в том, что хорошие свойства оценок параметров моделей ARIMA (модели авторегрессии с интегрированными процессами скользящих средних - от англ. autoregressive integrated moving average) относятся только к случаю стационарных рядов. Впрочем, такое ограничение не слишком сильно сужает сферу применения моделей этого класса, поскольку многие нестационарные ряды приводятся к стационарному виду путем дифференцирования (перевода уровней в первые, вторые и т.д. разности). Если визуальный анализ показывает, что временной ряд случайным образом колеблется вокруг некоторого фиксированного уровня, например вокруг среднего значения, то такой ряд стационарен.

Допустим, что мы установили стационарность интересующего нас ряда или привели его к стационарному виду. Построим теперь динамическую модель этого ряда. Пусть γ1 - это переменная, прогноз которой необходимо построить. Представим ее в виде суммы двух слагаемых - систематического и несистематического (случайного) компонентов:

γ1 = ƒ ( ) + ε1

где функция ƒ ( • ) - систематический компонент;
ε1 - случайный компонент.

Предполагается, что случайный компонент имеет среднее значение, равное нулю, и постоянную дисперсию, т.е. дисперсию, которая не меняется с течением времени. Такие случайные величины называют обычно белым шумом.

В авторегрессионых моделях систематическая компонента представлена функцией от прошлых значений самой моделируемой переменной:

γ1 = ρ γt-s + ε1

где yt-s - значение временного ряда, соответствующее времени t - s;
ρ - коэффициент автокорреляции.

Данное уравнение представляет собой авторегрессию первого порядка, которая обозначается как AR (1), поскольку текущее значение переменной в нем пропорционально значению этой переменной за прошлый период плюс некоторая случайная ошибка.

Бывают авторегрессии и более высоких порядков - в них текущее значение моделируемой переменной зависит от прошлых значений самой этой переменной за несколько периодов. Например, уравнение

γ1 = ρ1 γt-1 + ρ2 γt-2 + . . . ρp γt-m + ε1

представляет собой авторегрессию m-го порядка (AR(m)), поскольку систематическая часть уравнения включает в себя m слагаемых запаздывания.

Большинство современных эконометрических пакетов обладает встроенными функциями оценки коэффициентов автокорреляции p1, пользуясь которыми, легко получить и сами оценки этих коэффициентов, и их стандартные ошибки. Сопоставляя значения оценок коэффициентов и их стандартных ошибок, можно судить о том, насколько сильно влияют прошлые значения переменной на ее текущее значение при условии, что ряд стационарен.

Оценки коэффициентов регрессии должны обладать «хорошими» статистическими свойствами. Одно из необходимых условий заключается в том, чтобы случайные возмущения, относящиеся к разным точкам наблюдений, не коррелировали между собой. Наличие процесса авторегрессии, или скользящей средней нарушает это требование. Таким образом, если в динамике моделируемого показателя присутствует авторегрессионный процесс или процесс скользящих средних, а в модели это не учтено, оценки параметров такой модели будут не так «хороши», как нам бы того хотелось. Они будут состоятельными, но неэффективными по сравнению с оценками, построенными с учетом систематической зависимости между ошибками. Еще хуже то, что оценки дисперсии параметров окажутся в этом случае смещенными и несостоятельными. На содержательном уровне это означает, что неучет авторегрессии или какой-либо иной закономерности в динамике остатков приводит к тому, что оценки дисперсии параметров модели оказываются неверными, хотя сами оценки параметров в среднем будут правильными. Но раз дисперсия оценок определена неверно, возникает опасность того, что и выводы будут сделаны неверные, и прогнозные свойства модели будут оценены неправильно.

Таким образом, выявление и статистическая оценка закономерностей, присутствующих в динамике временного ряда, - необходимое условие построения правильного прогноза. Судить о наличии авторегрессии остатков можно, например, по статистике Дурбина - Уотсона. Именно эта статистика используется для выявления закономерностей в динамике остатков уравнений регрессии чаще всего. Строго говоря, статистика Дурбина - Уотсона была изначально построена как тест на наличие среди остатков авторегрессии первого порядка. Обозначим ошибку прогноза для периода t за u1 Данный тест позволяет проверить, имеет ли место среди ошибок прогноза зависимость вида:

u1 = ρ u t-1 + ε1

«Нулевая гипотеза» заключается в том, что в этом уравнении ρ = 0. Практика показывает, что по значению статистики Дурбина - Уотсона можно судить о присутствии в динамике ошибок авторегрессии не только первого, но и любого другого порядка. Это относится только к процессам авторегрессии. Присутствие процесса скользящих средних статистика Дурбина -Уотсона обнаружить не позволяет.

Значения статистики Дурбина - Уотсона лежат в интервале от 0 до 4; если значение равно 2, то ρ = 0, т.е. между соседними ошибками корреляция не прослеживается. Значения этой статистики, близкие 0, указывают на наличие положительной автокорреляции (р > 0), а значения, близкие к 4, свидетельствуют о наличии отрицательной автокорреляции (ρ < 0). Критические значения статистики Дурбина - Уотсона приводятся в статистических таблицах, которые можно найти в любом учебнике по эконометрическому прогнозированию. Эта статистика имеет две степени свободы (k - 1) и Т, где k - число оцениваемых параметров модели, а Т- количество точек наблюдения.

Интересно отметить, что распределение статистики Дурби-на - Уотсона зависит от конкретных значений объясняющих переменных в оцениваемой модели, так что к значениям в таблицах следует относиться как к неким приближениям. Таким образом, пороговые табличные значения статистики Дурбина -Уотсона задают некоторый интервал, в котором находятся истинные значения этой статистики для рассматриваемой модели. Бывает, что значение этой статистики для оцениваемой модели попадает в интервал "неопределенности", в котором гипотезу об отсутствии автокорреляции нельзя будет ни отвергнуть, ни принять. Впрочем, на практике такие случаи встречаются редко. Гораздо чаще эта статистика ясно указывает на то, что «нулевую гипотезу» следует отвергнуть.

Пример. Предположим, что нам нужно построить прогноз объема розничной торговли (Р) по месяцам. На рисунке представлены графики объема розничной торговли.

Графики объема розничной торговли:
в натуральном выражении - сплошная линия и в постоянных ценах, приведенных к декабрю 1995 г., - пунктирная линия

Анализ этого временного ряда показывает, что в январе объемы розничной торговли ниже, чем в другие месяцы, поэтому мы создадим так называемую «фиктивную переменную» Ф1, которая в январе принимает значение 1, а во все остальные месяцы года равна нулю. Первый вариант модели мог бы быть таким:

Оценим модель по месячным данным за период с января 1994 г. по апрель 1997 г. После оценки модели с помощью эконометрической компьютерной программы статистика Дурбина - Уотсона оказалась равной 0,788. Число степеней свобода в этом примере составляет: (k-1) = 1 и Т - 40. По таблице критических значений статистики Дурбина - Уотсона определяем, что при 1 и 40 степенях свобода нижнее критическое значение равно 1,35, верхнее-1,45. При значениях меньше 1,35 нулевую гипотезу об отсутствии автокорреляции можно с уверенностью отвергнуть, а при значениях больше 1,45 отвергнуть ее нельзя. Полученное нами значение 0,79 говорит о том, что нулевую гипотезу об отсутствии автокорреляции следует отвергнуть. Поэтому мы должны изменить спецификацию модели, представив индекс объема розничной торговли (Р) в виде авторегрессии. Фиктивную переменную Ф1 мы в модели сохраняем.

Результаты оценки данной модели, представленные в таблице, показывают, что объемы розничной торговли в январе ниже, чем в другие месяцы года - об этом можно судить по отрицательному коэффициенту при Ф1. Данное явление удалось измерить довольно точно, на что указывает низкая стандартная (среднеквадратическая) ошибка и высокое значение t-статистики коэффициента при Ф1.

Динамическая модель объема розничной торговли

Если в прошлом месяце объем розничной торговли был высоким, то и в текущем месяце он скорее всего будет высоким (положительный коэффициент Р-1 при авторегрессии AR(1)). От значения того же показателя три месяца назад Р-3 текущий объем розничной торговли зависит достаточно слабо. Авторегрессию второго порядка (объем розничной торговли два месяца назад) из модели пришлось исключить, поскольку стандартная ошибка коэффициента при ней получилась очень большой по сравнению с оценкой самого коэффициента. Для прогнозирования эта модель вряд ли пригодна - коэффициент детерминации R2 у нее составляет всего лишь 0,49, т. е. с помощью этой модели удалось объяснить менее 50% динамики показателя объема розничной торговли.

В моделях скользящих средних предполагается, что случайный компонент зависит от своих собственных прошлых реализаций. Процесс скользящей средней (МА - от англ. moving average) записывается так:

Свободный член β0 можно интерпретировать как среднее значение временного ряда. Вышеприведенное уравнение - это процесс скользящей средней q-ro порядка (МА(q)), поскольку в уравнении участвует q значений случайной ошибки, взятых с запаздыванием (лагом). В моделях МА предполагается, что текущее значение переменной y1 зависит от полинома оператора запаздывания, примененного к случайной ошибке.

Авторегрессионные компоненты и процессы скользящих средних часто используются вместе в одной и той же однофакторной модели - такие модели называются моделями ARMА. При работе с достаточно длинными временными рядами часто удается строить хорошие прогнозы, полагаясь исключительно на прошлую динамику самой прогнозируемой переменной, т.е. не используя в модели ничего другого, кроме самого моделируемого ряда, процессов авторегрессий и скользящих средних. Однако если прогнозируемая переменная на имеющемся периоде наблюдений испытывала воздействие структурных изменений (например, на нее мог повлиять резкий скачок в динамике переменной: изменение в законодательстве, дефолт в августе 1998 г. и др.), обычно приходится вводить в модель и другие компоненты.

Вернемся теперь к нашей модели динамики розничной торговли. В таблице приведен другой вариант модели.

 Вариант динамической модели розничной торговли

Судя по результатам, добавление процессов скользящих средних позволило существенно повысить прогнозные свойства этой модели. Перепробовав разные варианты, мы убедились, что компоненты скользящих средних третьего и двенадцатого порядков обеспечивают наибольшую близость расчетных данных данным наблюдений. Какие именно запаздывания (в статистике их называют «лагами») стоит попробовать использовать в модели, зависит от того, с какими данными приходится работать. Опыт показывает, что при работе с месячными данными включение в модель слагаемого МА (12) часто дает хорошие результаты. При работе с квартальными данными рекомендуется попробовать включить в модель слагаемое МА.

Вопросу о том, на какие признаки временного ряда следует обращать внимание, чтобы правильно подобрать авторегрессионные члены и процессы скользящих средних, посвящено много книг. В основном в этих целях рекомендуют ориентироваться на графики функций автокорреляции и частной автокорреляции.

Следует иметь в виду, что статистика R2 в моделях со скользящими средними не может служить надежным ориентиром при выборе спецификации, поскольку для оценки коэффициентов, стоящих при членах МА, используется нелинейная процедура оценки. Когда оценивается нелинейная модель, диапазон возможных значений R2 уже не ограничивается интервалом от 0 до 1, и содержательная ценность этой статистики снижается, хотя в большинстве статистических пакетов она включается в состав стандартной выдачи и при оценке нелинейных моделей. Нужно просто иметь в виду, что при подборе спецификаций нелинейных моделей рекомендуется пользоваться не только коэффициентом детерминации R2, сколько другими критериями. В последнее время большое распространение получили различные информационные критерии, например информационный критерий Акайка и критерий Шварца.

Rambler's Top100

Copyright © 2010