Главная

Структурные экономические модели при прогнозировании налоговых доходов

Рассмотрим второй большой класс моделей, используемых для прогнозирования, - структурные экономические модели. Они представляют собой стохастические уравнения, которые устанавливают зависимость между моделируемой переменной, представленной в виде временного ряда, и некоторым набором экономических показателей, также представленных в виде временных рядов. Основная идея этого подхода заключается в том, что динамика временного ряда, прогноз которого требуется построить, может зависеть от поведения некоторых других переменных, по которым у нас имеются данные. Предположим, например, что мы хотим построить прогноз поступлений налога на прибыль предприятий. В структурной модели динамика поступлений налога на прибыль (этот показатель называется зависимой переменной) представляется в виде функции от некоторого набора объясняющих или независимых переменных, например от индекса потребительских цен или темпа инфляции.

При использовании структурных моделей неявно предполагается наличие причинно-следственных связей между зависимой и независимыми переменными: при изменении независимых переменных изменяется и зависимая. Направление причинно-следственных связей должно при этом идти от независимых переменных к зависимой (моделируемой) переменной. Подобная интерпретация позволяет подбирать объясняющие переменные исходя из качественных, содержательных соображений.

У структурных моделей есть много достоинств для использования при прогнозировании. Во-первых, они нередко позволяют получить очень хорошие результаты даже при моделировании переменных, которые, казалось бы, ведут себя непредсказуемым, чисто случайным образом. С помощью однофакторных (динамических) моделей хорошего прогноза таких переменных не построишь. Например, динамику налога на прибыль не удается удовлетворительным образом объяснить, используя одни только авторегрессионные зависимости. Однако если между поступлениями от налога на прибыль и индексом промышленного производства существует устойчивая зависимость, то включение в модель этого индекса может существенно улучшить ее прогнозные свойства.

В общем виде структурная модель записывается так:

y1 = β0 + β1 хt1 + β2 хt2 + β3 хt3 + u1

где yt - значение моделируемой переменной в момент времени t.

В правой части уравнения представлены объясняющие переменные, которые могут влиять на значение моделируемой переменной. Объясняющие переменные обозначены как хt1, хt2, xt3 Неизвестными параметрами модели являются коэффициенты β1, которые показывают, как влияют изменения в независимых переменных на зависимую переменную. Последний член в правой части u1 представляет собой случайное возмущение. Случайное возмущение или остаток модели отражает ту часть динамики моделируемой переменной у, которую не удалось объяснить за счет включения в модель объясняющих переменных хt1 .

Модель, записанная в виде уравнения выше, линейна как по параметрам, так и по переменным (переменная у - это простая линейная функция от хt1). Параметры линейных моделей имеют простую содержательную интерпретацию. Например, коэффициент β1 показывает, как изменится моделируемая переменная у, если одна только переменная x1 изменится на единицу, а все остальные переменные останутся прежними. Свободный член модели β0 математически интерпретируется так: он показывает, чему будет равен у, если все переменные в правой части примут значение 0. К сожалению, никакого содержательного, экономического смысла подобная математическая интерпретация обычно не имеет.

Примером структурной модели является следующая модель поступлений налога на прибыль предприятий:

Рпри6t = β1 + β1 Рпромt + β2 Pзарпt + β3 Ф1t + β4 Ф2t + u1

Переменные в этой модели определяются так: Рпри6 β1 - объем поступлений налога на прибыль в федеральный бюджет в месяце t, деленный на индекс потребительских цен за соответствующий месяц; Рпромt - выпуск продукции промышленности в сопоставимых ценах (т.е. с поправкой на инфляцию, представленную индексом потребительских цен); Pзарпt - уровень среднемесячной зарплаты в реальном выражении; Ф1 - бинарная (фиктивная) переменная, которая принимает значение, равное 1, в январе и феврале и нулю во все остальные месяцы года; Ф2 - фиктивная переменная, отражающая влияние изменений в налоговом законодательстве, вступивших в силу с 1 октября 1996 г.; до октября 1996 г. эта переменная равна нулю, а начиная с октября 1996 г. и во все последующие месяцы она равна единице. Ниже мы будем говорить о фиктивных переменных подробнее.

Содержательная интерпретация параметров этой модели будет, конечно, зависеть от того, в каких единицах измеряются сами переменные. Пусть, например, переменная Рпри6 измеряется в тысячах рублей, а индексная переменная Рпром - безразмерная. В этом случае изменение переменной Рпром на единицу будет означать, что поступления налога на прибыль изменились на тысячу рублей. Если мы оценим эту модель и окажется, что коэффициент β1, равен 2, то это будет означать, что при росте индекса производства потребительских товаров на один процентный пункт доходы поступления налога на прибыль возрастут на 2 тыс. руб.

Чтобы структурную модель можно было использовать для получения прогнозов, необходимо оценить ее параметры. В примере с моделью налога на прибыль предприятий таких параметров пять (β0, β1, β2, β3, β4). Обозначим этот вектор. Необходимо также найти прогнозные значения переменных, стоящих в правой части уравнения. Обозначим вектор значений объясняющих переменных (1, Рпром, Рпри6, Рзарп, Ф1, Ф2) = (1, х1, х2, х3, х4) за хp.

Неизвестные параметры модели, оцениваются с помощью метода наименьших квадратов для множественных регрессий. Метод наименьших квадратов позволяет получить оценки, минимизирующие сумму квадратов остатков

где хi-вектор объясняющих переменных,
β - искомый вектор неизвестных параметров модели.

Статистические свойства оценок характеризуют точность, с которой полученная тем или иным методом оценка отражает истинное значение соответствующего параметра генеральной совокупности. При этом предполагается, что спецификация самой модели построена правильно, так что, когда мы рассматриваем свойства оценок коэффициентов уравнения, мы не ставим вопрос о том, подходит ли для моделирования временного ряда у линейная зависимость. Тесты, позволяющие в определенной мере проверять правильность спецификации модели, также существуют. Они в основном построены на сравнении разных моделей между собой.

Свойства оценок зависят от выбранного метода оценивания и выводятся из некоторого набора предположений относительно стохастических взаимосвязей между переменными модели. Переменная ut называется ошибкой. Она представляет собой разность между конкретной реализацией стохастической переменной yt и ее математическим ожиданием (условной средней), которая для линейной модели определяется как

Е (yt | xt) = xt β, где E (•) - знак математического ожидания;

Е (ut | xt) = 0. Данное предположение означает, что xt не коррелирует с ut

Е (ut2 | xt) = y2 для t = 1,2,..., Т;

Е (u1 us | xt) = 0 для t = s.

При этих предпосылках оценки, полученные методом наименьших квадратов, обладают следующими полезными свойствами.

Несмещенность - оценка является несмещенной, если ее математическое ожидание равно значению соответствующего параметра для всей генеральной совокупности. Пусть ß - это оценка параметра β. Оценка является несмещенной, если Е( ß ) = β. На содержательном уровне это означает, что, хотя

для разных выборок оценка параметра будет разной, в среднем эти разные значения будут совпадать с истинным значением параметра генеральной совокупности. Смещение оценки определяется так: смещение ( ß )= Е ( ß ) - β

Состоятельность - оценка является состоятельной, если при бесконечном увеличении размеров выборки ее значение сходится по вероятности к истинному значению параметра генеральной совокупности, т.е. lim( ß ) = ?. На содержательном уровне это означает, что при стремлении размеров выборки к бесконечности вероятность того, что оценка будет отличаться от истинного значения параметра, стремится к нулю. Опираясь на материалы предыдущего раздела, рассмотрим результаты оценивания модели налога на прибыль предприятий.

Налог на прибыль

Оценки коэффициентов показывают, как отражаются изменения переменных, стоящих в правой части уравнения, на значении моделируемой переменной. Для содержательной интерпретации оценок коэффициентов необходимо, как мы уже говорили, знать, в каких единицах измерены переменные. Предположим, например, что в модели налога на прибыль предприятий налоговые поступления выражены в миллионах рублей в месяц, а среднемесячная зарплата (Pзарп ) - в рублях. Обратившись к результатам оценивания модели, мы видим, что оценка коэффициента при реальной среднемесячной зарплате равна -8,43, что означает, что при повышении среднемесячной зарплаты на 1 рубль поступления от налога на прибыль предприятий сокращаются примерно на 8,4 млн руб. Коэффициент при переменной Pпром оказался равным 3,95. Это означает, что при увеличении индекса производства на один процентный пункт поступления от налога на прибыль предприятий возрастут почти на 4 млн руб.

Мера разброса оценок коэффициентов указана в столбце «Стандартная ошибка». Значения, стоящие в этом столбце, представляют собой корни квадратные из среднеквадратических отклонений оценок коэффициентов, т.е. стандартные ошибки коэффициентов. Если стандартная ошибка мала по сравнению со значением самого коэффициента, оценку можно считать достаточно точной. Так, стандартная ошибка коэффициента при индексе реального производства оказалась равной 1,03, тогда как сама оценка коэффициента получилась равной 3,9. Это неплохой результат, т.е. оценку можно считать достаточно точной. При реальной среднемесячной зарплате (Pзарп ) стандартная ошибка по сравнению с коэффициентом получилась достаточно большой.

Расчетные значения стандартных ошибок используются для проверки гипотез, относящихся к коэффициентам модели. Большинство статистических пакетов автоматически проверяет набор гипотез о коэффициентах при расчете оценок модели и выдает результаты этой проверки вместе с результатами оценки. Проверяемые гипотезы касаются наличия статистически существенной связи между той или иной объясняющей переменной и моделируемой переменной. Вернее, проверяется гипотеза о том, что между некоторой объясняющей переменной и моделируемой переменной статистически существенная связь отсутствует (это так называемая «нулевая гипотеза»), и если эту гипотезу не удается отвергнуть, принимается альтернативная гипотеза о том, что между моделируемой и объясняющей переменной имеется статистически значимая связь. Если мы обозначим коэффициент при Pзарп как β2, нулевая гипотеза записывается как Н0: β2 = 0 (читается эта запись так: «нулевая гипотеза о том, что коэффициент β2 равен нулю»). Если данную гипотезу не удастся отвергнуть, это будет означать, что существование связи между реальной среднемесячной зарплатой и поступлениями налога на прибыль предприятий не подтверждается статистическими данными.

Показатель, по величине которого судят о том, можно ли отвергнуть гипотезу о равенстве коэффициента нулю, называется t-статистикой. Значения этого показателя для разных коэффициентов модели приводятся в столбце «t-статистика». Необходимо иметь в виду, что проверки гипотез осуществляются для каждого коэффициента отдельно. Иными словами, мы проверяем наличие статистической связи между объясняющей переменной Рзарп и моделируемой переменной Рприб при условии, что все остальные переменные включены в модель. Значения t-статистики рассчитываются очень просто. Предположим, например, что нам необходимо решить, какую гипотезу выбрать - нулевую, которая записывается как Н0: β1 = 0, или альтернативную, которая записывается как Н1: β1 0. Значение t-статистики определяется по формуле:

t-статистика = (β1 - 0) / стандартная ошибка

 

Если «нулевая гипотеза» верна, то вышеуказанная t-статистика имеет распределение Стьюдента при (n - k) степенях свободы, где n - это число точек наблюдений, по которым была оценена модель, а k - количество оцениваемых коэффициентов модели. Решение о том, можно ли отвергнуть нулевую гипотезу, принимается на основе сравнения полученного значения t-статистики со значением, указанным в таблице критических значений распределения Стьюдента. При этом, за исключением случаев, когда точек очень мало, можно ориентироваться не на табличные значения, а на простое правило: если t-статистика по абсолютной величине больше 2, нулевая гипотеза об отсутствии связи может быть отвергнута.

Для проверки нулевой гипотезы можно использовать и другой критерий. В последнем столбце озаглавленном «Вероятность», указана вероятность получения значения t-статистики, приведенного в предыдущем столбце, если нулевая гипотеза об отсутствии связи истинна. Например, для коэффициента при Рпром вероятность такого события равна 0,0005. Это означает, что если бы истинное значение параметра Рпром было равно нулю, вероятность получения t-статистики, равной 3,85, составляла бы меньше одной тысячной. В данной модели только у среднемесячной зарплаты значение t-статистики не удовлетворяет стандартному критерию статистической значимости (указанная в последнем столбце вероятность равна 0,11, что превышает обычно используемый 5-процентный уровень).

Хотя может возникнуть желание удалить переменную Рзарп из модели на том основании, что у нее низкая t-статистика, с этим лучше не торопиться. Если состав объясняющих переменных был подобран исходя из содержательных соображений, т.е. если логика подсказывает, что данная переменная должна оказывать влияние на моделируемый показатель, прежде, чем ее исключать, лучше провести ряд дополнительных проверок. Конечно, если переменная была введена в модель просто «на пробу» в порядке эксперимента и у нее оказалась низкая t-статистика, такую переменную вполне можно исключить из модели без всяких дополнительных проверок. Предположение же о том, что поступления в бюджет от налога на прибыль зависят от уровня средней заработной платы (Рзарп ), представляется вполне разумным, поэтому эту переменную лучше оставить в модели.

Аналогичным образом интерпретируются и все остальные значения, стоящие в столбцах «t-статистика» и «Вероятность». Заметим, что с помощью t-статистики можно проверять и другие простые гипотезы относительно параметров модели. Проверим, например, гипотезу о том, что увеличение индекса промышленного производства (Рпром ) на один процентный пункт приводит к росту налоговых поступлений на 5 млн руб. Нулевая и альтернативная гипотезы записываются в этом случае так:

Н0: β1 = 5,    Н1: β1 5

Значение t-статистики нулевой гипотезы в этом случае равно

 

По таблице значений t-статистики определяем, что при 5-процентном уровне значимости и 19 степенях свободы критическое значение равно 2,093, так что полученное нами значение по абсолютной величине не превышает критического порога. Нулевую гипотезу о том, что истинное значение параметра равно 5, отвергнуть нельзя.

Фиктивными переменными называются искусственно созданные переменные, принимающие значения нуль или единица. Такие переменные могут использоваться, в частности, для того, чтобы описать некоторые систематические закономерности в динамике моделируемой переменной. Фиктивные переменные .вводятся в состав модели в качестве объясняющих переменных. Тогда при оценивании модели степень воздействия соответствующего систематического фактора на моделируемую переменную получает количественное выражение в виде коэффициента при фиктивной переменной. Допустим, мы моделируем поступления некоторого налога, который предприятия обязаны платить в первом месяце каждого квартала. Ясно, что в динамике этого налога будет прослеживаться квартальный цикл, обусловленный порядком уплаты этого налога: в первом месяце каждого квартала будет наблюдаться резкий скачок поступлений. В этом случае в модель имеет смысл ввести фиктивную переменную, которая будет принимать значение 1 в январе, апреле, июле и октябре, а во все прочие месяцы будет равна 0.

Кроме того, фиктивные переменные могут применяться для учета структурных однократных сдвигов в динамике моделируемой переменной. Причиной подобных сдвигов в динамике налоговых поступлений чаще всего бывает внесение изменений в налоговое законодательство. Например, поступления некоторого налога в бюджет могут скачкообразно увеличиться в результате включения в налоговую базу новых объектов обложения. В этом случае в модель можно ввести фиктивную переменную, которая будет равна нулю до того момента, как изменение в законодательстве вступило в силу, и единице после. Если этого не сделать, т.е. если не включить в модель фиктивную переменную, отражающую произошедший структурный сдвиг, во временном ряду значений налоговых поступлений останется «шум», который не удастся объяснить влиянием других переменных. Включенные в модель налога на прибыль фиктивные переменные вносят существенный вклад в объяснение динамики моделируемой переменной. На это указывает высокое (по абсолютной величине) значение t-статистик и их коэффициентов (или малая величина стандартных ошибок коэффициентов по сравнению со значениями самих коэффициентов).

Прежде чем использовать ту или иную модель для прогнозирования интересующей нас переменной, необходимо оценить прогнозные свойства этой модели. Ниже мы рассмотрим некоторые статистические критерии, помогающие сравнивать разные модели с точки зрения их прогнозных свойств и выбирать лучшие. При этом не следует забывать, что знания и опыт эксперта не менее важны для выбора наилучшей модели, чем чисто формальные статистические критерии.

Предположим, что у нас есть месячные данные по объемам розничной торговли (Pm)и мы должны решить, какая модель лучше подойдет для прогнозирования этого показателя - простая авторегрессия первого порядка, которая записывается как

или модель, в которой, помимо авторегрессии, участвует еще показатель реального экспорта. У первой модели коэффициент детерминации R2 равен 0,408, a R2 с поправкой на число степеней свободы равен 0,377. У второй модели, в которой участвует показатель экспорта, R2 равен 0,412, зато R2 с поправкой на число степеней свободы ниже, он равен 0,36. Таким образом, первая модель работает лучше.

Еще одним критерием, позволяющим сравнивать модели между собой, является показатель F-статистики. Этот показатель аналогичен R2 и, по существу, не добавляет никакой новой информации, помимо той, которая уже содержится в R2. Он используется для проверки «нулевой гипотезы» о том, что все параметры модели, за исключением свободного члена, равны нулю:

Н0: β1 = β2 = β3 = . . . = βk = 0

Если значение t-статистики не позволяет отвергнуть нулевую гипотезу, это говорит о том, что спецификация модели подобрана плохо.

Построение прогноза с помощью структурной модели состоит из двух этапов. Во-первых, необходимо получить прогнозные значения используемых в модели объясняющих переменных за тот период, за который необходимо построить прогноз. Во-вторых, эти данные необходимо ввести в модель и рассчитать прогноз.

Предположим, например, что нам необходимо построить прогноз валового внутреннего продукта (ВВП) на первый квартал 1998 г. Используемая модель ВВП в качестве объясняющих переменных включает реальный курс обмена рубля, а также другие переменные и записывается в виде

где Bt - валовой внутренний продукт в t-м квартале;
Rt- реальный обменный курс (обменный курс рубля в постоянных ценах) в t-м квартале;
хt1 - прочие переменные, от которых зависит ВВП.

Для расчета прогнозных значений ВВП на три месяца вперед нам необходимо знать, каким будет курс обмена рубля в эти три месяца. Ясно, что фактическими данными за будущие периоды мы не располагаем, придется использовать прогнозные значения. Прогноз обменного курса рубля можно построить самим, можно воспользоваться готовым прогнозом, если его удастся найти (например, прогнозом Центрального банка РФ), или рассмотреть несколько сценариев динамики этой переменной - пессимистический, оптимистический и средний.

Если мы решим строить прогнозы объясняющих переменных самостоятельно, придется для каждой такой переменной построить и оценить собственную модель. Шаг этот чрезвычайно ответственный, поскольку очевидно, что точность итогового прогноза будет во многом определяться точностью прогноза объясняющих переменных, с помощью которых этот прогноз был построен.

Под сценариями подразумеваются разные наборы объясняющих переменных. Иначе говоря, при использовании сценариев задается несколько разных наборов значений переменных, используемых в правой части уравнения, а затем для каждого такого набора рассчитывается собственный прогноз. Если задать два набора значений объясняющих переменных - один для наилучшего варианта экономического развития, другой - для наихудшего и для каждого из них построить свой прогноз, то это даст нам представление о диапазоне возможных значений валового внутреннего продукта в зависимости от экономической ситуации в стране. Разумеется, при выборе конкретного значения из этого диапазона в качестве прогнозного придется полагаться на собственное суждение или на мнение других экспертов о том, какой именно вариант экономического развития является наиболее вероятным.

Построив прогнозы объясняющих переменных (получив их из внешних источников или выбрав вероятные сценарии развития), можно переходить ко второму этапу прогнозирования.

Если вернуться к примеру с моделированием налога на прибыль предприятий, необходимо ввести будущие значения реальной заработной платы и других объясняющих переменных в компьютер в формате той программы или того статистического пакета, с помощью которого будет строиться прогноз. Дальнейшие действия будут зависеть от используемого статистического пакета.

В таблице представлены фактические и прогнозные значения (полужирный шрифт) объясняющих переменных, участвующих в модели налога на прибыль предприятий:

Объясняющие переменные в модели налога на прибыль предприятий

По этим значениям с помощью модели был рассчитан прогноз поступлений налога на прибыль предприятий на июнь, июль, август и сентябрь 1997 г. Фактические и прогнозные значения (полужирный шрифт) поступлений налога на прибыль представлены в таблице и на рисунке.

Фактические и прогнозные значения поступлений налога на прибыль предприятии

Диаграмма фактических и прогнозных значений
(светлая линия) поступлений налога на прибыль

Rambler's Top100

Copyright © 2010