Главная

Статистические модели выбора плательщиков

Большинство моделей статистического выбора плательщиков распадается на два типа: модели двоичного отклика (бинарные модели) и регрессионные модели. Хотя налоговые ведомства разных стран обычно предпочитают пользоваться каким-то одним типом моделей, все же более предпочтительным вариантом было бы совместное использование моделей и того, и другого типа. Модели двоичного отклика показывают, насколько высока вероятность того, что проверка данного предприятия даст дополнительные налоговые начисления, а регрессионные модели показывают, доначислений какого размера можно ожидать, если проверка окажется результативной. Для принятия обоснованного решения о том, следует или не следует проводить документальную проверку по данной налоговой декларации, желательно иметь оба типа информации.

Модели бинарного отклика тоже бывают разными. Наибольшую известность получили дискриминантные модели - модели «пробит» (probit) и «логит» (logit). Модели логит и пробит применяются тогда, когда анализируются количественные данные, отражающие выбор между двумя альтернативами - «да - нет». Моделируемая переменная при этом всегда является бинарной, а ее прогнозное значение показывает вероятность того, что она примет единичное значение. Модели различаются тем, какую функцию распределения зависимой переменной они используют (логит - логистическую, пробит - нормальную).

Общее у всех этих моделей то, что они позволяют оценивать вероятность того, что налогоплательщик с данными характеристиками окажется «продуктивным», если будет подвергнут документальной проверке. Так, в модели логит вероятность осуществления дополнительных налоговых начислений по результатам проверки данного плательщика описывается логистической функцией, которая математически записывается так:

exp (Вт X) / [ 1 + exp (Вт X)],

где X = (Х1, Х2 ... , Хn) - вектор объясняющих переменных;
В = (В1, В2, ... ,Вn) - вектор фиксированных коэффициентов;
т - знак транспонирования.

В качестве объясняющих переменных могут выступать фиктивные переменные, принимающие значение 1, если у данного плательщика присутствует некоторый атрибут (например, на поступившей от него налоговой декларации была задекларирована некоторая ненулевая сумма причитающихся с него налогов), и 0 в противном случае. С другой стороны, в качестве объясняющих могут также использоваться переменные, отражающие сумму (в рублях), указанную на той или иной строке отчета, или отношение величин, указанных в разных графах. Если объясняющая переменная умножается на положительный коэффициент;, это значит, что чем больше значение этой переменной, тем больше вероятность того, что проверка предприятия, к которому она относится, даст дополнительное начисление налогов. Отрицательный знак коэффициента, на который умножается объясняющая переменная, имеет противоположный смысл. Значения коэффициентов заранее не известны, они получаются в результате статистической оценки модели заданной спецификации по данным о предприятиях, о которых имеются как стандартные данные, так и результаты произведенных проверок. Чтобы построить оценки коэффициентов такой модели, необходимо иметь значения моделируемой бинарной переменной, отражающей начисление дополнительных налогов в результате проверки, а также значения объясняющих переменных, включенных в модель.

Модель можно записать в виде математической формулы, которая показывает, насколько высока вероятность того, что налоговая проверка данной налоговой декларации (вернее, предприятия или иного плательщика, ее подавшего) даст дополнительные налоговые начисления. «Пропустив» через такую математическую формулу или модель все поданные декларации, мы сможем, таким образом, составить список плательщиков, которые могут считаться потенциальными кандидатами на проведение налоговой проверки. Как показывает практика, применение любых моделей бинарного отклика (логит, пробит или дискриминантного анализа), как правило, дает весьма схожие результаты.

Недостатком моделей двоичного отклика является то, что они моделируют вероятность положительного исхода документальной проверки, т.е. того, что по результатам такой проверки будут сделаны дополнительные начисления, но не позволяют предсказать величину этих начислений. Таким образом, они позволяют более или менее точно идентифицировать плательщиков, пытающихся уйти от налогов, но не позволяют различать случаи мелкого и крупного «ухода от налогов», а ведь именно эти случаи обычно интересуют налоговые службы.

Регрессионные методы и модели обычно используются для того, чтобы объяснить, от каких факторов зависит величина дополнительных налоговых начислений у плательщиков, которым такие начисления (ненулевые) были сделаны. В качестве зависимой переменной обычно выступает та или иная переменная, отражающая результативность документальной проверки, а в качестве объясняющих переменных, точно так же, как в моделях бинарного отклика, выступают различные характеристики налогоплательщика. Когда мы оценим, чему равны неизвестные коэффициенты модели, мы сможем применить построенное регрессионное уравнение ко всей совокупности налоговых деклараций и по каждой из них предсказать размер дополнительных налоговых начислений в случае проведения документальной проверки. Недостатком регрессионных методов, когда эти методы не подкрепляются моделью бинарного отклика, является неучет вероятности того, что некоторые документальные проверки могут не приводить к дополнительным начислениям. Таким образом, они позволяют предсказывать величину дополнительных начислений в случае продуктивной проверки, но не содержат никакой информации о том, насколько высока вероятность того, что дополнительные начисления будут произведены, т.е. что проверка окажется продуктивной.

Комбинированный подход отбора налогоплательщиков путем использования статистических моделей является наиболее целесообразным. Модель бинарного отклика дает оценку вероятности того, что проверка данного предприятия окажется продуктивной, а регрессионная модель показывает, насколько большим может быть доначисление в случае, если проверка окажется продуктивной. Таким образом, перемножив эти два числа одно на другое, мы получим оценку продуктивности проверки, т.е. оценку ожидаемого размера начислений. Такая информация была бы полезна не только для принятия обоснованного решения о том, какие предприятия следует проверить, но и для прогнозирования налоговых поступлений. Зная, сколько средств выделено на проведение проверок предприятий, можно заранее рассчитать, сколько доходов может быть дополнительно начислено по результатам документальных проверок задолго до того, как будут проведены сами проверки.

Rambler's Top100

Copyright © 2010