Return to search

Modelo de predicción de default tributario de contribuyentes del segmento de micro y pequeña empresa del Servicio de Impuestos Internos de Chile

Ingeniera Civil Industrial / En Chile, durante los últimos años, ha habido un aumento en la tasa de evasión de impuestos, observándose que, en particular para el IVA esta cifra ha crecido un 8,5% con respecto el año 2007. Cada punto porcentual se traduce en una pérdida de recaudación de 350 millones de dólares, por lo que se hace necesario el diseño de un plan que revierta este efecto.
La presente memoria consiste en el desarrollo de un modelo estadístico que permita predecir el default en la declaración y pago de IVA para los contribuyentes de Micro y Pequeña empresa. Teniendo como resultado la detección de las variables que más influyen en esta conducta, la probabilidad de default de cada contribuyente para el período tributario julio 2013 y la identificación del porcentaje de default según zona geográfica.
La metodología de trabajo contempla las etapas de entendimiento del negocio, extracción de la información, preparación de datos, modelamiento y finalmente, la interpretación de los resultados. Dada la inexistencia de trabajos publicados en materia de default tributario, el sustento teórico de esta investigación se basa en el credit scoring, técnica utilizada en la industria bancaria.
Se toma como fuente de información el Data Warehouse del SII, con el que se construyen 55 variables que reflejan características demográficas, índices de liquidez, movimientos de caja, comportamiento y tamaño del negocio. Se prueban tres algoritmos de clasificación: árboles de decisión, regresión logística y redes neuronales. Se elige como modelo definitivo el de regresión logística, dada su clara interpretabilidad y buena capacidad de predicción, que alcanza una precisión global de 68,81%, especificidad de 67,29% y sensibilidad de 68,88%, cumpliendo con el objetivo inicial de obtener el mejor modelo predictivo balanceado posible.
Respecto de las variables, los resultados indican que las de mayor relevancia se relacionan con el historial de cumplimiento del F29, dónde se presenta una clara segmentación de los contribuyentes en tres tipos de conducta. Respecto de la identificación por zona geográfica, se aprecia el mayor porcentaje de default para la zona del norte grande del país, y el menor para la Región de Magallanes y la zona Centro y Oriente de la Región Metropolitana.
Se concluye que la presencia de errores en la información proporcionada por los contribuyentes, así como la cantidad de campos nulos encontrados, hace que aún no se cuente con una base de datos óptima para aplicar la técnica de credit scoring. El SII se encuentra trabajando en esta línea, lo que permitirá en un futuro obtener mejores resultados. Como recomendación final se propone utilizar las predicciones obtenidas para diseñar un plan de medidas preventivas, así como también evaluar el desarrollo de un modelo de alta precisión y baja especificidad que se enfoque en la detección de los defaulters más críticos.

Identiferoai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/115243
Date January 2013
CreatorsRettig Infante, Trinidad Sofia
ContributorsBravo Román, Cristián Danilo, Facultad de Ciencias Físicas y Matemáticas, Departamento de Ingeniería Industrial, Weber Haas, Richard, Cruz González, José
PublisherUniversidad de Chile
Source SetsUniversidad de Chile
LanguageSpanish
Detected LanguageSpanish
TypeTesis
RightsAttribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/

Page generated in 0.0027 seconds