Sistema de Scoring de aseguramiento aplicado a un seguro de automóviles mediante la implementación de modelos predictivos y algoritmos de aprendizaje
Fecha
2024
Tipo
tesis de maestría
Autores
González Chaves, Lauren Tatiana
Ugarte Quesada, Angie
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
En el presente documento se propone la implementación de un sistema de scoring de aseguramiento aplicado a un seguro de automóviles, utilizando modelos predictivos y algoritmos de aprendizaje automático. El objetivo principal es desarrollar un perfil de riesgo inicial al momento de suscripción, optimizando así la
evaluación y tarificación de asegurados. Para este fin, se emplean varios modelos predictivos, incluyendo K vecinos cercanos (KNN), Arboles de Decisión, Bosques Aleatorios, AdaBoost (ADA) y Gradient Boost Tree (GBT). Se eval´uan estos modelos en términos de precisión global, precisión positiva, precisión negativa, área bajo la curva (AUC) y otras. Se parte de una cartera de aseguramiento con más de cinco años de datos suministrados por el Instituto Nacional de Seguros, complementada con un histórico de siniestros de más de diez años. A estos datos se les aplica un proceso de imputación para garantizar la calidad y completitud de la información disponible. Al tratarse de un problema desbalanceado, la metodología utilizada incluye un método de balanceo de datos para mejorar el aprendizaje y la identificación de patrones en la clase minoritaria. Los algoritmos individuales fueron ajustados mediante barrido paramétrico para identificar los hiperparámetros que optimizaran sus indicadores de desempeño. Una vez seleccionados estos hiperparámetros, se sometieron a validación cruzada. Los algoritmos con mejor desempeño avanzaron a una segunda etapa, donde se emplearon para conformar tres diferentes consensos propios.
Los resultados obtenidos indican que los métodos de consenso, especialmente aquellos que incluyen técnicas de balanceo de clases, ofrecen mejores precisiones positivas y negativas, así como altos valores de AUC, en comparación con los modelos individuales. Esto demuestra la eficacia, estabilidad y adaptabilidad de los métodos de consenso en la predicción de siniestralidad con datos desbalanceados. La dinámica de evaluación incluye datos nuevos que son externos a la base de datos inicial y el cálculo de métricas de ajuste, proporcionando una visión integral sobre el desempeño del sistema de scoring propuesto. Además, se discuten las limitaciones del estudio y se sugieren futuras investigaciones y mejoras en la implementación del modelo.
Descripción
Palabras clave
ASEGURAMIENTO, MODELO PREDICTIVO, ALGORTIMOS, APRENDIZAJE