Logo Kérwá
 

Modelo de clasificación con algortimo TabNet para abandono de clientes en servicios de telecomunicaciones del Instituto Costarricense de Electricidad entre agosto y octubre de 2022

dc.contributor.advisorLeitón Montero, Juan José
dc.creatorSantamaría Guzmán, Patrick José
dc.date.accessioned2024-07-16T16:01:15Z
dc.date.available2024-07-16T16:01:15Z
dc.date.issued2024-07-15
dc.description.abstractDos de los principales objetivos de los proveedores de servicios de telecomunicación son maximizar las ganancias por el servicio brindado y mantenerse vivos en el mercado. Para lograr esto, las estrategias de retención de clientes juegan un papel fundamental, ya que el precio de retener clientes en un servicio de telecomunicación, es mucho menor que el de buscar nuevos clientes. Dada la necesidad de retención de clientes, los algoritmos de aprendizaje de máquinas suelen utilizarse en gran medida con el fin de poder aplicar estrategias de retención de clientes antes de que estos decidan abandonar el servicio de telecomunicación. Debido a esto, el principal objetivo de esta investigación, es determinar si el algoritmo TabNet, una variación de redes neuronales que promete tener un mejor desempeño en la predicción de datos tabulares que las redes neuronales convencionales, presenta mejoras respecto a algoritmos ampliamente utilizados en la predicción de datos en formato tabular, como XGBoost y LightGBM, para lo cual se utilizó un conjunto de datos proporcionado por el Instituto Costarricense de Electricidad de abandono de clientes sobre el uso del servicio prepago de sus clientes, en un periodo de estudio que va de agosto a octubre de 2022. Para comparar el desempeño de los algoritmos se utilizan dos criterios, el primero es por métricas de desempeño, donde se compara la exactitud, sensibilidad, especificidad y ROC AUC de las predicciones realizadas por los algoritmos, y el segundo criterio es el tiempo de ejecución en minutos que tardan los algoritmos en ejecutarse. El algoritmo TabNet logra una mejor métrica de desempeño solo cuando se compara la sensibilidad respecto a los otros dos algoritmos, logrando predecir correctamente hasta un 74,4% de los casos de abandonos de clientes, frente a XGBoost y LightGBM que lograron porcentajes de 73.2% y 72.9% respectivamente; si se compara por las demás métricas, LightGBM y XGBoost tienen mejores resultados. Por otro lado, TabNet tarda hasta 5.6 minutos más en ejecutarse que XGBoost y hasta 8.4 minutos más que LightGBM, esto cuando se comparan los algoritmos con las 3 mejores combinaciones de hiperparámetros obtenidas en la métrica de sensibilidad; si se compara por otras métricas de desempeño, estos tiempos pueden llegar a aumentarse hasta en 87 minutos si se compara contra XGBoost. En general el algoritmo TabNet, debido a sus altos tiempos de ejecución y a la similitud de las métricas obtenidas respecto a LightGBM y XGBoost, se recomendaría solo en caso de que se busque maximizar la métrica de sensibilidad, aunque LightGBM, en general, logra métricas similares con tiempos de ejecución para el ajuste de los modelos mucho menores.
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ciencias Sociales::Maestría Profesional en Estadística
dc.identifier.urihttps://hdl.handle.net/10669/91781
dc.language.isospa
dc.rightsacceso abierto
dc.sourceSan José, Costa Rica: Universidad de Costa Rica
dc.subjectTabNet
dc.subjectXGBoost
dc.subjectLightGBM
dc.subjectTelecomunicaciones
dc.subjectRedes
dc.subjectNeuronales
dc.titleModelo de clasificación con algortimo TabNet para abandono de clientes en servicios de telecomunicaciones del Instituto Costarricense de Electricidad entre agosto y octubre de 2022
dc.typetesis de maestría

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Trabajo de investigación Patrick Santamaría 1-7-2024 LCR APH GBC PSG JJLM FvD-firmado.pdf
Size:
1.32 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
3.5 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections