Comparación de modelos de identificación automática de odio en comentarios de microtextos en español

dc.contributor.advisorCasasola Murillo, Edgar
dc.creatorNavarro Murillo, Noelia
dc.date.accessioned2021-09-27T16:26:01Z
dc.date.available2021-09-27T16:26:01Z
dc.date.issued2021-09
dc.description.abstractEsta investigación se enfoca en la detección de odio en comentarios en español extraídos de Twitter. Se analiza la efectividad de los modelos de SVM (Support Vector Machine) y CNN (Convolutional Neural Network) en la identificación automática del odio en los textos. Se analizan los resultados obtenidos utilizando características de frecuencia de términos y word embeddings para SVM, así mismo el efecto de aplicar sobremuestro. Mientras, para las redes CNN se utilizaron los word embeddings. La investigación provee un corpus de textos anotados, para el cual se utilizó la guía de anotación de identificación de odio en el texto. Este trabajo busca colaborar con la investigación en español sobre la detección del odio, proporcionando el corpus anotado y el análisis de efectividad de los modelos SVM y CNN para la identificación automática del odio.es_ES
dc.description.abstractThis research focuses on detecting hate in comments in Spanish extracted from Twitter. The effectiveness of the SVM (Support Vector Machine) and CNN (Convolutional Neural Network) models in identifying hate in texts is analyzed. The results were analyzed using characteristics of term frequency and word embeddings for SVM, as well as the effect of oversampling. Meanwhile, for CNN word embeddings were used. The research provides a corpus of texts annotated by people following an annotation guide for the manual identification of hate speech. This work has the aim to collaborate with the Spanish research on hate speech detection. It provides the annotated corpus and the performance results analysis for the SVM and CNN models used to identify hate in text.es_ES
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informáticaes_ES
dc.identifier.urihttps://hdl.handle.net/10669/84459
dc.language.isospaes_ES
dc.rightsacceso abierto
dc.sourceUniversidad de Costa Rica. San José, Costa Ricaes_ES
dc.subjectclasificador de textoes_ES
dc.subjectdetección de odioes_ES
dc.subjectSupport Vector Machinees_ES
dc.subjectConvolutional Neural Networkes_ES
dc.titleComparación de modelos de identificación automática de odio en comentarios de microtextos en españoles_ES
dc.typetesis de maestría

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TFIA Noelia Navarro Murillo.pdf
Tamaño:
5.45 MB
Formato:
Adobe Portable Document Format
Descripción:
TFIA Noelia Navarro Murillo

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.5 KB
Formato:
Item-specific license agreed upon to submission
Descripción: