Comparación de modelos de identificación automática de odio en comentarios de microtextos en español

Navarro Murillo, Noelia

Comparación de modelos de identificación automática de odio en comentarios de microtextos en español

dc.contributor.advisor	Casasola Murillo, Edgar
dc.creator	Navarro Murillo, Noelia
dc.date.accessioned	2021-09-27T16:26:01Z
dc.date.available	2021-09-27T16:26:01Z
dc.date.issued	2021-09
dc.description.abstract	Esta investigación se enfoca en la detección de odio en comentarios en español extraídos de Twitter. Se analiza la efectividad de los modelos de SVM (Support Vector Machine) y CNN (Convolutional Neural Network) en la identificación automática del odio en los textos. Se analizan los resultados obtenidos utilizando características de frecuencia de términos y word embeddings para SVM, así mismo el efecto de aplicar sobremuestro. Mientras, para las redes CNN se utilizaron los word embeddings. La investigación provee un corpus de textos anotados, para el cual se utilizó la guía de anotación de identificación de odio en el texto. Este trabajo busca colaborar con la investigación en español sobre la detección del odio, proporcionando el corpus anotado y el análisis de efectividad de los modelos SVM y CNN para la identificación automática del odio.	es_ES
dc.description.abstract	This research focuses on detecting hate in comments in Spanish extracted from Twitter. The effectiveness of the SVM (Support Vector Machine) and CNN (Convolutional Neural Network) models in identifying hate in texts is analyzed. The results were analyzed using characteristics of term frequency and word embeddings for SVM, as well as the effect of oversampling. Meanwhile, for CNN word embeddings were used. The research provides a corpus of texts annotated by people following an annotation guide for the manual identification of hate speech. This work has the aim to collaborate with the Spanish research on hate speech detection. It provides the annotated corpus and the performance results analysis for the SVM and CNN models used to identify hate in text.	es_ES
dc.description.procedence	UCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informática	es_ES
dc.identifier.uri	https://hdl.handle.net/10669/84459
dc.language.iso	spa	es_ES
dc.rights	acceso abierto
dc.source	Universidad de Costa Rica. San José, Costa Rica	es_ES
dc.subject	clasificador de texto	es_ES
dc.subject	detección de odio	es_ES
dc.subject	Support Vector Machine	es_ES
dc.subject	Convolutional Neural Network	es_ES
dc.title	Comparación de modelos de identificación automática de odio en comentarios de microtextos en español	es_ES
dc.type	tesis de maestría

Files

Original bundle

Now showing 1 - 1 of 1

Name:: TFIA Noelia Navarro Murillo.pdf
Size:: 5.45 MB
Format:: Adobe Portable Document Format
Description:: TFIA Noelia Navarro Murillo

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 3.5 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Computación e informática