Comparación de modelos de identificación automática de odio en comentarios de microtextos en español
dc.contributor.advisor | Casasola Murillo, Edgar | |
dc.creator | Navarro Murillo, Noelia | |
dc.date.accessioned | 2021-09-27T16:26:01Z | |
dc.date.available | 2021-09-27T16:26:01Z | |
dc.date.issued | 2021-09 | |
dc.description.abstract | Esta investigación se enfoca en la detección de odio en comentarios en español extraídos de Twitter. Se analiza la efectividad de los modelos de SVM (Support Vector Machine) y CNN (Convolutional Neural Network) en la identificación automática del odio en los textos. Se analizan los resultados obtenidos utilizando características de frecuencia de términos y word embeddings para SVM, así mismo el efecto de aplicar sobremuestro. Mientras, para las redes CNN se utilizaron los word embeddings. La investigación provee un corpus de textos anotados, para el cual se utilizó la guía de anotación de identificación de odio en el texto. Este trabajo busca colaborar con la investigación en español sobre la detección del odio, proporcionando el corpus anotado y el análisis de efectividad de los modelos SVM y CNN para la identificación automática del odio. | es_ES |
dc.description.abstract | This research focuses on detecting hate in comments in Spanish extracted from Twitter. The effectiveness of the SVM (Support Vector Machine) and CNN (Convolutional Neural Network) models in identifying hate in texts is analyzed. The results were analyzed using characteristics of term frequency and word embeddings for SVM, as well as the effect of oversampling. Meanwhile, for CNN word embeddings were used. The research provides a corpus of texts annotated by people following an annotation guide for the manual identification of hate speech. This work has the aim to collaborate with the Spanish research on hate speech detection. It provides the annotated corpus and the performance results analysis for the SVM and CNN models used to identify hate in text. | es_ES |
dc.description.procedence | UCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informática | es_ES |
dc.identifier.uri | https://hdl.handle.net/10669/84459 | |
dc.language.iso | spa | es_ES |
dc.rights | acceso abierto | |
dc.source | Universidad de Costa Rica. San José, Costa Rica | es_ES |
dc.subject | clasificador de texto | es_ES |
dc.subject | detección de odio | es_ES |
dc.subject | Support Vector Machine | es_ES |
dc.subject | Convolutional Neural Network | es_ES |
dc.title | Comparación de modelos de identificación automática de odio en comentarios de microtextos en español | es_ES |
dc.type | tesis de maestría |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- TFIA Noelia Navarro Murillo.pdf
- Tamaño:
- 5.45 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- TFIA Noelia Navarro Murillo
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 3.5 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: