Logo Kérwá
 

Efecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimiento

dc.contributor.advisorCasasola Murillo, Edgar
dc.creatorSolís Fonseca, Carlos Francisco
dc.date.accessioned2021-02-03T22:04:05Z
dc.date.available2021-02-03T22:04:05Z
dc.date.issued2020-12-17
dc.description.abstractEn los últimos años los métodos de aprendizaje de máquina han sido incluidos en muchas áreas de investigación para dar soporte al análisis de datos. Los modelos de clasificación, los cuales corresponden a métodos de aprendizaje no supervisado, se han convertido en un instrumento muy importante para el análisis de texto y el análisis de sentimiento no es la excepción. Por esta razón es importante tener en consideración las características de los datos ya que, dependiendo de su naturaleza, pueden afectar la calidad del clasificador entrenado. Este trabajo se centra sobre el problema en las clases desbalanceadas. Mediante dos métodos de balanceo, submuestreo y sobremuestreo, se lleva a cabo un experimento estadístico para determinar si balancear un conjunto de datos con clases desbalanceadas mejora o no la calidad de un clasificador usando máquinas de soporte vectorial. Usando dos diferentes modelos para vectorizar palabras, TF-IDF y Word2Vec, se evalúa mediante un análisis de varianza el F-Score del clasificador de texto obteniendo como resultado un F-Score mayor cuando se usa sobremuestreo para balancear clases en comparación al F-Score obtenido del clasificador usando los datos con las clases desbalanceadas.es_ES
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informáticaes_ES
dc.identifier.urihttps://hdl.handle.net/10669/82700
dc.language.isoeses_ES
dc.rightsacceso abierto
dc.sourceUniversidad de Costa Rica, San José, Costa Ricaes_ES
dc.subjectBalanceo de claseses_ES
dc.subjectAnálisis de sentimientoes_ES
dc.subjectAprendizaje de máquinaes_ES
dc.subjectClasificación de textoes_ES
dc.subjectAprendizaje no supervisadoes_ES
dc.subjectrepresentación vectorial de palabrases_ES
dc.titleEfecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimientoes_ES
dc.typetesis de maestría

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFIA-Carlos Solis Fonseca.pdf
Size:
962.81 KB
Format:
Adobe Portable Document Format
Description:
Artículo principal

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.83 KB
Format:
Item-specific license agreed upon to submission
Description: