Show simple item record

dc.contributor.advisorCasasola Murillo, Edgar
dc.creatorRodríguez Betancourt, Esteban
dc.date.accessioned2022-06-30T15:44:49Z
dc.date.available2022-06-30T15:44:49Z
dc.date.issued2022-06-01
dc.identifier.urihttps://hdl.handle.net/10669/86838
dc.description.abstractEl significado de las palabras puede cambiar a lo largo del tiempo. Este fenómeno se conoce como desplazamiento semántico. Existen diferentes formas de medir este desplazamiento semántico, siendo una de ellas el análisis de los cambios en distancias en los \emph{embeddings} de las palabras. En este trabajo, se propone un mecanismo para la construcción de word embeddings diacrónicos, es decir, de diferentes momentos del tiempo. Luego se construye un word embedding diacrónico del español previo y posterior a la aparición de la pandemia por COVID-19. Estos embeddings fueron construidos a partir de un corpus 237 millones de sitios web. Finalmente, se analiza el desplazamiento semántico de los términos asociados a tres casos de estudio particulares: COVID-19, vacunación y mascarillas. A pesar de que pasaron pocos años entre la recolección de los corpus con los que se entrenaron los word embeddings, se encontraron cambios significativos en las vecindades de los clústeres de palabras analizadas. Además, se encontraron cambios sutiles en la distancia relativa a emociones.es_ES
dc.language.isospaes_ES
dc.sourceUniversidad de Costa Rica, San José, Costa Ricaes_ES
dc.subjectLINGÜÍSTICA INFORMÁTICAes_ES
dc.subjectPROCESAMIENTO DE DATOSes_ES
dc.subjectPROCESAMIENTO DE LA INFORMACIÓNes_ES
dc.titleAnálisis de desplazamiento semántico previo y posterior al COVID-19 en Word Embeddings diacrónicos del españoles_ES
dc.typetesis de maestríaes_ES
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informáticaes_ES


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record