Cuantificación del interés de un usuario en un tema mediante minería de texto y análisis de sentimiento

Rodríguez Aldape, Fernando Manuel (2013) Cuantificación del interés de un usuario en un tema mediante minería de texto y análisis de sentimiento. Maestría thesis, Universidad Autónoma de Nuevo León.

[img]
Vista previa
Texto
1080256675.pdf - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (843kB) | Vista previa

Resumen

Objetivos y metodo de estudio: ´ En la presente tesis se define y propone un m´etodo para cuantificar el inter´es de un usuario en un tema utilizando t´ecnicas de miner´ıa de texto y an´alisis de sentimiento en espa˜nol. Proponemos utilizar miner´ıa de texto para evaluar qu´e tanto habla un usuario acerca del tema y an´alisis de sentimiento para saber qu´e sentimiento utiliza al hablar de ´este. Para lograr este ´ultimo objetivo desarrollamos una herramienta de an´alisis de sentimiento en espa˜nol llamada TOM, la cual prob´o tener una precisi´on comparable a otras herramientas en el estado del arte. Se experiment´o con el m´etodo propuesto en un conjunto de 40,186,542 comentarios provenientes de 80,954 usuarios extra´ıdos de un microblog llamado Twitter. Para cuantificar el inter´es del usuario propusimos tres estrategias para crear representaciones de los usuarios, las cuales a su vez, pueden variar seg´un el sentimiento de dichos comentarios. As´ı mismo, propusimos un m´etodo simple y autom´atico para representar los temas mediante vectores de palabras y valores TFIDF. Finalmente mostramos que el Inter´es, cuantificado mediante nuestro m´etodo, tiene una correlaci´on superior a 0.8 en la mayor´ıa de los casos con la probabilidad de que dos usuarios sean contactos en el microblog. Esto concuerda con el principio de homofilia el cu´al dice que las personas tienden a contactar con m´as frecuencia a personas m´as similares que a personas menos similares [69]. Dicho principio tambi´en ha sido estudiado en microblogs [22]. Contribuciones y conlusiones: La contribuci´on principal de la tesis es la de- finici´on del Inter´es del usuario en un tema y el m´etodo propuesto para cuantificarlo; el cual tiene en cuenta lo cotidiano o frecuente que es para el usuario el hablar sobre un tema y el sentimiento que utiliza al hacerlo. Entre las contribuciones podemos mencionar las representaciones de los usuarios y los temas, as´ı como la posibilidad de utilizar el sentimiento como un filtro de contenido para crear la representaci´on de los usuarios. Esta idea podr´ıa ser utilizada para crear otros modelos que representen los intereses de los usuarios. Otra contribuci´on importante es la herramienta que desarrollamos para el an´alisis de sentimiento en espa˜nol llamada TOM que puede ser utilizada por otros investigadores dada la escasez de este tipo de recursos en nuestro idioma. Una posible aplicaci´on del Inter´es es la de crear sistemas de recomendaci´on para empresas que deseen promocionar sus productos en un mar de usuarios como lo son los microblogs.

Tipo de elemento: Tesis (Maestría)
Información adicional: Maestría en Ingeniería de la Información con Orientación en Inteligencia Artificial
Divisiones: Ingeniería Mecánica y Eléctrica
Usuario depositante: Admin Eprints
Creadores:
CreadorEmailORCID
Rodríguez Aldape, Fernando ManuelNO ESPECIFICADONO ESPECIFICADO
Fecha del depósito: 26 Jun 2014 21:41
Última modificación: 16 Feb 2017 15:24
URI: http://eprints.uanl.mx/id/eprint/3679

Actions (login required)

Ver elemento Ver elemento

Downloads

Downloads per month over past year