Generación adaptativa de consultas para la recuperación temática de tweets

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/22031
Información del item - Informació de l'item - Item information
Título: Generación adaptativa de consultas para la recuperación temática de tweets
Título alternativo: Adaptive query generation for topic-based tweet retrieval
Autor/es: Cotelo Moya, Juan Manuel | Cruz Mata, Fermín | Troyano Jiménez, José Antonio
Palabras clave: Recuperación de información | Twitter | Análisis de grafos | Information retrieval | Graph analysis
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2012
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: COTELO, Juan M.; CRUZ, Fermín L.; TROYANO, Jose A. “Generación adaptativa de consultas para la recuperación temática de tweets”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 57-64
Resumen: Twitter se ha convertido en un recurso con gran potencial a la hora de analizar los estados de opini ́n acerca de temas de actualidad. En el presente trabajo mostramos la metodología utilizada para la obtención de un corpus de mensajes de Twitter relacionados con las elecciones generales españolas del 20 de noviembre de 2011. Dado que el acceso a los mensajes en Twitter se realiza mediante consultas, hemos estudiado diversas estrategias de construcción de dichas consultas, tratando de maximizar la cobertura obtenida. Tras experimentar con diversos acercamientos, se propone un método basado en grafos que permite la captura de tweets relacionados con una temática determinada, adaptando dinámicamente las consultas utilizadas para incorporar automáticamente los temas relacionados que eventualmente vayan surgiendo. El recurso obtenido, de gran utilidad, entre otros, en trabajos de análisis del sentimiento, está públicamente disponible para su utilización. | Twitter has become a resource of great potential for analyzing opinion about hot topics. In this paper we show the methodology used for obtaning a corpus of Twitter messages related to the Spanish general elections of November 20, 2011. Given that access to Twitter messages is done through querying, we have studied various strategies for building such queries, trying to maximize the coverage. After experimenting with several approaches, we propose a graph-based method that allows retrieval of tweets related to a specific topic, dynamically adapting the queries to automatically include related topics that eventually arise. The obtained resource, very useful for, among others, sentiment analysis tasks, is publicy available for use.
URI: http://hdl.handle.net/10045/22031
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 48 (2012)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_48_07.pdf4,39 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.