Una aproximación supervisada para la minería de opiniones sobre tuits en español en base a conocimiento lingüístico

Vilares Calvo, David; Alonso Pardo, Miguel Ángel; Gómez Rodríguez, Carlos

Una aproximación supervisada para la minería de opiniones sobre tuits en español en base a conocimiento lingüístico

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/30627

Información del item - Informació de l'item - Item information
Títol:	Una aproximación supervisada para la minería de opiniones sobre tuits en español en base a conocimiento lingüístico
Títol alternatiu:	A supervised approach to opinion mining on Spanish tweets based on linguistic knowledge
Autors:	Vilares Calvo, David \| Alonso Pardo, Miguel Ángel \| Gómez Rodríguez, Carlos
Paraules clau:	Análisis del sentimiento \| Minería de opiniones \| Análisis sintáctico de dependencias \| Aprendizaje automático \| Twitter \| Sentiment analysis \| Opinion mining \| Dependency parsing \| Machine learning
Àrees de coneixement:	Lenguajes y Sistemas Informáticos
Data de publicació:	de setembre-2013
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica:	VILARES, David; ALONSO, Miguel A.; GÓMEZ-RODRÍGUEZ, Carlos. “Una aproximación supervisada para la minería de opiniones sobre tuits en español en base a conocimiento lingüístico”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 127-134
Resum:	En este artículo se describe un sistema para la clasificación de la polaridad de tuits escritos en español. Se adopta una aproximación híbrida, que combina conocimiento lingüístico obtenido mediante PLN con técnicas de aprendizaje automático. Como paso previo, se realiza una primera etapa de preprocesado para tratar ciertas características del uso del lenguaje en Twitter. A continuación se extrae información morfológica, sintáctica y semántica, para utilizarla posteriormente como entrada a un clasificador supervisado. La evaluación de la propuesta se lleva a cabo sobre el corpus TASS 2012, anotado para realizar tareas de clasificación con cuatro y seis categorías. Los resultados experimentales muestran un buen rendimiento para ambos casos, lo que valida la utilidad práctica de la propuesta. \| This article describes a system that classifies the polarity of Spanish tweets. We adopt a hybrid approach, which combines linguistic knowledge acquired by means of NLP with machine learning techniques. We carry out a preprocessing of the tweets as an initial step to address some characteristics of the language used in Twitter. Then, we apply part-of-speech tagging, dependency parsing and extraction of semantic knowledge, and we employ all that information as features for a supervised classifier. We have evaluated our proposal with the TASS 2012 corpus, which is annotated to undertake classification tasks with four and six categories. Experimental results are good in both cases and confirm the practical utility of the approach.
Patrocinadors:	Trabajo parcialmente financiado por el Ministerio de Economía y Competitividad y FEDER (TIN2010-18552-C03-02) y por la Xunta de Galicia (CN2012/008, CN 2012/319).
URI:	http://hdl.handle.net/10045/30627
ISSN:	1135-5948
Idioma:	spa
Tipus:	info:eu-repo/semantics/article
Revisió científica:	si
Apareix a la col·lecció:	Procesamiento del Lenguaje Natural - Nº 51 (2013)

Arxius per aquest ítem:

Arxius per aquest ítem:
Arxiu	Descripció	Tamany	Format
PLN_51_14.pdf		680,21 kB	Adobe PDF	Obrir Vista prèvia Tancar vista prèvia

Veure citacions a Google Académic

Mostrar el registre complet de l'ítem

Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.