A semantic relatedness approach to classifying opinion from Web reviews

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/10543
Full metadata record
Full metadata record
DC FieldValueLanguage
dc.contributorProcesamiento del Lenguaje Natural y Sistemas de Informaciónen
dc.contributor.authorBalahur Dobrescu, Alexandra-
dc.contributor.authorMontoyo, Andres-
dc.contributor.otherUniversidad de Alicante. Departamento de Lenguajes y Sistemas Informáticosen
dc.date.accessioned2009-05-20T10:37:24Z-
dc.date.available2009-05-20T10:37:24Z-
dc.date.issued2009-03-
dc.identifier.citationBALAHUR DOBRESCU, Alexandra; MONTOYO GUIJARRO, Andrés. “A semantic relatedness approach to classifying opinion from Web reviews”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 47-54en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/10543-
dc.description.abstractLos últimos años han marcado el inicio y la rápida expansión de la web social, donde cada persona puede expresar su libre opinión sobre diferentes "objetos", tales como productos, personas, tópicos de política etc. en blogs, foros o portales Web de comercio electrónico. A su vez, el rápido crecimiento del volumen de información en la web ha ido permitiendo a los usuarios la toma de decisiones mejores y más informadas. A raíz de esta expansión ha surgido la necesidad de desarrollar sistemas especializados de PLN que automáticamente escaneen la web en busca de las opiniones expuestas (que recuperen, extraigan y clasifiquen las opiniones existentes dada una consulta). La minería de opiniones (análisis de sentimientos) ha demostrado ser un problema difícil debido a la gran variabilidad semántica del texto libre. En este artículo se propone un método para extraer, clasificar y resumir opiniones sobre productos concretos utilizando críticas realizadas en la Web. El método se basa en una taxonomía de características de productos previamente construida, el cálculo de la proximidad semántica entre conceptos por medio de la Distancia Normalizada de Google y el método de aprendizaje automático SVM. Finalmente, demostramos que nuestro enfoque supera los resultados base de la tarea y ofrece una alta precisión y una alta confianza en las clasificaciones obtenidas.en
dc.description.abstractRecent years have marked the beginning and rapid expansion of the social web, where people can freely express their opinion on different “objects”, such as products, persons, topics etc. on blogs, forums or e-commerce sites. While the rapid growth of the information volume on the web allowed for better and more informed decisions from users, its expansion led to the need to develop specialized NLP systems that automatically mine the web for opinions (retrieve, extract and classify opinions of a query object). Opinion mining (sentiment analysis) has been proven to be a difficult problem, due to the large semantic variability of free text. In this article, we propose a method to extract, classify and summarize opinions on products from web reviews, based on the prior building of product characteristics taxonomy and on the semantic relatedness given by the Normalized Google Distance and SVM learning. We prove that our approach outperforms the baselines and has a high precision and classification confidence.en
dc.languageengen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.subjectMinería de opinionesen
dc.subjectResúmenes automáticosen
dc.subjectDistancia normalizada de Googleen
dc.subjectAprendizaje automático SVMen
dc.subjectOpinion miningen
dc.subjectSummarizationen
dc.subjectNormalized Google distanceen
dc.subjectSVM machine learningen
dc.subject.otherLenguajes y Sistemas Informáticosen
dc.titleA semantic relatedness approach to classifying opinion from Web reviewsen
dc.title.alternativeUn método de clasificación de opiniones de críticas extraídas de la Web basado en la proximidad semánticaen
dc.typeinfo:eu-repo/semantics/articleen
dc.peerreviewedsien
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_42_06.pdf904,05 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.