Caracterización de niveles de informalidad en textos de la Web 2.0

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/18525
Información del item - Informació de l'item - Item information
Title: Caracterización de niveles de informalidad en textos de la Web 2.0
Other Titles: Informality level characterization in Web 2.0 texts
Authors: Mosquera López, Alejandro | Moreda, Paloma
Research Group/s: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Center, Department or Service: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Keywords: Clustering | Registros del lenguaje | Web 2.0 | Language registers
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2011
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: MOSQUERA, Alejandro; MOREDA, Paloma. “Caracterización de niveles de informalidad en textos de la Web 2.0”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 171-177
Abstract: El análisis de textos de la Web 2.0 es un tema de investigación relevante hoy en día. Sin embargo, son muchos los problemas que se plantean a la hora de utilizar las herramientas actuales en este tipo de textos. Para ser capaces de medir estas dificultades primero necesitamos conocer los diferentes registros o grados de informalidad que podemos encontrar. Por ello, en este trabajo intentaremos caracterizar niveles de informalidad para textos en inglés en la Web 2.0 mediante técnicas de aprendizaje automático no supervisado, obteniendo resultados del 68 % en F1. | Analysis of Web 2.0 texts is a relevant investigation topic nowadays. However, many problems arise when using state of the art tools in this kind of texts. For being able to measure these difficulties first we need to identify the different registers or informality levels that we can find. Therefore, in this paper we will attempt to characterize the informality levels of english texts in Web 2.0 by using non-supervised machine learning techniques, obtaining results of 68 % in F1.
Sponsor: Este artículo ha sido cofinanciado por el Ministerio de Ciencia e Innovación (proyecto TIN2009-13391-C04-01), y la Conselleria d’Educació de la Generalitat Valenciana (proyectos PROMETEO/2009/119, ACOMP/2010/286 y ACOMP/2011/001).
URI: http://hdl.handle.net/10045/18525
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Peer Review: si
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 47 (2011)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_47_18.pdf427,04 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.