Caracterización de niveles de informalidad en textos de la Web 2.0
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/18525
Title: | Caracterización de niveles de informalidad en textos de la Web 2.0 |
---|---|
Other Titles: | Informality level characterization in Web 2.0 texts |
Authors: | Mosquera López, Alejandro | Moreda, Paloma |
Research Group/s: | Procesamiento del Lenguaje y Sistemas de Información (GPLSI) |
Center, Department or Service: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Keywords: | Clustering | Registros del lenguaje | Web 2.0 | Language registers |
Knowledge Area: | Lenguajes y Sistemas Informáticos |
Issue Date: | Sep-2011 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | MOSQUERA, Alejandro; MOREDA, Paloma. “Caracterización de niveles de informalidad en textos de la Web 2.0”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 171-177 |
Abstract: | El análisis de textos de la Web 2.0 es un tema de investigación relevante hoy en día. Sin embargo, son muchos los problemas que se plantean a la hora de utilizar las herramientas actuales en este tipo de textos. Para ser capaces de medir estas dificultades primero necesitamos conocer los diferentes registros o grados de informalidad que podemos encontrar. Por ello, en este trabajo intentaremos caracterizar niveles de informalidad para textos en inglés en la Web 2.0 mediante técnicas de aprendizaje automático no supervisado, obteniendo resultados del 68 % en F1. | Analysis of Web 2.0 texts is a relevant investigation topic nowadays. However, many problems arise when using state of the art tools in this kind of texts. For being able to measure these difficulties first we need to identify the different registers or informality levels that we can find. Therefore, in this paper we will attempt to characterize the informality levels of english texts in Web 2.0 by using non-supervised machine learning techniques, obtaining results of 68 % in F1. |
Sponsor: | Este artículo ha sido cofinanciado por el Ministerio de Ciencia e Innovación (proyecto TIN2009-13391-C04-01), y la Conselleria d’Educació de la Generalitat Valenciana (proyectos PROMETEO/2009/119, ACOMP/2010/286 y ACOMP/2011/001). |
URI: | http://hdl.handle.net/10045/18525 |
ISSN: | 1135-5948 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Peer Review: | si |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 47 (2011) INV - GPLSI - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
![]() | 427,04 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.