Legibilidad del texto, métricas de complejidad y la importancia de las palabras

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/81353
Información del item - Informació de l'item - Item information
Títol: Legibilidad del texto, métricas de complejidad y la importancia de las palabras
Títol alternatiu: Text readability, complexity metrics and the importance of words
Autors: López-Anguita, Rocío | Montejo Ráez, Arturo | Martínez Santiago, Fernando | Díaz Galiano, Manuel Carlos
Paraules clau: Legibilidad | Complejidad textual | Modelado del lenguaje | Readability | Text complexity | Language modelling
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2018
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2018, 61: 101-108. doi:10.26342/2018-61-11
Resum: El presente trabajo expone un estudio sobre la determinación de la edad recomendada de lectura sobre un conjunto de textos infantiles. Se ha evaluado el mismo con 12 medidas de complejidad propuestas por distintos autores. Usando estas medidas como características, hemos modelado los textos y aplicado una validación cruzada con varios clasificadores automáticos. Los resultados se han comparado con otras formas de representación de los textos, como vectores de palabras y vectores TF.IDF. Nuestras conclusiones indican que el rasgo más determinante para la determinación de la edad de lectura recomendada no radica tanto en factores como la complejidad sintáctica o léxica, sino en el uso de determinado vocabulario. | This article describes our study on the identification of the recommended age for readers in texts written for children. They have been evaluated over 12 complexity metrics proposed by different authors. By using these metrics as features, we have trained several automatic classifiers and cross-validated their performances to detect recommended reader level. The results have been compared with the classification performance obtained from other document models, like word embeddings and TF.IDF vectors. Our conclusions are that the most relevant facet to identify the recommended reader age is not on lexical or syntactical complexities, but strongly related with the vocabulary involved.
Patrocinadors: Este trabajo ha sido parcialmente financiado por el Gobierno de España a través del proyecto REDES (TIN2015-65136-C2-1-R).
URI: http://hdl.handle.net/10045/81353
ISSN: 1135-5948
DOI: 10.26342/2018-61-11
Idioma: spa
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2018-61-11
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 61 (2018)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_61_11.pdf900,47 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.