Por un análisis distante y profundo: un corpus piloto de la poesía lírica castellana del Siglo de Oro

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/129546
Información del item - Informació de l'item - Item information
Título: Por un análisis distante y profundo: un corpus piloto de la poesía lírica castellana del Siglo de Oro
Título alternativo: Towards a distant and deep reading: a pilot corpus of Golden-Age Spanish poetry
Autor/es: Navarro Colorado, Borja
Grupo/s de investigación o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Análisis distante | Poesía lírica | Siglo de Oro | Métrica | Procesamiento del Lenguaje Natural | Anotación de corpus | Distant reading | Poetry | Golden-Age | Meter | Natural Language Processing | Corpus annotation
Fecha de publicación: 2019
Editor: Universidad de Alcalá
Cita bibliográfica: Revista de Poética Medieval. 2019, 33: 51-76. https://doi.org/10.37536/RPM.2019.33.0.69109
Resumen: En este trabajo se plantea la necesidad de combinar el análisis llamado «distante» (análisis panorámico de gran cantidad de texto literario) con el análisis profundo (análisis en detalle de diferentes aspectos lingüísticos o literarios). Para ello se propone la creación de amplios corpus literarios de referencia en los que, aprovechando los actuales avances en procesamiento del lenguaje natural, la información implícita del texto (tanto de tipo lingüístico como literario) esté marcada de manera explícita y formal. La propuesta se concreta en el diseño y desarrollo de un corpus piloto de la poesía lírica del Siglo de Oro que incluye poemas con diferentes modelos métrico-estróficos (sonetos, romances, liras, églogas, etc.) así como diversidad de autores. Actualmente consta de más de 52.000 versos anotados con información lingüística (palabras, lemas, categorías gramaticales y morfología) y literaria (tipo de poema o estrofa y métrica). Si bien la anotación general del corpus ha sido realizada de manera automática, un 10% de esa anotación (5069 versos) ha sido revisada, validada o, en su caso, corregida por expertos. Este 10%, en tanto que Gold Standard, es ya un primer paso tanto para el análisis distante y profundo de la poesía castellana como para el desarrollo de sistemas de procesamiento del lenguaje natural específicos para el texto literario y poético. | This paper shows the necessity of combine the distant reading of literary texts (panoramic analysis of a great amount of texts) with «deep» reading (close analysis in detail of implicit linguistic or literary aspects of texts). With this objective, the development of large annotated corpora of literary texts is proposed. Taking advantage of recent developments of Natural Language Processing, the linguistic and literary implicit information could be annotated semi-automatically. In order to show the viability of this proposal, a pilot corpus of Golden-Age Spanish poetry is presented. The corpus is made-up of different types of poems (sonnets, romances, eclogues, etc.) and several poets. Nowadays it has more than 52,000 lines annotated at metrical and morphological level: metrical patterns of each line, and the lemma, part of speech and morphological information of each word. The annotation was developed automatically. 5,069 lines has been revised manually and emended (if necessary). This Gold Standard is the first step both for a distant and deep literary analysis of Golden-Age Spanish poetry and for the development of poetry-specific models of Natural Language Processing.
Patrocinador/es: Artículo financiado por las ayudas Fundación BBVA a equipos de investigación científica, proyecto «Análisis distante de base computacional del soneto castellano del Siglo de Oro (ADSO)» (2016-2018).
URI: http://hdl.handle.net/10045/129546
ISSN: 1137-8905 | 2660-891X (Internet)
DOI: 10.37536/RPM.2019.33.0.69109
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
Revisión científica: si
Versión del editor: https://doi.org/10.37536/RPM.2019.33.0.69109
Aparece en las colecciones:INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailNavarro-Colorado_2019_RevPoeticaMedieval.pdf506,73 kBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons