A benchmark of Spanish language datasets for computationally driven research

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/120141
Información del item - Informació de l'item - Item information
Título: A benchmark of Spanish language datasets for computationally driven research
Autor/es: Candela, Gustavo | Sáez Fernández, María Dolores | Escobar Esteban, María Pilar | Marco Such, Manuel
Grupo/s de investigación o GITE: Lucentia | Transducens
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Collections as data | Data quality metrics | Digital libraries | GLAM labs
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: 13-dic-2021
Editor: SAGE Publications
Cita bibliográfica: Journal of Information Science. 2023, 49(6): 1451-1461. https://doi.org/10.1177/01655515211060530
Resumen: In the domain of Galleries, Libraries, Archives and Museums (GLAM) institutions, creative and innovative tools and methodologies for content delivery and user engagement have recently gained international attention. New methods have been proposed to publish digital collections as datasets amenable to computational use. Standardised benchmarks can be useful to broaden the scope of machine-actionable collections and to promote cultural and linguistic diversity. In this article, we propose a methodology to select datasets for computationally driven research applied to Spanish text corpora. This work seeks to encourage Spanish and Latin American institutions to publish machine-actionable collections based on best practices and avoiding common mistakes.
Patrocinador/es: This research has been funded by the AETHER-UA (PID2020-112540RB-C43) Project from the Spanish Ministry of Science and Innovation.
URI: http://hdl.handle.net/10045/120141
ISSN: 0165-5515 (Print) | 1741-6485 (Online)
DOI: 10.1177/01655515211060530
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © The Author(s) 2021
Revisión científica: si
Versión del editor: https://doi.org/10.1177/01655515211060530
Aparece en las colecciones:INV - TRANSDUCENS - Artículos de Revistas
INV - LUCENTIA - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailCandela_etal_2021_JIS_preprint.pdfPreprint (acceso abierto)273,95 kBAdobe PDFAbrir Vista previa
ThumbnailCandela_etal_2021_JIS_final.pdfVersión final (acceso restringido)458,83 kBAdobe PDFAbrir    Solicitar una copia


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.