Building the Gold Standard for the Surface Syntax of Basque

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/64016
Información del item - Informació de l'item - Item information
Título: Building the Gold Standard for the Surface Syntax of Basque
Título alternativo: Construcción de un Gold Standard para la Sintaxis Superficial del Euskera
Autor/es: Aduriz Agirre, Itziar | Aranzabe Urruzola, María Jesús | Arriola Egurrola, José María | Díaz de Ilarraza Sánchez, Arantza | González Dios, Itziar | Urizar Enbeita, Rubén
Palabras clave: Sintaxis superficial | Gold standard | Euskera | Anotación de corpus | Surface syntax | Basque | Corpus annotation
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2017
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2017, 58: 125-132
Resumen: En este artículo presentamos el proceso de construcción de SF-EPEC, un corpus de 300.000 palabras, sintácticamente anotado, que pretende ser un Gold Standard para el procesamiento sintáctico superficial del euskera. En primer lugar, describimos el conjunto de etiquetas diseñado para este propósito; siendo el euskera una lengua aglutinante, en ocasiones hemos tenido que crear etiquetas sintácticas compuestas. Asimismo, se detallan las distintas fases en la construcción de SF-EPEC. | In this paper, we present the process in the construction of SF-EPEC, a 300,000-word corpus syntactically annotated that aims to be a Gold Standard for the surface syntactic processing of Basque. First, the tagset designed for this purpose is described; being Basque an agglutinative language, sometimes complex syntactic tags were needed. We also account for the different phases in the construction of SF-EPEC.
Patrocinador/es: PROSA-MED: Procesamiento semántico textual avanzado para la detección de diagnósticos, procedimientos, otros conceptos y sus relaciones en informes Médicos (TIN2016-77820-C3-1-R).
URI: http://hdl.handle.net/10045/64016
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 58 (2017)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_58_15.pdf701,88 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.