From dependencies to constituents in the reference corpus for the processing of Basque (EPEC)

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/8573
Información del item - Informació de l'item - Item information
Título: From dependencies to constituents in the reference corpus for the processing of Basque (EPEC)
Autor/es: Díaz de Ilarraza Sánchez, Arantza | Fernández Terrones, Enrique | Aldezabal Roteta, Izaskun | Aranzabe Urruzola, María Jesús
Palabras clave: Treebank | Formalismo de dependencias | Formalismo de constituyentes | Conversión de formalismos | Equivalencias lingüísticas | Conversor | Dependency-based | Constituent-based | Turning of formalism | Linguistic equivalents
Fecha de publicación: sep-2008
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: DÍAZ DE ILARRAZA SÁNCHEZ, Arantza, et al. “From dependencies to constituents in the reference corpus for the processing of Basque (EPEC)”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 147-154
Resumen: En este artículo se expone el proceso adoptado para la transformación de un treebank anotado con dependencias a un treebank anotado con constituyentes. En este trabajo se toma en cuenta primeramente las características de ambos formalismos, para luego proponer las correspondientes equivalencias lingüísticas. Al final se explica brevemente el desarrollo, mediante refinamientos de las equivalencias lingüísticas, llevado a cabo. La evaluación del trabajo realizado es satisfactoria ya que el resultado es que en este momento es posible explotar y trabajar con corpus anotados en los dos formalismos normalmente usados en la tarea de etiquetado sintáctico. Si las equivalencias lingüísticas son iguales, la conversión es expansible a otros corpus; de lo contrario, habría que volver a definir nuevas equivalencias. | In this paper the process for turning a dependency-based corpus to a constituent- based one is explained. For this purpose, first both the Dependency and the Constituent formalism are analized and then the corresponding equivalences of linguistic phenomena are treated. This process has had different phases in which the linguistic equivalences have been improved. Finally, the evaluation process is briefly explained and, as a result, we get corpora annotated in the two different formalisms usually proposed for syntactic tagging. If the linguistic equivalences are the same, the conversion process could be expanded to other corpus; otherwise, new equivalences should be defined.
URI: http://hdl.handle.net/10045/8573
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_41_18.pdf1,21 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.