Transforming a constituency treebank into a dependency treebank

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1309
Información del item - Informació de l'item - Item information
Título: Transforming a constituency treebank into a dependency treebank
Autor/es: Gelbukh Khan, Alexander Felixovitch | Torres Ramos, Sulema | Calvo Castro, Francisco Hiram
Palabras clave: Corpus anotados sintácticamente | Constituyentes | Dependencias | Formalismos gramaticales | Treebanks | Constituency | Dependency | Grammar formalisms
Fecha de publicación: sep-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GELBUKH KHAN, Alexander Felixovitch; TORRES RAMOS, Sulema; CALVO CASTRO, Francisco Hiram. “Transforming a constituency treebank into a dependency treebank”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 145-152
Resumen: Presentamos una técnica heurística para convertir un corpus anotado sintácticamente dentro del formalismo de constituyentes, a un corpus anotado dentro del formalismo de dependencias. Particularmente comentamos sobre nuestra experiencia en convertir el corpus Cast3LB del español. El método consiste en extracción de una gramática libre de contexto del corpus etiquetado, identificación automática del elemento rector en cada regla, y usando esta información para la construcción del árbol de dependencias. Nuestras heurísticas identifican el elemento rector de las reglas con precisión de 99% y cobertura de 80%, con lo que el algoritmo identifica correctamente 92% de las relaciones de dependencias entre las palabras. | We present a heuristic technique for converting a constituency treebank into a dependency treebank. In particular, we comment on our experience in converting the Spanish treebank Cast3LB. We extract a context-free grammar from the treebank, automatically identify the head in each rule, and use this information for constructing the dependency tree. Our heuristics have 99% precision and 80% recall in identifying the head in the rules, which gives 92% accuracy in identifying dependencies between words.
URI: http://hdl.handle.net/10045/1309
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_35_18.pdf251,92 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.