Resolving prepositional phrase attachment ambiguities in Spanish with a classifier

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/16945
Información del item - Informació de l'item - Item information
Título: Resolving prepositional phrase attachment ambiguities in Spanish with a classifier
Título alternativo: Resolviendo las ambigüedades de adjunción de sintagmas preposicionales en castellano con un clasificador
Autor/es: Aguilar Caro, Nora | Alonso Alemany, Laura | Lloberes Salvatella, Marina | Castellón Masalles, Irene
Palabras clave: Adjunción de sintagma preposicional | EuroWordNet | Métodos empíricos | PP attachment | Empirical methods
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: abr-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: AGUILAR CARO, Nora, et al. “Resolving prepositional phrase attachment ambiguities in Spanish with a classifier”. Procesamiento del Lenguaje Natural. N. 46 (2011). ISSN 1135-5948, pp. 75-82
Resumen: En este trabajo presentamos un clasificador que resuelve cierta clase de ambigüedades de estructura sintáctica en español, concretamente, la ambigüedad de adjunción de un sintagma preposicional (PP attachment). Como punto de partida, utilizamos la gramática de dependencias Txala para el español integrada dentro de FreeLing, con una precisión del 61 % en la adjunción de sintagma preposicional. Nuestro objetivo es desarrollar un módulo especializado para la adjunción del sintagma preposicional tal que el analizador sintáctico combine las reglas gramaticales hechas a mano con información estadística inferida por el clasificador. Hemos evaluado diferentes clasificadores y diferentes rasgos para caracterizar las ambigüedades de adjunción de sintagma preposicional. Nuestra mejor propuesta mejora el rendimiento de EsTxala en 20 puntos, aunque aún se encuentra por debajo de otros métodos no supervisados, que alcanzan un 94 % de precisión. Sin embargo, hemos obtenido una mejor comprensión de los factores que intervienen en la desambiguación de la adjunción del sintagma preposicional, lo cual nos permitirá construir modelos más ligeros que puedan ser fácilmente integrados en un analizador de uso general como FreeLing. | In this paper we present a classifier that solves a certain kind of ambiguities in syntactic structure for Spanish, namely, ambiguities as to the point of adjunction of a prepositional phrase in the syntactic structure of a sentence (PP attachment). As a starting point, we used EsTxala dependency grammar for Spanish, integrated within FreeLing, with an accuracy score of 61 % on PP adjunction. Our target is to develop a specialized module for for PP attachment, so that the syntactic analyzer combines dependency grammar’s manual rules with statistical information infered out of a classifier. We have evaluated different classifiers and different features to characterize PP-attachment ambiguities. Our best approaches improve the performance of EsTxala by 20 points, but are still far from the performance of unsupervised methods reporting 94 % accuracy. We gained insight on the factors governing the disambiguation of PP attachment ambiguities, which will arguably let us build lighter models that can be easily integrated within a general-purpose analyzer as FreeLing.
Patrocinador/es: This work has been partially funded by the Spanish Science and Innovation Ministry, via the KNOW2 project (TIN2009-14715-C04). Nora Aguilar was funded by a scholarship from Spanish MAEC-AECID 00536854 Program II.E, and by a postgraduate studies grant from the Secretary of Public Education of the Mexican Government.
URI: http://hdl.handle.net/10045/16945
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 46 (2011)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_46_09.pdf916,44 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.