Error analysis for the improvement of subject ellipsis detection

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18542
Información del item - Informació de l'item - Item information
Título: Error analysis for the improvement of subject ellipsis detection
Título alternativo: Análisis de errores para mejorar la detección de elipsis de sujeto
Autor/es: Rello, Luz | Ferraro, Gabriela | Burga, Alicia
Palabras clave: Elipsis de sujeto | Construcción impersonal | Pronombre zero | Análisis de errores | Análisis lingüístico | Aprendizaje automático | Subject ellipsis | Impersonal construction | Zero pronoun | Error analysis | Linguistic analysis | Machine learning
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: RELLO, Luz; FERRARO, Gabriela; BURGA, Alicia. “Error analysis for the improvement of subject ellipsis detection”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 223-230
Resumen: En este trabajo se presenta el análisis de los errores de un método de detección de elipsis de sujeto en español, con el fin de mejorar el sistema en el futuro. El sistema que se evalúa utiliza aprendizaje automático y alcanza una exactitud del 85,3%. El análisis se ha realizado extrayendo de los datos de aprendizaje las instancias que el sistema clasifica erróneamente (1.001), con objeto de establecer una tipología de errores. Cada tipo de error se ha considerado teniendo en cuenta tanto los valores de las características de las instancias como los patrones lingüísticos involucrados. Finalmente, se proponen nuevas características y un conjunto de reglas que puedan aportar una mayor precisión al método. | This paper presents an analysis of the errors of a machine learning method that allow us to propose changes to improve it in future developments. The evaluated system detects Spanish subject ellipsis and yields an accuracy of 85.3%. We extract the erroneously classified instances of our training data (1,001) and classify the errors. We perform an analysis of these instances taking into account the features and the linguistic patterns involved, which motivate the inclusion of new features and rules in the system.
URI: http://hdl.handle.net/10045/18542
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 47 (2011)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_47_24.pdf515,74 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.