AQA: a multilingual anaphora annotation scheme for question answering

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/10550
Información del item - Informació de l'item - Item information
Título: AQA: a multilingual anaphora annotation scheme for question answering
Título alternativo: AQA: un modelo de anotación anafórico multilingüe para búsqueda de respuestas
Autor/es: Boldrini, Ester | Puchol Blasco, Marcel | Navarro Colorado, Borja | Martínez-Barco, Patricio | Vargas-Sierra, Chelo
Grupo/s de investigación o GITE: Procesamiento del Lenguaje Natural y Sistemas de Información | El Inglés Profesional y Académico
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos | Universidad de Alicante. Departamento de Filología Inglesa
Palabras clave: Resolución de la anáfora | Corpus multilingüe | Aprendizaje automático | Acuerdo de anotación | Interacción | Sistemas de búsqueda de respuestas | Anaphora resolution | Multilingual corpora | Machine learning | Interannotator agreement | Interaction | Question answering systems
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2009
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: BOLDRINI, Ester, et al. “AQA: a multilingual anaphora annotation scheme for question answering”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 97-104
Resumen: En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina. | This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction.
Patrocinador/es: This paper has been supported by the following projects: “Question Answering Learning technologies in a multiLingual and Multimodal Environment QALL-ME” (FP6 IST-033860), “Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TEXT-MESS” (TIN2006-15265-C06-01), by the Generalitat Valenciana throught the research grant BFPI06/182, and by the grant BII2008-7898717 of the University of Alicante.
URI: http://hdl.handle.net/10045/10550
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)
INV - IPA - Artículos de Revistas Nacionales e Internacionales
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_42_12.pdf803,55 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.