AQA: a multilingual anaphora annotation scheme for question answering
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/10550
Title: | AQA: a multilingual anaphora annotation scheme for question answering |
---|---|
Other Titles: | AQA: un modelo de anotación anafórico multilingüe para búsqueda de respuestas |
Authors: | Boldrini, Ester | Puchol Blasco, Marcel | Navarro Colorado, Borja | Martínez-Barco, Patricio | Vargas-Sierra, Chelo |
Research Group/s: | Procesamiento del Lenguaje Natural y Sistemas de Información | El Inglés Profesional y Académico |
Center, Department or Service: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos | Universidad de Alicante. Departamento de Filología Inglesa |
Keywords: | Resolución de la anáfora | Corpus multilingüe | Aprendizaje automático | Acuerdo de anotación | Interacción | Sistemas de búsqueda de respuestas | Anaphora resolution | Multilingual corpora | Machine learning | Interannotator agreement | Interaction | Question answering systems |
Knowledge Area: | Lenguajes y Sistemas Informáticos |
Issue Date: | Mar-2009 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | BOLDRINI, Ester, et al. “AQA: a multilingual anaphora annotation scheme for question answering”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 97-104 |
Abstract: | En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina. | This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction. |
Sponsor: | This paper has been supported by the following projects: “Question Answering Learning technologies in a multiLingual and Multimodal Environment QALL-ME” (FP6 IST-033860), “Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TEXT-MESS” (TIN2006-15265-C06-01), by the Generalitat Valenciana throught the research grant BFPI06/182, and by the grant BII2008-7898717 of the University of Alicante. |
URI: | http://hdl.handle.net/10045/10550 |
ISSN: | 1135-5948 |
Language: | eng |
Type: | info:eu-repo/semantics/article |
Peer Review: | si |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009) INV - IPA - Artículos de Revistas Nacionales e Internacionales INV - GPLSI - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_42_12.pdf | 803,55 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.