Detección de menciones anidadas basada en expansión para el español

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18541
Información del item - Informació de l'item - Item information
Título: Detección de menciones anidadas basada en expansión para el español
Título alternativo: Nested mention detection in Spanish based on expansion
Autor/es: Puchol Blasco, Marcel | Martínez-Barco, Patricio
Grupo/s de investigación o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Detección | Menciones | Resolución de correferencia | Detection | Mentions | Coreference resolution
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: PUCHOL BLASCO, Marcel; MARTÍNEZ BARCO, Patricio. “Detección de menciones anidadas basada en expansión para el español”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 215-221
Resumen: La detección de menciones es el primer módulo utilizado en los sistemas de resolución de la correferencia. Debido a que los errores se van acarreando de un módulo a otro, es importante que los resultados obtenidos por este módulo sean los mejores posibles. Dentro del campo de la detección de menciones, las menciones anidadas son las más difíciles de detectar. En este artículo presentamos un sistema de detección de menciones anidadas basado en expansión, un nuevo modelo de detección de elementos de Procesamiento de Lenguaje Natural anidados basado en aprendizaje automático. Los resultados obtenidos por nuestro sistema son superiores al 72 % de medida-F en el corpus AnCora. No podemos comparar directamente nuestros resultados con otros sistemas debido a que no existen como tales, pero si comparamos la medida-F media obtenida por otros sistemas en la detección de todo tipo de menciones (no solo menciones anidadas), y que nosotros estamos tratando con las menciones más difíciles, conseguimos resultados favorables. | Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP based on machine learning. The results obtained by our system are above the 72 % in F-measure in AnCora corpus. We can not compare directly our results with other systems, since there are not exist, but if we consider that the average F-measure obtained by other systems for all mention (not only nested mentions), and that we are dealing with the most difficult mentions, we achieve good results.
Patrocinador/es: Este artículo está parcialmente financiado por el Ministerio de Ciencia e Innovación - Gobierno de España (beca no. TIN2009-13391-C04-01), y Conselleria d’Educació - Generalitat Valenciana (beca no. PROMETEO/2009/119).
URI: http://hdl.handle.net/10045/18541
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 47 (2011)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_47_23.pdf409,15 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.