Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/2956
Información del item - Informació de l'item - Item information
Title: Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL
Authors: Puchol Blasco, Marcel | Saquete Boró, Estela | Martínez-Barco, Patricio
Keywords: Información temporal | Reconocimiento de expresiones temporales | Aprendizaje automático | Temporal information | Temporal expression recognition | Machine learning
Issue Date: Sep-2007
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: PUCHOL BLASCO, Marcel; SAQUETE BORÓ, Estela; MARTÍNEZ BARCO, Patricio. "Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 97-104
Abstract: Este artículo presenta un sistema basado en aprendizaje automático para el reconocimiento de expresiones temporales. El sistema utiliza la aplicación TiMBL, la cual consiste en un sistema de aprendizaje automático basado en memoria. La portabilidad que presenta este sistema hacia otros idiomas nuevos posee un coste muy reducido, ya que prácticamente no requiere de ningún recurso dependiente del lenguaje (únicamente requiere un tokenizador y un desambiguador léxico categorial, aunque la carencia del POS tagger no repercute mucho en los resultados finales del sistema). Este sistema ha sido evaluado para tres idiomas distintos: inglés, español e italiano. La evaluación realizada presenta resultados satisfactorios para corpus que contienen un gran número de ejemplos, mientras que obtiene resultados bastante pobres en aquellos corpus que contienen pocos ejemplos. | This paper presents a Machine Learning-based system for temporal expression recognition. The system uses the TiMBL application, which is a memory-based machine learning system. The portability of the system to other new languages has a very low cost, because it does not need any dependent language resource (only requires a tokenizer and a POS tagger, although the lack in POS tagger does not have enough repercussions on the final system results). This systems has been evaluated on three different languages: English, Spanish and Italian. The evaluation results are quite successful for corpus having a lot of examples; however it obtains very poor results with corpus that have only a few examples.
Sponsor: Esta investigación ha sido parcialmente financiada bajo los proyectos QALL-ME (FP6-IST- 033860), TEXT-MESS (TIN-2006-15265-C06-01) y GV06/028; y bajo la beca de investigación BFPI06/182
URI: http://hdl.handle.net/10045/2956
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_39_12.pdf185,05 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.