Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/2956
Title: | Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL |
---|---|
Authors: | Puchol Blasco, Marcel | Saquete Boró, Estela | Martínez-Barco, Patricio |
Keywords: | Información temporal | Reconocimiento de expresiones temporales | Aprendizaje automático | Temporal information | Temporal expression recognition | Machine learning |
Issue Date: | Sep-2007 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | PUCHOL BLASCO, Marcel; SAQUETE BORÓ, Estela; MARTÍNEZ BARCO, Patricio. "Aprendizaje automático para el reconocimiento temporal multilingüe basado en TiMBL". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 97-104 |
Abstract: | Este artículo presenta un sistema basado en aprendizaje automático para el reconocimiento de expresiones temporales. El sistema utiliza la aplicación TiMBL, la cual consiste en un sistema de aprendizaje automático basado en memoria. La portabilidad que presenta este sistema hacia otros idiomas nuevos posee un coste muy reducido, ya que prácticamente no requiere de ningún recurso dependiente del lenguaje (únicamente requiere un tokenizador y un desambiguador léxico categorial, aunque la carencia del POS tagger no repercute mucho en los resultados finales del sistema). Este sistema ha sido evaluado para tres idiomas distintos: inglés, español e italiano. La evaluación realizada presenta resultados satisfactorios para corpus que contienen un gran número de ejemplos, mientras que obtiene resultados bastante pobres en aquellos corpus que contienen pocos ejemplos. | This paper presents a Machine Learning-based system for temporal expression recognition. The system uses the TiMBL application, which is a memory-based machine learning system. The portability of the system to other new languages has a very low cost, because it does not need any dependent language resource (only requires a tokenizer and a POS tagger, although the lack in POS tagger does not have enough repercussions on the final system results). This systems has been evaluated on three different languages: English, Spanish and Italian. The evaluation results are quite successful for corpus having a lot of examples; however it obtains very poor results with corpus that have only a few examples. |
Sponsor: | Esta investigación ha sido parcialmente financiada bajo los proyectos QALL-ME (FP6-IST- 033860), TEXT-MESS (TIN-2006-15265-C06-01) y GV06/028; y bajo la beca de investigación BFPI06/182 |
URI: | http://hdl.handle.net/10045/2956 |
ISSN: | 1135-5948 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007) INV - GPLSI - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_39_12.pdf | 185,05 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.