Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica del ruso

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/1556
Información del item - Informació de l'item - Item information
Title: Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica del ruso
Authors: Oliver González, Antoni | Castellón Masalles, Irene | Màrquez Villodre, Lluís
Keywords: Adquisición léxica | Morfología computacional | Filología eslava | Lengua rusa | Lexical acquisition | Computational morphology | Slavonic philology | Russian language
Issue Date: Sep-2003
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: OLIVER GONZÁLEZ, Antoni; CASTELLÓN MASALLES, Irene; MÀRQUEZ VILLODRE, Lluís. “Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica del ruso”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 269-276
Abstract: En este artíiculo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. | This paper present a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus.
Sponsor: Esta investigación se ha llevado a cabo con el apoyo de los proyectos INTERLINGUA (Universitat Oberta de Catalunya e IN3-IR266) y HERMES (TIC2000-0335-C03-02).
URI: http://hdl.handle.net/10045/1556
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_31_32.pdf227,01 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.