Creación, etiquetación y desambiguación de un corpus de referencia del español

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/1769
Información del item - Informació de l'item - Item information
Title: Creación, etiquetación y desambiguación de un corpus de referencia del español
Authors: Civit Torruella, Montserrat | Castellón Masalles, Irene | Martí Antonín, Maria Antònia
Keywords: Anotación morfosintáctica | Desambiguación morfosintáctica | Corpus | Lengua española
Issue Date: Sep-2001
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: CIVIT TORRUELLA, Montserrat; CASTELLÓN MASALLES, Irene; MARTÍ ANTONÍN, Maria Antònia. “Creación, etiquetación y desambiguación de un corpus de referencia del español”. Procesamiento del lenguaje natural. Nº 27 (sept. 2001), pp. 21-28
Abstract: En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación.
Sponsor: Este trabajo ha sido parcialmente financiado por una beca FPU (AP98-39864555), por la CICYT TIC98-0423-C06 y por X-Tract (PB98-1226).
URI: http://hdl.handle.net/10045/1769
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 27 (septiembre 2001)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_27_02.pdf162,74 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.