Inducción de clases de comportamiento verbal a partir del corpus SENSEM

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/2973
Información del item - Informació de l'item - Item information
Title: Inducción de clases de comportamiento verbal a partir del corpus SENSEM
Authors: Alonso Alemany, Laura | Castellón Masalles, Irene | Tinkova Tincheva, Nevena
Keywords: Adquisición de subcategorización | Análisis sintáctico | Clases sintácticas | Sentidos verbales | Acquiring verbal subcategorizations | Parsing | Syntactic classes | Verb senses
Issue Date: Sep-2007
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: ALONSO ALEMANY, Laura; CASTELLÓN MASALLES, Irene; TINKOVA TINCHEVA, Nevena. "Inducción de clases de comportamiento verbal a partir del corpus SENSEM". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948; pp. 123-130
Abstract: En este artículo presentamos la construcción de un clasificador con el objetivo final de asignar automáticamente patrones de subcategorización a piezas verbales no conocidas previamente, partiendo de una generalización de patrones anotados manualmente. A partir del banco de datos SENSEM (Fernández et al 2004) se han adquirido los esquemas de subcategorización de 1161 sentidos verbales. Estos esquemas se han agrupado en clases de equivalencia mediante técnicas de clustering. Cada clase representa una generalización sobre el comportamiento sintáctico-semántico de los verbos que contiene. Nuestro objetivo final es enriquecer un lexicón verbal con esquemas de subcategorización, asignando automáticamente cada pieza verbal a una de estas clases, a partir de ejemplos de corpus anotados automáticamente. Presentamos una evaluación preliminar de un clasificador que lleva a cabo esta tarea. | In this paper we present the construction of a classifier with the final objective of automatically assigning subcategorization frames to previously unseen verb senses of Spanish, starting from a generalization of manually annotated frames. Taking as a departure point the data base SENSEM (Fernández et al 2004), the subcategorization frames of 1161 verbal senses have been acquired. These frames have been grouped in equivalence classes by clustering techniques. Each class represents a generalization over the syntactico-semantic behaviour of the verbs in it. Our final target is to enrich a verbal lexicon with subcategorization frames, automatically assigning each verbal piece to one of these classes based on examples from corpus that have been automatically analyzed. We present a preliminary evaluation of a classifier that carries out this task.
Sponsor: Esta investigación ha sido posible gracias al proyecto KNOW (TIN2006-1549-C03-02) del Ministerio de Educación y Ciencia, a una beca Postdoctoral Beatriu de Pinós de la Generalitat de Catalunya otorgada a Laura Alonso y a la beca Predoctoral FI-IQUC también de la Generalitat de Catalunya, otorgada a Nevena Tinkova, con número de expediente 2004FI-IQUC1/00084.
URI: http://hdl.handle.net/10045/2973
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_39_15.pdf160,83 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.