Inducción de clases de comportamiento verbal a partir del corpus SENSEM

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/2973
Información del item - Informació de l'item - Item information
Títol: Inducción de clases de comportamiento verbal a partir del corpus SENSEM
Autors: Alonso Alemany, Laura | Castellón Masalles, Irene | Tinkova Tincheva, Nevena
Paraules clau: Adquisición de subcategorización | Análisis sintáctico | Clases sintácticas | Sentidos verbales | Acquiring verbal subcategorizations | Parsing | Syntactic classes | Verb senses
Data de publicació: de setembre-2007
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: ALONSO ALEMANY, Laura; CASTELLÓN MASALLES, Irene; TINKOVA TINCHEVA, Nevena. "Inducción de clases de comportamiento verbal a partir del corpus SENSEM". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948; pp. 123-130
Resum: En este artículo presentamos la construcción de un clasificador con el objetivo final de asignar automáticamente patrones de subcategorización a piezas verbales no conocidas previamente, partiendo de una generalización de patrones anotados manualmente. A partir del banco de datos SENSEM (Fernández et al 2004) se han adquirido los esquemas de subcategorización de 1161 sentidos verbales. Estos esquemas se han agrupado en clases de equivalencia mediante técnicas de clustering. Cada clase representa una generalización sobre el comportamiento sintáctico-semántico de los verbos que contiene. Nuestro objetivo final es enriquecer un lexicón verbal con esquemas de subcategorización, asignando automáticamente cada pieza verbal a una de estas clases, a partir de ejemplos de corpus anotados automáticamente. Presentamos una evaluación preliminar de un clasificador que lleva a cabo esta tarea. | In this paper we present the construction of a classifier with the final objective of automatically assigning subcategorization frames to previously unseen verb senses of Spanish, starting from a generalization of manually annotated frames. Taking as a departure point the data base SENSEM (Fernández et al 2004), the subcategorization frames of 1161 verbal senses have been acquired. These frames have been grouped in equivalence classes by clustering techniques. Each class represents a generalization over the syntactico-semantic behaviour of the verbs in it. Our final target is to enrich a verbal lexicon with subcategorization frames, automatically assigning each verbal piece to one of these classes based on examples from corpus that have been automatically analyzed. We present a preliminary evaluation of a classifier that carries out this task.
Patrocinadors: Esta investigación ha sido posible gracias al proyecto KNOW (TIN2006-1549-C03-02) del Ministerio de Educación y Ciencia, a una beca Postdoctoral Beatriu de Pinós de la Generalitat de Catalunya otorgada a Laura Alonso y a la beca Predoctoral FI-IQUC también de la Generalitat de Catalunya, otorgada a Nevena Tinkova, con número de expediente 2004FI-IQUC1/00084.
URI: http://hdl.handle.net/10045/2973
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_39_15.pdf160,83 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.