Aprendizaje de gramáticas propabilísticas a partir de árboles sintácticos
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/1508
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Verdú Mas, José Luis | - |
dc.date.accessioned | 2007-09-06T07:00:36Z | - |
dc.date.available | 2007-09-06T07:00:36Z | - |
dc.date.issued | 2003-09 | - |
dc.identifier.citation | VERDÚ MAS, José Luis. “Aprendizaje de gramáticas propabilísticas a partir de árboles sintácticos”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 175-182 | en |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/1508 | - |
dc.description.abstract | En este artículo se analizan varios tipos de gramáticas independientes del contexto probabilísticas obtenidas a partir de corpus etiquetados sintácticamente (treebanks). Estas gramáticas se utilizan para la desambiguación léxica y sintáctica de frases procedentes del lenguaje natural. Los modelos que aquí se estudian son los siguientes: (1) uno que simplemente extrae las reglas contenidas en el corpus y cuenta el número de ocurrencias de cada una; (2) un modelo que además almacena información acerca de la categoría sintáctica del nodo padre, y (3) un modelo que extrae y estima las probabilidades de las reglas almacenando información acerca de la categoría sintáctica de los hijos. Este último permite análisis sintácticos más eficientes, disminuye considerablemente la perplejidad de los conjuntos de tests y supone formalmente una generalización del concepto de n-gramas al caso de árboles. | en |
dc.description.abstract | In this paper, we compare three different approaches to build a probabilistic context-free grammar for natural language parsing from a tree bank corpus: (1) a model that simply extracts the rules contained in the corpus and counts the number of occurrences of each rule; (2) a model that also stores information about the parent node's category, and (3) a model that estimates the probabilities according to a generalized k-gram scheme for trees with k = 3. The last model allows for faster parsing, decreases considerably the perplexity of test samples and may be seen as a generalization of the classic n-gram models to the case of trees. | en |
dc.description.sponsorship | Trabajo financiado por el proyecto de la CICyT número TIC2000-1599 y el proyecto de la Generalitat Valenciana número CTIDIB/2002/173. | en |
dc.language | spa | en |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | en |
dc.relation.ispartof | Procesamiento del lenguaje natural, nº 31 (septiembre 2003); pp. 175-182 | en |
dc.subject | Gramáticas probabilísticas de contexto libre | en |
dc.subject | Análisis sintáctico | en |
dc.subject | Treebanks | en |
dc.subject | Stochastic context-free grammar | en |
dc.title | Aprendizaje de gramáticas propabilísticas a partir de árboles sintácticos | en |
dc.type | info:eu-repo/semantics/article | en |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003) INV - TRANSDUCENS - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_31_21.pdf | 180,16 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.