Inducción gramatical semisupervisada usando información de análisis superficial

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/22028
Información del item - Informació de l'item - Item information
Título: Inducción gramatical semisupervisada usando información de análisis superficial
Título alternativo: Semisupervised grammar induction based on text chunking information
Autor/es: Araujo Serna, Lourdes | Santamaría Martínez, Jesús
Palabras clave: Inducción gramatical | Métodos semisupervisados | Análisis superficial | Grammar induction | Semisupervised methods | Chunking
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2012
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ARAUJO, Lourdes; SANTAMARÍA, Jesús. “Inducción gramatical semisupervisada usando información de análisis superficial”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 35-42
Resumen: El análisis sintáctico de los textos es un proceso fundamental en el procesamiento del lenguaje natural que requiere disponer de la gramática correspondiente a la lengua considerada. La gramática puede obtenerse de un corpus anotado sintácticamente, pero tales corpora no existen para muchas lenguas. Esta razón ha provocado un interés creciente en los métodos no supervisados de inducción gramatical, que no requieren dichos corpora. Sin embargo, los resultados de estos métodos son menos precisos. Por este motivo nosotros hemos recurrido a información adicional menos costosa de obtener. Concretamente, en este trabajo estudiamos la forma de introducir el análisis sintáctico superficial para mejorar los resultados de la inducción gramatical no supervisada de un sistema basado en patrones léxicos. El análisis superficial o chunking identifica a los constituyentes de la oración, sin especificar su estructura interna. Los resultados han mostrado una mejora apreciable de los resultados a medida que se añaden distintos tipos de constituyentes. | Syntactic analysis of texts requires the availability of the grammar underlying the language. The grammar can be obtained from corpora syntactically annotated, but such corpora do not exist for many languages. This has led to a growing interest in unsupervised grammar induction, which does not require such annotations, but provides less accurate results. Aiming at improving the accuracy of this kind of approach, we have resorted to additional information, which can be obtained more easily. Shallow parsing or chunking identifies the sentence constituents, but without specifying their internal structure. In this work we have investigated how the results of a pattern-based unsupervised grammar induction system improve as data on new kind of phrase are added.
Patrocinador/es: Financiado por el proyecto Holopedia (TIN2010-21128-C02), y por el proyectos de la Comunidad Autónoma de Madrid MA2VICMR (S2009/TIC-1542).
URI: http://hdl.handle.net/10045/22028
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 48 (2012)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_48_04.pdf1,06 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.