Inducción gramatical semisupervisada usando información de análisis superficial
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/22028
Título: | Inducción gramatical semisupervisada usando información de análisis superficial |
---|---|
Título alternativo: | Semisupervised grammar induction based on text chunking information |
Autor/es: | Araujo Serna, Lourdes | Santamaría Martínez, Jesús |
Palabras clave: | Inducción gramatical | Métodos semisupervisados | Análisis superficial | Grammar induction | Semisupervised methods | Chunking |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | mar-2012 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ARAUJO, Lourdes; SANTAMARÍA, Jesús. “Inducción gramatical semisupervisada usando información de análisis superficial”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 35-42 |
Resumen: | El análisis sintáctico de los textos es un proceso fundamental en el procesamiento del lenguaje natural que requiere disponer de la gramática correspondiente a la lengua considerada. La gramática puede obtenerse de un corpus anotado sintácticamente, pero tales corpora no existen para muchas lenguas. Esta razón ha provocado un interés creciente en los métodos no supervisados de inducción gramatical, que no requieren dichos corpora. Sin embargo, los resultados de estos métodos son menos precisos. Por este motivo nosotros hemos recurrido a información adicional menos costosa de obtener. Concretamente, en este trabajo estudiamos la forma de introducir el análisis sintáctico superficial para mejorar los resultados de la inducción gramatical no supervisada de un sistema basado en patrones léxicos. El análisis superficial o chunking identifica a los constituyentes de la oración, sin especificar su estructura interna. Los resultados han mostrado una mejora apreciable de los resultados a medida que se añaden distintos tipos de constituyentes. | Syntactic analysis of texts requires the availability of the grammar underlying the language. The grammar can be obtained from corpora syntactically annotated, but such corpora do not exist for many languages. This has led to a growing interest in unsupervised grammar induction, which does not require such annotations, but provides less accurate results. Aiming at improving the accuracy of this kind of approach, we have resorted to additional information, which can be obtained more easily. Shallow parsing or chunking identifies the sentence constituents, but without specifying their internal structure. In this work we have investigated how the results of a pattern-based unsupervised grammar induction system improve as data on new kind of phrase are added. |
Patrocinador/es: | Financiado por el proyecto Holopedia (TIN2010-21128-C02), y por el proyectos de la Comunidad Autónoma de Madrid MA2VICMR (S2009/TIC-1542). |
URI: | http://hdl.handle.net/10045/22028 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 48 (2012) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_48_04.pdf | 1,06 MB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.