Aplicación de técnicas de extracción de información en bibliotecas digitales
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1904
Título: | Aplicación de técnicas de extracción de información en bibliotecas digitales |
---|---|
Autor/es: | Bia Platas, Alejandro | Muñoz, Rafael |
Palabras clave: | Extracción de información | Bibliotecas digitales | HTML |
Fecha de publicación: | sep-2000 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | BIA PLATAS, Alejandro; MUÑOZ GUILLENA, Rafael. “Aplicación de técnicas de extracción de información en bibliotecas digitales”. Procesamiento del lenguaje natural. Nº 26 (sept. 2000), pp. 207-214 |
Resumen: | Con frecuencia, las Bibliotecas Digitales tienen la necesidad de extraer información a partir de documentos pobremente marcados para almacenarla en bases de datos o crear nuevos documentos hipertexto con un marcado altamente estructurado. En este trabajo, abordaremos el problema de extraer información bibliográfica a partir de informes literarios en formato HTML para alimentar una base de datos de publicaciones gallegas de una Biblioteca Digital para ser consultada a través de Internet. Para este fin se ha utilizado con éxito una metodología que aprovecha la información contenida en las marcas HTML y que a su vez aplica técnicas de Procesamiento del Lenguaje Natural (PLN). |
URI: | http://hdl.handle.net/10045/1904 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 26 (septiembre 2000) INV - GPLSI - Artículos de Revistas INV - IWAD - Artículos de Revistas |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_26_31.pdf | 479,75 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.