Català Roig, Neus, Castell Ariño, Nuria Construcción automática de diccionarios de patrones de extracción de información CATALÀ ROIG, Neus; CASTELL ARIÑO, Nuria. “Construcción automática de diccionarios de patrones de extracción de información”. Procesamiento del lenguaje natural. Nº 21 (jul. 1997), pp. 123-136 URI: http://hdl.handle.net/10045/2079 DOI: ISSN: 1135-5948 Abstract: Uno de los componentes esenciales de un sistema de extracción de información es el diccionario de patrones necesarios para identificar la información relevante de un documento. Construir un diccionario manualmente además de ser costoso, incide negativamente en la portabilidad del sistema a nuevos dominios. La automatización del proceso de obtención de diccionarios para sistemas de extracción resuelve en parte este problema, aunque sigue precisando la intervención de un experto. En este artículo se propone una metodología para el aprendizaje automático de patrones de extracción partiendo de corpus textuales sin anotaciones, representativos del dominio de trabajo. La metodología incluye diversas etapas, de las cuales destaca la generalización de patrones específicos para obtener patrones de mayor cobertura manteniendo la relevancia de la información extraída. La generalización conlleva además la compactación del diccionario y por tanto reduce el volumen de información a validar por parte del experto. Keywords:Extracción de información, Recuperación de información, Aprendizaje automático, Patrones de extracción Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article