Otero Pombo, Juan, Vilares Ferro, Jesús, Vilares Ferro, Manuel Consultas degradadas en recuperación de información textual OTERO POMBO, Juan; VILARES FERRO, Jesús; VILARES FERRO, Manuel. “Consultas degradadas en recuperación de información textual”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 9-16 URI: http://hdl.handle.net/10045/10532 DOI: ISSN: 1135-5948 Abstract: En este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones. In this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation. Keywords:n-gramas de caracteres, Consultas degradadas, Recuperación de información, Corrección ortográfica, Character n-grams, Degraded queries, Information retrieval, Spelling correction Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article