Consultas degradadas en recuperación de información textual
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/10532
Registro completo de metadatos
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | Otero Pombo, Juan | - |
dc.contributor.author | Vilares Ferro, Jesús | - |
dc.contributor.author | Vilares Ferro, Manuel | - |
dc.date.accessioned | 2009-05-19T15:52:44Z | - |
dc.date.available | 2009-05-19T15:52:44Z | - |
dc.date.issued | 2009-03 | - |
dc.identifier.citation | OTERO POMBO, Juan; VILARES FERRO, Jesús; VILARES FERRO, Manuel. “Consultas degradadas en recuperación de información textual”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 9-16 | en |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/10532 | - |
dc.description.abstract | En este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones. | en |
dc.description.abstract | In this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation. | en |
dc.description.sponsorship | Este trabajo ha sido parcialmente subvencionado por el Ministerio de Educación y Ciencia y FEDER (a través de los proyectos de investigación HUM2007-66607-C04-02 y HUM2007-66607-C04-03), y por la Xunta de Galicia (a través de los proyectos 05PXIC30501PN, 07SIN005206PR, INCITE07PXI104119ES y la ”Red Gallega de PLN y RI”). | en |
dc.language | spa | en |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | en |
dc.subject | n-gramas de caracteres | en |
dc.subject | Consultas degradadas | en |
dc.subject | Recuperación de información | en |
dc.subject | Corrección ortográfica | en |
dc.subject | Character n-grams | en |
dc.subject | Degraded queries | en |
dc.subject | Information retrieval | en |
dc.subject | Spelling correction | en |
dc.subject.other | Lenguajes y Sistemas Informáticos | en |
dc.title | Consultas degradadas en recuperación de información textual | en |
dc.title.alternative | Corrupted queries in text retrieval | en |
dc.type | info:eu-repo/semantics/article | en |
dc.peerreviewed | si | en |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_42_01.pdf | 824,66 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.