Consultas degradadas en recuperación de información textual

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/10532
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorOtero Pombo, Juan-
dc.contributor.authorVilares Ferro, Jesús-
dc.contributor.authorVilares Ferro, Manuel-
dc.date.accessioned2009-05-19T15:52:44Z-
dc.date.available2009-05-19T15:52:44Z-
dc.date.issued2009-03-
dc.identifier.citationOTERO POMBO, Juan; VILARES FERRO, Jesús; VILARES FERRO, Manuel. “Consultas degradadas en recuperación de información textual”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 9-16en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/10532-
dc.description.abstractEn este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones.en
dc.description.abstractIn this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation.en
dc.description.sponsorshipEste trabajo ha sido parcialmente subvencionado por el Ministerio de Educación y Ciencia y FEDER (a través de los proyectos de investigación HUM2007-66607-C04-02 y HUM2007-66607-C04-03), y por la Xunta de Galicia (a través de los proyectos 05PXIC30501PN, 07SIN005206PR, INCITE07PXI104119ES y la ”Red Gallega de PLN y RI”).en
dc.languagespaen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.subjectn-gramas de caracteresen
dc.subjectConsultas degradadasen
dc.subjectRecuperación de informaciónen
dc.subjectCorrección ortográficaen
dc.subjectCharacter n-gramsen
dc.subjectDegraded queriesen
dc.subjectInformation retrievalen
dc.subjectSpelling correctionen
dc.subject.otherLenguajes y Sistemas Informáticosen
dc.titleConsultas degradadas en recuperación de información textualen
dc.title.alternativeCorrupted queries in text retrievalen
dc.typeinfo:eu-repo/semantics/articleen
dc.peerreviewedsien
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_42_01.pdf824,66 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.