Consultas degradadas en recuperación de información textual

Otero Pombo, Juan; Vilares Ferro, Jesús; Vilares Ferro, Manuel

Consultas degradadas en recuperación de información textual

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/10532

Registro completo de metadatos

Registro completo de metadatos
Campo DC	Valor	Idioma
dc.contributor.author	Otero Pombo, Juan	-
dc.contributor.author	Vilares Ferro, Jesús	-
dc.contributor.author	Vilares Ferro, Manuel	-
dc.date.accessioned	2009-05-19T15:52:44Z	-
dc.date.available	2009-05-19T15:52:44Z	-
dc.date.issued	2009-03	-
dc.identifier.citation	OTERO POMBO, Juan; VILARES FERRO, Jesús; VILARES FERRO, Manuel. “Consultas degradadas en recuperación de información textual”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 9-16	en
dc.identifier.issn	1135-5948	-
dc.identifier.uri	http://hdl.handle.net/10045/10532	-
dc.description.abstract	En este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones.	en
dc.description.abstract	In this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation.	en
dc.description.sponsorship	Este trabajo ha sido parcialmente subvencionado por el Ministerio de Educación y Ciencia y FEDER (a través de los proyectos de investigación HUM2007-66607-C04-02 y HUM2007-66607-C04-03), y por la Xunta de Galicia (a través de los proyectos 05PXIC30501PN, 07SIN005206PR, INCITE07PXI104119ES y la ”Red Gallega de PLN y RI”).	en
dc.language	spa	en
dc.publisher	Sociedad Española para el Procesamiento del Lenguaje Natural	en
dc.subject	n-gramas de caracteres	en
dc.subject	Consultas degradadas	en
dc.subject	Recuperación de información	en
dc.subject	Corrección ortográfica	en
dc.subject	Character n-grams	en
dc.subject	Degraded queries	en
dc.subject	Information retrieval	en
dc.subject	Spelling correction	en
dc.subject.other	Lenguajes y Sistemas Informáticos	en
dc.title	Consultas degradadas en recuperación de información textual	en
dc.title.alternative	Corrupted queries in text retrieval	en
dc.type	info:eu-repo/semantics/article	en
dc.peerreviewed	si	en
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_42_01.pdf		824,66 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro sencillo