Desambiguación de términos basada en IDF aplicada a recuperación de información
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/16948
Título: | Desambiguación de términos basada en IDF aplicada a recuperación de información |
---|---|
Título alternativo: | Word sense disambiguation based on IDF applied to information retrieval |
Autor/es: | Perea Ortega, José Manuel | Martínez Santiago, Fernando | García Cumbreras, Miguel Ángel | Montejo Ráez, Arturo |
Palabras clave: | Desambiguación de términos | Recuperación de información | IDF | Word sense disambiguation | Information retrieval |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | mar-2011 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | PEREA ORTEGA, José Manuel, et al. “Desambiguación de términos basada en IDF aplicada a recuperación de información”. Procesamiento del Lenguaje Natural. N. 46 (2011). ISSN 1135-5948, pp. 99-106 |
Resumen: | Por regla general, la aplicación de la desambiguación del sentido de las palabras (Word Sense Disambiguation, WSD) viene determinada exclusivamente por la confianza en el sistema desambiguador utilizado. En este trabajo se realiza un estudio en el ámbito de la Recuperación de Información (Information Retrieval, IR) sobre la incidencia que tiene en la desambiguación otros factores, tales como la confianza en la herramienta de desambiguación, el grado de polisemia o granularidad y la diferencia en la fuerza de discriminación entre el término original y el desambiguado. Por tanto, se propone un enfoque para decidir si un término debe ser desambiguado o no y aplicarlo a recuperación de información. Finalmente, se muestra que una desambiguación selectiva de términos basada en Frecuencia Inversa de Documento (Inverse Document Frequency, IDF) mejora ligeramente el rendimiento de un sistema de recuperación de información. | The application of Word Sense Disambiguation (WSD) is usually determined exclusively by the trust in the disambiguation system used. In this paper, a study in the Information Retrieval (IR) field is carried out about the impact of others factors in WSD such as the confidence of the WSD tool, the grade of polisemy or granularity and the difference in the discrimination strength between the original term and the disambiguated one. Thus, a proposal to decide whether a word should be disambiguated or not according to Inverse Document Frequency (IDF) is presented. Finally, it is shown that a selective disambiguation based on IDF improves slightly the performance of an IR system. |
Patrocinador/es: | Este trabajo ha sido cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER), proyecto TIN2009-13391-C04-02 (MICINN), proyecto GeOasis (P08-TIC-41999) de la Junta de Andalucía, proyecto UJA2009/12/14 (Universidad de Jaén) y por el proyecto Geocaching Urbano (RFC/IEG2010). |
URI: | http://hdl.handle.net/10045/16948 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 46 (2011) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_46_12.pdf | 678,45 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.