Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1484
Información del item - Informació de l'item - Item information
Título: Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet
Autor/es: Gómez Hidalgo, José María | Puertas Sanz, Enrique | Carrero García, Francisco | Buenaga Rodríguez, Manuel de
Palabras clave: Categorización automática de texto | Filtrado de Internet | Aprendizaje sensible al coste | Receiver Operating Characteristic | Automated text categorization | Internet filtering | Cost sensitive learning
Fecha de publicación: sep-2003
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GÓMEZ HIDALGO, José María, et al. “Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 13-20
Resumen: El creciente problema del acceso a contenidos inapropiados de Internet se puede abordar como un problema de categorización automática de texto sensible al coste. En este artículo presentamos la evaluación comparativa de un rango representativo de algoritmos de aprendizaje y métodos de sensibilización al coste, sobre dos colecciones de páginas Web en español e inglés. Los resultados de nuestros experimentos son prometedores. | The access to inapropiate Internet content is an increasing problem that can be approached as a cost-sensitive Automated Text Categorization task. In this paper, we report a series of experiments that compare a representative range of learning algorithms and methods for making them cost-sensitive, on two Web pages collections in Spanish and English. The results of our experiments are promising.
Patrocinador/es: Esta investigación ha sido financiada parcialmente por la Comisión Europea a través del Safe Internet Action Plan (POESIA - SIAP-2117) y por el Ministerio de Ciencia y Tecnología a través del programa PROFIT (FIT-070000-2002-861).
URI: http://hdl.handle.net/10045/1484
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_31_02.pdf128,55 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.