Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/1484
Información del item - Informació de l'item - Item information
Title: Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet
Authors: Gómez Hidalgo, José María | Puertas Sanz, Enrique | Carrero García, Francisco | Buenaga Rodríguez, Manuel de
Keywords: Categorización automática de texto | Filtrado de Internet | Aprendizaje sensible al coste | Receiver Operating Characteristic | Automated text categorization | Internet filtering | Cost sensitive learning
Issue Date: Sep-2003
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: GÓMEZ HIDALGO, José María, et al. “Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 13-20
Abstract: El creciente problema del acceso a contenidos inapropiados de Internet se puede abordar como un problema de categorización automática de texto sensible al coste. En este artículo presentamos la evaluación comparativa de un rango representativo de algoritmos de aprendizaje y métodos de sensibilización al coste, sobre dos colecciones de páginas Web en español e inglés. Los resultados de nuestros experimentos son prometedores. | The access to inapropiate Internet content is an increasing problem that can be approached as a cost-sensitive Automated Text Categorization task. In this paper, we report a series of experiments that compare a representative range of learning algorithms and methods for making them cost-sensitive, on two Web pages collections in Spanish and English. The results of our experiments are promising.
Sponsor: Esta investigación ha sido financiada parcialmente por la Comisión Europea a través del Safe Internet Action Plan (POESIA - SIAP-2117) y por el Ministerio de Ciencia y Tecnología a través del programa PROFIT (FIT-070000-2002-861).
URI: http://hdl.handle.net/10045/1484
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_31_02.pdf128,55 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.