Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1484
Información del item - Informació de l'item - Item information
Títol: Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet
Autors: Gómez Hidalgo, José María | Puertas Sanz, Enrique | Carrero García, Francisco | Buenaga Rodríguez, Manuel de
Paraules clau: Categorización automática de texto | Filtrado de Internet | Aprendizaje sensible al coste | Receiver Operating Characteristic | Automated text categorization | Internet filtering | Cost sensitive learning
Data de publicació: de setembre-2003
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: GÓMEZ HIDALGO, José María, et al. “Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 13-20
Resum: El creciente problema del acceso a contenidos inapropiados de Internet se puede abordar como un problema de categorización automática de texto sensible al coste. En este artículo presentamos la evaluación comparativa de un rango representativo de algoritmos de aprendizaje y métodos de sensibilización al coste, sobre dos colecciones de páginas Web en español e inglés. Los resultados de nuestros experimentos son prometedores. | The access to inapropiate Internet content is an increasing problem that can be approached as a cost-sensitive Automated Text Categorization task. In this paper, we report a series of experiments that compare a representative range of learning algorithms and methods for making them cost-sensitive, on two Web pages collections in Spanish and English. The results of our experiments are promising.
Patrocinadors: Esta investigación ha sido financiada parcialmente por la Comisión Europea a través del Safe Internet Action Plan (POESIA - SIAP-2117) y por el Ministerio de Ciencia y Tecnología a través del programa PROFIT (FIT-070000-2002-861).
URI: http://hdl.handle.net/10045/1484
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_31_02.pdf128,55 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.