Dossier Next
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/102434
Title: | Dossier Next |
---|---|
Authors: | Fernández Martínez, Javier | Gómez, José M. | Martínez-Barco, Patricio | Gutiérrez, Yoan | Llopis, Fernando | Muñoz, Rafael | Montoyo, Andres | Moreda, Paloma | Palomar, Manuel |
Right's holder: | Universidad de Alicante |
Research Group/s: | Procesamiento del Lenguaje Natural y Sistemas de Información (GPLSI) |
Center, Department or Service: | Universidad de Alicante. Instituto Universitario de Investigación Informática | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Keywords: | Tecnologías del Lenguaje Humano | Extracción de información | Crawler | Aplicación web |
Knowledge Area: | Lenguajes y Sistemas Informáticos |
Issue Date: | 10-Feb-2020 |
Abstract: | Dossier Next es una aplicación web que permite rastrear y clasificar de forma automática y periódica la información procedente de cualquier tipo de fuente de internet con contenido textual i.e. páginas web, periódicos digitales, boletines oficiales, etc., extrayendo únicamente la información más interesante para el usuario y descartando el resto. Para comenzar la recolección de información, el usuario debe indicar las fuentes a partir de las cuales desea obtener información, haciendo referencia a cada una las partes de interés para la recuperación de información, i.e. título, cuerpo, fecha, autor, etc. Para que el sistema pueda decidir qué contenido es relevante para el usuario, éste debe indicar también una serie de palabras claves, que deben aparecer en el documento en cuestión. Una vez establecida esta configuración del sistema se procede a descargar toda la información deseada por el usuario. Desde la página inicial se pueden visualizar los documentos por fecha y fuente. | Dossier Next is a web application that allows you to automatically and periodically track and classify information from any type of Internet source with textual content i.e. web pages, digital newspapers, official bulletins, etc., extracting only the most interesting information for the user and discarding the rest. To start collecting information, the user must define the sources from which to obtain information, indicating for each one the relevant document parts i.e. title, body, date, author, etc. How the user sets-up the searching criteria? The user must also indicate a series of keywords, which must appear in the document to be considered relevant. Once this system configuration is established, all the information desired by the user is downloaded. From the home page you can display the documents by date and source. |
Sponsor: | Este trabajo ha sido parcialmente financiado por la Universidad de Alicante (España), la Generalitat Valenciana y el Gobierno Español a través de los proyectos Tecnologías del Lenguaje Humano para una Sociedad Inclusiva Igualitaria y Accesible (PROMETEU/2018/089), Modelado del Comportamiento de Entidades Digitales mediante Tecnologías del Lenguaje Humano (RTI2018- 094653-B-C22) e Integer: Intelligent Text Generation, Generación Inteligente de Textos (RTI2018-094649-B-I00). |
URI: | http://hdl.handle.net/10045/102434 |
Language: | spa |
Type: | software |
Rights: | © Universitat d'Alacant / Universidad de Alicante |
Peer Review: | no |
Appears in Collections: | Registro de Programas de Ordenador y Bases de Datos |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
![]() | Memoria descriptiva | 54,75 kB | Adobe PDF | Open Preview |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.