Parsing Large XES Files for Discovering Process Models: A Big Data Problem

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/49370
Información del item - Informació de l'item - Item information
Título: Parsing Large XES Files for Discovering Process Models: A Big Data Problem
Autor/es: Aponte Báez, Yosvanys | Sánchez, Alexander | Marco Such, Manuel
Grupo/s de investigación o GITE: Transducens
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Indexing | Big data | XES | Hadoop | Map Reduce
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: jul-2015
Editor: IJARCSSE
Cita bibliográfica: International Journal of Advanced Research in Computer Science and Software Engineering. 2015, 5(7): 144-149
Resumen: Process mining is a group of techniques for retrieving de-facto models using system traces. Discovering algorithms can obtain mathematical models exploiting the information contained into list of events of activities. Completeness of the traces is relevant for the accuracy of the final results. Noiseless traces appear as an ideal scenario. The performance of the algorithms is significant reduce if the log files are not processed efficiently. XES is a logical model for process logs stored in data centric xml files. In real processes the sizes of the logs increase exponentially. Parsing XES files is presented as a big data problem in real scenarios with dense traces. Lazy parsers and DOM models are not enough appropriate in scenarios with large volumes of data. We discuss this problematic and how to use indexing techniques for retrieving useful information for process mining. An XES compression schema is also discussed for reducing the index construction time.
URI: http://hdl.handle.net/10045/49370
ISSN: 2277-6451 (Print) | 2277-128X (Online)
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: CC Attribution-NonCommercial-NoDerivs 4.0
Revisión científica: si
Versión del editor: http://www.ijarcsse.com/index.php
Aparece en las colecciones:INV - TRANSDUCENS - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailV5I7-01777.pdf602,73 kBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons