Fénix: a flexible information exchange data model for natural language processing

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/35764
Información del item - Informació de l'item - Item information
Títol: Fénix: a flexible information exchange data model for natural language processing
Títol alternatiu: Fénix: un modelo de datos flexible para el intercambio de información en procesamiento del lenguaje natural
Autors: Gómez, José M. | Tomás, David | Moreda, Paloma
Grups d'investigació o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centre, Departament o Servei: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Paraules clau: Data model | NLP tools | Resource integration | Information exchange | Modelo de datos | Herramientas de PLN | Integración de recursos | Intercambio de información
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de març-2014
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2014, 52: 21-28
Resum: In this paper we describe Fénix, a data model for exchanging information between Natural Language Processing applications. The format proposed is intended to be flexible enough to cover both current and future data structures employed in the field of Computational Linguistics. The Fénix architecture is divided into four separate layers: conceptual, logical, persistence and physical. This division provides a simple interface to abstract the users from low-level implementation details, such as programming languages and data storage employed, allowing them to focus in the concepts and processes to be modelled. The Fénix architecture is accompanied by a set of programming libraries to facilitate the access and manipulation of the structures created in this framework. We will also show how this architecture has been already successfully applied in different research projects. | En este artículo se describe Fénix, un modelo de datos para el intercambio de información entre aplicaciones en el campo del Procesamiento del Lenguaje Natural. El formato propuesto está pensado para ser lo suficientemente flexible como para dar cobertura a estructuras de datos, tanto presentes como futuras, empleadas en el campo de la Lingüística Computacional. La arquitectura Fénix está dividida en cuatro capas: conceptual, lógica, persistencia y física. Esta división proporciona una interfaz sencilla para abstraer a los usuarios de los detalles de implementación de bajo nivel, como los lenguajes de programación o el almacenamiento de datos empleado, permitiéndoles centrarse en los conceptos y procesos a modelar. La arquitectura Fénix viene acompañada por un conjunto de librerías de programación para facilitar el acceso y manipulación de las estructuras creadas en este marco de trabajo. También mostraremos cómo se ha aplicado de manera exitosa esta arquitectura en diferentes proyectos de investigación.
Patrocinadors: This research has been partially funded by the Spanish Ministry of Economy and Competitiveness under project LegoLangUAge (Técnicas de Deconstrucción en las Tecnologías del Lenguaje Humano, TIN2012-31224).
URI: http://hdl.handle.net/10045/35764
ISSN: 1135-5948
Idioma: eng
Tipus: info:eu-repo/semantics/article
Revisió científica: si
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 52 (2014)
INV - GPLSI - Artículos de Revistas

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_52_02.pdf1,06 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.