Landscaping Language Technologies using Topic Modeling and Graph Analysis: Overview of the Spanish Contribution

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96602
Información del item - Informació de l'item - Item information
Título: Landscaping Language Technologies using Topic Modeling and Graph Analysis: Overview of the Spanish Contribution
Título alternativo: Caracterización del sector de Tecnologías del Lenguaje mediante modelado de tópicos y análisis de grafos: Visión general de la participación española
Autor/es: Samy, Doaa | Pérez-Fernández, David | Arenas-García, Jerónimo
Palabras clave: Human Language Technologies | Topic Modeling | Latent Dirichlet Allocation (LDA) | Louvain modularity algorithm | Natural Language Processing | Tecnologías del Lenguaje | Modelado de Tópicos | Algoritmo de modularidad de Louvain | Procesamiento del Lenguaje Natural
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 129-136. doi:10.26342/2019-63-14
Resumen: This paper aims at landscaping the Human Language Technologies (HLT) sector by applying topic modeling and graph analysis to study the scientific literature in ACL Anthology with special emphasis on the Spanish participation. The analysis takes into account the structured and unstructured data to offer an overview of the HLT landscape in Spain identifying main underlying themes and its evolution in the last years compared to the international HLT community. Results obtained are represented through an interactive visualization to allow the exploration of the HLT landscape in the time frame 1983-2018. | El presente trabajo aplica herramientas de modelado de tópicos y análisis de grafos para caracterizar el sector de Tecnologías del Lenguaje (TL) en España. Para ello, se estudian el repositorio de ACL Anthology. Este análisis tiene en cuenta los datos estructurados y no-estructurados en dichas fuentes con el fin de retratar el panorama actual en términos de temáticas subyacentes y su evolución en los últimos años en comparación con la comunidad internacional. Los resultados se presentan mediante una visualización interactiva que permite navegar en el espacio de TL en el intervalo temporal 1983-2018.
Patrocinador/es: This work has been carried out in the framework of the Spanish State Plan for Natural Language Technologies. The work of J. Arenas-García has also been partly funded by MINECO projects TEC2014-52289-R and TEC2017-83838-R.
URI: http://hdl.handle.net/10045/96602
ISSN: 1135-5948
DOI: 10.26342/2019-63-14
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-14
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_14.pdf1,85 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.