Creación de un corpus de noticias de gran tamaño en español para el análisis diacrónico y diatópico del uso del lenguaje

Razgovorov, Pavel; Tomás, David

Creación de un corpus de noticias de gran tamaño en español para el análisis diacrónico y diatópico del uso del lenguaje

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/89930

Registro completo de metadatos

Registro completo de metadatos
Campo DC	Valor	Idioma
dc.contributor	Procesamiento del Lenguaje y Sistemas de Información (GPLSI)	es_ES
dc.contributor.author	Razgovorov, Pavel	-
dc.contributor.author	Tomás, David	-
dc.contributor.other	Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos	es_ES
dc.date.accessioned	2019-03-20T11:37:53Z	-
dc.date.available	2019-03-20T11:37:53Z	-
dc.date.issued	2019-03	-
dc.identifier.citation	Procesamiento del Lenguaje Natural. 2019, 62: 29-36. doi:10.26342/2019-62-3	es_ES
dc.identifier.issn	1135-5948	-
dc.identifier.uri	http://hdl.handle.net/10045/89930	-
dc.description.abstract	Este artículo describe el proceso llevado a cabo para desarrollar un corpus de noticias periodísticas de gran tamaño en español. Todos los textos recopilados están ubicados tanto temporal como geográficamente. Esto lo convierte en un recurso de gran utilidad para trabajos en el ámbito de la lingüística, la sociología y el periodismo de datos, permitiendo tanto el estudio diacrónico y diatópico del uso del lenguaje como el seguimiento de la evolución de determinados eventos. El corpus se puede descargar libremente empleando el software que se ha desarrollado como parte de este trabajo. El artículo se completa con un análisis estadístico del corpus y con la presentación de dos casos de estudio que muestran su potencial a la hora de analizar sucesos.	es_ES
dc.description.abstract	This article describes the process carried out to develop a large corpus of news stories in Spanish. The collected texts are located both temporally and geographically. This makes it a very useful resource to work with in the field of linguistics, sociology and data journalism, allowing the diachronic and diatopic study of the use of language and tracking the evolution of specific events. The corpus can be freely downloaded using the software developed as part of this work. The article includes a statistical analysis of the corpus and two case studies that show its potential for event analysis.	es_ES
dc.language	spa	es_ES
dc.publisher	Sociedad Española para el Procesamiento del Lenguaje Natural	es_ES
dc.rights	© Sociedad Española para el Procesamiento del Lenguaje Natural	es_ES
dc.subject	Corpus	es_ES
dc.subject	Minería de texto	es_ES
dc.subject	Análisis diacrónico	es_ES
dc.subject	Análisis diatópico	es_ES
dc.subject	Text mining	es_ES
dc.subject	Diachronic analysis	es_ES
dc.subject	Diatopic analysis	es_ES
dc.subject.other	Lenguajes y Sistemas Informáticos	es_ES
dc.title	Creación de un corpus de noticias de gran tamaño en español para el análisis diacrónico y diatópico del uso del lenguaje	es_ES
dc.title.alternative	Creation of a large news corpus in Spanish for the diachronic and diatopic analysis of the use of language	es_ES
dc.type	info:eu-repo/semantics/article	es_ES
dc.peerreviewed	si	es_ES
dc.identifier.doi	10.26342/2019-62-3	-
dc.relation.publisherversion	https://doi.org/10.26342/2019-62-3	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 62 (2019) INV - GPLSI - Artículos de Revistas

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_62_03.pdf		1,21 MB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro sencillo