Creación de un corpus de noticias de gran tamaño en español para el análisis diacrónico y diatópico del uso del lenguaje

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/89930
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributorProcesamiento del Lenguaje y Sistemas de Información (GPLSI)es_ES
dc.contributor.authorRazgovorov, Pavel-
dc.contributor.authorTomás, David-
dc.contributor.otherUniversidad de Alicante. Departamento de Lenguajes y Sistemas Informáticoses_ES
dc.date.accessioned2019-03-20T11:37:53Z-
dc.date.available2019-03-20T11:37:53Z-
dc.date.issued2019-03-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2019, 62: 29-36. doi:10.26342/2019-62-3es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/89930-
dc.description.abstractEste artículo describe el proceso llevado a cabo para desarrollar un corpus de noticias periodísticas de gran tamaño en español. Todos los textos recopilados están ubicados tanto temporal como geográficamente. Esto lo convierte en un recurso de gran utilidad para trabajos en el ámbito de la lingüística, la sociología y el periodismo de datos, permitiendo tanto el estudio diacrónico y diatópico del uso del lenguaje como el seguimiento de la evolución de determinados eventos. El corpus se puede descargar libremente empleando el software que se ha desarrollado como parte de este trabajo. El artículo se completa con un análisis estadístico del corpus y con la presentación de dos casos de estudio que muestran su potencial a la hora de analizar sucesos.es_ES
dc.description.abstractThis article describes the process carried out to develop a large corpus of news stories in Spanish. The collected texts are located both temporally and geographically. This makes it a very useful resource to work with in the field of linguistics, sociology and data journalism, allowing the diachronic and diatopic study of the use of language and tracking the evolution of specific events. The corpus can be freely downloaded using the software developed as part of this work. The article includes a statistical analysis of the corpus and two case studies that show its potential for event analysis.es_ES
dc.languagespaes_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.subjectCorpuses_ES
dc.subjectMinería de textoes_ES
dc.subjectAnálisis diacrónicoes_ES
dc.subjectAnálisis diatópicoes_ES
dc.subjectText mininges_ES
dc.subjectDiachronic analysises_ES
dc.subjectDiatopic analysises_ES
dc.subject.otherLenguajes y Sistemas Informáticoses_ES
dc.titleCreación de un corpus de noticias de gran tamaño en español para el análisis diacrónico y diatópico del uso del lenguajees_ES
dc.title.alternativeCreation of a large news corpus in Spanish for the diachronic and diatopic analysis of the use of languagees_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.identifier.doi10.26342/2019-62-3-
dc.relation.publisherversionhttps://doi.org/10.26342/2019-62-3es_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 62 (2019)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_62_03.pdf1,21 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.