Annotated Corpus for Citation Context Analysis

Por favor, use este identificador para citar o enlazar este ítem:
Información del item - Informació de l'item - Item information
Título: Annotated Corpus for Citation Context Analysis
Autor/es: Hernández Álvarez, Myriam | Gómez, José M. | Martínez-Barco, Patricio
Grupo/s de investigación o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Corpus | Annotation | Methodology | Machine-learning | Function | Polarity | Aspects | Schema | Keywords | Labels | Classification
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: may-2016
Editor: National Polytechnic School of Ecuador. Faculty of Systems Engineering
Cita bibliográfica: Latin-American Journal of Computing (LAJC). 2017, 3(1): 35-41
Resumen: In this paper, we present a corpus composed of 85 scientific articles annotated with 2092 citations analyzed using context analysis. We obtained a high Inter-annotator agreement; therefore, we assure reliability and reproducibility of the annotation performed by three coders in an independent way. We applied this corpus to classify citations according to qualitative criteria using a medium granularity categorization scheme enriched by annotated keywords and labels to obtain high granularity. The annotation schema handle three dimensions: PURPOSE: POLARITY: ASPECTS. Citation purpose define functions classification: use, critique, comparison and background with more specific classes stablished using keywords: Based on, Supply; Useful; Contrast; Acknowledge, Corroboration, Debate; Weakness and Hedges. Citation aspects complement the citation characterization: concept, method, data, tool, task, among others. Polarity has three levels: Positive, Negative and Neutral. We developed the schema and annotated the corpus focusing in applications for citation influence assessment, but we suggest that applications as summary generation and information retrieval also could use this annotated corpus because of the organization of the scheme in clearly defined general dimensions.
ISSN: 1390-9266 | 1390-9134 (Internet)
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: Creative Commons Attribution 3.0 License
Revisión científica: si
Versión del editor:
Aparece en las colecciones:INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
Thumbnail2016_Hernandez-Alvarez_etal_LAJC.pdf548,85 kBAdobe PDFAbrir Vista previa

Este ítem está licenciado bajo Licencia Creative Commons Creative Commons