Building the Gold Standard for the Surface Syntax of Basque

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/64016
Full metadata record
Full metadata record
DC FieldValueLanguage
dc.contributor.authorAduriz Agirre, Itziar-
dc.contributor.authorAranzabe Urruzola, María Jesús-
dc.contributor.authorArriola Egurrola, José María-
dc.contributor.authorDíaz de Ilarraza Sánchez, Arantza-
dc.contributor.authorGonzález Dios, Itziar-
dc.contributor.authorUrizar Enbeita, Rubén-
dc.date.accessioned2017-03-07T11:22:56Z-
dc.date.available2017-03-07T11:22:56Z-
dc.date.issued2017-03-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2017, 58: 125-132es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/64016-
dc.description.abstractEn este artículo presentamos el proceso de construcción de SF-EPEC, un corpus de 300.000 palabras, sintácticamente anotado, que pretende ser un Gold Standard para el procesamiento sintáctico superficial del euskera. En primer lugar, describimos el conjunto de etiquetas diseñado para este propósito; siendo el euskera una lengua aglutinante, en ocasiones hemos tenido que crear etiquetas sintácticas compuestas. Asimismo, se detallan las distintas fases en la construcción de SF-EPEC.es_ES
dc.description.abstractIn this paper, we present the process in the construction of SF-EPEC, a 300,000-word corpus syntactically annotated that aims to be a Gold Standard for the surface syntactic processing of Basque. First, the tagset designed for this purpose is described; being Basque an agglutinative language, sometimes complex syntactic tags were needed. We also account for the different phases in the construction of SF-EPEC.es_ES
dc.description.sponsorshipPROSA-MED: Procesamiento semántico textual avanzado para la detección de diagnósticos, procedimientos, otros conceptos y sus relaciones en informes Médicos (TIN2016-77820-C3-1-R).es_ES
dc.languageenges_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.subjectSintaxis superficiales_ES
dc.subjectGold standardes_ES
dc.subjectEuskeraes_ES
dc.subjectAnotación de corpuses_ES
dc.subjectSurface syntaxes_ES
dc.subjectBasquees_ES
dc.subjectCorpus annotationes_ES
dc.subject.otherLenguajes y Sistemas Informáticoses_ES
dc.titleBuilding the Gold Standard for the Surface Syntax of Basquees_ES
dc.title.alternativeConstrucción de un Gold Standard para la Sintaxis Superficial del Euskeraes_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.relation.publisherversionhttp://journal.sepln.org/sepln/ojs/ojs/index.php/plnes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2013-2016/TIN2016-77820-C3-1-R-
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 58 (2017)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_58_15.pdf701,88 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.