Anotación semiautomática con papeles temáticos de los corpus CESS-ECE

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3121
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorMartí Antonín, Maria Antònia-
dc.contributor.authorTaulé Delor, Mariona-
dc.contributor.authorMàrquez Villodre, Lluís-
dc.contributor.authorBertran Ibarz, Manuel-
dc.date.accessioned2007-11-20T13:12:53Z-
dc.date.available2007-11-20T13:12:53Z-
dc.date.issued2007-04-
dc.identifier.citationMARTÍ ANTONÍN, Maria Antònia, et al. "Anotación semiautomática con papeles temáticos de los corpus CESS-ECE". Procesamiento del lenguaje natural. N. 38 (abr. 2007). ISSN 1135-5948, pp. 67-76en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/3121-
dc.description.abstractEn este artículo se presenta la metodología seguida en el proceso de anotación semántica automática (estructura argumental y papeles temáticos de los predicados verbales) del corpus CESS-ECE-CAT/ESP, así como la evaluación de los resultados obtenidos. A partir de un léxico verbal (1.482 verbos) con información sobre las funciones sintácticas de cada verbo y su proyección temático-argumental, se ha anotado automáticamente el treebank CESS-ECE aplicando un conjunto de reglas simples sobre los árboles sintácticos. Se ha conseguido anotar automáticamente el 60% de los argumentos y papeles temáticos, con un error muy bajo (inferior al 2%). Este índice de calidad elevado permite usar la presente metodología para semiautomatizar el proceso de anotación semántica del corpus, con el consiguiente ahorro en tiempo de anotación manual. Una vez completada la anotación este corpus podrá ser utilizado como fuente de información para los sistemas de anotación automática de papeles temáticos.en
dc.description.abstractIn this paper we present the methodology followed in the automatic semantic annotation (argument structure and thematic roles of the verbal predicates) of the CESS-ECECAT/ ESP corpus. Building from a verbal lexicon (1,482 entries) with information about the syntactic functions and their projection to arguments and thematic roles, we present a set of simple rules to automatically enrich syntactic trees with semantic information. This procedure permits to automatically annotate 60% of the expected arguments and thematic roles with a fairly low error rate (below 2%). Given the high quality of the obtained results, we claim that this methodology provides substantial savings in manual annotation effort and allows a semiautomatic approach to corpus annotation. Once completed, the CESS-ECE corpus will permit researchers to develop complete systems for automatic Semantic Role Labeling of Catalan and Spanish.en
dc.languagespaen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.relation.ispartofProcesamiento del lenguaje natural. N. 38 (abril 2007); pp. 67-76en
dc.subjectCorpus CESS-ECEen
dc.subjectAnotación semántica automáticaen
dc.subjectPapeles temáticosen
dc.titleAnotación semiautomática con papeles temáticos de los corpus CESS-ECEen
dc.typeinfo:eu-repo/semantics/articleen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 38 (abril 2007)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_38_09.pdf118,64 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.