A morphological analyser for K’iche’

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/114242
Información del item - Informació de l'item - Item information
Títol: A morphological analyser for K’iche’
Títol alternatiu: Un analizador morfológico para el idioma k’iche’
Autors: Richardson, Ivy | Tyers, Francis M.
Paraules clau: K’iche’ | Morphological analysis | Finite-state | Quiché | Análisis morfológico | Transductores de estados finitos
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de març-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2021, 66: 99-109. https://doi.org/10.26342/2021-66-8
Resum: This paper describes the development of a free/open-source computational morphological description for K’iche’, a Mayan language spoken in Guatemala. The language is of the agglutinative morphological type, with both prefixing and suffixing morphology. Both the nominal and verbal morphology are moderately complex. K’iche’ is under-resourced and this is the first publication describing a computational tool for the language, and one of the first publications describing a computational tool for any language of the Mayan group. We use the Helsinki Finite-State Toolkit (HFST) for implementing the finite-state transducer. An automatic evaluation of the coverage of our implementation shows that the coverage is adequate, between 86% and 96% on range of freely available corpora. A manual evaluation gives a recall of over 90% over a hand-annotated test set. Both the analyser and the hand-annotated test set are available under a free/open-source licence. | Este artículo describe el desarrollo de un modelo computacional de la morfología quiché. La lengua quiché es una lengua maya que se habla en Guatemala. Es un idioma del tipo aglutinante con morfología de prefijos y sufijos. Tanto la morfología verbal como la morfología nominal son complejos a un nivel moderado. El quiché es una lengua de pocos recursos computacionales y esta publicación es la primera que describe una herramienta computacional para el idioma, y alguna de las primeras para cualquier lengua del grupo maya. La herramienta está desarrollada con HFST, una caja instrumentos para implantar transductores de estados finitos. Una evaluación indica que la cobertura de vocabulario está adecuada, entre 86% y 96% calculado sobre diversos corpus libres. Una evaluación manual indica una sensibilidad por 90% sobre un conjunto de pruebas anotadas a mano. Tanto el analizador como el conjunto de pruebas están disponibles bajo una licencia de software libre.
Patrocinadors: This article is an output of a research project implemented as part of the Basic Research Program at the National Research University Higher School of Economics (HSE University).
URI: http://hdl.handle.net/10045/114242
ISSN: 1135-5948
DOI: 10.26342/2021-66-8
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2021-66-8
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 66 (2021)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_66_08.pdf953,13 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.