The influence of context during the categorization and discrimination of Spanish and Portuguese person names

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/2950
Información del item - Informació de l'item - Item information
Title: The influence of context during the categorization and discrimination of Spanish and Portuguese person names
Authors: Kozareva, Zornitsa Petrova | Vázquez, Sonia | Montoyo, Andres
Keywords: Discriminación de nombres | Categorización de nombres | Información semántica | Name discrimination | Name categorization | Semantic information
Issue Date: Sep-2007
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: KOZAREVA, Zornitsa Petrova; VÁZQUEZ PÉREZ, Sonia; MONTOYO GUIJARRO, Andrés. "The influence of context during the categorization and discrimination of Spanish and Portuguese person names". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 81-88
Abstract: Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación. | This paper presents a method for fine-grained categorization and discrimination of person names on the basis of the semantic similarity information. We employ latent semantic analysis which establishes the semantic relations between the words of the context in which the named entities appear. We carry out several experimental studies in which we observe the influence of the context and the robustness of our approach with different number of examples. Our approach is evaluated with Spanish and Portuguese. The experimental results are encouraging, reaching 90% for the Spanish and 82% for the Portuguese person name categorization, and 80% for the Spanish and 65% for the Portuguese NE discrimination of six conflated names.
Sponsor: This research has been funded by QALLME number FP6 IST-033860 and TEXT-MESS number TIN2006-15265-C06-01.
URI: http://hdl.handle.net/10045/2950
ISSN: 1135-5948
Language: eng
Type: info:eu-repo/semantics/article
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_39_10.pdf221,69 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.