DSpace Colección:http://hdl.handle.net/10045/146892024-03-28T13:15:40Z2024-03-28T13:15:40ZDetermination of Features for a Machine Learning Approach to Pronominal Anaphora Resolution in BasqueArregi Uriarte, OlatzCeberio Berger, KlaraDíaz de Ilarraza Sánchez, ArantzaGoenaga, IakesSierra, BasilioZelaia Jauregi, Ana Victoriahttp://hdl.handle.net/10045/852072018-12-21T01:15:28Z2010-10-01T00:00:00ZTítulo: Determination of Features for a Machine Learning Approach to Pronominal Anaphora Resolution in Basque
Autor/es: Arregi Uriarte, Olatz; Ceberio Berger, Klara; Díaz de Ilarraza Sánchez, Arantza; Goenaga, Iakes; Sierra, Basilio; Zelaia Jauregi, Ana Victoria
Resumen: En este trabajo presentamos una primera aproximación basada en el aprendizaje automático para resolver la anáfora pronominal en euskara. Asimismo, determinamos las características más relevantes para esta tarea.; In this paper we present the preliminaries for a machine learning approach to resolve the pronominal anaphora in Basque language. In this work we determine the appropriate features to be used in this task.2010-10-01T00:00:00ZEvaluación de la Extracción de Entidades Nombradas de OpenCalais en castellanoToribio, RaquelMartínez Fernández, PalomaPablo Sánchez, César dehttp://hdl.handle.net/10045/851892018-12-21T01:15:21Z2010-10-01T00:00:00ZTítulo: Evaluación de la Extracción de Entidades Nombradas de OpenCalais en castellano
Autor/es: Toribio, Raquel; Martínez Fernández, Paloma; Pablo Sánchez, César de
Resumen: En los últimos años se han popularizado herramientas de Extracción de Información comerciales dentro del ecosistema de servicios de la Web Semántica. OpenCalais ofrece actualmente reconocimiento y categorización de Entidades Nombradas en castellano de fácil integración en aplicaciones de PLN. Hemos evaluado esta herramienta de anotación de entidades en el corpus de noticias CoNLL 2002. OpenCalais obtiene valores de precisión aceptables en las principales clases (persona, lugares y organización). Sin embargo, en comparación con los prototipos de investigación en castellano puede mejorar la cobertura y el tratamiento de la ambigüedad.; The Semantic Web ecosystem has seen the growing popularity of commercial Information Extraction services. Among them, OpenCalais provides Named Entity Recognition and Classification in Spanish. We have evaluated this service in the CONLL 2002 news corpus. The precision results are good enough for the development of applications that use the main classes (person, location and organization). However, recall and the treatment of ambiguous entities could be improved to be in pair with research prototypes.2010-10-01T00:00:00ZA machine learning method for identifying impersonal constructions and zero pronouns in SpanishRello, LuzSuárez, PabloMitkov, Ruslanhttp://hdl.handle.net/10045/851772018-12-21T01:15:25Z2010-10-01T00:00:00ZTítulo: A machine learning method for identifying impersonal constructions and zero pronouns in Spanish
Autor/es: Rello, Luz; Suárez, Pablo; Mitkov, Ruslan
Resumen: En este trabajo se presenta un método basado en aprendizaje automático para la clasificación de la elipsis del sujeto como referencial o no referencial en español. Se trata, tal como se desprende de la revisión bibliográfica realizada, del primer intento de identificar construcciones impersonales no referenciales en esta lengua. Una evaluación del sistema con un corpus de entrenamiento formado por 6.827 verbos anotados ha mostrado que alcanza una exactitud del 87%.; In this paper, we present a machine learning system for classifying subject ellipsis in Spanish as either referential or non-referential. To the best of our knowledge, this is the first attempt to automatically identify non-referential ellipsis in Spanish. An evaluation of our system against 6,827 finite verbs shows an accuracy of 87%.2010-10-01T00:00:00ZApplication of Information Retrieval Techniques to Document Filtered Set Generation for External Plagiarism DetectionMicol Ponce, DanielFerrández Escámez, ÓscarMuñoz, Rafaelhttp://hdl.handle.net/10045/851762018-12-21T01:07:48Z2010-10-01T00:00:00ZTítulo: Application of Information Retrieval Techniques to Document Filtered Set Generation for External Plagiarism Detection
Autor/es: Micol Ponce, Daniel; Ferrández Escámez, Óscar; Muñoz, Rafael
Resumen: En este artículo presentamos un método para la generación de conjuntos filtrados de documentos empleando técnicas de recuperación de información. Esto se presenta en el contexto de la detección de plagios externos, aunque las técnicas detalladas en este artículo son aplicables a cualquier tipo de documentos o consultas. La producción de conjuntos filtrados, y por ende la limitación del espacio de búsqueda del problema, puede resultar en una gran mejora de rendimiento y es utilizada hoy en día en gran cantidad de aplicaciones reales, como buscadores web. Respecto a la detección de plagios en documentos, la base de datos de textos con los que comparar el candidato sospechoso es potencialmente grande, y por lo tanto es muy recomendable aplicar técnicas de generación de conjuntos filtrados.; In this paper we present an approach to generate document filtered sets using information retrieval techniques. This is presented in the context of external document plagiarism detection, although the techniques detailed in this paper are applicable to any sort of documents or queries. Producing filtered sets, and hence limiting the problem's search space, can be a tremendous performance improvement and is used today in many real world applications such as web search engines. With regards to document plagiarism detection, the database of documents to match the suspicious candidate against is potentially fairly large, and hence it becomes very recommendable to apply filtered set generation techniques.2010-10-01T00:00:00Z