GPLSI Wikipedia Characterisation V1.0: Descubrimiento y Vinculación de Entidades a Wikipedia

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/66373
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributorProcesamiento del Lenguaje Natural y Sistemas de Información (GPLSI)es_ES
dc.contributor.authorTomás, David-
dc.contributor.authorGutiérrez, Yoan-
dc.contributor.authorMoreno, Isabel-
dc.contributor.otherUniversidad de Alicante. Departamento de Lenguajes y Sistemas Informáticoses_ES
dc.date.accessioned2017-05-29T14:36:49Z-
dc.date.available2017-05-29T14:36:49Z-
dc.date.created2017-
dc.date.issued2017-06-01-
dc.identifier.urihttp://hdl.handle.net/10045/66373-
dc.description.abstractResumen de la aplicación: GPLSI Wikipedia Characterisation (Descubrimiento y vinculación de entidades a Wikipedia) constituye una interfaz de programación de aplicaciones (API) que incluye librerías de programación útiles para sistemas de terceros. Esta API ofrece la funcionalidad de analizar contenidos textuales para descubrir menciones de entidades y enlazarlas a Wikipedia mediante el uso de DBpedia, su versión estructurada. Como resultado se obtiene una lista de sugerencias de URIs de DBpedia (cada URI se corresponde con una página de Wikipedia) por cada entidad, ordenadas por el grado de confianza (en el intervalo [0,1]). Este grado de confianza se obtiene considerando dos características claves. La primera se corresponde con el número de enlaces entrantes para cada entidad de Wikipedia (más enlaces implica mayor relevancia). La segunda característica es la similitud entre el contexto (lista de palabras adyacentes a la palabra objetivo) de la entidad objetivo y la descripción de cada entidad de Wikipedia. Para este propósito se ha utilizado un algoritmo de desambiguación basado en el paradigma LESK, combinado con estadísticas sobre los enlaces entrantes a las páginas de Wikipedia. Los resultados que alcanza esta tecnología rondan el 70% de F1.es_ES
dc.description.abstractGPLSI Wikipedia Characterisation (Entity Discovery and Linking to Wikipedia) is an application programming interface (API) which programming libraries for third-parties. This service allows analysing textual content to discover Wikipedia entities related to that content by means of DBpedia, its structured version. As a result, a list of URIs from DBpedia (each one corresponding to a Wikipedia page) is obtained for each entity, ranked by a confidence score (in the interval [0,1]). This score is obtained considering two key features. The first one is the number of incoming links to the Wikipedia article (more links implies more relevance). The second one is the similarity of the context (list of words adjacent to the target word) of the entity found in text and the description of that entity in Wikipedia. For this purpose, the Lesk disambiguation algorithm has been followed, combined with statistics based on Wikipedia inlinks. The results achieved reflect around 70% of F1.es_ES
dc.description.sponsorshipMinisterio de Educación, Cultura y Deporte, Ministerio de Economía y Competitividad (MINECO) proyectos TIN2015-65136-C2-2-R y TIN2015-65100-R, Comisión Europea (SAM project FP7-611312), Gobierno de la Generalitat Valenciana (PROMETEOII/2014/001), Ayudas Fundación BBVA a equipos de investigación científica 2016 (Análisis de Sentimientos Aplicado a la Prevención del Suicidio en las Redes Sociales - ASAP), Universidad de Alicante a través de Proyecto Emergente ("GRE16-01: Plataforma inteligente para recuperación, análisis y representación de la información generada por usuarios en Internet").es_ES
dc.languagespaes_ES
dc.languageenges_ES
dc.rights© Universitat d'Alacant / Universidad de Alicantees_ES
dc.subjectEntity discoveryes_ES
dc.subjectEntity Linkinges_ES
dc.subjectEntity Disambiguationes_ES
dc.subjectWikipediaes_ES
dc.subjectDBpediaes_ES
dc.subjectDescubrimiento de Entidadeses_ES
dc.subjectVinculación de Entidades a Wikipediaes_ES
dc.subject.otherLenguajes y Sistemas Informáticoses_ES
dc.titleGPLSI Wikipedia Characterisation V1.0: Descubrimiento y Vinculación de Entidades a Wikipediaes_ES
dc.title.alternativeGPLSI Wikipedia Characterisation V1.0: Entity Discovery and Linking to Wikipediaes_ES
dc.typesoftwarees_ES
dc.peerreviewednoes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/EC/FP7/611312es_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/MINECO//TIN2015-65100-R-
dc.relation.projectIDinfo:eu-repo/grantAgreement/MINECO//TIN2015-65136-C2-2-R-
dc.rights.holderUniversidad de Alicante-
Aparece en las colecciones:Registro de Programas de Ordenador y Bases de Datos
Investigaciones financiadas por la UE

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailMemoria-entitylinking-registro-de-software_V1.pdf132,43 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.