Removing noisy mentions for distant supervision
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/30586
Títol: | Removing noisy mentions for distant supervision |
---|---|
Títol alternatiu: | Eliminando menciones ruidosas para la supervisión a distancia |
Autors: | Intxaurrondo González de Langarika, Ander | Surdeanu, Mihai | López de Lacalle Lekuona, Oier | Agirre Bengoa, Eneko |
Paraules clau: | Extracción de información | Extracción de relaciones | Supervisión a distancia | Aprendizaje con ruido | Information extraction | Relation extraction | Distant supervision | Learning with noise |
Àrees de coneixement: | Lenguajes y Sistemas Informáticos |
Data de publicació: | de setembre-2013 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | INTXAURRONDO, Ander, et al. “Removing noisy mentions for distant supervision”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 41-48 |
Resum: | Los métodos para Extracción de Información basados en la Supervisión a Distancia se basan en usar tuplas correctas para adquirir menciones de esas tuplas, y así entrenar un sistema tradicional de extracción de información supervisado. En este artículo analizamos las fuentes de ruido en las menciones, y exploramos métodos sencillos para filtrar menciones ruidosas. Los resultados demuestran que combinando el filtrado de tuplas por frecuencia, la información mutua y la eliminación de menciones lejos de los centroides de sus respectivas etiquetas mejora los resultados de dos modelos de extracción de información significativamente. | Relation Extraction methods based on Distant Supervision rely on true tuples to retrieve noisy mentions, which are then used to train traditional supervised relation extraction methods. In this paper we analyze the sources of noise in the mentions, and explore simple methods to filter out noisy mentions. The results show that a combination of mention frequency cut-off, Pointwise Mutual Information and removal of mentions which are far from the feature centroids of relation labels is able to significantly improve the results of two relation extraction models. |
URI: | http://hdl.handle.net/10045/30586 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipus: | info:eu-repo/semantics/article |
Revisió científica: | si |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 51 (2013) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_51_04.pdf | 780,68 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.