Describing biomedical document sets in terms of its most distinctive facts
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/11710
Títol: | Describing biomedical document sets in terms of its most distinctive facts |
---|---|
Títol alternatiu: | Descripción de conjuntos de documentos biomédicos a través de sus hechos más distintivos |
Autors: | Ramírez Cruz, Yunior | Berlanga Llavori, Rafael | Pons Porrata, Aurora |
Paraules clau: | Minería de textos | Recuperación de información | Aplicaciones biomédicas | Text mining | Information retrieval | Biomedical applications |
Àrees de coneixement: | Lenguajes y Sistemas Informáticos |
Data de publicació: | de setembre-2009 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | RAMÍREZ CRUZ, Yunior; BERLANGA LLAVORI, Rafael; PONS PORRATA, Aurora. “Describing biomedical document sets in terms of its most distinctive facts”. Procesamiento del lenguaje natural. N. 43 (sept. 2009). ISSN 1135-5948, pp. 159-167 |
Resum: | En este artículo proponemos un método para describir un conjunto de documentos biomédicos, conceptualmente indexados, a través de sus hechos más distintivos. Estos documentos han sido recuperados como soporte de un concepto foco, el cual representa una necesidad de información. Los hechos utilizados para la descripción son unidades de información concisas, representadas mediante tripletas con la forma entidad-verbo-entidad. Estos se presentan ordenados por su relevancia con respecto al concepto foco, la cual se calcula usando modelos de lenguajes. Los resultados experimentales, obtenidos sobre tres conjuntos de documentos de una colección extraída de MEDLINE, son prometedores. | In this paper, we propose a method to describe a set of conceptually indexed biomedical documents in terms of its most distinctive facts. These documents are retrieved to support the occurrence of a focus concept, which expresses an information need. The facts used for description are concise information units, represented as triples of the form entity-verb-entity. These are presented as a ranked list, ordered by their relevance with respect to the focus concept, which is determined using a language modeling approach. Experimental results, obtained on three document sets over a collection extracted from MEDLINE, are promising. |
Patrocinadors: | This work has been partially funded by the CICYT Project TIN2008-01825/TIN and the Research Promotion Program 2008 of Universitat Jaume I, Spain. |
URI: | http://hdl.handle.net/10045/11710 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipus: | info:eu-repo/semantics/article |
Revisió científica: | si |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 43 (septiembre 2009) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_43_18.pdf | 219,2 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.