Novel similarity measures for the effective and efficient retrieval of pharmacological datasets

Oscar Miguel Rivera Borroto; Yoandy Hernández Díaz; José Manuel García de la Vega; Ricardo del Corazón Grau Ábalo; Yiovani Marrero Ponce

Ayuda

Novel similarity measures for the effective and efficient retrieval of pharmacological datasets

Autores: Oscar Miguel Rivera Borroto, Yoandy Hernández Díaz, José Manuel García de la Vega, Ricardo del Corazón Grau Ábalo, Yiovani Marrero Ponce
Localización: Afinidad: Revista de química teórica y aplicada, ISSN 0001-9704, Vol. 68, Nº. 551, 2011, págs. 50-56
Idioma: inglés
Títulos paralelos:
- Noves mesures de semblança per la recuperació efectiva i eficient dels conjunts de dades farmacològiques
- Nuevas medidas de similitud para la recuperación efectiva y eficiente de los conjuntos de datos farmacológicos
Enlaces
- Texto completo
Resumen
- español
  La búsqueda de similitud es una prestación importante en los sistemas modernos de gestión de la información química para acceder a la rica información contenida en los enormes repositorios químicos de hoy día. Básicamente, partiendo de una representación molecular, una medida de similitud y un algoritmo de búsqueda, la salida de la técnica devuelve una lista ordenada de moléculas en orden decreciente de similitud con respecto a la molècula consulta especificada por el usuario. Como consecuencia, los investigadores han puesto su interés en la eficàcia de las representaciones y medidas de similitud en estas tareas. Sin embargo, sus estudios se han enfocado predominantemente hacia las representaciones binarias y las medidas de semejanza correspondientes, y se ha trabajado poco en otros tipos de descripción numérica. También se han aplicado técnicas de Aprendizaje Automático en la selección de rasgos, aunque no de forma consistente con el principio de vecindad. Estos precedentes junto a la necesidad de nuevos métodos, apropiados para contexto químico, constituyen la motivación para este trabajo. El mismo comprende la implementación computacional, en el ambiente Java, y comparación de dos medidas novedosas con otras dos medidas estándares de la literatura, en la recuperación efectiva de ocho conjuntos farmacológicos de la Química Medicinal, representadas por descriptores reales, seleccionados por Aprendizaje Automático, y un algoritmo de búsqueda eficiente.
- English
  Similarity searching is an important facility in modern chemical information management systems to accede the rich information contained in currently enormous chemical repositories. Basically, given a molecular representation, a similarity measure, and a matching algorithm, the technique output returns an ordered list of dataset molecules in decreasing order of similarity with respect to a query or reference molecule specified by the user. As a consequence, researchers have put their interest in molecular representations and similarity measures performance. However, their studies have been predominantly focused in binary representations and the corresponding resemblance measures, and little work has been done taking into account other types of numerical description. Also, Machine Learning techniques have been applied for descriptor selection, though not consistently with the neighbourhood principle. These precedents, together with the need of new methods suitable for each chemical context, constitute the motivation for this work. It comprises the computational implementation, in the Java environment, and comparison of two novel measures of similarity to other proximity models established in the literature at effectively retrieving eight pharmacological datasets from Medicinal Chemistry, represented by machine learning-selected real descriptors, and some efficient matching algorithm.
- català
  La recerca de semblança és una prestació important en els sistemes moderns de gestió de la informació química per accedir a la rica informació continguda en els enormes repositoris químics d’avui dia. Bàsicament, partint d’una representació molecular, una mesura de semblança i un algoritsme de recerca, la tècnica retorna una llista ordenada de molècules en ordre decreixent de semblança respecte a la consulta de la molècula especificada per l’usuari. Com a conseqüència, els investigadors han posat el seu interès en l’eficàcia de les representacions i mesures de semblança en aquestes tasques. No obstant això, els estudis s’han enfocat predominantment cap a les representacions binàries i les mesures de semblança corresponents, i s’ha treballat poc en altres tipus de descripció numèrica. També s’han aplicat tècniques d’Aprenentatge Automàtic en la selecció de trets, encara que no de forma consistent amb el principi de veïnatge. Aquests precedents, amb la ne-cessitat de nous mètodes, apropiats per al context químic, constitueixen la motivació per a aquest treball. El treball comprèn la implementació computacional, en l’ambient Java, i la comparació de dues mesures noves amb altres dues mesures estàndards de la literatura en la recuperació efectiva de vuit conjunts farmacològics de Química Mèdica, representades per descriptors reals seleccionats per Aprenentatge Automàtic, i un algorisme de cerca eficient.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: