Ayuda
Ir al contenido

Dialnet


Resumen de Learning from data in structural bioinformatics: a protein-protein interaction study

Rubén Sánchez García

  • español

    Las interacciones entre proteínas (PPIs) son esenciales en la mayor parte de los procesos celulares y, por ello, su estudio permite mejorar nuestra comprensión de dichos procesos y de las enfermedades asociadas. Como consecuencia, se han llevado a cabo estudios para identificar redes de PPIs a gran escala. A pesar de la innegable utilidad de la información interactómica, para comprender los mecanismos moleculares de las PPIs es necesario disponer de información estructural. Desgraciadamente, las técnicas de biología estructural progresan más lentamente que la recolección de datos interactómicos y, por ello, la diferencia entre el número de PPIs que se conocen y el número de PPIs para los que se dispone de información estructural no para de crecer. Con el objetivo de mitigar este problema, el objetivo de esta tesis doctoral es el desarrollo de algoritmos que permitan predecir aspectos estructurales de las PPIs.

    La primera herramienta, 3DIANA, es una plataforma web que utiliza como fuente de conocimiento las interacciones a nivel de dominio (DDI) ya conocidas. Con ello, 3DIANA permite determinar la consistencia de los contactos entre los dominios de un modelo propuesto además de facilitar el modelado basado en plantillas o mediante “protein-protein docking”.

    La segunda, BIPSPI, es un predictor de sitios de unión de PPIs basado en aprendizaje automático y que considera a las dos proteínas de una PPI particular (“partner-specificity”). Con BIPSPI se puede predecir qué residuos forman parte de la interfaz de una PPI y, por ello, se pueden emplear para guiar “protein-protein docking”, con lo que se complementan las funcionalidades de 3DIANA. Sin embargo, BIPSPI puede usarse en escenarios alejados del “docking”, como, por ejemplo, cuando sólo se conocen las secuencias de las proteínas implicadas. Gracias a su “partner-specificity”, a las variables seleccionadas y a la potencia de su algoritmo de aprendizaje, BIPSPI es hoy uno de los mejores predictores de sitios de unión desarrollados hasta la fecha.

    De entre todas las variables que emplea BIPSI, las matrices de puntuación dependientes de la posición (PSSMs) sobresalen. Las PSSMs se han empleado en multitud de algoritmos bioinformáticos. Sin embargo, debido al coste computacional del cálculo de PSSMs, el desarrollo de estos métodos se ve ralentizado, como también los servicios webs que ofrecen estos algoritmos. Gracias a 3DCONS-DB hemos aliviado esta situación mediante la recopilación de las PSSMs de todas las proteínas incluidas en el Protein Data Bank (PDB), teniendo un impacto inmediato sobre BIPSPI.

    Todos estos recursos, juntos, suponen un potente arsenal que puede ser empleado para obtener información estructural de PPIs en muy variadas situaciones, como por ejemplo en el diseño racional de experimentos o en diversos análisis computacionales a gran escala

  • English

    Protein-protein interactions (PPIs) are essential for most cellular processes, and thus, unveiling the molecular mechanisms of protein interactions is a crucial question for improving our understanding of cellular processes and associated diseases. Many studies have been conducted to compile interactomic data and build PPI networks for different organisms. This information has proven quite useful in order to grasp protein function and diseases. However, PPI networks lack of the needed granularity to explain the molecular underpinnings of interactions and thus, structural information becomes extremely valuable. Unfortunately, the pace at which interactomic data grows cannot be met by structural biology techniques. As a result, there is an increasing gap between the number of known PPIs and the number of structurally solved interactions. In an effort to mitigate this problem, this thesis explores the development of new computational tools for the structural prediction of PPIs.

    The first implemented tool is 3DIANA, a web platform designed for quaternary modelling and evaluation of protein complexes that uses domain-domain interaction (DDIs) data as a source of knowledge. 3DIANA can be employed to assess whether contacts between the protein domains of a given PPI model are consistent with known DDIs or to build structural models of PPIs through template-based domain-domain docking or guided protein-docking.

    The second tool, BIPSPI, is a machine learning-based method developed for the prediction of partner-specific binding sites, which performs predictions at residue level by identifying the residues that belong to the interface of a given PPI. As a complement to 3DIANA, BIPSPI’s predictions can effectively be employed to guide protein docking. However, its scope goes beyond docking as it can also be used when only protein sequences are available. Its partner-specificity, along with a powerful learning algorithm and a carefully selected set of protein descriptors make BIPSPI a state-of-the-art prediction method.

    Among all of the protein descriptors used in BIPSPI, Position Specific Scoring Matrices (PSSMs), which are ubiquitously found in bioinformatics, stand out. Unfortunately, the computational cost of PSSMs calculation represents a hurdle in the development of new algorithms and, especially, to provide fast web services. With 3DCONS-DB, we have been able to alleviate this situation by pre-computing PSSMs for all proteins included in the PDB database. As a result, BIPSPI development and, more importantly, its web server predictions have experienced immense acceleration.

    All these methods comprise a powerful toolbox that can be used to obtain structural insights of PPIs in a broad range of situations, including experiment designing or computational high-throughput scenarios


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus