Ayuda
Ir al contenido

Dialnet


Statistical methods for the integration analysis of –omics data (genomics, epigenomics and transcriptomics): an application to bladder cancer

  • Autores: Silvia Pineda Sanjuan
  • Directores de la Tesis: Núria Malats Riera (dir. tes.), Kristel van Steen (dir. tes.)
  • Lectura: En la Universidad Autónoma de Madrid ( España ) en 2015
  • Idioma: inglés
  • Tribunal Calificador de la Tesis: Fernando Rodríguez Artalejo (presid.), Alfonso Valencia Herrera (secret.), Mario Fernández Fraga (voc.), Douglas Easton (voc.), Monika Stoll (voc.)
  • Materias:
  • Enlaces
  • Resumen
    • español

      En las últimas décadas, la cantidad de datos –ómicos generados ha incrementado considerablemente y con ellos, se han realizado múltiples análisis considerando cada dato –ómico por separado. Este tipo de análisis ha revelado hallazgos significativos para entender mejor las enfermedades complejas, como el cáncer, pero la combinación de más de dos conjuntos de datos –ómicos puede revelar nuevos conocimientos biológicos que no se podrían encontrar de otra forma. Así, en los últimos cinco años, ha aparecido el concepto de integración de datos en el contexto de la biología de sistemas. No obstante, la integración de datos –ómicos requiere de técnicas estadísticas apropiadas para hacer frente a los principales retos que los datos de alto rendimiento (–ómicos) imponen. En esta tesis, proponemos diferentes aproximaciones estadísticas para integrar datos –ómicos (genómica, transcriptómica y epigenómica del tejido tumoral y la genómica de muestras en sangre) en individuos con cáncer de vejiga. Como primer enfoque, se propone un marco basado en una estrategia de etapas múltiples donde se analizan todas las posibles combinaciones por parejas utilizando los tres datos -ómicos medidos en el tejido tumoral (transcriptómica-epigenómica, eQTL y methQTL) para finalmente, combinar los resultados significativos en relaciones triples. Estas relaciones sugieren patrones y asociaciones biológicas "trans" muy interesantes. Como segundo enfoque, se propone un análisis multi-dimensional, donde los tres datos –ómicos se consideran conjuntamente en el mismo modelo. Para ello, se han aplicado métodos de regresión penalizada (LASSO y ENET), ya que pueden combinar los datos en una misma matriz de entrada haciendo frente a muchos de los retos que la integración de datos –ómicos impone. Además se propone un método basado en permutaciones MaxT para evaluar la bondad de ajuste a la vez que se corrige por test múltiples ya que precisamente estos son los inconvenientes principales de los métodos de regresión penalizada. Como resultado, hemos obtenido y validado en una base de datos externa, una lista de genes asociados con genotipos y metilación del ADN en relaciones "cis". Por último, este mismo enfoque se ha implementado para integrar los tres datos –ómicos en tumor con la genómica en las muestras de sangre en un análisis de integración de eQTLs y se ha comparado con una regresión en 2 etapas ya que es un método previamente utilizado para el análisis de integración de eQTLs. Nuestro enfoque muestra relevantes eQTLs además de las ya propuestas por la regresión en 2 etapas generando una lista de genes y eQTLs que pueden ser consideradas en análisis futuros. En general, esta tesis muestra lo necesarios que son los análisis de integración de datos –ómicos para encontrar información que todavía no conocemos. Además demostramos que la implementación de los métodos estadísticos más apropiados, nos proporciona la posibilidad de integrar toda la información disponible mostrando relaciones biológicas interesantes.

    • English

      An increase amount of –omics data are being generated and single –omics analysis have been performed to analyze them in the last decades. They have revealed significant findings to better understand the biology of complex disease, such as cancer, but combining more than two –omics data may reveal important biological insights that are not found otherwise. For this reason, in the last five years the idea of integrating data has appeared on the context of system biology. However, the integration of –omics data requires of appropriate statistical techniques to address the main challenges that high-throughput data impose. In this thesis, we propose different statistical approaches to integrate –omics data (genomics, epigenomics and transcriptomics from tumor tissue and genomics from blood samples) in individuals with bladder cancer. In the first approach, a framework based on a multi-staged strategy is proposed. Pairwise combinations using the three –omics measured in tumor were analyzed (transcriptomics-epigenomics, eQTL and methQTL) to end with the combination of all of them in triples relationships. They showed a whole spectrum of the associations between them and sound biological "trans" associations identifying new possible molecular targets. In the second approach, a multi-dimensional analysis is applied where the three –omics are considered together in the same model. Penalized regression methods (LASSO and ENET) were applied since they can combine the data in a large input matrix dealing with many of the –omics integrative challenges. Besides, a permutation–based MaxT method was proposed to assess goodness of fit while correcting by multiple testing which are the main drawbacks of the penalized regression methods. We obtained and externally validated in an independent data set a list of genes associated with genotypes and DNA methylation in "cis" relationship. Finally, this approach is applied to integrate the three –omics in tumor with the genomics in blood samples in an integrative eQTL analysis. This approach was compared with the 2 stage regression (2SR) approach previously used for eQTL integrative analysis. Our approach highlighted relevant eQTLs including also the ones found by the 2SR approach generating a list of genes and eQTLs that may be considered in future analysis. Overall, we have shown that –omics integrative analysis are needed to find missing, hidden or unreliable information and the application of the appropriate statistical approaches help in the integration of all the information available showing interesting biological relationships.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno