Ayuda
Ir al contenido

Dialnet


Computational tool for visualization, analysis and comparison of epigenomes

  • Autores: Oscar Reina Garcia
  • Directores de la Tesis: Ferran Azorín Marín (dir. tes.), Camille Stephan Otto Attolini (codir. tes.)
  • Lectura: En la Universitat Pompeu Fabra ( España ) en 2018
  • Idioma: español
  • Tribunal Calificador de la Tesis: Sergi Vives Civit (presid.), Víctor Moreno Aguado (secret.), Jordi Bernués Martínez (voc.)
  • Programa de doctorado: Programa de Doctorado en Biomedicina por la Universidad Pompeu Fabra
  • Materias:
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • Introducción El genoma eucariota contiene tanto información genética, codificada en la secuencia de ADN, como instrucciones epigenéticas, que residen en factores asociados al ADN (es decir, reguladores del ARN, histonas y otro tipo de proteínas que se unen al DNA), regulando su expresión. Por tanto, la comprensión completa de la función y regulación del genoma requiere de la descripción de esta información epigenética o, en otras palabras, es necesario describir el epigenoma. En este sentido, el desarrollo de herramientas para analizar, visualizar y comparar el epigenoma se está convirtiendo en una alta prioridad en el campo. En esta propuesta, abordamos esta pregunta.

      Contexto En los últimos años, la cantidad de datos recopilados sobre diferentes aspectos del funcionamiento del genoma, desde la expresión génica y los ARN no codificantes hasta la distribución genómica de factores epigenéticos, es cada vez mayor. Del mismo modo, también hay una gran cantidad de bases de datos que describen funciones génicas e interacciones, y sus alteraciones en la varias enfermedades. Cada vez se están desarrollando nuevas herramientas para analizar, visualizar e integrar datos genómicos a nivel funcional. En cambio, aunque se están dedicando grandes esfuerzos a la descripción del epigenoma (Refs. 10,22-30), el desarrollo de herramientas para integrar resultados experimentales y bases de datos sobre factores epigenéticos y elementos genéticos sigue siendo un desafío. En este contexto, hemos desarrollado una nueva técnica de reducción de dimensionalidad, llamada chroGPS, para integrar y visualizar las asociaciones entre factores epigenéticos y su relación con elementos genéticos funcionales en mapas visuales en 2 y 3 dimensiones. Estos mapas permiten asimismo el análisis funcional y diferencial entre datos epigenéticos entre distintos orígenes o condiciones experimentales.

      Materiales y métodos chroGPS es un enfoque de reducción de la dimensionalidad que mide la similitud epigenética entre factores y / o elementos genéticos y, posteriormente, las representa en mapas 2D / 3D utilizando técnicas de Multidimensional Scaling (MDS). En este sentido, también hemos desarrollado una implementación de MDS que utiliza técnicas de paralelización para poder generar de forma eficiente mapas que en algunos casos (chroGPS-genes) implican decenas de miles de elementos.

      Como prueba de principio, utilizamos los datos generados por el proyecto modENCODE en las líneas celulares Drosophila S2 y BG3, así como la línea celular humana K562 del proyecto ENCODE para generar dos tipos de mapas: chroGPS-factors y chroGPS-genes. Asimismo, ulilizamos técnicas matemáticas/estadísticas como Procrustes, clustering jerárquico y estimación Bayesiana de densidades en los clusters resultantes para llevar a cabo el análisis funcional y diferencial de los mapas resultantes. El software desarrollado ha sido implementado en forma de paquete para el software estadístico R, y está disponible de forma libre en el repositorio Bioconductor.

      Resultados chroGPS-factors describe las similitudes entre factores epigenéticos e informa sobre su asociación funcional. La similitud entre los factores se calcula en función de la distribución genómica de sus perfiles de unión utilizando la métrica desarrollada para determinar la superposición de intervalos (iOverlap) [Font-Burgada et al., 2014]. Estas similitudes se representan luego en 2 o 3 mapas dimensionales utilizando MDS no métrico (isoMDS) que estima conjuntamente una relación monotónica no paramétrica entre las distancias euclidianas originales y las gráficas en el mapa. La representación resultante describe con precisión los estados epigenéticos conocidos: cromatina activa, insulators, represión relacionada con heterocromatina HP1 y silenciamiento dependiente de Polycomb (PC).

      chroGPS-genes integra marcas epigenéticas a nivel de gen y describe el contexto epigenético de la expresión y función génica. En este caso, la similitud epigenética entre genes se define en función de las marcas epigenéticas que tienen en común y se determina utilizando la métrica Tanimoto [Font-Burgada et al., 2014].

      El análisis funcional se realiza mediante clustering jerárquico para identificar grupos de genes con perfiles epigenéticos similares, seguido de una estimación de densidad bayesiana para determinar el número óptimo de clusters según la tasa de clasificación correcta (CCR). Al usar este enfoque, se pueden identificar 12 grupos que están específicamente representados por factores epigenéticos particulares y describen distintos estados epigenéticos: genes transcritos activamente, silenciados con HP1 y genes silenciados para PC.

      Comparar mapas cuando contienen un número reducido de elementos, como en los mapas de chroGPS-factors, es relativamente directo. Los mapas pueden superponerse utilizando los factores compartidos entre diferentes mapas como puntos de anclaje usando el ajuste de Procrustes. Procrustes superpone dos conjuntos de puntos al alterar su centro, escala y orientación, conservando las distancias relativas dentro de cada conjunto, y las diferencias relevantes entre los conjuntos se pueden obtener a través de la suma de errores de Procrustes al cuadrado. Este enfoque se ha aplicado con éxito para integrar y comparar el paisaje epigenético de las células S2 de Drosophila en diferentes momentos durante la replicación, pero puede ampliarse para comparar diferentes líneas o tejidos celulares. De esta forma, los factores que cambian significativamente su posición relativa en los mapas podrían identificarse fácilmente y las alteraciones observadas se evaluarían desde una perspectiva funcional.

      Con el fin de comparar los mapas chroGPS-genes, se utiliza un enfoque similar, generando mapas que consideran todos los perfiles epigenéticos posibles para los genes de ambas condiciones. El análisis funcional se realiza utilizando clustering jerárquico, fusión de clúster no supervisada y estimación de densidad Bayesiana para identificar y caracterizar grupos de genes que presentan cambios significativos entre ambas condiciones. Usamos esta estrategia para identificar y caracterizar los genes potencialmente implicados en los cambios epigenómicos entre larvas de Drosophila S2 de tercer estadio y tejido neuronal BG3.

      Bibliografía 1. Karnik R, Meissner A. Browsing (Epi)genomes: a guide to data resources and epigenome browsers for stem cell researchers. Cell Stem Cell. 2013;13:14–21.

      2. Celniker SE, Dillon LA, Gerstein MB, Gunsalus KC, Henikoff S, Karpen GH, Kellis M, Lai EC, Lieb JD, MacAlpine DM, et al. Unlocking the secrets of the genome. Nature. 2009;459:927–930.

      3. Ernst J, Kellis M. Discovery and characterization of chromatin states for systematic annotation of the human genome. Nat. Biotechnol. 2010;28:817–825.

      4. Ernst J, Kheradpour P, Mikkelsen TS, Shoresh N, Ward LD, Epstein CB, Zhang X, Wang L, Issner R, Coyne M, et al. Mapping and analysis of chromatin state dynamics in nine human cell types. Nature. 2011;473:43–49.

      5. Filion GJ, van Bemmel JG, Braunschweig U, Talhout W, Kind J, Ward LD, Brugman W, de Castro IJ, Kerkhoven RM, Bussemaker HJ, et al. Systematic protein location mapping reveals five principal chromatin types in Drosophila cells. Cell.2010;143:212–214.

      6. Gerstein MB, Lu ZJ, Van Nostrand EL, Cheng C, Arshinoff BI, Liu T, Yip KY, Robilotto R, Rechtsteiner A, Ikegami K, et al. Integrative analysis of the Caenorhabditis elegans genome by the modENCODE project. Science.2011;330:1775–1787.

      7. Kharchenko PV, Alekseyenko AA, Schwartz YB, Minoda A, Riddle NC, Ernst J, Sabo PJ, Larschan E, Gorchakov AA, Gu T, et al. Comprehensive analysis of the chromatin landscape in Drosophila melanogaster. Nature. 2011;471:480–485.

      8. Liu T, Rechtsteiner A, Egelhofer TA, Vielle A, Latorre I, Cheung MS, Ercan S, Ikegami K, Jensen M, Kolasinska-Zwierz P, et al. Broad chromosomal domains of histone modification patterns in C. elegans. Genome Res. 2011;21:227–236.

      9. Roudier F, Ahmed I, Bérard C, Sarazin A, Mary-Huard T, Cortijo S, Bouyer D, Caillieux E, Duvernois-Berthet E, Al-Shikhley L, et al. Integrative epigenomic mapping defines four main chromatin states in Arabidopsis. EMBO J.2011;30:1928–1938.

      10. Roy S, Ernst J, Kharchenko PV, Kheradpour P, Negre N, Eaton ML, Landolin JM, Bristow CA, Ma L, Lin MF, et al. Identification of functional elements and regulatory circuits by Drosophila modENCODE. Science. 2010;330:1787–1797.

      11. van Bemmel J, Filion G, Rosado A, Talhout W, de Haas M, van Welsem T, van Leeuwen F, van Steensel B. A network model of the molecular organization of chromatin in Drosophila. Mol. Cell. 2013;49:759–771.

      12. Ernst J, Kellis M. ChromHMM: automatic chromatin-state discovery and characterization. Nat. Methods. 2012;9:215–216.

      13. Steiner L, Hopp L, Wirth H, Galle J, Binder H, Prohaska SJ, Rohlf T. A global genome segmentation method for exploration of epigenetic patterns. PLoS One.2012;7:e46811.

      14. Gerighausen D, Zeckzer D, Steiner L, Prohaska SJ. ChromatinVis: a tool for analyzing epigentic data. (Institut für Informatik, Universität Leipzig, Härtelstr. 16-18, D-04107 Leipzig).

      15. Zhang Y, Su J, Yu D, Wu Q, Yan H. EpiDiff: Entropy-based quantitative identification of differential epigenetic modification regions from epigenomes. Conf Proc IEEE Eng Med Biol Soc. 2013;2013:655-8. doi: 10.1109/EMBC.2013.6609585.

      16. Cao X, Zhong S. Enabling interspecies epigenomic comparison with CEpBrowser. Bioinformatics. 2013 May 1;29(9):1223- 5.

      17. Arrigo Nils, Loren P. Albert, Pascal G. Mickelson and Michael S. Barker. Quantitative visualization of biological data in Google Earth using R2G2, an R CRAN package. Molecular Ecology Resources. 2012. doi: 10.1111/1755-0998.12012.

      18. Ming J. Visualizing Biological Data in Google Earth. Doctoral Thesis. Iowa State University.

      19. Gentleman RC, Carey VJ, Bates DM, Bolstad B, Dettling M, Dudoit S, Ellis B, Gautier L, Ge Y, Gentry J, et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biol. 2004;5:R80.

      20. Torgerson WSP. Multi-dimensional scaling: I, theory and method. Psychometrika. 1952; 17:401–419.

      21. Miclaus K, Wolfinger R, Czika W. SNP selection and multidimensional scaling to quantify population structure. Genet. Epidemiol. 2009;33:488–496.

      22. Motsinger AA, Ritchie MD. Multifactor dimensionality reduction: an analysis strategy for modeling and detecting gene-gene interaction in human genetics and pharmacogenomics studies. Hum. Genom. 2006;2:318–328.

      23. van de Wiel MA, van Wieringen WN. CGHregions: dimension reduction for array CGH data with minimal information loss. Cancer Inform. 2007;3:55–63.

      24. Smoot ME, Ono K, Ruscheinski J, Wang PL, Ideker T. Cytoscape 2.8: new features for data integration and network visualization. Bioinformatics.2011;27:431–432.

      25. RStudio and Inc. (2014). shiny: Web Application Framework for R. R package version 0.10.1. http://CRAN.R-project.org/package=shiny 26. https://plot.ly/ 27. Nature Roadmap Epigenomics data and publication portal http://www.roadmapepigenomics.org/publications/ 28. Koike N, Yoo SH, Huang HC. Transcriptional architecture and chromatin landscape of the core circadian clock in mammals. Science (New York, N.Y.). 338(6105):349-54. 2012. [pubmed] 29. Masri S, Kinouchi K, Sassone-Corsi P. Circadian clocks, epigenetics, and cancer. Current opinion in oncology. 27(1):50-6. 2015. [pubmed] 30. Puram RV, Kowalczyk MS, de Boer CG. Core Circadian Clock Genes Regulate Leukemia Stem Cells in AML. Cell. 165(2):303-16. 2016. [pubmed] 31. Bogdanovic O, Fernandez-Miñán A, Tena JJ. Dynamics of enhancer chromatin signatures mark the transition from pluripotency to cell specification during embryogenesis. Genome research. 22(10):2043-53. 2012. [pubmed] 32. Bogdanović O, Fernández-Miñán A, Tena JJ, de la Calle-Mustienes E, Gómez-Skarmeta JL. The developmental epigenomics toolbox: ChIP-seq and MethylCap-seq profiling of early zebrafish embryos. Methods (San Diego, Calif.). 62(3):207-15. 2013. [pubmed]


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno