Ayuda
Ir al contenido

Dialnet


Regiones genómicas implicadas en la metilación diferencial del ADN

  • Autores: Guillermo Barturen Briñas
  • Directores de la Tesis: Michael Hackenberg (dir. tes.), José Lutgardo Oliver Jiménez (dir. tes.)
  • Lectura: En la Universidad de Granada ( España ) en 2014
  • Idioma: español
  • Tribunal Calificador de la Tesis: Rafael Lozano Ruiz (presid.), Francisco Perfectti Álvarez (secret.), Pedro A. Bernaola Galván (voc.), Fuencisla Matesanz del Barrio (voc.), Carmelo Ruiz Rejón (voc.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: DIGIBUG
  • Resumen
    • español

      RESUMEN (Castellano) Introducción La metilación del ADN es la marca epigénetica por excelencia. Consiste en la unión covalente de un grupo metilo al carbono 5 de las citosinas, dando lugar a metilcitosinas, descritas por algunos autores como ¿la quinta base del ADN¿1.

      En mamíferos, esta marca epigenética se encuentra sobre todo en los dinucleótidos CpG, que aparecen metilados en la mayor parte del genoma2. La excepción son las islas CpG (CGIs), regiones abiertas de la cromatina, con una elevada densidad de CpGs y libres de metilación, lo que permite la interacción con el ADN3, 4. Aproximadamente el 70% de los genes humanos presentan CGIs, entre los que figuran la totalidad de los genes domésticos y un 40% de los genes tejido específicos5, 6. La metilación puede variar entre diferentes tejidos, individuos o tipos celulares. El mecanismo subyacente es la regulación de la interacción de diferentes proteínas con el ADN.

      Básicamente, la metilación interviene en la transcripción de los genes y mantiene la estabilidad del genoma. Sin embargo, estas funciones pueden regularse de diferentes maneras: * Regulación de la transcripción: o Regulando la interacción del complejo de la ARN polimerasa con los promotores7.

      o Interviniendo en mecanismos de splicing alternativo8.

      o Regulando la unión de factores de transcripción a regiones potenciadoras9 y aisladoras10.

      * Estabilidad genómica: o Silenciando elementos repetidos como retrotransposones11.

      o Participando en la compensación de dosis de cromosomas sexuales12 y en la impronta de genes autosómicos13.

      Observando los múltiples mecanismos reguladores en los que se encuentra implicada la metilación, no es de extrañar que se hayan encontrado patrones aberrantes de metilación asociados a un gran número de enfermedades14, entre las que destacan diferentes tipos de tumores.

      Objetivos El objetivo principal de esta Tesis es la identificación y caracterización de regiones diferencialmente metiladas, que puedan servir como marcadores epigenéticos. Ello exige como requisito imprescindible disponer de mapas de metilación en genoma completo (metilomas) de alta calidad y procedentes de diferentes tejidos. Solo así se puede llevar cabo el estudio comparado de los mismos e identificar las regiones diferencialmente metiladas.

      Además, se sabe que la densidad de CpGs juega un papel crítico tanto en la unión de los factores de transcripción (TFs) como en la determinación del estado de metilación del ADN15, 16. Sin embargo, ni las herramientas existentes ni los estudios realizados en múltiples tejidos tienen en cuenta esta importante característica. Así pues, otro objetivo de esta Tesis ha sido la mejora del algoritmo CpGcluster17, dando lugar a un nuevo algoritmo (WordCluster18), capaz de identificar islas CpG (CGIs) estadísticamente significativas y con una alta densidad de CpGs.

      Desarrollo teórico y Resultados El primer paso fue el desarrollo de las herramientas bioinformáticas necesarias para la generación de metilomas de alta calidad a partir de datos de secuenciación masiva de ADN tratado con bisulfito: NGSmethPipe19 y MethylExtract20. El primer programa permite preprocesar y alinear las lecturas cortas frente al genoma de referencia, mientras que el segundo infiere los niveles de metilación de citosinas individuales y las variaciones de un solo nucleótido (SNVs) a partir de dichos alineamientos. Ambos programas incorporan rigurosos controles de calidad, de forma que los metilomas generados para diferentes tejidos, especies o estados patológicos sean comparables. Asimismo, fue necesario el desarrollo de una base de datos relacional (NGSmethDB21, 22) para el almacenamiento, gestión y explotación de toda la información generada. Actualmente, NGSmethDB contiene metilomas para 6 especies y 114 tejidos y/o condiciones diferentes, para lo que sido necesario procesar 40 terabytes de lecturas.

      El algoritmo desarrollado, WordCluster, presenta importantes ventajas con respecto a los métodos clásicos de identificación de CGIs, destacando entre ellas la delimitación de dominios de metilación más cortos pero estadísticamente significativos y homogéneos, y el que sus predicciones se asocian de manera más específica tanto con elementos reguladores, como con regiones conservadas del genoma23.

      El estudio estadístico de la metilación diferencial en las CGIs predichas por WordCluster ha permitido establecer que el uso combinado de la prueba exacta de Fisher y la binomial negativa es el mejor método para identificar DMIs (islas CpG diferencialmente metiladas). La mayoría de las DMIs pueden ser de dos tipos: DMIs-M (metiladas en la mayoría de los tejidos y no-metiladas en algún tejido) y DMIs-U (metiladas solamente en algún tejido y no-metiladas en el resto). El análisis funcional mediante el enriquecimiento en términos GO (Gene Ontology) muestra que las DMIs-U parecen estar implicadas en procesos de desarrollo y diferenciación, mientras que las DMIs-M se asocian con funciones tejido-específicas.

      Por último, los estudios de enriquecimiento de las DMIs en elementos reguladores han revelado importantes diferencias con respecto a otras DMRs24 (Regiones diferencialmente metiladas), recientemente identificadas sin tener en cuenta la densidad de CpGs. Entre estas diferencias destacan el elevado enriquecimiento de las DMIs en promotores y exones y su empobrecimiento en intrones, así como la significativa menor proporción de DMIs-M asociadas con TFBSs cuando se las compara con las DMRs. Cabe destacar también que las DMIs-U solapan en mucho mayor grado con los TFBSs que las DMIs-M. Todas estas importantes características encontradas en las DMIs sugieren que WordCluster puede ser el algoritmo adecuado para preseleccionar las regiones a analizar en futuros estudios de metilación diferencial.

      La Tesis se encuentra disponible en: http://bioinfo2.ugr.es/Publicaciones/tesis_GB.pdf

    • English

      ABSTRACT (English) Introduction DNA methylation presents the most characteristic traits of epigenetic marks. Basically, it consist in a covalent bond between a methyl group and the cytosines¿ fifth carbon, which will result on methylcytosines, named by some authors as the ¿fifth base of the DNA¿1.

      In mammals, methylation is almost restricted to the CpG dinucleotides, which appears methylated all over the genome2. CpG islands (CGIs) are the exception to this CpG global methylation. CGIs are chromatin opened, high CpG density and methylation free regions, which allow the interaction with the DNA3, 4. Almost 70% of human genes present CGIs, including all housekeeping genes and 40% of tissue-specific genes5, 6. DNA methylation could vary between tissues, individuals or cellular types. The underlying mechanism is the regulation of the protein interaction with the DNA.

      Basically, DNA methylation participates in gene transcription and keeps genome stability. However, these functions could be regulated on different ways: * Transcription regulation: o Regulates the RNA polymerase complex interaction with the promoters7.

      o Participates in splicing mechanisms8.

      o Regulates the transcription factors binding to enhancers9 and insulators10.

      * Genome stability: o Silences repetitive elements as retrotransposons11.

      o Participates in the dosage compensation of sexual chromosomes12 and in the imprinting13 of autosomic genes.

      Taking into account the multiple mechanisms where the DNA methylation participates, it is expected that aberrant methylation patterns will be associated with multiple diseases14, including multiple types of cancers.

      Objectives The main goal of this Thesis is the identification and characterization of differentially methylated regions, which could serve as epigenetic markers. In order to reach this objective, it is needed to obtain high-quality genome-wide methylation maps (methylomes) from multiple tissues. This is the only way to perform a comparative study and identify those differentially methylated regions.

      In addition, it is known that the CpG density plays an important role during transcription factors (TFs) binding and DNA methylation state determination15, 16. However, neither the available tools nor the studies carried out for multiple tissues take into account this important feature. So, another goal of this Thesis has been to improve the CpGcluster algorithm17, resulting on a new one (WordCluster18), which is able to identify CGIs statistically significant and with a high CpG density.

      Theoretical developments and Results The first step was to develop bioinformatics tools to obtain high-quality methylomes from Next-Generation bisulfite treated Sequencing raw datasets: NGSmethPipe19 and MethylExtract20. The first software was developed to preprocess and align the reads against the reference genome, while the second one infers the methylation levels for single cytosines and the Single Nucleotide Variants (SNVs) from the mapped reads. Both of them include strict quality controls, in order to obtain comparable methylomes from different tissues, species or pathological samples. In addition, it was necessary to develop a relational database (NGSmethDB21, 22) to store, manage and take advantage of all the produced methylomes. Currently, NGSmethDB contains methylomes for 6 species and 114 tissues and/or different conditions; in order to obtain those methylomes, 40 terabytes of reads were processed.

      The new developed algorithm, WordCluster, presents important advantages compared to the classic algorithms used to identify CGIs. The most important ones are: its ability to delimit shorter methylation domains but statistically significant and more homogeneous, and that its predictions presents more specific association with regulatory elements as well as with conserved regions of the genome23.

      The statistical study developed about the methylation differences between tissues on the CGIs predicted by WordCluster demonstrates that the best method to identify DMIs (Differentially Methylated CpG Islands) is based on the combination of the Fisher¿s exact test and the negative binomial. Most of the DMIs can be classified into two classes: DMIs-M (methylated on almost all the tissues and unmethylated on few ones) and DMIs-U (methylated on few tissues and unmethylated on the rest of them). The functional analysis based on GO (Gene Ontology) terms shows that DMIs-U used to regulate development and cell differentiation processes, while DMIs-M are associated with tissue-specific functions.

      Finally, the enrichment studies of the DMIs within regulatory elements had revealed important differences with other DMRs (Differentially Methylated Regions), recently identified irrespective the CpG density. The most important differences are that DMIs are highly enriched on promoters and exons but depleted on introns, as well as the significantly less proportion of DMIs-M associated with TFBSs compared with DMRs. It is also remarkable that the DMIs-U presents a higher overlapping ratio with TFBSs than the DMIs-M. All these important features found on the analysed DMIs, suggest that WordCluster could be the algorithm of choice in order to preselect interesting regions on future differentially methylation studies.

      The Thesis is available on: http://bioinfo2.ugr.es/Publicaciones/tesis_GB.pdf


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno