El género Colletotrichum de destaca entre los hongos filamentosos más importantes a nivel mundial, está comprendido por numerosas especies que en su mayoría son patógenos de plantas, los cuales puede tener un impacto significativo en la agricultura. Afecta principalmente a especies dicotiledóneas como fresas, manzanas y cítricos, pero también infecta a monocotiledóneas como maíz y sorgo. Este género es conocido por causar antracnosis, una enfermedad que produce lesiones necróticas en tallos, hojas y frutos, generando pérdidas económicas sustanciales. Por su parte, la especie Colletotrichum graminicola es un patógeno de gran importancia en cultivos de maíz, causando la enfermedad conocida como antracnosis del maíz, que puede resultar en pérdidas totales del cultivo. Los síntomas incluyen lesiones necróticas y pudrición del tallo, afectando considerablemente el rendimiento. El cultivo maíz (Zea mays) es de relevancia mundial, y hoy día sigue siendo el segundo cereal más cultivado. La mancha foliar y la pudrición del tallo producida por C. graminicola puede infectar todas las partes de la planta y estar presente durante todo el crecimiento. La expansión geográfica de C. graminicola en Europa, reportada recientemente en España, destaca la necesidad de continuar investigando y monitoreando esta enfermedad para prevenir futuras epidemias y proteger principalmente la producción de maíz y en general la seguridad alimentaria.
La estirpe de referencia de esta especie es la M1.001 la cual fue aislada en Estados Unidos durante una epidemia en los años 70 y producto de los graves daños causados en esta época se ha convertido en un modelo para la investigación en fitopatología y desde entonces ha sido fundamental para estudios moleculares y genómicos. La primera versión del genoma de C. graminicola se publicó en 2012, proporcionando un recurso significativo para la comunidad científica. Pero en los últimos diez años, las tecnologías de secuenciación han avanzado considerablemente, permitiendo ensamblajes de genomas de mayor resolución y más completos. Dentro de las tecnologías de secuenciación de tercera generación, pueden alcanzar ensamblajes más completos, llegando incluso a generar secuencias de cromosomas de extremo a extremo. Aunque tienes una tasa de error más alta que la secuenciación de segunda generación, estos errores pueden corregirse combinando secuencias de alta fidelidad provenientes de lectura corta de plataformas como Illumina, creando un ensamblaje híbrido del genoma. Además, las lecturas largas pueden mejorar el ensamblaje de regiones genómicas ricas en repeticiones, que son comunes encontrar en hongos patógenos.
En el capítulo uno (Chapter I) presentamos un análisis detallado del genoma de la estirpe de referencia (M1.001) de C. graminicola, este genoma fue secuenciado por primera vez en 2012 utilizando secuenciación Sanger, pirosecuenciación 454 donde obtuvieron más de 600 secuencias, las cuales fueron ensambladas en 13 cromosomas con la información resultante de un mapa óptico (V1). En el presente proyecto, se re-secuenció esta estirpe utilizando tecnologías de secuenciación de corta (Illumina) y larga lectura (PacBio), y una década después de la primera publicación del ensamblaje, presentamos una versión del genoma con mayor resolución que consta de 13 cromosomas con una longitud total de 57,43 Mb (V4). La anotación del genoma reveló 15118 genes predichos, incluyendo más de tres mil nuevos genes en comparación con la versión anterior. Además, se encontró que el 26% del nuevo ensamblaje está compuesta por elementos de ADN repetitivo, que se encuentran mayoritariamente en regiones con baja densidad de genes. Se identificaron 1140 proteínas secretadas, principalmente en regiones ricas en repeticiones. También se observó que los tres cromosomas más pequeños, denominados minicromosomas, están fuertemente afectados por mutaciones puntuales inducidas por repeticiones (RIP) en comparación con los cromosomas más grandes a los cuales nos referimos como cromosomas centrales. El contenido génico de los minicromosomas incluye 121 genes, de los cuales el 83% son proteínas hipotéticas sin función predicha. Además, solo el 2% de los genes en Chr11 tienen homólogos en otras estirpes de C. graminicola, mientras que Chr12 y Chr13 tienen el 58% y 57% respectivamente, sugiriendo que Chr11 podría ser dispensable. Los cromosomas centrales (Chr1-Chr10) se diferencian de los minicromosomas en cuanto a contenido y características de secuencia, planteando la hipótesis de que la mayor densidad de elementos repetitivos y RIPs en los minicromosomas podría estar relacionada con la adaptación y/o co-evolución del huésped de este hongo patógeno.
También encontramos que las proteínas secretadas y los efectores predichos tienden a estar ubicados más cerca de las repeticiones que el resto de los genes. La caracterización de estas regiones ricas en repeticiones también son un indicador del ensamblaje de mayor resolución, ya que estas regiones suelen ser las más difíciles de ensamblar, identificando a su vez un mayor porcentaje de elementos repetitivos en V4 en comparación con V1. Por otro lado, observamos que los minicromosomas contienen bloques ricos en AT y podrían desempeñar un papel importante como mecanismo de defensa para protegerse contra la proliferación de los elementos repetitivos. Estas diferencias también se muestran en el porcentaje de RIPs. Anteriormente, se ha descrito que la plasticidad y arquitectura de los genomas de patógenos de plantas se debe a la considerable variación en el tamaño y contenido de elementos repetitivos. Estos minicromosomas tal como hemos mencionado están enriquecidos en elementos repetitivos y presentan un contenido génico más bajo. Estos compartimentos genómicos que hemos observado en C. graminicola, se han reportado también en otros sistemas de hongos fitopatógenos, pero a diferencia de otros estudios, nosotros no hemos encontrado que los genes presentes en los minicromosomas estén involucrados en virulencia o codifiquen candidatos a efectores.
Por otro lado, el resultado con otras especies de Colletotrichum no reveló una asociación entre la filogenia y otras características genómicas como el tamaño del genoma o el contenido de ADN repetitivo, ya que por ejemplo C. lupini y C. scovillei, ambas pertenecientes al mismo complejo de especies, tienen diferencias en el contenido de elementos repetitivos. Lo mismo ocurre con C. graminicola y C. higginsianum, que, aunque no pertenecen al mismo complejo de especies, muestran claras diferencias en el contenido de repeticiones, por lo que no determinamos ningún patrón. En conclusión, hemos mejorado el ensamblaje del genoma de C. graminicola, revelando nuevos conocimientos sobre la estructura y el contenido del genoma. Además, hemos encontrado que los minicromosomas están enriquecidos en repeticiones y tienen un contenido génico reducido en comparación con los cromosomas principales. También encontramos que las proteínas secretadas y los efectores predichos tienden a estar ubicados más cerca de repeticiones que el resto del genoma, lo cual junto con las características ya mencionadas mostramos evidencia de la compartimentalización genómica en esta especie.
Luego de recopilar estos resultados del capítulo uno (Chapter I), presentamos la segunda parte de este proyecto (Chapter II) el cual se basó en un análisis más amplio, estudiando y analizando las variaciones estructurales a nivel de todo el genoma de la especie C. graminicola, buscando también encontrar una posible relación de los cambios estructurales asociados a la patogenicidad. Las variaciones estructurales representan una fuente importante de diversidad genética principalmente en hongos fitopatógenos, permitiéndoles adaptarse a entornos ambientales cambiantes y participar en la carrera armamentista que se presenta con el huésped. Para comenzar con este objetivo se secuenciaron, ensamblaron y anotaron cuatro estirpes de C. graminicola recolectadas en Francia, Croacia, Brasil y Argentina utilizando tecnologías de secuenciación de larga lectura. También se incluyó la estirpe de referencia previamente secuenciada M1.001.
El análisis de sintenía de los genomas a nivel de cromosoma de CGRA01V4, ARG-5133-7 y CRO-I-41 mostró grandes bloques de colinealidad en los cromosomas principales, aunque se encontraron translocaciones e inversiones en chr04 y chr10. También se observaron tanto conservación de sintenía como reordenamientos estructurales en los minicromosomas. Por ejemplo, chr11 de ARG-5133-7 tiene regiones de sintenía con chr12 de CGRA01V4. Chr11 de ARG-5133-7 y chr12 de CRO-I-41 tienen características similares a los minicromosomas de CGRA01V4, con tamaños menores a 1,5 Mb, baja densidad de genes y alto contenido de elementos repetitivos. Un análisis adicional comparando CGRA01V4 con los cuatro genomas reveló que los cromosomas principales chr02, chr05 y chr07 tienen más del 93% de sintenía, mientras que chr01, chr03 y chr08 tienen entre 81% y 88%. Chr04, chr09 y chr06 presentan grandes variaciones estructurales. Los minicromosomas mostraron una sintenía del 32%, indicando mayor variabilidad. Se encontró que el 82,52% de los efectos de las variantes genéticas ocurren en regiones intergénicas, afectando al 10% de los genes, de los cuales el 73% no tienen función conocida.
También determinamos duplicaciones segmentarias en el genoma de referencia CGRA01V4 encontrando alrededor de 174 kb de duplicaciones segmentarias que además constituyen regiones específicas en la estirpe. Estas regiones están enriquecidas con elementos repetitivos, RIPs y variaciones estructurales, pero tienen una notable carencia de genes. La distribución de las regiones de duplicación segmentaria y su enlace entre los cromosomas se observa particularmente entre un cromosoma central (No. 4) y dos minicromosomas (11 y 13). Además, determinamos los genes específicos de cada una de las estirpes por medio de un clúster de proteínas. La estirpe ARG-5133-7 presenta 125 genes, F-64330-2 tiene 148, CRO-I-41 tiene 200, BR-85925-1 tiene 366 y CGRA01V4 presenta el mayor número con 733 genes. La mayoría de los cromosomas centrales mostraron un bajo porcentaje de genes específicos, que varían entre el 2% y el 6%, en contraste con los altos porcentajes encontrados en los minicromosomas 11, 12 y 13. El minicromosoma 12 por ejemplo contiene el 28% de los genes específicos de la estirpe, el minicromosoma 11 tiene el 93% y el minicromosoma 13 está completamente compuesto por genes específicos. Estos minicromosomas contienen 87 genes específicos de la estirpe de un total de 121 genes, reflejando su baja sintenía en comparación con los cromosomas central y como también se revela una alta tasa de variantes.
El análisis de los genes específicos en CGRA01V4 mostró que estos genes sufren variaciones de alto impacto que son las podrían alterar significativamente la función de los genes. La mayoría de los genes específicos afectados por variantes de alto impacto también tienen secuencias de ADN genómico que son ortólogas en las otras estirpes, pero sin el modelo de gen correspondiente. Notablemente, el 62% de los genes específico son no funcionales en al menos una de las cuatro estirpes, mientras que para el resto del contenido de genes no específicos solo el 7% son afectados por variaciones de alto impacto.
Se encontraron diferencias funcionales entre las estirpes en los genes específicos. La distribución de estos genes en diversas funciones señala algunas categorías funcionales de interés, como transportadores, hidrolasas y deshidrogenasas, para la adaptación a diferentes entornos, la degradación de compuestos y procesos metabólicos, respectivamente. CGRA01V4 muestra un grupo de genes en diferentes categorías, como transportadores, repeticiones de tipo ankyrin y factores de transcripción específicos de hongos, sugiriendo una capacidad de adaptación y regulación génica. CRO-I-41, aunque menos diversa, tiene funciones asociadas a estos genes como deshidrogenasas y proteínas de unión. Por su parte, ARG-5133-7 tiene una variedad menor de funciones específicas, pero tiene genes relacionados con proteínas de unión y peptidasas. La estirpe BR-85925-1 tiene genes en categorías como deshidrogenasas, hidrolasas y transportadores, indicando una alta capacidad degradativa y metabólica. Finalmente, F-64330-2 muestra una alta presencia de genes en funciones como deshidrogenasas e hidrolasas, indicando su capacidad para degradar compuestos. Otros genes, como factores de transcripción específicos de hongos, oxidasas y quinasas indican diferenciación en la regulación génica y la señalización celular, reflejando adaptaciones a diferentes nichos ecológicos. En conjunto, estos genes específicos de estirpe muestran variabilidad y especificidad según la especialización y capacidad patogénica de las diferentes estirpes.
Para abordar y comprender un poco más el grupo de genes específicos desarrollamos una investigación más detallada en la estirpe de referencia, basándonos en la comparación de estos genes específicos con otros hongos patógenos de plantas, como C. higginsianum y Magnaporthe oryzae, lo cual nos permitió profundizar en las posibles funciones e importancia de estos genes en procesos que involucran el desarrollo de la infección. Observamos que algunos de estos genes codifican transportadores esenciales en procesos biológicos relacionados con la patogenicidad, como la autofagia, que es importante para la infección de plantas. Otros genes están relacionados con el metabolismo del azufre y el carbono, como algunas permeasas y los transportadores de azúcares, los cuales son importantes para la nutrición del hongo durante la infección. Además, se identificaron genes involucrados en la degradación de la pared celular del huésped, lo que facilita la invasión del tejido vegetal.
También destacamos la importancia de los factores de transcripción que regulan la expresión génica durante la infección, así como de los genes relacionados con la detoxificación y la biosíntesis de metabolitos secundarios. Observamos una tendencia en estos genes al estar relacionados con procesos que involucran el apresorio, el cual es una estructura especializada del hongo para penetrar en el huésped, y también con genes involucrados en la etapa biotrófica de la infección. Esta recopilación de información muestra la complejidad de los mecanismos de patogenicidad que presenta C. graminicola y proporcionan una base para futuros estudios sobre la interacción planta-patógeno, dejando un grupo de genes de interés en el establecimiento y desarrollo de esta enfermedad, los cuales a su vez están asociados a variaciones estructurales que pueden estudiarse con más detalle para comprender la estrategia evolutiva que plantea esta especie fitopatógena.
Como ya hemos mencionado el género Colletotrichum incluye numerosas especies que son patógenos de plantas con un gran impacto en la agricultura. Pero estas especies pueden ser específicas del huésped o afectar a múltiples plantas, tanto dicotiledóneas como monocotiledóneas, causando la enfermedad conocida como antracnosis. En el contexto de los hongos fitopatógenos, nos enfocamos en las secuencias repetidas de aminoácidos, que son comunes en las proteínas y forman elementos estructurales específicos e importantes para el plegamiento y las interacciones proteína-proteína. Se ha estudiado en otras investigaciones que los efectores secretados por estos hongos fitopatógenos, en algunos casos, contienen estas repeticiones y desempeñan un papel fundamental en alterar el sistema inmunitario de las plantas, facilitando así el avance de la infección y por lo tanto el establecimiento de la enfermedad. Las variaciones en el número de repeticiones, en algunos casos de tipo tándem dentro de una proteína, pueden contribuir a la variabilidad funcional, lo que destaca la importancia de este tipo de proteínas con repeticiones en la patogenicidad.
Por lo tanto, en el capítulo tres (Chapter III) nos enfocamos en estudiar la evolución y el impacto funcional de las proteínas que contienen repeticiones dentro del repertorio de proteínas secretadas en especies pertenecientes al género Colletotrichum, centrándonos en la especie C. graminicola. Además, incluimos un nuevo genoma y proteoma de C. navitas, la cual es la especie más cercana filogenéticamente a C. graminicola. Para investigar el repertorio de proteínas secretadas con repeticiones dentro del género Colletotrichum, se descargaron 24 genomas y proteomas desde el NCBI, los cuales fueron secuenciados utilizando tecnologías de larga lectura y que además presentaban disponibles sus anotaciones de genes. A este conjunto de datos se incorporaron las cuatro estirpes de la especie C. graminicola estudiadas en el capítulo dos (Chapter II) y el genoma de referencia obtenido en el capítulo uno (Chapter I). Se utilizaron herramientas como RepeatModeler y RepeatMasker para determinar el contenido de elementos repetitivos en todos los genomas, y SignalP para identificar las proteínas con señal de secreción, y Effector-P3 se utilizó para identificar los efectores predichos. RADAR fue utilizado para determinar las proteínas con repeticiones en todos los proteomas de Colletotrichum. En la construcción del árbol filogenético, se utilizaron los 29 proteomas de Colletotrichum y un proteoma de Verticillium dahliae como ortogrupo. Los ortogrupos de copia única se alinearon y se filtraron alineamientos de baja calidad para construir el árbol filogenético. Este árbol reveló siete complejos de especies: Gloeosporioides, Truncatum, Orbiculare, Spaethianum, Acutatum, Destructivum y Graminicola, que se ajustan a la taxonomía estudiada y publicada de este género.
El análisis de la proporción de proteínas secretadas y no secretadas que contienen repeticiones dentro del género Colletotrichum mostró que el porcentaje de proteínas con repeticiones es significativamente mayor en proteínas secretadas (71%) en comparación con proteínas no secretadas (67%). Esta diferencia es más pronunciada en C. graminicola, donde las proteínas secretadas representan el mayor porcentaje de las proteínas con repeticiones, siendo significativamente más alto que el 55% en proteínas no secretadas. Además, la comparación de la proporción de proteínas con repeticiones secretadas en Colletotrichum que infectan diferentes tipos de plantas (dicotiledóneas y monocotiledóneas) fue significativa. Las proteínas en especies que afectan dicotiledóneas tienen un porcentaje significativamente mayor de proteínas con repeticiones en comparación con las especies que afectan plantas monocotiledóneas. Estos resultados sugieren que las proteínas secretadas en Colletotrichum, especialmente en C. graminicola, están enriquecidas en proteínas que contienen repeticiones, lo que podría estar relacionado con su participación en la patogenicidad y la interacción con el huésped. Además, las diferencias observadas entre dicotiledóneas y monocotiledóneas pueden reflejar adaptaciones específicas del patógeno a diferentes tipos de plantas, destacando la importancia funcional de estas repeticiones en la biología de este género de hongos fitopatógeno.
También se observó variabilidad en el porcentaje de proteínas con repeticiones entre diferentes complejos de especies dentro del género Colletotrichum, indicando que la presencia de estas proteínas puede ser una característica distintiva que varía dentro de un mismo complejo. Los complejos de especies Graminicola y Orbiculare mostraron porcentajes relativamente constantes y menos variabilidad entre sus estirpes, mientras que los complejos Acutatum y Spaethianum presentaron una mayor variación en los porcentajes de proteínas con repeticiones entre sus estirpes. Esta variabilidad podría estar asociada a la diversidad de proteínas, especialmente aquellas que presentan repeticiones en relación con la adaptación específica de especies a diferentes nichos ecológicos o estrategias de patogenicidad.
Dentro de este capítulo también analizamos las proteínas secretadas de la estirpe de referencia, centrándonos en el conjunto de proteínas secretadas con repeticiones y aquellas categorizadas sin anotación funcional. Para abordar este enfoque se utilizó InterProScan y predicciones estructurales con AlphaFold, destacando una diversidad funcional y adaptaciones evolutivas. Este tipo de proteínas presentaron diversas arquitecturas de dominios y plegamientos. Algunas con arquitectura tipo sándwich mostraron una posible evolución convergente, lo que podría significar que han desarrollado funciones similares de forma independiente debido a presiones evolutivas similares. La anotación estructural realizada con modelos 3D generados por AlphaFold identificó 27 tipos de arquitecturas, siendo las más abundantes las estructuras tipo sándwich. Algunas arquitecturas fueron únicas, identificadas en una sola estructura. La diversidad en los tipos de plegamiento de estas arquitecturas sugiere una adaptabilidad y flexibilidad en las interacciones planta-patógeno. También se observó que las hidrolasas, oxidorreductasas y transferasas predominaron entre las proteínas que contienen repeticiones, desempeñando posibles funciones en la degradación de moléculas del huésped, la evasión de respuestas inmunitarias y la adaptación a condiciones de estrés. Veinte proteínas del grupo analizado fueron identificadas como efectores y presentaron una diversidad de plegamientos, sugiriendo una posible evolución adaptativa para mejorar la virulencia y especificidad del huésped.
La comparación de las relaciones evolutivas basadas en la estructura primaria y terciaria de las proteínas mostró diferentes patrones. Por su parte la clasificación funcional basada en la secuencia de aminoácidos mostró una distribución heterogénea, la filogenia basada en la estructura terciaria reflejó una agrupación más homogénea, sugiriendo que las proteínas con repeticiones estudiadas han adquirido sus funciones posiblemente a través de la evolución convergente. Por lo tanto, estas proteínas con funciones similares pueden tener estructuras terciarias parecidas, aunque sus secuencias primarias sean diferentes. La construcción de un tanglegram, que es una representación visual que alinea dos árboles filogenéticos para resaltar similitudes y diferencias, nos permitió comparar el árbol genético derivado de la estructura primaria de las proteínas con el árbol genético basado en la estructura terciaria del mismo conjunto de proteínas. Esta comparación reveló diferencias y similitudes en las relaciones evolutivas, por lo cual hacemos énfasis en la importancia de la estructura terciaria para comprender la función y la evolución de este tipo de proteínas. Estos resultados nos permiten dar algunas primeras perspectivas del rol de estas proteínas en las interacciones planta-patógeno, principalmente en el género Colletotrichum, destacando su posible papel en la patogenicidad y las adaptaciones a diferentes tipos de plantas. La combinación de análisis genómicos, filogenéticos y estructurales nos permitió plantear estas hipótesis de interés, sugiriendo que sean más sólidas en investigaciones futuras.
Colletotrichum, a member of the division Ascomycota, represents one of the largest phyla of fungi (Damm et al., 2009). Many species are plant pathogens and have a significant impact on agriculture, affecing a wide range of hosts (Cannon et al., 2012). Some species are host specific, while others can affect more than one plant species (O’Connell et al., 2012; Baroncelli et al., 2017; Talhinhas and Baroncelli, 2021). The Colletotrichum genus primarily affects dicotyledonous species, including strawberry, apple, citrus, and stone fruits, making up more than 77% of all documented plant pathogens. Around 20% of the species in the genus affect monocotyledonous plants like maize and sorghum, showing a disinct host preference. This divergence is paricularly pronounced within specific clades such as the bambusicola, spaethianum, ibetense, and graminicola/caudatum species complexes, which predominantly infect monocots (Talhinhas and Baroncelli, 2023). Numerous species have been described since the first report of Colletotrichum (Corda, 1831). From constant taxonomic revisions, about 340 species of Colletotrichum have been idenified and organized into 20 phylogeneic lineages known as species complexes (Figure 1) (Talhinhas and Baroncelli, 2021; Talhinhas and Baroncelli, 2023). This genus is classified by plant pathologists as being among the top ten most destrucive genera of pathogenic fungi (Dean et al., 2012), capable of causing total crop failures and significant economic losses (Prusky et al., 2000; Baroncelli et al., 2017; Dowling et al., 2020).
© 2001-2026 Fundación Dialnet · Todos los derechos reservados