Introduction:
This dataset has the data to determinate the impact of free heme (added as hemin) and Hb supplementation on the Trypanosoma cruzi epimastigote transcriptome. Using Next Generation Sequencing and alignment to the T. cruzi Dm28c 2018 genome, we analyzed transcriptomic changes 4 and 24 hours after heme re-supplementation, compared to heme-starved parasites. Transcriptome data can be analyzed by comparing all samples to time 0 (heme-starved), or heme re-supplementation sample against non-supplemented samples at each time point (4 and 24h). The dataset also includes raw data of Western blot and qPCR, to design and validate the heme starvation conditions used for the transcriptomic assay, and of alphaFold predicted structures of the new identified protein TcCRAL/TRIO.
Value of the data:
Trypanosoma cruzi, the causative agent of Chagas disease, cannot synthesize heme and relies on scavenging it from its hosts and vectors. In the triatomine insect midgut, epimastigotes are exposed to hemoglobin (Hb) and heme (free heme) product of Hb degradation. This dataset represents the first transcriptomic analysis of Trypanosoma cruzi epimastigotes exposed to two distinct heme sources—hemin and hemoglobin—at early time points (4 and 24 hours) following heme restitution after heme starvation. Our work provides novel insight into the immediate gene expression changes triggered by physiologically relevant heme sources, capturing early regulatory events and potentially transient responses that are critical for parasite adaptation. Heme restitution induced a rapid, but mild, global shift in the epimastigote transcriptome. This dataset offers a valuable resource for understanding heme sensing and metabolism in T. cruzi, and may help identify novel molecular targets for therapeutic development.
Content of the dataset and file organization.
The dataset includes 73 files organized into four main sections (folders), corresponding to the different types of experiments performed:
- SECTION A- RNAseq Raw data The files correspond to the different determinations. For example “BR1-t24-0 heme_1” refers to a sample from biological replicate (BR) 1, taken at time 24 h (t24), from a culture with 0 uM heme (0 heme), part 1. Due to the size of the data, the data of each determination is divided into 2 files (part 1 and part 2).
- SECTION B- RT-qPCR Raw Data The file contains the Cq values for each of the determinations for each of the validated genes.
- SECTION C- Raw data of TcCRAL-TRIO structure prediction by Alphafold The files contained here correspond to the files used to initiate the structure prediction job by AlphaFold, files of each of the five (0 to 4) structures of TcCRAL/TRIO predicted by Alphafold, and the files of the superposition.
- SECTION D- Western Blot The files correspond to the images of the Western Blot tests performed, one photo per treatment tested..
Instrument- or software-specific information needed to interpret the data:
RNAseq: The quality of raw reads obtained from the RNA-seq assay was assessed using FastQC (Andrews, 2010). Adapter trimming and low-quality base removal were performed using sickle. Reads from each library were aligned to the Trypanosoma cruzi Dm28c 2018 reference genome (available at TriTrypDB: https://tritrypdb.org) using Bowtie2 (Langmead & Salzberg, 2012; doi:10.1038/nmeth.1923), with the "end-to-end" alignment mode. The resulting SAM alignment files were converted to BAM format and indexed using SAMtools (Li et al., 2009; doi:10.1093/bioinformatics/btp352) for downstream processing and to obtain mapping statistics. Gene-level quantification was performed using featureCounts (Liao et al., 2014; doi:10.1093/bioinformatics/btt656), restricting counting to coding sequences (CDS). A global count matrix was generated, and differential gene expression analysis (DEG) was conducted in R using the DESeq2 package (Love, et al., 2014, DOI: 10.1186/s13059-014-0550-8). Normalized counts were visualized using heatmaps generated with the pheatmap package. Additional data exploration and visualization were carried out using R packages including dplyr, ggplot2, RColorBrewer, ggrepel, stringr, hrbrthemes, GGally, and viridis. RT-qPCR Raw Data: Instrument used: CFX Opus 96 Real-Time PCR System (#12011319 - Bio-Rad Laboratories, Hercules, CA, USA) and Eppendorf Mastercycler epGradient (#5341, Eppendorf, Hamburg, Germany). The files were exported to .xls.
TcCRAL/TRIO structure prediction by Alphafold: Structural visualization of TcCRAL/TRIO predicted structure, model overlay, and comparison with the crystal structure of S. cerevisiae Sfh5 (PDB ID: 6W32; Khan, et al., 2021, DOI: 10.7554/eLife.57081) were performed using ChimeraX (Meng, et al., 2023, DOI: https://doi.org/10.1002/pro.4792).
Variable List:
-Time
-Culture condition (heme, hemin, hemoglobin)
The specific information for each variable is described in the METHODOLOGICAL INFORMATION section.
Specialized formats or other abbreviations used:
Hb: hemoglobin.
qRT-PCR: quantitative real-time PCR.
RB, R or BR: Biological replicate
R1, R2, R3: Biological Replica 1, Biological Replica 2, Biological Replica 3.
ScSFH5 Saccharomyces cerevisiae Sec-Fourteen Homolog 5
t0: time 0. 0 hours. 0 h.
t4: time 4. 4 hours. 4 h.
t8: time 8. 8 hours. 8 h.
t10: time 10. 10 hours. 10 h.
t24: time 24. 24 hours. 24 h.
TcHRG: Trypanosoma cruzi Heme Responsive Gene
WB: Western blot
NH, hem, Hb: No heme (NH) addition, or addition of 5 µM hemin (hem) or 1.25 µM
hemoglobin (Hb) after 48 hours of heme starvation.
(2025-12-1)
Introducción:
Este dataset reúne los datos generados para el estudio del impacto del hemo libre (adicionado como hemina) y de la suplementación con Hb sobre el transcriptoma de epimastigotes de Trypanosoma cruzi. Utilizando secuenciación de nueva generación (Next Generation Sequencing) y alineamiento al genoma de T. cruzi Dm28c 2018, analizamos los cambios transcriptómicos a las 4 y 24 horas posteriores a la re- suplementación con hemo, en comparación con parásitos privados de hemo. Los datos transcriptómicos se pueden comprarar contra el tiempo 0 (privadas de hemo) o resuplementados contra no suplementadas en cada punto temporal (4 y 24 h). El dataset también incluye datos crudos de Western blot y qPCR para diseñar y validar las condiciones de hambreado de hemo utilizadas para el ensayo de transcriptómica; y de modelados con alphaFold de la proteína identificada TcCRAL/TRIO.
Contenido del conjunto de datos y organización de archivos
El conjunto de datos incluye 73 archivos organizados en cuatro secciones principales (carpetas), correspondientes a los distintos tipos de experimentos realizados:
- SECTION A- RNAseq Raw data: Los archivos acá contenidos corresponden a las distintas determinaciones realizadas. Ejemplo “BR1-t24-0 heme_1” refiere a la replica biologica (BR) 1, tomada a las 24 h (t24), del cultivo 0 uM hemo (0 heme), part 1. Por el tamaño de los datos, se encuentra dividido en 2 archivos (parte 1 y parte 2).
- SECTION B- RT-qPCR Raw Data: El archivo contenido contiene los valores de Cq de cada una de las determinaciones para cada uno de los genes validados.
- SECTION C- Raw data of TcCRAL-TRIO structure prediction by Alphafold: Los archivos contenidos corresponden a los archivos utilizados para iniciar las predicciones por AlphaFold, los archivos de los modelos obtenidos y los archivos de las superposiciones realizadas.
- SECTION D- Western Blot: Los archivos acá contenidos corresponden a las imágenes de los ensayo de Western Blot realizados, una foto por tratamiento ensayado.
Formatos especiales y abreviaturas utilizadas:
Hb: hemoglobina.
qRT-PCR: PCR cuantitativa en tiempo real.
RB, R or BR: Replica biológica
R1, R2, R3: Replica biologica 1, Replica biologica 2, Replica biologica 3.
ScSFH5 Saccharomyces cerevisiae Sec-Fourteen Homolog 5
t0: tiempo 0. 0 hora. 0 h.
t4: tiempo 4. 4 horas. 4 h.
t8: tiempo 8. 8 horas. 8 h.
t10: tiempo 10. 10 horas. 10 h.
t24: tiempo 24. 24 horas. 24 h.
TcHRG: Genes de Respuesta a hemo de Trypanosoma cruzi
WB: Western blot
NH, hem, Hb: Sin hemo agregado (NH), con el agregado de 5 µM hemina (hem) o 1,25 µM hemoglobina (Hb) después de 48 horas de hambreado de hemo.
Metodología
Los datos fueron generados mediante una combinación de técnicas experimentales como se detalla en la sección Introducción. La metodología detallada y la descripción completa de los archivos se documentan en el archivo Readme.txt .
Calidad de los datos
En el caso del análisis de transcriptómica (los datos contenidos en SECTION A- RNAseq Raw data), la calidad de las lecturas obtenidas fue determinada utilizando FastQC (Andrews, 2010). El recorte de adaptadores y la remoción de baja calidad se realizó utilizando sickle. Las lecturas de cada librería fue alineada con el genoma de referencia de Trypanosoma cruzi Dm28c 2018 (disponible en TriTrypDB: https://tritrypdb.org) usando Bowtie2 (Langmead & Salzberg, 2012; doi:10.1038/nmeth.1923), con el modo de alineamiento "end-to-end".
Relevancia de los datos:
Trypanosoma cruzi, el agente causal de la enfermedad de Chagas, es incapaz de sintetizar hemo y depende de su obtención a partir de sus hospedadores y vectores. En el intestino medio del insecto triatomino, los epimastigotes están expuestos a hemoglobina (Hb) y hemo libre, producto de la degradación de la Hb. Este conjunto de datos representa el primer análisis transcriptómico de epimastigotes de Trypanosoma cruzi expuestos a dos fuentes distintas de hemo—hemina y hemoglobina—a tiempos tempranos (4 y 24 horas) tras la restitución de hemo luego del hambreado. Nuestro trabajo aporta información novedosa sobre los cambios inmediatos en la expresión génica inducidos por fuentes de hemo fisiológicamente relevantes, capturando eventos regulatorios tempranos y respuestas potencialmente transitorias que son clave para la adaptación del parásito. La restitución de hemo indujo un cambio rápido, aunque sutil, en el transcriptoma global de los epimastigotes. Este conjunto de datos constituye un recurso valioso para comprender la detección y el metabolismo del hemo en T. cruzi, y podría contribuir a la identificación de nuevos blancos moleculares para el desarrollo de estrategias terapéuticas. |