Este conjunto de datos fue generado en el marco del estudio “Mitochondrial genome of Neuryurus rudis (Xenarthra, Cingulata); contribution to phylogeny and origin of glyptodonts”. El objetivo fue reconstruir las relaciones evolutivas y los tiempos de divergencia entre gliptodontes extintos y armadillos actuales. Las muestras corresponden a material fósil y moderno, procesado para la extracción de ADN mitocondrial y su secuenciación mediante tecnología Illumina. Los datos fueron analizados con distintos enfoques filogenéticos, incluyendo máxima verosimilitud y métodos bayesianos. 2. Descripción de los datos Secuencias y alineamientos out.1.fastq y out.2.fastq: lecturas crudas pareadas generadas por secuenciación. read1_trimmed y read2_trimmed: lecturas filtradas y recortadas tras control de calidad. alineamiento total 23-6-21.fasta: alineamiento final de secuencias mitocondriales, combinando regiones homólogas entre especies fósiles y actuales. MAXIMUM TREE.tree: árbol filogenético obtenido por máxima verosimilitud. Secuencias: secuencias curadas utilizadas en los análisis comparativos. Archivos BEAST (análisis bayesianos) Conjuntos de archivos con fechas entre el 5/8/2021 y el 14/8/2021, correspondientes a corridas independientes de BEAST. .log: registros de ejecución MCMC con parámetros de convergencia y likelihood. .ops: configuración de operadores de muestreo bayesiano. .trees: árboles muestreados durante la cadena, usados para generar el árbol de consenso y las probabilidades posteriores. Cada corrida representa una replicación independiente del análisis de datación molecular y topología. 3. Obtención y procesamiento Las lecturas FASTQ se obtuvieron mediante secuenciación de ADN extraído de restos fósiles de Neuryurus rudis y de especies actuales de Cingulata. El filtrado se realizó con CutAdapt, el alineamiento con Muscle por defecto y la curación manual en Geneious Prime. El análisis filogenético se hizo por inferencia bayesiana utilizando el programa BEAST, usando un modelo de sustitución GTR+G+I, un reloj molecular relajado lognormal y calibraciones fósiles. La convergencia de las cadenas se evaluó en Tracer, y los árboles de consenso se generaron con TreeAnnotator. 4. Contribución científica Estos datos constituyen uno de los primeros conjuntos moleculares obtenidos de un gliptodonte, aportando evidencia directa sobre la posición filogenética de Neuryurus rudis dentro de los Cingulata. Las estimaciones bayesianas mostraron una alta probabilidad posterior (>0.95) para su relación con el linaje de los gliptodontes, respaldando la hipótesis de una divergencia temprana respecto de los armadillos modernos. Los resultados permiten refinar el marco temporal de la evolución de los Xenarthros y vincular información genética con evidencias paleontológicas. 5. Potencial de reutilización El dataset puede reutilizarse para: Reanálisis filogenómicos con nuevos modelos de sustitución o calibraciones temporales. Comparaciones con genomas completos mitocondriales o nucleares de especies actuales de Cingulata y Pilosa. Estudios de tasas evolutivas y conservación de secuencias proteicas entre linajes fósiles y modernos. Metaanálisis de dataciones moleculares en Xenarthros. El formato estándar de los archivos (FASTQ, FASTA, TREE, LOG, OPS) facilita su integración en repositorios abiertos como GenBank o Dryad, garantizando su trazabilidad y reutilización en investigaciones evolutivas futuras.
Contexto de creación
Este conjunto de datos fue generado en el marco del estudio “Mitochondrial genome of Neuryurus rudis (Xenarthra, Cingulata); contribution to phylogeny and origin of glyptodonts”.
El objetivo fue reconstruir las relaciones evolutivas y los tiempos de divergencia entre gliptodontes extintos y armadillos actuales. Las muestras corresponden a material fósil y moderno, procesado para la extracción de ADN mitocondrial y su secuenciación mediante tecnología Illumina. Los datos fueron analizados con enfoques filogenéticos, incluyendo máxima verosimilitud y métodos bayesianos.
Descripción de los datos
Secuencias y alineamientos
out.1.fastq y out.2.fastq: lecturas crudas pareadas generadas por secuenciación.
read1_trimmed y read2_trimmed: lecturas filtradas y recortadas tras control de calidad.
alineamiento total 23-6-21.fasta: alineamiento final de secuencias mitocondriales combinando regiones homólogas entre especies fósiles y actuales.
MAXIMUM TREE.tree: árbol filogenético obtenido por máxima verosimilitud.
- Secuencias curadas utilizadas en los análisis comparativos.
Archivos BEAST (análisis bayesianos)
- Archivos generados entre el 5/8/2021 y el 14/8/2021, correspondientes a corridas independientes de BEAST.
.log: registros de ejecución MCMC con parámetros de convergencia y likelihood.
.ops: configuración de operadores de muestreo bayesiano.
.trees: árboles muestreados durante la cadena, usados para generar el árbol de consenso y las probabilidades posteriores.
Cada corrida representa una replicación independiente del análisis de datación molecular y topología.
Obtención y procesamiento
Las lecturas FASTQ se obtuvieron mediante secuenciación de ADN extraído de restos fósiles de Neuryurus rudis y de especies actuales de Cingulata.
El filtrado se realizó con CutAdapt, el alineamiento con Jalview y la curación manual en Geneious Prime.
El análisis filogenético se efectuó por inferencia bayesiana utilizando BEAST , con un modelo GTR+G+I, un reloj molecular relajado lognormal y calibraciones fósiles. La convergencia se evaluó en Tracer y los árboles de consenso se generaron con TreeAnnotator.
Contribución científica
Estos datos constituyen uno de los primeros conjuntos moleculares obtenidos de un gliptodonte, aportando evidencia sobre la posición filogenética de Neuryurus rudis dentro de los Cingulata.
Las estimaciones bayesianas mostraron una alta probabilidad posterior (>0.95) para su relación con el linaje de los gliptodontes, respaldando la hipótesis de una divergencia temprana respecto de los armadillos modernos.
Los resultados permiten refinar el marco temporal de la evolución de los Xenarthros y vincular información genética con evidencias paleontológicas.
Potencial de reutilización
El dataset puede reutilizarse para:
- Reanálisis filogenómicos con nuevos modelos de sustitución o calibraciones temporales.
- Comparaciones con genomas mitocondriales o nucleares de especies actuales de Cingulata y Pilosa.
- Estudios de tasas evolutivas y conservación de secuencias proteicas entre linajes fósiles y modernos.
- Metaanálisis de dataciones moleculares en Xenarthros.
El formato estándar de los archivos (FASTQ, FASTA, TREE, LOG, OPS) facilita su integración en repositorios como GenBank o Dryad, garantizando su trazabilidad y reutilización en futuras investigaciones evolutivas.
Context of creation
This dataset was generated as part of the study “Mitochondrial genome of Neuryurus rudis (Xenarthra, Cingulata); contribution to phylogeny and origin of glyptodonts.”
The aim was to reconstruct the evolutionary relationships and divergence times between extinct glyptodonts and extant armadillos. The samples correspond to fossil and modern material processed for mitochondrial DNA extraction and Illumina sequencing. Data were analyzed using phylogenetic approaches, including maximum likelihood and Bayesian inference methods.
Data description
Sequences and alignments
out.1.fastq and out.2.fastq: paired raw reads generated by sequencing.
read1_trimmed and read2_trimmed: filtered and trimmed reads after quality control.
alineamiento total 23-6-21.fasta: final mitochondrial sequence alignment combining homologous regions among fossil and extant species.
MAXIMUM TREE.tree: phylogenetic tree obtained by maximum likelihood.
- Curated sequences used in comparative analyses.
BEAST files (Bayesian analyses)
- Files generated between 08/05/2021 and 08/14/2021, corresponding to independent BEAST runs.
.log: MCMC run logs including convergence and likelihood parameters.
.ops: configuration of Bayesian sampling operators.
.trees: trees sampled during the chain, used to generate the consensus tree and posterior probabilities.
Each run represents an independent replication of the molecular dating and topology analysis.
Data acquisition and processing
FASTQ reads were obtained by sequencing DNA extracted from fossil remains of Neuryurus rudis and from extant Cingulata species.
Filtering was performed using CutAdapt, alignment with Jalview, and manual curation in Geneious Prime.
Phylogenetic analyses were carried out using Bayesian inference in BEAST, applying a GTR+G+I model, a lognormal relaxed molecular clock, and fossil calibrations. Convergence was evaluated in Tracer, and consensus trees were generated with TreeAnnotator.
Scientific contribution
This dataset represents one of the first molecular datasets obtained from a glyptodont, providing evidence of the phylogenetic position of Neuryurus rudis within Cingulata.
Bayesian estimates showed high posterior probability (>0.95) supporting its relationship to the glyptodont lineage, reinforcing the hypothesis of an early divergence from modern armadillos.
The results refine the temporal framework of xenarthran evolution and link genetic information with paleontological evidence.
Reuse potential
The dataset can be reused for:
- Phylogenomic reanalyses using new substitution models or temporal calibrations.
- Comparisons with mitochondrial or nuclear genomes of extant Cingulata and Pilosa species.
- Studies of evolutionary rates and protein sequence conservation between fossil and extant lineages.
- Molecular dating meta-analyses in Xenarthra.
The standardized file formats (FASTQ, FASTA, TREE, LOG, OPS) facilitate integration into repositories such as GenBank or Dryad, ensuring traceability and reuse in future evolutionary research. |