Introduction:
This dataset compiles experimental data on the recovery of sterylglucosides from biodiesel tanks precipitates. It includes isolated compounds reported bioactivity data (ChEMBL database), purity measurements (quantitative NMR), toxicity assays on cells (Huh7) and male mice (C57BL/6).
The present dataset is focused on the review of reported biological activity of each one of the three compounds isolated as mixture (beta-sitosterylglucoside:stigmasterylglucoside:campesterylglucoside in 2:1:1 ratio), followed by purity measurement of the mixture and the later toxicity of the mixture against a cell-line and mice.
Methodological information:
- Sample origin: The biodiesel tank bottom sample was provided by UnitecBio (https://unitecbio.com.ar/) in 2015.
- Isolation and Purification Procedure: Two consecutive washes (hexane and methanol, respectively) were used to eliminate the biodiesel and the remaining minor components. Then, the sterylglycosides were recovered by filtration and dried until they reached a constant weight. The identity of the sterylglycosides was confirmed by proton (¹H) and carbon (¹³C) Nuclear Magnetic Resonance Spectroscopy, and also two-dimensional NMR experiments, i.e. Correlation Spectroscopy (COSY) NMR, Heteronuclear Single Quantum Coherence (HSQC) NMR, and Heteronuclear Multiple Bond Correlation (HMBC) NMR. NMR spectra were acquired on a Bruker Avance II 300 MHz (75.13 MHz) using CDCl₃ as solvent. Spectra were processed using Bruker TopSpin 4.4.1.
- Purity Determination: The isolated mixture was mixed with the internal standard, 4-methoxyphenol. It was then derivatized by acetylation, and ¹H NMR spectra were recorded (128 scans). NMR spectra were acquired on a Bruker Avance II 300 MHz (75.13 MHz) using CDCl3 as solvent. Spectra were processed using Bruker TopSpin 4.4.1.
- Reported Bioactivity Evaluation: A search for the bioactivities of the compounds in the mixture was performed in the ChEMBL35 database on June 30, 2025. The corresponding SMILES were used as input for the ChEMBL advanced search engine.
- Solubility tests: SGs were suspended in various solvents or solvent mixtures in screw-capped tubes. Samples were heated at 40 °C with orbital shaking (400 rpm, 5 min) using a thermomixer, then visually inspected for undissolved material. Solubility was evaluated by the Tyndall effect using a red laser. If insolubility or partial solubility was observed, additional solvent was added and the process repeated. In certain cases, ultrasonic treatment was applied (20 min, 40 °C) to improve dissolution.
- Toxicity assays: In vitro cytotoxicity was assessed using Huh7 hepatocarcinoma cells exposed to increasing concentrations of SGs for 72 hours. For in vivo evaluation, SGs were administered orally to mice (n = 11, 2 per group, 3 for control) at 25–200 mg/kg/day for 21 days. Biochemical markers of liver function (GOT, GPT) and metabolic parameters (glucose, cholesterol, TAGs) were measured after euthanasia. All animal procedures were performed in accordance with the Regulation for the Care and Use of Laboratory Animals and were approved by the Institutional Committee for the Care and Use of Laboratory Animals (CICUAL) of the Universidad Nacional de Rosario (UNR), Argentina.
Dataset content:
This dataset's files are organized into four main folders according to the type of analysis performed.
Sterylglucosides_NMR_experiments: This contains the NMR spectra that were used to determine the structure of the isolated mixture. It includes zipped files with the following spectral data:
- Sterylglucosides_13C_spectrum.zip
- Sterylglucosides_1H_spectrum.zip
- Sterylglucosides_COSY_spectrum.zip
- Sterylglucosides_HMBC_spectrum.zip
- Sterylglucosides_HSQC_spectrum.zip
NMR spectra were acquired on a Bruker Avance II 300 MHz (75.13 MHz) using CDCl₃ as solvent. Chemical shifts (δ) were reported in ppm downfield from tetramethylsilane and coupling constants are in hertz (Hz). All NMR spectra were referenced to the residual undeuterated solvent as an internal reference. Spectra were processed using Bruker TopSpin 4.4.1.
Sterylglucosides_purity_determination: This contains the NMR spectra that were used to determine the purity of the isolated mixture. It includes zipped files with the following spectral data:
- Entry_1_q1HRMN_spectrum.zip
- Entry_2_q1HRMN_spectrum.zip
- Entry_3_q1HRMN_spectrum.zip
Signals corresponding to the aromatic protons of 4-methoxyphenyl acetate (7.1–6.9 ppm, dd, 4H) and the proton attached to C6 (5.42 ppm, m, 1H) were integrated relative to each other to determine the sample's purity. Spectra were processed using Bruker TopSpin 4.4.1.
It also contains the processed data for purity determination, included in the following file:
- Sterylglucosides_purity_determination-1.tab
Sterylglucosides_reported_activities_in_ChEMBL: This contains the results of searches for bioactivities by structure in the ChEMBL database. Each of the three structures was used as input to ChEMBL's advanced search engine (https://www.ebi.ac.uk/chembl/) “chemical search” -> “SIMILARITY>95%”.
Three entries were obtained for beta-sitosterylglucoside, one for stigmasterylglucoside and none for campesterylglucoside. Each entry is presented as a separate sheet indicating the corresponding ChEMBL ID preceded by “B” for beta-sitosterylglucoside and “S” for stigmasterylglucoside in the following file:
- Carlucci_et_al_Sterylglucosides_activities_ChEMBL.tab
Sterylglucosides_toxicity_assays: It compiles experimental toxicity data obtained through in vitro Huh7 cell assays and in vivo C57BL/6 mouse studies. The data are included in the following file:
- Carlucci_et_al_Sterylglucosides_toxicity_cells_mice.tab
Solubility and MTT result are resumed for Acetone and DMSO vehicles in Sheet 1. Raw UV-vis data and viability percentages for MTT assays for both control and SGs are described in Sheets 2-5. Mice body weights (BW) and liver weights (LW) results are described in Sheet 6. Mice plasma and tissue metabolic assays results (raw data included) are described in Sheets 7-11 (i.e., TG & cholesterol, glycemia, GOT, GPT and WP MTP, respectively)
Additionally, the results of the analysis of variance are included in the following files:
- Carlucci_et_al_Sterylglucosides_toxicity_cells_ANOVA.pzfx
- Carlucci_et_al_Sterylglucosides_toxicity_mice_ANOVA.pzfx
Value of the data: The general significance of this dataset revolves around the revision of the reported biological activities of sterylglucosides and the assessment of their purity and toxicity when isolated from biodiesel tank bottom deposits. This dataset offers valuable insights for researchers working in the fields of natural product chemistry, toxicology, and bioactivity profiling by providing experimental evidence that highlights the non-toxic behavior of a sterylglucoside mixture in both in vitro (Huh7 cells) and in vivo (C57BL/6 mice) models.
The biological activities of β-sitosterylglucoside, stigmasterylglucoside, and campesterylglucoside were systematically re-evaluated based on existing data. The purity and structural integrity of the isolated sterylglucosides were confirmed. Toxicity assessments indicated no significant adverse effects in human liver cells or mice. Solubility profiles in different solvents were established to support future applications. Structural identification was consistent with previously reported NMR data.
This dataset may be particularly valuable for studies involving sterylglucosides derived from industrial waste sources, contributing to the evaluation of their safety profiles and potential applications in biomedical and pharmaceutical research.
Data quality: Experiments were carried out with replicates (n = 3 or 2). For the controls of the in vitro and in vivo experiments, solvents were used as vehicles in the absence of sterylglucosides.
(2024-06-30)
Introducción:
Este conjunto de datos compila información experimental sobre la recuperación de esterilglucósidos a partir de precipitados de tanques de biodiesel. Incluye datos sobre la bioactividad de los compuestos aislados (base de datos ChEMBL), mediciones de pureza (RMN cuantitativa), y ensayos de toxicidad en células (Huh7) y en ratones machos (C57BL/6).
El presente conjunto de datos se centra en la revisión de la actividad biológica previamente reportada de cada uno de los tres compuestos aislados como mezcla (beta-sitosterglucósido:estigmasterglucósido:campesterglucósido en una proporción 2:1:1), seguida por la medición de la pureza de la mezcla y la posterior evaluación de su toxicidad en una línea celular y en ratones.
Información metodológica:
- Origen de la muestra: La muestra de fondos de tanques de biodiesel fue provista por UnitecBio (https://unitecbio.com.ar/) en 2015.
- Procedimiento de aislamiento y purificación: Se realizaron dos lavados consecutivos (con hexano y metanol, respectivamente) para eliminar el biodiesel y los componentes minoritarios remanentes. Luego, los esterilglucósidos se recuperaron por filtración y se secaron hasta alcanzar un peso constante. La identidad de los esterilglucósidos fue confirmada mediante espectroscopía de resonancia magnética nuclear de protón (¹H) y carbono (¹³C), además de experimentos bidimensionales de RMN, es decir, espectroscopía de correlación (COSY), coherencia cuántica simple heteronuclear (HSQC) y correlación de múltiples enlaces heteronucleares (HMBC). Los espectros se adquirieron en un espectrómetro Bruker Avance II 300 MHz (75.13 MHz), utilizando CDCl₃ como disolvente, y se procesaron con el programa Bruker TopSpin 4.4.1.
- Determinación de la pureza: A la mezcla aislada se le adicinó el estándar interno 4-metoxifenol. Luego se derivatizó la mezcla por acetilación y se registraron espectros de RMN de ¹H (128 escaneos). Los espectros se adquirieron en un Bruker Avance II 300 MHz (75.13 MHz) utilizando CDCl₃ como disolvente y se procesaron con el programa Bruker TopSpin 4.4.1.
- Evaluación de bioactividad reportada: Se realizó una búsqueda de las bioactividades de los compuestos en la mezcla en la base de datos ChEMBL35 el 30 de junio de 2025. Se utilizaron los SMILES correspondientes como entrada en el motor de búsqueda avanzada de ChEMBL.
- Pruebas de solubilidad: Los esterilglucósidos se suspendieron en varios solventes o mezclas de solventes en tubos con tapa a rosca. Las muestras se calentaron a 40 °C con agitación orbital (400 rpm, 5 min) utilizando un termomezclador y se inspeccionaron visualmente para verificar la presencia de material no disuelto. La solubilidad se evaluó mediante el efecto Tyndall con un láser rojo. En caso de observarse insolubilidad o solubilidad parcial, se añadió disolvente adicional y se repitió el procedimiento. En ciertos casos se aplicó tratamiento ultrasónico (20 min, 40 °C) para mejorar la disolución.
- Ensayos de toxicidad: La citotoxicidad in vitro se evaluó utilizando células de hepatocarcinoma Huh7 expuestas a concentraciones crecientes de esterilglucósidos durante 72 horas. Para la evaluación in vivo, los compuestos se administraron por vía oral a ratones (n = 11; 2 por grupo tratado, 3 para el grupo control) en un rango de 25–200 mg/kg/día durante 21 días. Se midieron marcadores bioquímicos de función hepática (GOT, GPT) y parámetros metabólicos (glucosa, colesterol, TAGs) tras la eutanasia. Todos los procedimientos con animales se realizaron de acuerdo con el Reglamento para el Cuidado y Uso de Animales de Laboratorio y fueron aprobados por el Comité Institucional para el Cuidado y Uso de Animales de Laboratorio (CICUAL) de la Universidad Nacional de Rosario (UNR), Argentina.
Contenido del conjunto de datos:
Los archivos del conjunto de datos están organizados en cuatro carpetas principales según el tipo de análisis realizado.
Sterylglucosides_NMR_experiments:
Contiene los espectros de RMN utilizados para determinar la estructura de la mezcla aislada. Incluye archivos comprimidos con los siguientes datos espectrales:
- Sterylglucosides_13C_spectrum.zip
- Sterylglucosides_1H_spectrum.zip
- Sterylglucosides_COSY_spectrum.zip
- Sterylglucosides_HMBC_spectrum.zip
- Sterylglucosides_HSQC_spectrum.zip
Los espectros de RMN fueron adquiridos en un Bruker Avance II 300 MHz (75.13 MHz) utilizando CDCl₃ como disolvente. Los desplazamientos químicos (δ) se reportan en ppm desde tetrametilsilano y las constantes de acoplamiento en hercios (Hz). Todos los espectros fueron referenciados al solvente no deuterado residual como referencia interna. El procesamiento se realizó con el software Bruker TopSpin 4.4.1.
Sterylglucosides_purity_determination:
Contiene los espectros de RMN utilizados para determinar la pureza de la mezcla aislada. Incluye archivos comprimidos con los siguientes datos espectrales:
- Entry_1_q1HRMN_spectrum.zip
- Entry_2_q1HRMN_spectrum.zip
- Entry_3_q1HRMN_spectrum.zip.zip
Las señales correspondientes a los protones aromáticos del acetato de 4-metoxifenilo (7.1–6.9 ppm, dd, 4H) y al protón unido al carbono 6 (5.42 ppm, m, 1H) se integraron entre sí para determinar la pureza de la muestra. Los espectros se procesaron con el programa Bruker TopSpin 4.4.1.
También contiene los datos procesados para la determinación de pureza en el siguiente archivo:
- Sterylglucosides_purity_determination-1.tab
Sterylglucosides_reported_activities_in_ChEMBL:
Contiene los resultados de las búsquedas de bioactividad por estructura en la base de datos ChEMBL. Cada una de las tres estructuras fue utilizada como entrada en el buscador avanzado de ChEMBL (https://www.ebi.ac.uk/chembl/) usando la opción “chemical search” -> “SIMILARITY>95%”.
Se obtuvieron tres entradas para el beta-sitosterilglucósido, una para el estigmasterilglucósido y ninguna para el campesterilglucósido. Cada entrada se presenta en una hoja separada indicando el ID correspondiente de ChEMBL precedido por “B” para beta-sitosterilglucósido y “S” para estigmasterilglucósido en el siguiente archivo:
- Carlucci_et_al_Sterylglucosides_activities_ChEMBL.tab
Sterylglucosides_toxicity_assays:
Compila los datos experimentales de toxicidad obtenidos mediante ensayos in vitro en células Huh7 y estudios in vivo en ratones C57BL/6. Los datos están incluidos en el siguiente archivo:
- Carlucci_et_al_Sterylglucosides_toxicity_cells_mice.tab
Los resultados de solubilidad y del ensayo MTT están resumidos para los vehículos acetona y DMSO en la Hoja 1. Los datos crudos de UV-vis y los porcentajes de viabilidad para los ensayos MTT (control y con SGs) se detallan en las Hojas 2–5. Los resultados de peso corporal (BW) y peso hepático (LW) de los ratones se incluyen en la Hoja 6. Los ensayos metabólicos en plasma y tejidos (datos crudos incluidos) se encuentran en las Hojas 7–11 (TG y colesterol, glucemia, GOT, GPT y WP MTP, respectivamente).
Además, los resultados del análisis de varianza se encuentran en los siguientes archivos:
- Carlucci_et_al_Sterylglucosides_toxicity_cells_ANOVA.pzfx
- Carlucci_et_al_Sterylglucosides_toxicity_mice_ANOVA.pzfx
Valor de los datos:
La importancia general de este conjunto de datos radica en la revisión de las actividades biológicas reportadas de los esterilglucósidos y en la evaluación de su pureza y toxicidad cuando son aislados de depósitos del fondo de tanques de biodiesel. Ofrece información experimental valiosa para investigadores en las áreas de química de productos naturales, toxicología y bioactividad, al proporcionar evidencia que destaca el comportamiento no tóxico de una mezcla de esterilglucósidos en modelos in vitro (células Huh7) e in vivo (ratones C57BL/6).
Se re-evaluaron sistemáticamente las actividades biológicas del β-sitosterglucósido, estigmasterglucósido y campesterglucósido a partir de datos existentes. Se confirmó la pureza e integridad estructural de la mezcla aislada. Se establecieron perfiles de solubilidad en diferentes disolventes para respaldar aplicaciones futuras. Las evaluaciones toxicológicas no mostraron efectos adversos significativos en células hepáticas humanas ni en ratones. La identificación estructural fue consistente con los datos de RMN previamente reportados.
Este conjunto de datos puede resultar especialmente útil para estudios sobre esterilglucósidos derivados de fuentes de desecho industrial, contribuyendo a la evaluación de su perfil de seguridad y potenciales aplicaciones en investigación biomédica y farmacéutica.
Calidad de los datos:
Los experimentos se realizaron con réplicas (n = 3 o 2). Para los controles de los experimentos in vitro e in vivo, se utilizaron los solventes empleados como vehículos en ausencia de esterilglucósidos. (2024-06-30) |