Introducción
Se presentan datos bibliográficos sobre la distribución de la producción científica de la Facultad de Ciencias Bioquímicas y Farmacéuticas de la Universidad Nacional de Rosario (UNR) durante el período 2015-2019. Este dataset se creó para estudiar las tendencias de publicación y los costos asociados. En particular, resulta útil para estimar la adopción de prácticas de publicación en acceso abierto en la universidad, tomando como base una facultad con alta producción científica.
En 2016, la UNR implementó su Política Institucional de Acceso Abierto con el objetivo de fomentar el acceso libre y gratuito al conocimiento científico producido por sus investigadores, según lo establece la Ley 26.899. Esta política facilita la reutilización y distribución de las obras, garantizando que se respete la integridad y autoría de los contenidos.
El período analizado permite evaluar la evolución reciente, respecto a la fecha de recolección, de las prácticas de acceso abierto y el financiamiento de publicaciones. El dataset incluye información detallada sobre 782 publicaciones, proporcionando una visión clara del alcance de la producción científica de la facultad. Este análisis constituye el primer paso para monitorear la evolución de estas prácticas en el futuro. Contenidos del dataset
El dataset incluye varios archivos:
- 0_Informe_datos.txt: información general sobre el dataset, incluyendo un resumen y análisis de los datos. En texto plano.
- 1_Diccionario_datos.xls: descripción de los campos presentes en el conjunto de datos, incluyendo sus definiciones. En archivo de hoja de cálculo de Microsoft Excel.
- 2_UNR_Bioquimica_OA.tab: contiene todos los registros de publicaciones con los campos en inglés. Disponible en formato .tab.
- 3_Licencias_AA.tab: información sobre las licencias utilizadas en las publicaciones. Disponible en formato .tab.
- 4_Documentos_categoría_de_acceso.xlsx: datos clasificados según la categoría de acceso. En archivo de hoja de cálculo de Microsoft Excel.
- 5_Análisis_APC.tab: estimación de los costos asociados a la publicación en revistas de acceso abierto e híbridas que aplican cargos APC (Article Processing Charges). Disponible en formato .tab.
- 6_Publicaciones_por_revista.tab: muestra el porcentaje de publicaciones por revista. Disponible en formato .tab.
- 7_Participación_por_editorial.tab: detalles sobre la participación editorial. Disponible en formato .tab.
Análisis de los datos
Los datos están clasificados según la vía de acceso de las publicaciones, lo que facilita la evaluación del impacto de las políticas de acceso abierto y el financiamiento de publicaciones:
- Dorado: publicaciones en revistas completamente en acceso abierto.
- Híbrido: publicaciones en revistas de suscripción que permiten a los autores publicar en acceso abierto mediante el pago de una APC.
- Bronce: publicaciones abiertas pero sin licencia de reutilización.
- Verde: publicaciones depositadas en repositorios institucionales o temáticos.
- Revistas cerradas: publicaciones sin acceso abierto.
Recolección de los datos
Los pasos para la recolección de datos fueron los siguientes:
- Identificación de publicaciones y obtención de datos bibliográficos: se comenzó por identificar las publicaciones científicas en función de la filiación institucional de los autores. Para ello, se utilizó la base de datos SCOPUS de Elsevier, realizando la recolección en agosto de 2020 y descargando los registros bibliográficos clasificados por año.
- Determinación de vías de acceso: se utilizó la herramienta Unpaywall para evaluar el porcentaje de producción científica disponible. Aprovechando el DOI de cada artículo, la herramienta identificó si los documentos estaban disponibles en acceso abierto o a través de otras vías de publicación.
- Análisis complementario: el análisis se complementó con información obtenida de bases de datos adicionales como DOAJ (Directory of Open Access Journals) y SciELO (Scientific Electronic Library Online), así como de los sitios web de editoriales y revistas. Esto permitió obtener detalles adicionales sobre los costos de APC y las políticas de acceso abierto de las revistas donde se publicaron los artículos.
Calidad de los datos
La lista de publicaciones se considera completa dentro del marco temporal y las fuentes utilizadas. Valor de uso de los datos
Estos datos resultan valiosos para la comunidad académica, las instituciones educativas y los investigadores interesados en entender la distribución de la producción científica en acceso abierto y su financiamiento. Los datos recopilados pueden ser reutilizados en futuros estudios sobre políticas de acceso abierto y tendencias en la publicación científica, proporcionando una visión más completa de la disponibilidad y accesibilidad de la investigación académica. También pueden ser de interés para las instituciones financiadoras del sistema científico argentino y para la planificación de políticas públicas sobre acceso abierto.
Introduction
Bibliographic data on the distribution of scientific production from the Faculty of Biochemical and Pharmaceutical Sciences at the National University of Rosario (UNR) during the period 2015-2019 is presented. This dataset was created to study publication trends and associated costs. In particular, it is useful for estimating the adoption of open access publishing practices at the university, using a faculty with high scientific production as a basis.
In 2016, UNR implemented its Institutional Open Access Policy with the aim of promoting free and open access to the scientific knowledge produced by its researchers, as established by Law 26.899. This policy facilitates the reuse and distribution of works, ensuring that the integrity and authorship of the content are respected.
The analyzed period allows for the assessment of recent developments, relative to the date of collection, in open access practices and publication funding. The dataset includes detailed information on 782 publications, providing a clear view of the scope of the faculty's scientific production. This analysis constitutes the first step in monitoring the evolution of these practices in the future. Contents of the dataset
The dataset includes several files:
- 0_Informe_datos.txt: general information about the dataset, including a summary and analysis of the data. In plain text.
- 1_Diccionario_datos.xls: description of the fields and variables present in the dataset, including definitions. In a Microsoft Excel spreadsheet that can be downloaded in its original format.
- 2_UNR_Bioquimica_OA.tab: contains all records of publications with fields in English. In a Microsoft Excel spreadsheet that can be downloaded in its original format or .tab.
- 3_Licencias_AA.tab: information about the licenses used in the publications. In a Microsoft Excel spreadsheet that can be downloaded in its original format or .tab.
- 4_Documentos_categoría_de_acceso.xlsx: data classified according to access category. In a Microsoft Excel spreadsheet that can be downloaded in its original format.
- 5_Análisis_APC.tab: estimation of costs associated with publication in open access and hybrid journals that apply APC charges. In a Microsoft Excel spreadsheet that can be downloaded in its original format or .tab.
- 6_Publicaciones_por_revista.tab: shows the percentage of publications by journal. In a Microsoft Excel spreadsheet that can be downloaded in its original format or .tab.
- 7_Participación_por_editorial.tab: details about editorial participation. In a Microsoft Excel spreadsheet that can be downloaded in its original format or .tab.
Data analysis
The data are classified according to the access route of the publications, facilitating the evaluation of the impact of open access policies and publication funding:
- Gold: publications in completely open access journals.
- Hybrid: publications in subscription journals that allow authors to publish open access by paying an APC (Article Processing Charges).
- Bronze: open publications but without a reuse license.
- Green: publications deposited in institutional or thematic repositories.
- Closed journals: publications without open access.
Data collection
The steps for data collection were as follows:
- Identification of publications and acquisition of bibliographic data: the process began by identifying scientific publications based on the authors' institutional affiliation. For this purpose, the SCOPUS database from Elsevier was used, with data collection carried out in August 2020 and bibliographic records downloaded and classified by year.
- Determination of access pathways: the Unpaywall tool was used to assess the percentage of available scientific production. By leveraging the DOI of each article, the tool identified whether the documents were available in open access or through other publication channels.
- Complementary analysis: the analysis was supplemented with information obtained from additional databases such as DOAJ (Directory of Open Access Journals) and SciELO (Scientific Electronic Library Online), as well as from the websites of publishers and journals. This provided additional details on APC (Article Processing Charges) and open access policies of the journals where the articles were published.
Data quality
The list of publications is considered complete within the given time frame and the sources used. Data usage value
These data are valuable to the academic community, educational institutions, and researchers interested in understanding the distribution of scientific production in open access and its funding. The collected data can be reused in future studies on open access policies and trends in scientific publishing, providing a more comprehensive view of the availability and accessibility of academic research. They may also be of interest to the funding institutions of the Argentine scientific system and for the planning of public policies on open access. |