ciencia_abierta

reposirtorio para la asignatura de ciencia abierta e inteligencia artificial, donde , estaran los porgramas de la primera practica junto con los archivos necesarios

https://github.com/malekit01/ciencia_abierta

Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

✓
CITATION.cff file
Found CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
✓
.zenodo.json file
Found .zenodo.json file
○
DOI references
○
Academic publication links
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (3.1%) to scientific vocabulary

Last synced: 10 months ago · JSON representation ·

Repository

reposirtorio para la asignatura de ciencia abierta e inteligencia artificial, donde , estaran los porgramas de la primera practica junto con los archivos necesarios

Basic Info

Host: GitHub
Owner: malekit01
License: other
Language: Python
Default Branch: main
Size: 12.2 MB

Statistics

Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Releases: 0

Created over 1 year ago · Last pushed over 1 year ago

Metadata Files

Readme License Citation

Ciencia_abierta

Este repositorio contiene los contenidos para la práctica de ciencia abierta. Incluye scripts de Python para procesar PDFs de artículos científicos, generar nubes de palabras, extraer figuras y enlaces, así como un script de configuración y un archivo de requisitos.

Contenido

lectroPDF.py: Script para procesar archivos PDF de artículos científicos utilizando Grobid y convertirlos a formato XML.
creadorNubesPalabras.py: Script para generar nubes de palabras a partir de los archivos XML generados por lectroPDF.py.
creadorFiguras.py: Script para contar el número de figuras en los archivos XML y generar una gráfica comparativa.
extractorLinks.py: Script para extraer enlaces de los archivos XML.
prev_practica.sh: Script de shell para crear la estructura de carpetas necesaria para los scripts.
requirements.txt: Lista de dependencias de Python necesarias para ejecutar los scripts.
LICENSE: Archivo de licencia para el repositorio.
CITATION: Archivo de citación para el repositorio.

Requisitos

Antes de ejecutar los scripts, asegúrate de tener instalado Python3 y las siguientes dependencias:

matplotlib
wordcloud
requests

Puedes instalar las dependencias utilizando pip o con el archivo requirements.txt del repositorio como se indica en Configuracion en el paso 3 :

También necesitas tener Grobid instalado. Puedes encontrar instrucciones de instalación en el repositorio de Grobid (https://github.com/kermitt2/grobid) .

Configuracion

Clona el repositorio

git clone https://github.com/malekit01/ciencia_abierta

accede a la carpeta ciencia_abierta
```
cd ciencia_abierta
```
comprobar que las depedencias estan instaladas
```
pip install -r requirements.txt
```
Ejecuta el script prev_practica.sh para crear la estructura de carpetas necesaria
```
bash prev_practica.sh
```
Coloca tus archivos PDF de artículos científicos en la carpeta
```
/ciencia_abierta/articulos_cientificos
```
ya hay 5 articulos base que puede usar.
Ejecutar Grobid en otra terminal:
```
 docker run -t --rm -p 8070:8070 lfoppiano/grobid:0.7.2
```
si prefieres usar solo una terminal añadir & al final del anterior comando

con estos pasos tendriamos la configuracion previa para poder ejecutar los programas.

Uso

Desde la carpeta ciencia_abierta :

Ejecuta lectroPDF.py para procesar los PDFs y generar archivos XML:
```
python3 lectorPDF.py
```
Ejecuta creadorNubesPalabras.py para generar nubes de palabras a partir de los archivos XML:
```
python3 creadorNubesPalabras.py
```
Ejecuta creadorFiguras.py para contar figuras y generar una gráfica:
```
python3 creadorFiguras.py
```
Ejecuta extractorLinks.py para extraer enlaces de los archivos XML:
```
python3 extractorLinks.py
```

Licencia

Este proyecto está licenciado bajo la [LICENCIA].

Citación

Si utilizas este repositorio en tu investigación, por favor cita este trabajo como se describe en [CITATION]

Notas

El script prev_practica.sh debe ejecutarse antes de cualquier otro script para asegurar que la estructura de carpetas esté configurada correctamente.
Los scripts asumen que los archivos PDF y XML están en los directorios especificados. Asegúrate de que los archivos existan y estén en los formatos correctos.
Para un correcto funcionamiento de lectroPDF.py es necesario que Grobid este instalado y en funcionamiento.

Owner

Login: malekit01
Kind: user

Repositories: 1
Profile: https://github.com/malekit01

Citation (CITATION.cff)

cff-version: 1.2.0
message: "Si usas este código, por favor cítalo de la siguiente manera:"
title: "ciencia_abierta"
authors:
  - name: "Javier Gonzalez Gonzalez"
    affiliation: "UPM FI" 
date-released: "2024-03-03"  
version: "1.0.0"
license: "CC BY 4.0"
url: "https://github.com/malekit01/ciencia_abierta"
doi: "10.xxxx/zenodo.xxxx"  # (Opcional, si subes tu código a Zenodo)

GitHub Events

Total

Push event: 37
Create event: 2

Last Year

Push event: 37
Create event: 2

Dependencies

requirements.txt pypi

matplotlib *
requests *
wordcloud *

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Open Source Science