ciencia_abierta
reposirtorio para la asignatura de ciencia abierta e inteligencia artificial, donde , estaran los porgramas de la primera practica junto con los archivos necesarios
Science Score: 44.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
✓CITATION.cff file
Found CITATION.cff file -
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
○DOI references
-
○Academic publication links
-
○Academic email domains
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (3.1%) to scientific vocabulary
Repository
reposirtorio para la asignatura de ciencia abierta e inteligencia artificial, donde , estaran los porgramas de la primera practica junto con los archivos necesarios
Basic Info
- Host: GitHub
- Owner: malekit01
- License: other
- Language: Python
- Default Branch: main
- Size: 12.2 MB
Statistics
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
- Releases: 0
Metadata Files
README.md
Ciencia_abierta
Este repositorio contiene los contenidos para la práctica de ciencia abierta. Incluye scripts de Python para procesar PDFs de artículos científicos, generar nubes de palabras, extraer figuras y enlaces, así como un script de configuración y un archivo de requisitos.
Contenido
lectroPDF.py: Script para procesar archivos PDF de artículos científicos utilizando Grobid y convertirlos a formato XML.
creadorNubesPalabras.py: Script para generar nubes de palabras a partir de los archivos XML generados por lectroPDF.py.
creadorFiguras.py: Script para contar el número de figuras en los archivos XML y generar una gráfica comparativa.
extractorLinks.py: Script para extraer enlaces de los archivos XML.
prev_practica.sh: Script de shell para crear la estructura de carpetas necesaria para los scripts.
requirements.txt: Lista de dependencias de Python necesarias para ejecutar los scripts.
LICENSE: Archivo de licencia para el repositorio.
CITATION: Archivo de citación para el repositorio.
Requisitos
Antes de ejecutar los scripts, asegúrate de tener instalado Python3 y las siguientes dependencias:
matplotlib
wordcloud
requests
Puedes instalar las dependencias utilizando pip o con el archivo requirements.txt del repositorio como se indica en Configuracion en el paso 3 :
También necesitas tener Grobid instalado. Puedes encontrar instrucciones de instalación en el repositorio de Grobid (https://github.com/kermitt2/grobid) .
Configuracion
Clona el repositorio
git clone https://github.com/malekit01/ciencia_abiertaaccede a la carpeta ciencia_abierta
cd ciencia_abiertacomprobar que las depedencias estan instaladas
pip install -r requirements.txtEjecuta el script prev_practica.sh para crear la estructura de carpetas necesaria
bash prev_practica.shColoca tus archivos PDF de artículos científicos en la carpeta
/ciencia_abierta/articulos_cientificosya hay 5 articulos base que puede usar.
Ejecutar Grobid en otra terminal:
docker run -t --rm -p 8070:8070 lfoppiano/grobid:0.7.2si prefieres usar solo una terminal añadir & al final del anterior comando
con estos pasos tendriamos la configuracion previa para poder ejecutar los programas.
Uso
Desde la carpeta ciencia_abierta :
Ejecuta lectroPDF.py para procesar los PDFs y generar archivos XML:
python3 lectorPDF.pyEjecuta creadorNubesPalabras.py para generar nubes de palabras a partir de los archivos XML:
python3 creadorNubesPalabras.pyEjecuta creadorFiguras.py para contar figuras y generar una gráfica:
python3 creadorFiguras.pyEjecuta extractorLinks.py para extraer enlaces de los archivos XML:
python3 extractorLinks.py
Licencia
Este proyecto está licenciado bajo la [LICENCIA].
Citación
Si utilizas este repositorio en tu investigación, por favor cita este trabajo como se describe en [CITATION]
Notas
- El script prev_practica.sh debe ejecutarse antes de cualquier otro script para asegurar que la estructura de carpetas esté configurada correctamente.
- Los scripts asumen que los archivos PDF y XML están en los directorios especificados. Asegúrate de que los archivos existan y estén en los formatos correctos.
- Para un correcto funcionamiento de lectroPDF.py es necesario que Grobid este instalado y en funcionamiento.
Owner
- Login: malekit01
- Kind: user
- Repositories: 1
- Profile: https://github.com/malekit01
Citation (CITATION.cff)
cff-version: 1.2.0
message: "Si usas este código, por favor cítalo de la siguiente manera:"
title: "ciencia_abierta"
authors:
- name: "Javier Gonzalez Gonzalez"
affiliation: "UPM FI"
date-released: "2024-03-03"
version: "1.0.0"
license: "CC BY 4.0"
url: "https://github.com/malekit01/ciencia_abierta"
doi: "10.xxxx/zenodo.xxxx" # (Opcional, si subes tu código a Zenodo)
GitHub Events
Total
- Push event: 37
- Create event: 2
Last Year
- Push event: 37
- Create event: 2
Dependencies
- matplotlib *
- requests *
- wordcloud *