py_so

python pour la science ouverte

https://github.com/ml4rrieu/py_so

Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
    Found CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (2.5%) to scientific vocabulary

Keywords

jupyter-notebook open-science python
Last synced: 6 months ago · JSON representation ·

Repository

python pour la science ouverte

Basic Info
  • Host: GitHub
  • Owner: ml4rrieu
  • License: gpl-3.0
  • Language: Jupyter Notebook
  • Default Branch: main
  • Homepage:
  • Size: 4.98 MB
Statistics
  • Stars: 5
  • Watchers: 1
  • Forks: 2
  • Open Issues: 1
  • Releases: 0
Topics
jupyter-notebook open-science python
Created over 4 years ago · Last pushed over 1 year ago
Metadata Files
Readme License Citation

README.md

Python pour la science ouverte

Exemples de notebooks Jupyter pour booster la science ouverte dans son établissement



Techniques | Contexte | Ressources

Applications

Identifier les publications HAL de son établissement issues des projets ANR qui ne sont pas en accès ouvert

| <!-- -->| <!-- -->| | ------ | ----------- | |Difficulté| faible | |Exercice | pubprojetresearchhalno_oa.ipynb | |Compétences| requêtes API HAL, json vers dataframe| |Objectif | faire respecter l'obligation d'accès ouvert| |Démo | pubprojetresearchhalno_oa.ipynb|


Représenter l'évolution et les types de dépôts dans HAL d'une structure ou institution

| | | | -------- |--------| |Difficulté| faible | |Exercice | halevoldepots.ipynb | |Compétences| requêtes API de HAL en série, json vers dataframe, plot histogramme| |Objectif | Automatiser la production de statistiques pour les unités de recherche| |Démo | halevoldepots.ipynb|


Récupérer les identifiants des projets de recherche ANR portés par son établissemement

| | | | -------- |--------| |Difficulté| moyen | |Exercice | getanrresearch_project.ipynb | |Compétences| requêtes aurehal structure, données API, read_csv, filtre| |Objectif | initier une politique de suivi des publications des projets de recherche ANR| |Démo | getanrresearch_project.ipynb |


Niveau de bruit de son établissement dans le référentiel structure de HAL

| | | | -------- |--------| |Difficulté| faible | |Exercice | aurehalstructnoise.ipynb | |Compétences| requêtes aurehal structure, données API, fonction| |Objectif | Mesurer le niveau de bruit de son établissement dans le référentiel HAL structure| <!-- |Démo | aurehalstructnoise.ipynb | -->


Extraire un tableau des structures non valides de son étab. avec le nombre de documents associés

| | | | -------- |--------| |Difficulté| moyen | |Exercice | aurehalstructincoming_list.ipynb | |Compétences| requêtes aurehal struct, données API, fonction apply| |Objectif | Nettoyer les structures de son établissement dans le référentiel AureHAL| |Démo | aurehalstructincoming_list.ipynb|


Calculer le niveau de bruit dans le référentiel structures des établissements ayants un portail HAL

| | | | -------- |--------| |Difficulté| moyen | |Compétences| requêtes aurehal struct, données API, fonction| |Objectif | Sensibiliser les adminsitrateurs HAL à la propreté du référentiel structure| |Démo | aurehalstructnoiseperinstitution.ipynb |


Représenter le niveau de bruit des établissements dans le référentiel structure

| | | | -------- |--------| |Difficulté| moyen | |Compétences| wordcloud, pandas, matplotlib| |Objectif | Rendre comte du niveau de bruit des étab. dans le ref. structure| |Démo | aurehalstructnoiseperinstitution_graph.ipynb |

cf. résultats nuage de mots-clés


Vérifier à partir d'une source externe la présence en accès ouvert dans HAL des publications de son établissement

| | | | -------- |--------| |Difficulté| fort | |Compétences| API ScanR, Permissions, Module python| |Objectif | Identifier les publications de son établissement pouvant être déposées en accès ouvert #HALathon| |Démo | github.com/ml4rrieu/halathon|

Notebook réalisé dans le cadre du CasuHalathon 2021


Retrouver dans Zenodo les jeux de données de son établissement

| | | | -------- |--------| |Difficulté| moyenne | |Compétences| API Zenodo, JSON, iterations | |Objectif | Retrouver les jeux de données déposés dans Zenodo relevant de son établissement| |Démo | getdatasetfrom_zenodo.ipynb|


Récupérer les métadonnées d'un article publié avec Lodel pour enregistrer son DOI chez CrossRef

| | | | -------- |--------| |Difficulté| moyenne | |Compétences| request, XML, BeautifulSoup | |Objectif | Récupérer les métadonnées et former un XML Crossref pour l'enregistrement du DOI| |Démo | getmetadatafromarticletoregistercrossref_doi.ipynb|



Contexte

Formation initiée en 2021 avec Emilien Shultz, à la suite de l'excellent ouvrage Python pour les SHS (pyshs.fr). Formation en deux volets (2* 1.5 jours) : Python les fondamentaux et Python pour la science ouverte.

Un langage de programmation ne s'apprend pas en trois jours.

La formation en elle-même ne vous permettra pas de programmer en python. Par contre la réalisation des exercices, le livre Python pour les SHS, des MOOCs, votre perséverance et curiosité vous permettront de programmer en python.

  • 2024-02, URFIST Lyon
  • 2023-05, CasuHAL Visioconférence
  • 2023-03, URFIST Lyon
  • 2022-10, URFIST Occitanie
  • 2022-06, Journées CasuHAL
  • 2021-11, URFIST Occitanie

Partage sur twitter : #py_so



Pré-requis

  • Avoir les compétences décrites jusqu'au chapitre 4 du manuel Python pour les SHS
  • Maîtriser les APIs de HAL (l'API générale "search" et celle du référentiel structures de Aurehal)
  • Bonne connaissance du paysage de l'Enseignement Supérieur et de la Recherche et des enjeux de la science ouverte



Techniques à maîtriser

  • différentes syntaxes pour imprimer : print("ici", "là"), print(f"{ma_variable} encore") , print("{} dernière".format("une"))
  • Request, pandas
  • passer des données en JSON en dataframe (Pandas)
  • fonction avec argument
  • sortir un résultat structuré
  • filtrer une dataframe, extraire une liste, ajouter colonne



Ressources

  • JSON Viewer https://jsoncrack.com/editor

  • Excellent cours en ligne https://melaniewalsh.github.io/Intro-Cultural-Analytics/welcome.html

  • Ressource phySHS https://github.com/pyshs/ressources-pyshs

  • matplotlib Cheatsheets https://github.com/matplotlib/cheatsheets

  • Jupyter manual https://docs.jupyter.org/en/latest/index.html

Owner

  • Name: Maxence Larrieu
  • Login: ml4rrieu
  • Kind: user
  • Company: Université Paris Cité

Open Science Developer Phd in Computer Music

Citation (CITATION.cff)

# This CITATION.cff file was generated with cffinit.
# Visit https://bit.ly/cffinit to generate yours today!

cff-version: 1.2.0
title: Python pour la science ouverte
type: software
authors:
  - given-names: Maxence
    family-names: Larrieu
    orcid: 'https://orcid.org/0000-0002-1834-3007'
repository-code: 'https://github.com/ml4rrieu/py_so'
abstract: >-
  Exemples de notebooks Jupyter permettant de déployer la  
  science ouverte en contexte institutionnel
keywords:
  - open science
  - open scholarly communication
license: GPL-3.0

GitHub Events

Total
  • Watch event: 1
  • Push event: 1
Last Year
  • Watch event: 1
  • Push event: 1