Scientific Software
Updated 6 months ago

Metasyn — Peer-reviewed • Rank 9.7 • Science 98%

Metasyn: Transparent Generation of Synthetic Tabular Data with Privacy Guarantees - Published in JOSS (2025)

Artificial Intelligence and Machine Learning
Scientific Software · Peer-reviewed
Scientific Software
Updated 6 months ago

rgugik — Peer-reviewed • Rank 11.3 • Science 93%

rgugik: Search and Retrieve Spatial Data from the Polish Head Office of Geodesy and Cartography in R - Published in JOSS (2021)

Engineering (40%) Earth and Environmental Sciences (40%)
Scientific Software · Peer-reviewed
Scientific Software
Updated 6 months ago

Git-RDM — Peer-reviewed • Rank 4.2 • Science 95%

Git-RDM: A research data management plugin for the Git version control system - Published in JOSS (2016)

Updated 6 months ago

herbie-data • Rank 19.4 • Science 77%

Download numerical weather prediction datasets (HRRR, RAP, GFS, IFS, etc.) from NOMADS, NODD partners (Amazon, Google, Microsoft), ECMWF open data, and the University of Utah Pando Archive System.

Updated 6 months ago

catalystcoop.pudl • Rank 17.3 • Science 77%

The Public Utility Data Liberation Project provides analysis-ready energy system data to climate advocates, researchers, policymakers, and journalists.

Updated 6 months ago

open-grid-emissions • Rank 7.0 • Science 77%

Tools for producing high-quality hourly generation and emissions data for U.S. electric grids

Updated 6 months ago

cbssuitabilityhaiti • Rank 1.6 • Science 77%

Data for a sanitation zoning assessment prepared for the city of Cap Haitien, Haiti. The package combines two datasets used for an analysis of the suitability of container-based sanitation (CBS)

Updated 6 months ago

sars-cov-2-nowcasting_und_-r-schaetzung • Rank 6.7 • Science 67%

Das Nowcasting erstellt eine Schätzung des Verlaufs der Anzahl von bereits erfolgten SARS-CoV-2-Erkrankungsfällen in Deutschland unter Berücksichtigung des Diagnose-, Melde- und Übermittlungsverzugs.

Updated 6 months ago

manuscript • Rank 6.2 • Science 67%

This repository implements an automated system to write our collaborative manuscript, while tracking changes and contributions.

Updated 6 months ago

sars-cov-2-infektionen_in_deutschland • Rank 5.1 • Science 67%

Der vorliegende Datansatz enthält umfassende Informationen zu SARS-CoV-2-Infektionen in Deutschland, die gemäß dem Infektionsschutzgesetze (IfSG) von den Gesundheitsämtern an das Robert Koch-Institut (RKI) gemeldet wurden. Die Daten umfassen Informationen zur Anzahl der bestätigten Fälle, Todesfälle und Genesungen, aus denen sich weitere Kennzah...

Updated 6 months ago

covid-19-todesfaelle_in_deutschland • Rank 4.1 • Science 67%

Im Datensatz 'COVID-19-Todesfälle in Deutschland' werden die Todesfälle in Bezug auf COVID-19 in Deutschland bereitgestellt. Darüber hinaus wird neben der Anzahl der übermittelten Todesfälle der Fall-Verstorbenen-Anteil berechnet. Angaben zum Tod zählen zu den melde- und übermittlungspflichtigen Inhalten. Bei der Ermittlung von Todesfällen und d...

Artificial Intelligence and Machine Learning (40%)
Updated 6 months ago

ile-de-france • Rank 7.0 • Science 64%

An open synthetic population of Île-de-France for agent-based transport simulation

Updated 6 months ago

covid-19_7-tage-inzidenz_in_deutschland • Rank 3.7 • Science 67%

Im Datensatz '7-Tage-Inzidenz von COVID-19 in Deutschland' werden die aktuellen 7-Tage-Inzidenzen der nach den Vorgaben des Infektionsschutzgesetzes - IfSG - an das RKI übermittelten COVID-19-Fälle veröffentlicht. Datengrundlage zur Berechnung der 7-Tage-Inzidenzen sind die an das RKI übermittelten COVID-19-Fälle. Eine detaillierte Dokumentation...

Updated 6 months ago

sars-cov-2-pcr-testungen_in_deutschland • Rank 2.7 • Science 67%

Im Rahmen der Bewältigung der COVID-19-Pandemie spielt die Diagnostik hinsichtlich SARS-CoV-2/COVID-19 eine entscheidende Rolle. Die Bedeutung liegt nicht nur in der diagnostischen Abklärung, sondern hat eine herausragende Stellung auch für die Beurteilung der epidemiologischen Entwicklung und hinsichtlich Strategien zur Verlangsamung des aktuellen Geschehens in Deutschland. Die Erfassung der durchgeführten PCR-Tests sowie die Ermittlung des Anteils der SARS-CoV-2 positiven PCR-Tests ermöglichen eine Einschätzung zur Wirksamkeit der Maßnahmen und der Umsetzung der Teststrategie. Vor diesem Hintergrund werden im Datensatz an das RKI übermittelte Daten zu PCR-Testungen, PCR-Testergebnissen und Testkapazitäten in Deutschland als offene Daten bereitgestellt.

Updated 6 months ago

corona-datenspende_teildatensatz_vitaldaten • Rank 2.6 • Science 67%

Die Daten von Fitnessarmbändern und SmartwatchesDie Daten von Fitnessarmbändern und Smartwatches, sogenannten Wearables, können Hinweise auf Symptome einer COVID-19 Erkrankung liefern. Mit Hilfe der Corona-Datenspende-App (CDA) konnten Bürger:innen dem Robert Koch-Institut solche Daten für wissenschaftliche Zwecke zur Verfügung stellen.

Updated 6 months ago

helminthR • Rank 10.0 • Science 59%

Accesses parasite occurrence records from the London Natural History Museum's Host-Parasite database, which contains over a quarter of a million helminth records.

Updated 6 months ago

corona-datenspende_teildatensatz_erleben_und_verhalten_in_der_pandemie • Rank 1.8 • Science 67%

Die Daten von Fitnessarmbändern und Smartwatches, sogenannten Wearables, können Hinweise auf Symptome einer Infektion mit COVID-19 liefern. Mit Hilfe der Corona-Datenspende-App (CDA) können Bürger:innen dem Robert Koch-Institut diese Daten zur wissenschaftlichen Auswertung zur Verfügung stellen. Zusammen mit Informationen aus anderen Quellen, z.B.

Updated 6 months ago

cbsodata • Rank 14.5 • Science 54%

Unofficial Statistics Netherlands (CBS) open data API client for Python

Updated 6 months ago

hochfrequente_mental_health_surveillance • Rank 1.4 • Science 67%

Im Rahmen der Mental Health Surveillance (MHS) am Robert Koch-Institut (RKI) werden für eine Auswahl an Indikatoren der psychischen Gesundheit von Erwachsenen basierend auf Surveydaten Zeitreihen bestehend aus gleitenden Drei-Monats-Schätzern und Glättungskurven berechnet. Dadurch sollen Entwicklungen in der psychischen Gesundheit der erwachsene...

Updated 6 months ago

core-geonetwork • Rank 11.9 • Science 54%

GeoNetwork is a catalog application to manage spatially referenced resources. It provides powerful metadata editing and search functions as well as an interactive web map viewer. It is currently used in numerous Spatial Data Infrastructure initiatives across the world.

Updated 5 months ago

https://github.com/catalyst-cooperative/pudl-archiver • Rank 6.5 • Science 59%

A tool for capuring snapshots of public data sources and archiving them on Zenodo for programmatic use.

Updated 6 months ago

meteostat • Rank 20.1 • Science 44%

Access and analyze historical weather and climate data with Python.

Updated 6 months ago

basedosdados • Rank 19.5 • Science 44%

⚙️ Código de manutenção do datalake (metadados e pacotes de acesso) | 📖 Docs: https://basedosdados.org/docs/home

Updated 6 months ago

waterpumpkwale • Rank 0.7 • Science 59%

Weekly volume of water pumped for handpumps monitored with Smart Handpump technology, Kwale County, Kenya

Updated 6 months ago

open-data-on-github • Rank 4.5 • Science 54%

Dataset files for the Open Data on GitHub paper

Updated 6 months ago

fowd • Rank 3.4 • Science 54%

Processing framework for FOWD, a free ocean wave dataset, ready for your ML application :ocean:

Updated 6 months ago

goes2go • Rank 15.6 • Science 36%

Download and process GOES-16 and GOES-17 data from NOAA's archive on AWS using Python.

Updated 6 months ago

innovationgraph • Rank 7.3 • Science 44%

GitHub Innovation Graph

Updated 6 months ago

csp-guru • Rank 4.9 • Science 46%

A database of concentrating solar power plants of the world for energy modellers and analysts.

Updated 6 months ago

government-open-source-policies • Rank 6.0 • Science 44%

Dataset of Government Open Source Policies

Updated 6 months ago

transparency • Rank 4.2 • Science 44%

Structured data files for topics covered by GitHub's Transparency Report

Updated 6 months ago

gbfs • Rank 11.7 • Science 36%

Documentation for the General Bikeshare Feed Specification, a standardized data feed for shared mobility system availability. Maintained by MobilityData

Updated 6 months ago

wb-reproducible-research-repository • Rank 3.7 • Science 44%

This repository supports the World Bank's Reproducible Research Repository

Updated 6 months ago

RSocrata • Rank 18.4 • Science 26%

Provides easier interaction with Socrata open data portals http://dev.socrata.com. Users can provide a 'Socrata' data set resource URL, or a 'Socrata' Open Data API (SoDA) web query, or a 'Socrata' "human-friendly" URL, returns an R data frame. Converts dates to 'POSIX' format. Manages throttling by 'Socrata'.

Updated 6 months ago

upgini • Rank 17.5 • Science 26%

Data search & enrichment library for Machine Learning → Easily find and add relevant features to your ML & AI pipeline from hundreds of public and premium external data sources, including open & commercial LLMs

Updated 6 months ago

censusapi • Rank 17.3 • Science 26%

R package to retrieve U.S. Census data and metadata via API

Updated 6 months ago

os_strategy_nhmw • Rank 1.8 • Science 41%

Open Science in Museums - Strategy of the "Naturhistorisches Museum Wien"

Updated 6 months ago

covid19-italy-integrated-surveillance-data • Rank 5.0 • Science 36%

COVID-19 integrated surveillance data provided by the Italian Institute of Health and processed via UnrollingAverages.jl to deconvolve the weekly moving averages.

Updated 6 months ago

brightsky • Rank 14.6 • Science 26%

JSON API for DWD's open weather data.

Updated 6 months ago

osmextract • Rank 14.3 • Science 26%

Download and import OpenStreetMap data from Geofabrik and other providers

Scientific Software
Updated 6 months ago

NPSdataverse — Peer-reviewed • Rank 4.0 • Science 36%

NPSdataverse: a suite of R packages for data processing, authoring Ecological Metadata Language metadata, checking data-metadata congruence, and accessing data - Published in JOSS (2025)

Updated 6 months ago

eia • Rank 11.9 • Science 26%

An R package wrapping the US Energy Information Administration open data API.

Updated 6 months ago

transitland-atlas • Rank 10.1 • Science 26%

an open directory of mobility feeds and operators — powers both Transitland v1 and v2

Updated 6 months ago

awesome-sentinel • Rank 9.5 • Science 26%

curated list of awesome tools, tutorials and APIs for Copernicus Sentinel satellite data

Updated 6 months ago

earth-osm • Rank 11.5 • Science 23%

Export infrastructure data from OpenStreetMap using Python

Updated 6 months ago

giessdenkiez-de • Rank 7.8 • Science 26%

The consequences of climate change, especially the dry and hot summers, are putting a strain on Berlin's ecosystem. Our urban trees are drying out and suffering long-term damage. Gieß den Kiez is made to enable coordinated citizen participation in the irrigation of urban trees.

Updated 6 months ago

openpdi • Rank 1.1 • Science 28%

A Python 3 library for decentralized aggregation of data from the Police Data Initiative (PDI).

Updated 6 months ago

NitrogenUptake2016 • Rank 6.0 • Science 23%

R package containing data and source code from Hill et al. 2018a (DOI: https://doi.org/10.1016/j.jembe.2018.07.006) and Hill et al. 2018b (DOI: https://doi.org/10.1016/j.dib.2018.09.133)

Updated 6 months ago

read.abares • Rank 2.1 • Science 26%

Harvest data from Australian Bureau of Agricultural and Resource Economics and Sciences (ABARES) part of the Australian Department of Agriculture, Fisheries and Forestry for your work in R

Updated 6 months ago

kiwisR • Rank 14.8 • Science 13%

Provides a simplified method for bringing tidy data into R from KISTERS WISKI databases via KiWIS API.

Updated 6 months ago

osdg-data • Rank 4.7 • Science 23%

The OSDG Community Dataset (OSDG-CD) is a public dataset of thousands of text excerpts, validated by OSDG Community Platform (OSDG-CP) citizen scientists with respect to the Sustainable Development Goals (SDGs). The dataset is updated every quarter and published on Zenodo.

Updated 5 months ago

https://github.com/crsh/psych-transparency-guide • Rank 3.4 • Science 23%

Supplementary material for "A practical guide for transparency in psychological science" (find the paper at https://psyarxiv.com/rtygm/)

Updated 6 months ago

statnipokladna • Rank 10.1 • Science 13%

R package to use data from the Czech public finance database

Updated 6 months ago

https://github.com/inseefrlab/pynsee • Rank 6.7 • Science 13%

pynsee package contains tools to easily search and download French data from INSEE and IGN APIs

Updated 5 months ago

https://github.com/cdcgov/opencdc • Rank 5.8 • Science 13%

This is the repository for the openCDC web site. Entire site is generated from data files describing CDC Open Technology types for data, api, code, and events. All CDC programs are welcome to submit pull requests with updates and new items useful to the public health open source community.

Updated 5 months ago

https://github.com/catalyst-cooperative/pudl-scrapers • Rank 3.4 • Science 10%

Scrapers used to acquire snapshots of raw data inputs for versioned archiving and replicable analysis.

Updated 6 months ago

dataset-register • Science 26%

Components (API and crawler) for the NDE Dataset Register

Updated 6 months ago

influenzafaelle_in_deutschland • Science 67%

Im Datensatz "Laborbestätigte Influenzafälle in Deutschland" werden die wöchentlichen Fallzahlen und Inzidenzen (Fälle pro 100.000 Personen) der nach den Vorgaben des Infektionsschutzgesetzes (IfSG) von den Gesundheitsämtern in Deutschland an die zuständigen Landesbehördne und das Robert Koch-Institut (RKI) übermittelten laborbestätigt...

Updated 6 months ago

csv-conf-khoj • Science 57%

A presentation (for csv,conf,v7) on building a dataset around Indian High Court Judges

Updated 5 months ago

https://github.com/ctjacobs/orchidokie • Science 13%

Lists the datasets associated with a journal article, conference paper, or other publication using ORCID.

Updated 5 months ago

https://github.com/afsc-gap-products/metadata • Science 13%

This repository provides guidance for all of our data's metadata needs.

Updated 6 months ago

bundesweiter_klinischer_krebsregisterdatensatz-datenschema_und_klassifikationen • Science 67%

Das Repository stellt Informationen zu Struktur und Klassifikationen des bundesweiten klinischen Krebsregisterdatensatzes bereit. Die verwendeten Klassifikationen bilden den derzeitigen Arbeitsstand des ZfKD ab. Ziel ist es, diesen Stand transparent bereit zu stellen und beteiligte Akteure zur gemeinsamen Harmonisierung von Standards einzuladen.

Updated 6 months ago

bcsa • Science 75%

The bcsa package provide datasets for source apportionment of light absorbing carbon (LAC) in Blantyre, Malawi. The package contains data on Absorption Angstrom Exponent experiments determination of local pollution sources. The package also contains data on spatial distribution and ambient concentrations of LAC concentrations.

Updated 6 months ago

oeplatform • Science 54%

Repository for the code of the Open Energy Platform (OEP) website. The OEP provides an interface to the Open Energy Family

Updated 6 months ago

nightlight • Science 44%

Global scale nightlight time series dataset

Updated 6 months ago

gesundheitsberichterstattung_-_daten_zu_nichtuebertragbaren_erkrankungen • Science 67%

Die Gesundheitsberichterstattung (GBE) des RKI informiert regelmäßig über die gesundheitliche Situation der Bevölkerung in Deutschland. Das Themenspektrum ist vielfältig und reicht von Gesundheitszustand und Einflussfaktoren auf die Gesundheit über Gesundheitsförderung, Prävention und gesundheitliche Versorgung bis hin zu den damit verbundenen ...

Updated 6 months ago

offenses_data • Science 44%

Demographics and offenses of California's prison population acquired by Redo.io through public records laws

Updated 6 months ago

wbstats • Science 23%

wbstats: An R package for searching and downloading data from the World Bank API

Updated 6 months ago

mantis • Science 26%

READONLY COPY (https://gitlab.com/opendata-apps/mantis) | An interactive web application to track Mantis Religiosa sightings in Brandenburg.

Updated 6 months ago

washinvestments • Science 67%

Dataset on multilateral development bank (MDB) investment in water supply and sanitation associated with the paper "Multilateral development banks investment behaviour in water and sanitation: Findings and lessons from 60 years of investment projects in Africa and Asia" (Heidler et al. 2023).

Updated 6 months ago

stopptcovid-studie_daten_analyse_und_ergebnisse • Science 67%

Die getroffenen Maßnahmen zur Kontrolle von Severe Acute Respiratory Syndrome Coronavirus Type 2 (SARS-CoV-2) haben während der Coronavirus Disease 2019-(COVID-19-) Pandemie zu starken Einschränkungen des öffentlichen Lebens in Deutschland geführt. Das übergeordnete Ziel des Projekts "StopptCOVID" bestand darin, die Evidenzgrundlage für die ...

Updated 6 months ago

burden_2020_-_krankheitslast_in_deutschland_und_seinen_regionen • Science 67%

Kennzahlen der Krankheitslast (engl. Burden of Disease) rücken für eine Vielzahl von Anwendungsmöglichkeiten, unter anderem im Öffentlichen Gesundheitsdienst des Bundes und der Länder, in Forschung, Entwicklung und anderen Bereichen des Gesundheitswesens, zunehmend in den Vordergrund. Sie erfassen den Gesundheitszustand einer Bevölkerung mit Hilfe

Updated 6 months ago

polioviren_im_abwasser-pia • Science 67%

Derzeit wird in Deutschland zur Überwachung der Poliofreiheit eine syndromische Surveillance hospitalisierter Patienten mit aseptischer Meningitis/Enzephalitis und akuter schlaffer Paresen durchgeführt (Enterovirus-Surveillance, EVSurv).

Updated 6 months ago

saniabidjan • Science 44%

Data about household survey of managing sanitation facilities in Abidjan, Cote d’Ivoire