Scientific Software
Updated 7 months ago

Metasyn — Peer-reviewed • Rank 9.7 • Science 98%

Metasyn: Transparent Generation of Synthetic Tabular Data with Privacy Guarantees - Published in JOSS (2025)

Artificial Intelligence and Machine Learning
Scientific Software · Peer-reviewed
Scientific Software
Updated 7 months ago

rgugik — Peer-reviewed • Rank 11.3 • Science 93%

rgugik: Search and Retrieve Spatial Data from the Polish Head Office of Geodesy and Cartography in R - Published in JOSS (2021)

Engineering (40%) Earth and Environmental Sciences (40%)
Scientific Software · Peer-reviewed
Scientific Software
Updated 7 months ago

Git-RDM — Peer-reviewed • Rank 4.2 • Science 95%

Git-RDM: A research data management plugin for the Git version control system - Published in JOSS (2016)

Updated 7 months ago

herbie-data • Rank 19.4 • Science 77%

Download numerical weather prediction datasets (HRRR, RAP, GFS, IFS, etc.) from NOMADS, NODD partners (Amazon, Google, Microsoft), ECMWF open data, and the University of Utah Pando Archive System.

Updated 7 months ago

catalystcoop.pudl • Rank 17.3 • Science 77%

The Public Utility Data Liberation Project provides analysis-ready energy system data to climate advocates, researchers, policymakers, and journalists.

Updated 7 months ago

open-grid-emissions • Rank 7.0 • Science 77%

Tools for producing high-quality hourly generation and emissions data for U.S. electric grids

Updated 7 months ago

cbssuitabilityhaiti • Rank 1.6 • Science 77%

Data for a sanitation zoning assessment prepared for the city of Cap Haitien, Haiti. The package combines two datasets used for an analysis of the suitability of container-based sanitation (CBS)

Updated 7 months ago

sars-cov-2-nowcasting_und_-r-schaetzung • Rank 6.7 • Science 67%

Das Nowcasting erstellt eine Schätzung des Verlaufs der Anzahl von bereits erfolgten SARS-CoV-2-Erkrankungsfällen in Deutschland unter Berücksichtigung des Diagnose-, Melde- und Übermittlungsverzugs.

Updated 7 months ago

manuscript • Rank 6.2 • Science 67%

This repository implements an automated system to write our collaborative manuscript, while tracking changes and contributions.

Updated 7 months ago

sars-cov-2-infektionen_in_deutschland • Rank 5.1 • Science 67%

Der vorliegende Datansatz enthält umfassende Informationen zu SARS-CoV-2-Infektionen in Deutschland, die gemäß dem Infektionsschutzgesetze (IfSG) von den Gesundheitsämtern an das Robert Koch-Institut (RKI) gemeldet wurden. Die Daten umfassen Informationen zur Anzahl der bestätigten Fälle, Todesfälle und Genesungen, aus denen sich weitere Kennzah...

Updated 7 months ago

covid-19-todesfaelle_in_deutschland • Rank 4.1 • Science 67%

Im Datensatz 'COVID-19-Todesfälle in Deutschland' werden die Todesfälle in Bezug auf COVID-19 in Deutschland bereitgestellt. Darüber hinaus wird neben der Anzahl der übermittelten Todesfälle der Fall-Verstorbenen-Anteil berechnet. Angaben zum Tod zählen zu den melde- und übermittlungspflichtigen Inhalten. Bei der Ermittlung von Todesfällen und d...

Artificial Intelligence and Machine Learning (40%)
Updated 7 months ago

ile-de-france • Rank 7.0 • Science 64%

An open synthetic population of Île-de-France for agent-based transport simulation

Updated 7 months ago

covid-19_7-tage-inzidenz_in_deutschland • Rank 3.7 • Science 67%

Im Datensatz '7-Tage-Inzidenz von COVID-19 in Deutschland' werden die aktuellen 7-Tage-Inzidenzen der nach den Vorgaben des Infektionsschutzgesetzes - IfSG - an das RKI übermittelten COVID-19-Fälle veröffentlicht. Datengrundlage zur Berechnung der 7-Tage-Inzidenzen sind die an das RKI übermittelten COVID-19-Fälle. Eine detaillierte Dokumentation...

Updated 7 months ago

sars-cov-2-pcr-testungen_in_deutschland • Rank 2.7 • Science 67%

Im Rahmen der Bewältigung der COVID-19-Pandemie spielt die Diagnostik hinsichtlich SARS-CoV-2/COVID-19 eine entscheidende Rolle. Die Bedeutung liegt nicht nur in der diagnostischen Abklärung, sondern hat eine herausragende Stellung auch für die Beurteilung der epidemiologischen Entwicklung und hinsichtlich Strategien zur Verlangsamung des aktuellen Geschehens in Deutschland. Die Erfassung der durchgeführten PCR-Tests sowie die Ermittlung des Anteils der SARS-CoV-2 positiven PCR-Tests ermöglichen eine Einschätzung zur Wirksamkeit der Maßnahmen und der Umsetzung der Teststrategie. Vor diesem Hintergrund werden im Datensatz an das RKI übermittelte Daten zu PCR-Testungen, PCR-Testergebnissen und Testkapazitäten in Deutschland als offene Daten bereitgestellt.

Updated 7 months ago

corona-datenspende_teildatensatz_vitaldaten • Rank 2.6 • Science 67%

Die Daten von Fitnessarmbändern und SmartwatchesDie Daten von Fitnessarmbändern und Smartwatches, sogenannten Wearables, können Hinweise auf Symptome einer COVID-19 Erkrankung liefern. Mit Hilfe der Corona-Datenspende-App (CDA) konnten Bürger:innen dem Robert Koch-Institut solche Daten für wissenschaftliche Zwecke zur Verfügung stellen.

Updated 7 months ago

helminthR • Rank 10.0 • Science 59%

Accesses parasite occurrence records from the London Natural History Museum's Host-Parasite database, which contains over a quarter of a million helminth records.

Updated 7 months ago

corona-datenspende_teildatensatz_erleben_und_verhalten_in_der_pandemie • Rank 1.8 • Science 67%

Die Daten von Fitnessarmbändern und Smartwatches, sogenannten Wearables, können Hinweise auf Symptome einer Infektion mit COVID-19 liefern. Mit Hilfe der Corona-Datenspende-App (CDA) können Bürger:innen dem Robert Koch-Institut diese Daten zur wissenschaftlichen Auswertung zur Verfügung stellen. Zusammen mit Informationen aus anderen Quellen, z.B.

Updated 7 months ago

cbsodata • Rank 14.5 • Science 54%

Unofficial Statistics Netherlands (CBS) open data API client for Python

Updated 7 months ago

hochfrequente_mental_health_surveillance • Rank 1.4 • Science 67%

Im Rahmen der Mental Health Surveillance (MHS) am Robert Koch-Institut (RKI) werden für eine Auswahl an Indikatoren der psychischen Gesundheit von Erwachsenen basierend auf Surveydaten Zeitreihen bestehend aus gleitenden Drei-Monats-Schätzern und Glättungskurven berechnet. Dadurch sollen Entwicklungen in der psychischen Gesundheit der erwachsene...

Updated 7 months ago

core-geonetwork • Rank 11.9 • Science 54%

GeoNetwork is a catalog application to manage spatially referenced resources. It provides powerful metadata editing and search functions as well as an interactive web map viewer. It is currently used in numerous Spatial Data Infrastructure initiatives across the world.

Updated 7 months ago

https://github.com/catalyst-cooperative/pudl-archiver • Rank 6.5 • Science 59%

A tool for capuring snapshots of public data sources and archiving them on Zenodo for programmatic use.

Updated 7 months ago

meteostat • Rank 20.1 • Science 44%

Access and analyze historical weather and climate data with Python.

Updated 7 months ago

basedosdados • Rank 19.5 • Science 44%

⚙️ Código de manutenção do datalake (metadados e pacotes de acesso) | 📖 Docs: https://basedosdados.org/docs/home

Updated 7 months ago

waterpumpkwale • Rank 0.7 • Science 59%

Weekly volume of water pumped for handpumps monitored with Smart Handpump technology, Kwale County, Kenya

Updated 7 months ago

open-data-on-github • Rank 4.5 • Science 54%

Dataset files for the Open Data on GitHub paper

Updated 7 months ago

fowd • Rank 3.4 • Science 54%

Processing framework for FOWD, a free ocean wave dataset, ready for your ML application :ocean:

Updated 7 months ago

goes2go • Rank 15.6 • Science 36%

Download and process GOES-16 and GOES-17 data from NOAA's archive on AWS using Python.

Updated 7 months ago

innovationgraph • Rank 7.3 • Science 44%

GitHub Innovation Graph

Updated 7 months ago

csp-guru • Rank 4.9 • Science 46%

A database of concentrating solar power plants of the world for energy modellers and analysts.

Updated 7 months ago

government-open-source-policies • Rank 6.0 • Science 44%

Dataset of Government Open Source Policies

Updated 7 months ago

transparency • Rank 4.2 • Science 44%

Structured data files for topics covered by GitHub's Transparency Report

Updated 7 months ago

gbfs • Rank 11.7 • Science 36%

Documentation for the General Bikeshare Feed Specification, a standardized data feed for shared mobility system availability. Maintained by MobilityData

Updated 7 months ago

wb-reproducible-research-repository • Rank 3.7 • Science 44%

This repository supports the World Bank's Reproducible Research Repository

Updated 7 months ago

RSocrata • Rank 18.4 • Science 26%

Provides easier interaction with Socrata open data portals http://dev.socrata.com. Users can provide a 'Socrata' data set resource URL, or a 'Socrata' Open Data API (SoDA) web query, or a 'Socrata' "human-friendly" URL, returns an R data frame. Converts dates to 'POSIX' format. Manages throttling by 'Socrata'.

Updated 7 months ago

upgini • Rank 17.5 • Science 26%

Data search & enrichment library for Machine Learning → Easily find and add relevant features to your ML & AI pipeline from hundreds of public and premium external data sources, including open & commercial LLMs

Updated 7 months ago

censusapi • Rank 17.3 • Science 26%

R package to retrieve U.S. Census data and metadata via API

Updated 7 months ago

os_strategy_nhmw • Rank 1.8 • Science 41%

Open Science in Museums - Strategy of the "Naturhistorisches Museum Wien"

Updated 7 months ago

covid19-italy-integrated-surveillance-data • Rank 5.0 • Science 36%

COVID-19 integrated surveillance data provided by the Italian Institute of Health and processed via UnrollingAverages.jl to deconvolve the weekly moving averages.

Updated 7 months ago

brightsky • Rank 14.6 • Science 26%

JSON API for DWD's open weather data.

Updated 7 months ago

osmextract • Rank 14.3 • Science 26%

Download and import OpenStreetMap data from Geofabrik and other providers

Scientific Software
Updated 7 months ago

NPSdataverse — Peer-reviewed • Rank 4.0 • Science 36%

NPSdataverse: a suite of R packages for data processing, authoring Ecological Metadata Language metadata, checking data-metadata congruence, and accessing data - Published in JOSS (2025)

Updated 7 months ago

eia • Rank 11.9 • Science 26%

An R package wrapping the US Energy Information Administration open data API.

Updated 7 months ago

transitland-atlas • Rank 10.1 • Science 26%

an open directory of mobility feeds and operators — powers both Transitland v1 and v2

Updated 7 months ago

awesome-sentinel • Rank 9.5 • Science 26%

curated list of awesome tools, tutorials and APIs for Copernicus Sentinel satellite data

Updated 7 months ago

earth-osm • Rank 11.5 • Science 23%

Export infrastructure data from OpenStreetMap using Python

Updated 7 months ago

giessdenkiez-de • Rank 7.8 • Science 26%

The consequences of climate change, especially the dry and hot summers, are putting a strain on Berlin's ecosystem. Our urban trees are drying out and suffering long-term damage. Gieß den Kiez is made to enable coordinated citizen participation in the irrigation of urban trees.

Updated 7 months ago

openpdi • Rank 1.1 • Science 28%

A Python 3 library for decentralized aggregation of data from the Police Data Initiative (PDI).

Updated 7 months ago

NitrogenUptake2016 • Rank 6.0 • Science 23%

R package containing data and source code from Hill et al. 2018a (DOI: https://doi.org/10.1016/j.jembe.2018.07.006) and Hill et al. 2018b (DOI: https://doi.org/10.1016/j.dib.2018.09.133)

Updated 7 months ago

read.abares • Rank 2.1 • Science 26%

Harvest data from Australian Bureau of Agricultural and Resource Economics and Sciences (ABARES) part of the Australian Department of Agriculture, Fisheries and Forestry for your work in R

Updated 7 months ago

kiwisR • Rank 14.8 • Science 13%

Provides a simplified method for bringing tidy data into R from KISTERS WISKI databases via KiWIS API.

Updated 7 months ago

osdg-data • Rank 4.7 • Science 23%

The OSDG Community Dataset (OSDG-CD) is a public dataset of thousands of text excerpts, validated by OSDG Community Platform (OSDG-CP) citizen scientists with respect to the Sustainable Development Goals (SDGs). The dataset is updated every quarter and published on Zenodo.

Updated 7 months ago

https://github.com/crsh/psych-transparency-guide • Rank 3.4 • Science 23%

Supplementary material for "A practical guide for transparency in psychological science" (find the paper at https://psyarxiv.com/rtygm/)

Updated 7 months ago

statnipokladna • Rank 10.1 • Science 13%

R package to use data from the Czech public finance database

Updated 7 months ago

https://github.com/inseefrlab/pynsee • Rank 6.7 • Science 13%

pynsee package contains tools to easily search and download French data from INSEE and IGN APIs

Updated 7 months ago

https://github.com/cdcgov/opencdc • Rank 5.8 • Science 13%

This is the repository for the openCDC web site. Entire site is generated from data files describing CDC Open Technology types for data, api, code, and events. All CDC programs are welcome to submit pull requests with updates and new items useful to the public health open source community.

Updated 7 months ago

https://github.com/catalyst-cooperative/pudl-scrapers • Rank 3.4 • Science 10%

Scrapers used to acquire snapshots of raw data inputs for versioned archiving and replicable analysis.

Updated 7 months ago

https://github.com/bjmorgan/data_f-tio2_intercalation_anions • Science 23%

Data analysis for DFT calculations of intercalation into (F/OH)-TiO2

Updated 7 months ago

abwassersurveillance_amelag_-_wochenbericht • Science 67%

Im Rahmen des Vorhabens „Abwassermonitoring für die epidemiologische Lagebewertung“ (AMELAG) wird in Deutschland das Abwasser von ausgewählten Kläranlagen auf verschiedene Krankheitserreger untersucht. Der folgende Bericht präsentiert die vergangenen und aktuellen Ergebnisse und Entwicklungen dieser Untersuchungen.

Updated 7 months ago

sars-cov-2-sequenzdaten_aus_deutschland • Science 67%

Ein zentraler Bestandteil einer erfolgreichen Erregersurveillance ist das Verständnis der Verbreitung eines Erregers sowie seiner pathogenen Eigenschaften. Hierbei stellt das Wissen über das Erregergenom eine wichtige Informationsquelle dar. So erlaubt der Nachweis von Mutationen im Genom eines Erregers, Verwandtschaftsbeziehungen zu rekonstruie...

Updated 7 months ago

gesundheitsberichterstattung_-_daten_zu_nichtuebertragbaren_erkrankungen • Science 67%

Die Gesundheitsberichterstattung (GBE) des RKI informiert regelmäßig über die gesundheitliche Situation der Bevölkerung in Deutschland. Das Themenspektrum ist vielfältig und reicht von Gesundheitszustand und Einflussfaktoren auf die Gesundheit über Gesundheitsförderung, Prävention und gesundheitliche Versorgung bis hin zu den damit verbundenen ...

Updated 7 months ago

covid-19-hospitalisierungen_in_deutschland • Science 67%

Im Datensatz 'COVID-19-Hospitalisierungen' werden die aktuellen Zahlen der nach den Vorgaben des Infektionsschutzgesetzes - IfSG - erfassten hospitalisierten COVID-19-Fälle bereitgestellt. Um den Trend der Anzahl von Hospitalisierungen und der 7-Tage-Hospitalisierungsinzidenz besser bewerten zu können, wird die berichtete Hospitalisierungsinzide...

Updated 7 months ago

abwassersurveillance_amelag • Science 67%

Das Vorhaben „Abwassermonitoring für die epidemiologische Lagebewertung“ (AMELAG) läuft vom 22.11.2022 bis zum 31.12.2025. Behörden, Kläranlagen und Labore arbeiten zusammen, um Proben zu nehmen, zu analysieren und zu bewerten. Das Ziel dieses Vorhabens ist es, SARS-CoV-2-Nachweise aus dem Abwasser als zusätzlichen Indikator zur epidemiologische...

Updated 7 months ago

https://github.com/bamweldx/iiw2021_aa_cxii • Science 13%

Repository providing code and datasets used for the online 2021 IIW Annual Assembly C-XII meeting 15.-17.07.2021 .

Updated 7 months ago

bundesweiter_klinischer_krebsregisterdatensatz-datenschema_und_klassifikationen • Science 67%

Das Repository stellt Informationen zu Struktur und Klassifikationen des bundesweiten klinischen Krebsregisterdatensatzes bereit. Die verwendeten Klassifikationen bilden den derzeitigen Arbeitsstand des ZfKD ab. Ziel ist es, diesen Stand transparent bereit zu stellen und beteiligte Akteure zur gemeinsamen Harmonisierung von Standards einzuladen.

Updated 7 months ago

ylac-2024-session • Science 44%

A slide deck on "Translating Research into Action" presented during the YLAC's Yound Researchers for Social Impact Program 2024

Updated 7 months ago

appendix_potential_covid-19_test_fraud_detection • Science 67%

The methods and results of the publication "Potential COVID-19 test fraud detection: Findings from a pilot study comparing conventional and statistical approaches" are described in more detail in this appendix. The R-syntax for the calculation is provided, as well as a pseudo data set with which the syntax can also be tested.

Updated 7 months ago

https://github.com/capjamesg/rainfall.scot • Science 26%

See reports of amount of rainfall measured at a station by month.

Updated 7 months ago

sidb • Science 59%

Soil Incubation Database sidb

Updated 7 months ago

https://github.com/afsc-gap-products/metadata • Science 13%

This repository provides guidance for all of our data's metadata needs.

Updated 7 months ago

grippeweb_daten_des_wochenberichts • Science 67%

GrippeWeb ist ein Online-Portal des Robert Koch-Instituts (RKI). Es wurde im Jahr 2011 gegründet und ist das erste Webportal, das die Aktivität akuter Atemwegserkrankungen (ARE) in Deutschland beobachtet, und dabei Informationen direkt aus der Bevölkerung verwendet. Es ist ein robustes und zeitnahes System der partizipativen syndromischen Survei...

Updated 7 months ago

gap_products • Science 39%

This repository supports code used to create tables in the GAP_PRODUCTS Oracle schema. These tables include the master production tables, tables shared with AKFIN, and tables publicly shared on FOSS.

Updated 7 months ago

assam-tenders-data • Science 26%

Data mining repo for Open Contracting - Assam

Updated 7 months ago

wastewater-catchment-areas • Science 57%

8,185 wastewater catchment areas in Great Britain covering more than 99% of the population.

Updated 7 months ago

burden_2020_-_krankheitslast_in_deutschland_und_seinen_regionen • Science 67%

Kennzahlen der Krankheitslast (engl. Burden of Disease) rücken für eine Vielzahl von Anwendungsmöglichkeiten, unter anderem im Öffentlichen Gesundheitsdienst des Bundes und der Länder, in Forschung, Entwicklung und anderen Bereichen des Gesundheitswesens, zunehmend in den Vordergrund. Sie erfassen den Gesundheitszustand einer Bevölkerung mit Hilfe