opendata_sandbox

This repository contains the code for the manuscript Ensemble-labeling of infectious diseases time series to evaluate early warning systems with which you can reproduce the manuscript's results and figures.

https://github.com/rkiopendata/opendata_sandbox

Science Score: 67.0%

This score indicates how likely this project is to be science-related based on various indicators:

✓
CITATION.cff file
Found CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
✓
.zenodo.json file
Found .zenodo.json file
✓
DOI references
Found 4 DOI reference(s) in README
✓
Academic publication links
Links to: zenodo.org
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (3.6%) to scientific vocabulary

Keywords

7-tage-inzidenz covid-19 germany incidence infections infektion inzidenz open-data open-source python r rki sars-cov-2

Last synced: 10 months ago · JSON representation ·

Repository

Basic Info

Host: GitHub
Owner: RKIOpenData
License: cc-by-4.0
Language: HTML
Default Branch: main
Homepage:
Size: 21.4 MB

Statistics

Stars: 0
Watchers: 1
Forks: 0
Open Issues: 9
Releases: 88

Topics

7-tage-inzidenz covid-19 germany incidence infections infektion inzidenz open-data open-source python r rki sars-cov-2

Created almost 3 years ago · Last pushed 10 months ago

Metadata Files

Readme License Citation

Readme.md

Dokumentation

Ergebnisse der Diabetes-Surveillance 2015 - 2024

Robert Koch-Institut

Beitragende
Team der Nationalen Diabetes-Surveillance¹𝄒²

¹ Robert Koch-Institut | Fachgebiet 24
² Robert Koch-Institut | Fachgebiet 25

Zitieren
Robert Koch-Institut. (2025). Ergebnisse der Diabetes-Surveillance 2015 - 2024 [Data set]. Zenodo. https://doi.org/10.5281/zenodo.14935276

Zusammenfassung
Im Datensatz "Ergebnisse der Diabetes-Surveillance 2015 - 2024" des Robert Koch-Instituts werden Informationen zu Diabetes mellitus in Deutschland bereitgestellt. Im Rahmen des zugrundeliegenden Projekts "Diabetes-Surveillance" wurde ein indikatorbasiertes Surveillance-System für die zeitnahe und regelmäßige Berichterstattung zu Krankheitsdynamik, Versorgungsqualität, Determinanten und Folgeerkrankungen von Diabetes mellitus in Deutschland etabliert. Der Datensatz umfasst aggregierte Auswertungen zu 40 Indikatoren und Indikatorgruppen, strukturiert nach vier gesundheitsrelevanten Handlungsfeldern: Diabetesrisiko reduzieren, Diabetesfrüherkennung und -behandlung verbessern, Diabeteskomplikationen reduzieren sowie Krankheitslast und -kosten senken. Die Indikatoren basieren auf Primär- und Sekundärdaten (u.a. Gesundheitsbefragungen, amtliche Statistik, Krankenkassendaten) und wurden standardisiert nach Geschlecht, Alter, Region und Bildung aufbereitet. Zudem wird zwischen Kindern und Jugendlichen sowie Erwachsenen unterschieden. Der Ergebnisstand der Diabetes-Surveillance zum Projektende 2024 ist auf dem Publikationsserver des RKI veröffentlicht (https://edoc.rki.de/handle/176904/12467).

Inhaltsverzeichnis  - Informationen zum Datensatz und Entstehungskontext - Administrative und organisatorische Angaben - Entstehungskontext - Daten und Datenaufbereitung - Indikatoren - Aufbau und Inhalt des Datensatzes - Hinweise zur Nachnutzung der Daten

Inhaltsverzeichnis

Beispieltext

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.

Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a,

Variablen und Werte

Die Datei Sandbox_Data.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschemaSandboxData.json hinterlegt:

tableschemaSandboxData.json

| Variable | Typ | Ausprägungen | Beschreibung | |:----------------------|:-------|:--------------------|:----------------------------------------------------------------------------------------| | LINEAGE | string | Beispiel: BA.2 | Zugewiesene Pangolin Lineage | | WHOLABEL | string | Beispiel: Omikron | Name der Virusvariante, der von der World Health Organisation vergeben wurde | | CONTRIBUTINGLINEAGES | string | Beispiel: JN.13.1 | Pangolin Lineages, die von der Lineage abstammen | | COLOR | any | | Veraltete Variable. Ist nicht mehr relevant und wird persepektivisch entfernt. | | variant_category | string | Werte: VOC, VOI | WHO Einstufung der Variante als VOC (variant of concern) oder VOI (variant of interest) |

Die Datei SandboxDatalfs.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschemaSandboxData_lfs.json hinterlegt:

tableschemaSandboxData_lfs.json

| Variable | Typ | Ausprägungen | Beschreibung | |:--------------------------------------|:--------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | igsid | string | Beispiel: IGS-10099-CVDP-01A2C74B-54A8-4
7B1-B7E4-6562C6231234 | Ein eindeutiger Identifikator der Sequenzdaten und Metadaten zusammenführt. Dieser Identifikator wird als Teil der FASTA ID in den Sequenzdaten genutzt. | | dateofsampling | date | Format: YYYY-MM-DDTHH:MM:SS | Datum der Probeentnahme im ISO 8601 Format ohne Zeitzone | | sequencingplatform | string | Beispiel: ILLUMINA | Die verwendete Sequenzierungs-Plattform auf Basis der von ENA zugelassenen Ontologie (siehe ena). | | sequencingreason | string | Werte: random, requested, clinical, other | Grund für die Durchführung der Sequenzierung random: Die Probe wurde randomisiert genommen. requested: Die Probe wurde aufgrund von Bedenken/Verdacht auf eine neue Variante oder Vergleichbares genommen. clinical: Die Probe kommt aus einem klinischem Umfeld. other: Der Grund it keiner der oben genannten. | | isolationsource | string | Beispiel: Nasopharyngeal swab (specimen) | DEMIS Vokabular | | labsequenceid | string | Beispiel: 873a7cc28d29e3f17b0544ea6e9e84
36defe32f6d60649159ee8ac78d414
7ac9 | Vom Labor genutzte FASTA ID in verschlüsselter Form | | dateofsubmission | date | Format: YYYY-MM-DDTHH:MM:SS | Datum des Eingangs des Genoms am RKI im ISO 8601 Format ohne Zeitzone | | version | integer | Werte: ≥0 | Version der Sequenz startend mit 0 | | primediagnosticlab.demislab
id | string | Beispiel: DEMIS-10099 | Identifikationsnummer des primärdiagnostischen Labors | | primediagnosticlab.postal
code | string | Beispiel: 50858 | Postleitzahl des primärdiagnostischen Labors | | sequencinglab.demislabid | string | Beispiel: DEMIS-10099 | Identifikationsnummer des sequenzierenden Labors | | sequencinglab.postalcode | string | Beispiel: 50858 | Postleitzahl des sequenzierenden Labors | | lineages | string | Beispiele: [{'method': 'PANGOLIN_LATEST', 'classification_version': 'PUSHER-v1.28.1', 'tool_version': '4.3', 'lineage': 'BA.2', '@qc_notes': 'Ambiguous_content:0.02', '@is_designated': False, '@qc_status': 'pass', '@conflict': 0.0, '@note': 'Usher placements: BA.2(1/1)'}] | Pangolin Zuordnung im JSON-Format |

Metadaten

Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:

Metadaten/

Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.

Metadaten/zenodo.json

In der zenodo.json ist neben dem Publikationsdatum ("publication_date") auch der Datenstand in folgendem Format enthalten (Beispiel):

"dates": [ { "start": "2023-09-11T15:00:21+02:00", "end": "2023-09-11T15:00:21+02:00", "type": "Collected", "description": "Date when the Dataset was created" } ],

Hinweise zur Nachnutzung der Daten

Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:

https://zenodo.org/communities/robertkochinstitut
https://github.com/robert-koch-institut
https://gitlab.opencode.de/robert-koch-institut
https://edoc.rki.de/

Lizenz

Der Datensatz "Open Data Sandbox" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.

Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.

Appendix

Dies ist ein Beispiel-Appendix 📂.

Owner

Name: RKI | Open Data
Login: RKIOpenData
Kind: user
Location: Berlin
Company: @robert-koch-institut

Website: https://github.com/robert-koch-institut
Repositories: 2
Profile: https://github.com/RKIOpenData

Funktionsaccount das Open Data Teams des RKI

Citation (citation.cff)

cff-version: 1.2.0
type: dataset
title: Open Data Sandbox
abstract: >-
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
  Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
  Lorem Ipsum Lorem Ipsum Lorem Ipsum.
date-released: '2025-09-03'
keywords:
  - Deutschland
  - Germany
  - RKI
  - Open Data
  - Offen Daten
  - Gesundheitsberichterstattung
  - Epidemiologie
  - Public health surveillance
  - Epidemiology
  - Gesundheitsförderung
message: Cite me!
url: https://www.github.io/RKIOpenData/OpenData_Sandbox
license: CC-BY-4.0
doi: 10.5072/zenodo.324600
version: v0.0.19
authors:
  - name: Robert Koch-Institut
    email: info@rki.de
  - name: Team der Nationalen Diabetes-Surveillance
  - family-names: Kocher
    given-names: Theresa
    affiliation: >-
      Robert Koch-Institut | Fachgebiet MF 2, Robert Koch Institute | Fachgebiet
      MF 2
    orcid: 0000-0001-8958-4150

GitHub Events

Total

Create event: 32
Issues event: 30
Release event: 29
Delete event: 15
Issue comment event: 9
Push event: 97

Last Year

Create event: 32
Issues event: 30
Release event: 29
Delete event: 15
Issue comment event: 9
Push event: 97

Issues and Pull Requests

Last synced: 10 months ago

All Time

Total issues: 19
Total pull requests: 0
Average time to close issues: 8 minutes
Average time to close pull requests: N/A
Total issue authors: 2
Total pull request authors: 0
Average comments per issue: 0.37
Average comments per pull request: 0
Merged pull requests: 0
Bot issues: 0
Bot pull requests: 0

Past Year

Issues: 19
Pull requests: 0
Average time to close issues: 8 minutes
Average time to close pull requests: N/A
Issue authors: 2
Pull request authors: 0
Average comments per issue: 0.37
Average comments per pull request: 0
Merged pull requests: 0
Bot issues: 0
Bot pull requests: 0

View more stats

Top Authors

Issue Authors

RKIOpenData (17)
SimonScholler (2)

Pull Request Authors

Top Labels

Issue Labels

Pull Request Labels

Dependencies

.github/workflows/Build_and_deploy_website.yml actions

robert-koch-institut/OpenData-Website main composite

.github/workflows/Create_release_on_tag_push.yml actions

actions/checkout v3 composite
actions/create-release v1 composite

.github/workflows/Send_metadata_to_Govdata.yml actions

actions/checkout v3 composite
dmnemec/copy_file_to_another_repo_action main composite

.github/workflows/Sync_OpenData_repo_to_OpenCoDE.yml actions

actions/checkout v3 composite

.github/workflows/Publish_Dataset.yml actions

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Open Source Science