opendata_sandbox
This repository contains the code for the manuscript Ensemble-labeling of infectious diseases time series to evaluate early warning systems with which you can reproduce the manuscript's results and figures.
Science Score: 67.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
✓CITATION.cff file
Found CITATION.cff file -
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
✓DOI references
Found 4 DOI reference(s) in README -
✓Academic publication links
Links to: zenodo.org -
○Academic email domains
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (3.6%) to scientific vocabulary
Keywords
Repository
This repository contains the code for the manuscript Ensemble-labeling of infectious diseases time series to evaluate early warning systems with which you can reproduce the manuscript's results and figures.
Basic Info
Statistics
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 9
- Releases: 88
Topics
Metadata Files
Readme.md
Dokumentation
Ergebnisse der Diabetes-Surveillance 2015 - 2024
Beitragende
Team der Nationalen Diabetes-Surveillance¹𝄒²
¹ Robert Koch-Institut | Fachgebiet 24
² Robert Koch-Institut | Fachgebiet 25
Zitieren
Robert Koch-Institut. (2025). Ergebnisse der Diabetes-Surveillance 2015 - 2024 [Data set]. Zenodo. https://doi.org/10.5281/zenodo.14935276
Zusammenfassung
Im Datensatz "Ergebnisse der Diabetes-Surveillance 2015 - 2024" des Robert Koch-Instituts werden Informationen zu Diabetes mellitus in Deutschland bereitgestellt. Im Rahmen des zugrundeliegenden Projekts "Diabetes-Surveillance" wurde ein indikatorbasiertes Surveillance-System für die zeitnahe und regelmäßige Berichterstattung zu Krankheitsdynamik, Versorgungsqualität, Determinanten und Folgeerkrankungen von Diabetes mellitus in Deutschland etabliert. Der Datensatz umfasst aggregierte Auswertungen zu 40 Indikatoren und Indikatorgruppen, strukturiert nach vier gesundheitsrelevanten Handlungsfeldern: Diabetesrisiko reduzieren, Diabetesfrüherkennung und -behandlung verbessern, Diabeteskomplikationen reduzieren sowie Krankheitslast und -kosten senken. Die Indikatoren basieren auf Primär- und Sekundärdaten (u.a. Gesundheitsbefragungen, amtliche Statistik, Krankenkassendaten) und wurden standardisiert nach Geschlecht, Alter, Region und Bildung aufbereitet. Zudem wird zwischen Kindern und Jugendlichen sowie Erwachsenen unterschieden. Der Ergebnisstand der Diabetes-Surveillance zum Projektende 2024 ist auf dem Publikationsserver des RKI veröffentlicht (https://edoc.rki.de/handle/176904/12467).
Inhaltsverzeichnis <!-- TOCSTART: {"headingdepth": 2} --> - Informationen zum Datensatz und Entstehungskontext - Administrative und organisatorische Angaben - Entstehungskontext - Daten und Datenaufbereitung - Indikatoren - Aufbau und Inhalt des Datensatzes - Hinweise zur Nachnutzung der Daten <!-- TOC_END -->
Inhaltsverzeichnis
Beispieltext
Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.
Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a,
Variablen und Werte
Die Datei Sandbox_Data.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschemaSandboxData.json hinterlegt:
| Variable | Typ | Ausprägungen | Beschreibung |
|:----------------------|:-------|:--------------------|:----------------------------------------------------------------------------------------|
| LINEAGE | string | Beispiel: BA.2 | Zugewiesene Pangolin Lineage |
| WHOLABEL | string | Beispiel: Omikron | Name der Virusvariante, der von der World Health Organisation vergeben wurde |
| CONTRIBUTINGLINEAGES | string | Beispiel: JN.13.1 | Pangolin Lineages, die von der Lineage abstammen |
| COLOR | any | | Veraltete Variable. Ist nicht mehr relevant und wird persepektivisch entfernt. |
| variant_category | string | Werte: VOC, VOI | WHO Einstufung der Variante als VOC (variant of concern) oder VOI (variant of interest) |
Die Datei SandboxDatalfs.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschemaSandboxData_lfs.json hinterlegt:
| Variable | Typ | Ausprägungen | Beschreibung |
|:--------------------------------------|:--------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| igsid | string | Beispiel: IGS-10099-CVDP-01A2C74B-54A8-47B1-B7E4-6562C6231234 | Ein eindeutiger Identifikator der Sequenzdaten und Metadaten zusammenführt. Dieser Identifikator wird als Teil der FASTA ID in den Sequenzdaten genutzt. |
| dateofsampling | date | Format: YYYY-MM-DDTHH:MM:SS | Datum der Probeentnahme im ISO 8601 Format ohne Zeitzone |
| sequencingplatform | string | Beispiel: ILLUMINA | Die verwendete Sequenzierungs-Plattform auf Basis der von ENA zugelassenen Ontologie (siehe ena). |
| sequencingreason | string | Werte: random, requested, clinical, other | Grund für die Durchführung der Sequenzierung random: Die Probe wurde randomisiert genommen. requested: Die Probe wurde aufgrund von Bedenken/Verdacht auf eine neue Variante oder Vergleichbares genommen. clinical: Die Probe kommt aus einem klinischem Umfeld. other: Der Grund it keiner der oben genannten. |
| isolationsource | string | Beispiel: Nasopharyngeal swab (specimen) | DEMIS Vokabular |
| labsequenceid | string | Beispiel: 873a7cc28d29e3f17b0544ea6e9e8436defe32f6d60649159ee8ac78d4147ac9 | Vom Labor genutzte FASTA ID in verschlüsselter Form |
| dateofsubmission | date | Format: YYYY-MM-DDTHH:MM:SS | Datum des Eingangs des Genoms am RKI im ISO 8601 Format ohne Zeitzone |
| version | integer | Werte: ≥0 | Version der Sequenz startend mit 0 |
| primediagnosticlab.demislab
id | string | Beispiel: DEMIS-10099 | Identifikationsnummer des primärdiagnostischen Labors |
| primediagnosticlab.postal
code | string | Beispiel: 50858 | Postleitzahl des primärdiagnostischen Labors |
| sequencinglab.demislabid | string | Beispiel: DEMIS-10099 | Identifikationsnummer des sequenzierenden Labors |
| sequencinglab.postalcode | string | Beispiel: 50858 | Postleitzahl des sequenzierenden Labors |
| lineages | string | Beispiele: [{'method': 'PANGOLIN_LATEST', 'classification_version': 'PUSHER-v1.28.1', 'tool_version': '4.3', 'lineage': 'BA.2', '@qc_notes': 'Ambiguous_content:0.02', '@is_designated': False, '@qc_status': 'pass', '@conflict': 0.0, '@note': 'Usher placements: BA.2(1/1)'}] | Pangolin Zuordnung im JSON-Format |
Metadaten
Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben dem Publikationsdatum ("publication_date") auch der Datenstand in folgendem Format enthalten (Beispiel):
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Hinweise zur Nachnutzung der Daten
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Lizenz
Der Datensatz "Open Data Sandbox" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.
<!-- FOOTER_END -->
Appendix
Dies ist ein Beispiel-Appendix 📂. <!-- CUSTOMMARKDOWNEND -->
Owner
- Name: RKI | Open Data
- Login: RKIOpenData
- Kind: user
- Location: Berlin
- Company: @robert-koch-institut
- Website: https://github.com/robert-koch-institut
- Repositories: 2
- Profile: https://github.com/RKIOpenData
Funktionsaccount das Open Data Teams des RKI
Citation (citation.cff)
cff-version: 1.2.0
type: dataset
title: Open Data Sandbox
abstract: >-
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem
Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
Lorem Ipsum Lorem Ipsum Lorem Ipsum.
date-released: '2025-09-03'
keywords:
- Deutschland
- Germany
- RKI
- Open Data
- Offen Daten
- Gesundheitsberichterstattung
- Epidemiologie
- Public health surveillance
- Epidemiology
- Gesundheitsförderung
message: Cite me!
url: https://www.github.io/RKIOpenData/OpenData_Sandbox
license: CC-BY-4.0
doi: 10.5072/zenodo.324600
version: v0.0.19
authors:
- name: Robert Koch-Institut
email: info@rki.de
- name: Team der Nationalen Diabetes-Surveillance
- family-names: Kocher
given-names: Theresa
affiliation: >-
Robert Koch-Institut | Fachgebiet MF 2, Robert Koch Institute | Fachgebiet
MF 2
orcid: 0000-0001-8958-4150
GitHub Events
Total
- Create event: 32
- Issues event: 30
- Release event: 29
- Delete event: 15
- Issue comment event: 9
- Push event: 97
Last Year
- Create event: 32
- Issues event: 30
- Release event: 29
- Delete event: 15
- Issue comment event: 9
- Push event: 97
Issues and Pull Requests
Last synced: 6 months ago
All Time
- Total issues: 19
- Total pull requests: 0
- Average time to close issues: 8 minutes
- Average time to close pull requests: N/A
- Total issue authors: 2
- Total pull request authors: 0
- Average comments per issue: 0.37
- Average comments per pull request: 0
- Merged pull requests: 0
- Bot issues: 0
- Bot pull requests: 0
Past Year
- Issues: 19
- Pull requests: 0
- Average time to close issues: 8 minutes
- Average time to close pull requests: N/A
- Issue authors: 2
- Pull request authors: 0
- Average comments per issue: 0.37
- Average comments per pull request: 0
- Merged pull requests: 0
- Bot issues: 0
- Bot pull requests: 0
Top Authors
Issue Authors
- RKIOpenData (17)
- SimonScholler (2)
Pull Request Authors
Top Labels
Issue Labels
Pull Request Labels
Dependencies
- robert-koch-institut/OpenData-Website main composite
- actions/checkout v3 composite
- actions/create-release v1 composite
- actions/checkout v3 composite
- dmnemec/copy_file_to_another_repo_action main composite
- actions/checkout v3 composite