sars-cov-2-nowcasting_und_-r-schaetzung
Das Nowcasting erstellt eine Schätzung des Verlaufs der Anzahl von bereits erfolgten SARS-CoV-2-Erkrankungsfällen in Deutschland unter Berücksichtigung des Diagnose-, Melde- und Übermittlungsverzugs.
https://github.com/robert-koch-institut/sars-cov-2-nowcasting_und_-r-schaetzung
Science Score: 67.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
✓CITATION.cff file
Found CITATION.cff file -
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
✓DOI references
Found 13 DOI reference(s) in README -
✓Academic publication links
Links to: zenodo.org -
○Committers with academic emails
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (1.5%) to scientific vocabulary
Keywords
Keywords from Contributors
Repository
Das Nowcasting erstellt eine Schätzung des Verlaufs der Anzahl von bereits erfolgten SARS-CoV-2-Erkrankungsfällen in Deutschland unter Berücksichtigung des Diagnose-, Melde- und Übermittlungsverzugs.
Basic Info
- Host: GitHub
- Owner: robert-koch-institut
- License: cc-by-4.0
- Default Branch: main
- Homepage: https://doi.org/10.5281/zenodo.4680400
- Size: 8.16 MB
Statistics
- Stars: 74
- Watchers: 6
- Forks: 27
- Open Issues: 0
- Releases: 766
Topics
Metadata Files
Readme.md
[!IMPORTANT] Einstellung des Nowcastings zum 21.06.2023
Seit dem
21.06.2023ist die tägliche Berechnung des Nowcasting und des R-Werts durch das RKI eingestellt. Es erfolgt keine weitere Aktualisierung der Daten.Im ARE-Wochenbericht des RKI wird weiterhin über die Zirkulation von SARS-CoV-2 im Rahmen der virologischen Surveillance sowie über die Krankheitslast von akuten > Atemwegserkrankungen in der Bevölkerung, im ambulanten sowie im stationären Bereich im Rahmen der syndromischen Surveillance berichtet werden. (Siehe: ARE-Wochenbericht, Pandemieradar, frühere COVID-19-Wochenberichte)
Dokumentation
SARS-CoV-2-Nowcasting und -R-Schaetzung
Beitragende
Justus Benzler², & Hannes Wünsche³
¹ Robert Koch-Institut | Fachgebiet 34
² Robert Koch-Institut | Fachgebiet 32
³ Robert Koch-Institut | Fachgebiet MF 4
Zitieren
an der Heiden, M. (2023). SARS-CoV-2-Nowcasting und -R-Schaetzung [Data set]. Zenodo. https://doi.org/10.5281/zenodo.8062328
Zusammenfassung
Im Datensatz "SARS-CoV-2-Nowcasting und -R-Schätzung" des Robert Koch-Instituts wurden von März 2020 bis Juni 2023 täglich aktualisierte epidemiologische Schätzwerte zur COVID-19-Pandemie in Deutschland bereitgestellt. Ziel war es, auf Basis gemeldeter SARS-CoV-2-Infektionen eine zeitnahe Einschätzung des Infektionsgeschehens sowie der effektiven Reproduktionszahl (R-Wert) zu ermöglichen. Der Datensatz umfasst Schätzwerte zur Anzahl an Neuerkrankungen und zum R-Wert.
Inhaltsverzeichnis <!-- TOCSTART: {"headingdepth": 2} --> - Informationen zur Studie und zum Forschungskontext - Aufbereitung und Auswertung der Daten - Hinweise zur Nachnutzung der Daten <!-- TOC_END -->
Informationen zur Studie und zum Forschungskontext
Administrative und organisatorische Angaben
Der Datensatz "SARS-CoV-2-Nowcasting und -R-Schätzung" wird vom Robert Koch-Institut im Zusammenhang mit der SARS-CoV-2-Pandemie bereitgestellt. Autor des Datensatzes ist Matthias an der Heiden, wissenschaftlicher Mitarbeiter des Fachgebiet 34 | HIV/AIDS und andere sexuell oder durch Blut übertragbare Infektionen des RKI. Inhaltliche Fragen bezüglich des Nowcastings und der R-Schätzungen können an an das RKI unter info@rki.de gestellt werden. Das Nowcasting und die R-Schätzung erfolgt seit März 2020 und wird täglich aktualisiert.
Die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgt durch Justus Benzler, Fachgebiet 32 | FG 32 | Surveillance und elektronisches Melde- und Informationssystem (DEMIS) | ÖGD Kontaktstelle und Hannes Wünsche, Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement des RKI. Fragen zum Datenmanagement und zur Publikationsinfrastruktur können an das Open Data Team des Fachgebiets MF4 unter OpenData@rki.de gerichtet werden.
Inhalt und Aufbau des Datensatzes
Der Datensatz enthält die epidemiologischen Schätzungen über den Verlauf der SARS-CoV-2-Infektionen in Deutschland und der daraus resultierenden Reproduktionszahl. Weiterhin enthält er grundlegende Metadaten sowie die Datensatzdokumentation und die in ihr zitierten wissenschaftlichen Publikationen. Im Datensatz enthalten sind:
- Tabelle mit täglichen Fallzahlenschätzungen und R-Wert-Angaben
- Archiv mit der Sammlung bisheriger Fallzahlenschätzungen und R-Wert-Angaben
- Lizenz-Datei mit der Nutzungslizenz des Datensatzes in Deutsch und Englisch
- Datensatzdokumentation und auf den Datensatz bezogene Publikationen in deutscher Sprache
- Metadaten-Datei zum Import in Zenodo
Aufbereitung und Auswertung der Daten
Es besteht ein großes Interesse daran, das aktuelle Infektionsgeschehen und die zeitliche Entwicklung der Zahlen von SARS-CoV-2-Infektionen und Covid-19-Erkrankungsfällen in Deutschland zeitnah darzustellen und zu verstehen. Aufgrund unvermeidbarer Verzüge kann niemand die tatsächliche Anzahl der heute oder in der vergangenen Woche erfolgten Infektionen genau wissen oder bestimmen. Erst wenn die betroffenen Personen positiv getestet wurden, kann deren Anzahl in einem Erhebungssystem erfasst und analysiert werden.
Ganz allgemein gilt jedoch, dass nicht alle infizierten Personen Symptome entwickeln, dass nicht alle, die Symptome entwickeln, eine Arztpraxis aufsuchen, dass nicht alle, die zum Arzt gehen, getestet werden, und dass nicht alle, die positiv getestet werden, auch in einem Erhebungssystem erfasst werden. Außerdem vergeht zwischen all diesen einzelnen Schritten eine gewisse Zeit, so dass kein Erhebungssystem, und sei es noch so gut, ohne zusätzliche Annahmen und Berechnungen eine Aussage über das aktuelle Infektionsgeschehen machen kann.
In Deutschland werden gemäß der Meldepflicht nach Infektionsschutzgesetz (IfSG) Infektionen mit SARS-CoV-2 von den diagnostizierenden Ärzten und Laboren an die zuständigen Gesundheitsämter gemeldet und von diesen über die zuständigen Landesbehörden an das Robert Koch-Institut übermittelt.
Methoden, Instrumente und Verlauf der Datengenerierung
Grundlage der Berechnungen des Nowcastings und der R-Schätzungen sind die aktuellen, durch die Gesundheitsämter an des Robert Koch-Institut gemeldeten, SARS-CoV-2-Infektionen in Deutschland. Die öffentlich zur Verfügung gestellten Daten der Infektionsmeldungen sind im SARS-CoV-2 Daten-Dashboard des RKI, auf GitHub und in Zenodo abrufbar. Auf Basis der gemeldeten SARS-CoV-2-Infektionen erfolgen die Fallzahlenschätzungen und die R-Wert-Berechnung in folgenden Schritten:
- Multiple Imputation fehlender Information zum Erkrankungsbeginn von COVID-19-Fällen unter einer Missing-at-Random-Annahme
- Korrektur der Anzahl von Neuerkrankungen für den Diagnose-, Melde- und Übermittlungsverzug mittels des Nowcasting-Verfahrens
- Berechnung der zeitlich variierenden Reproduktionszahl unter der Annahme einer Generationszeit von 4 Tagen
Eine detaillierte Beschreibung der Methoden, Instrumente und des Verlaufs der Datengenerierung findet sich in folgenden Publikationen, die ebenfalls im Datensatz enthalten sind:
an der Heiden, M; Hamouda, O (2020): Schätzung der aktuellen Entwicklung der SARS-CoV-2-Epidemie in Deutschland – Nowcasting. Epid Bull, S.10–16. DOI: 10.25646/6692.4
Robert Koch-Institut (2020): Erläuterung der Schätzung der zeitlich variierenden Reproduktionszahl R. RKI. DOI:10.25646/8164
Daten und Datenaufbereitung
Der Datensatz enthält die Tabelle mit dem Nowcasting der aktuellen Infektionen und der sich daraus ergebenden R-Werte. Diese sind im Hauptverzeichnis unter "NowcastRaktuell.csv" abrufbar und werden täglich überschrieben. Im Archivordner sind das Nowcasting und die R-Schaetzung unter den Dateinamen "NowcastRJJJJ-MM-TT.csv" enthalten. Im Dateinamen repräsentiert die Sequenz "JJJJ-MM-TT" das Erstellungsdatum der Datei und damit gleichzeitig das Datum des enthaltenen Datenstands. "JJJJ" steht dabei für das Jahr, "MM" für den Monat und "TT" für den Tag der Erstellung bzw. des enthaltenen Datenstands.
NowcastRaktuell.csv
Archiv/NowcastRJJJJ-MM-TT.csv
Die Tabelle des Nowcastings und der R-Schätzung wurden täglich um die Zeile der Daten des vergangenen Tages erweitert. Die Fallzahlenschätzungen und R-Wert-Angaben bilden einen tagesaktuellen Stand (00:00 Uhr) des Publikationsdatums ab.
Die Schätzwerte zur Anzahl von Neuerkrankungen und der R-Schätzung zu früheren Tagen können von den Angaben in früheren Versionen der Tabelle abweichen, weil täglich der Gesamtverlauf, aufgrund der aktuell verfügbaren Daten, neu geschätzt wird.
Variablen des Nowcastings und der R-Schätzung
Drei zentrale Variablen sind im Nowcasting und in der R-Schätzung für jeden Tag JJJJ-MM-TT abgebildet:
- Punktschätzer der Anzahl an Neuerkrankungen (ohne Glättung)
- ohne Glättung: ohne Bildung eines gleitenden Mittelwerts
- Punktschätzer der Anzahl an Neuerkrankungen (mit Glättung)
- mit Glättung: unter Bildung eines gleitenden Mittelwerts über 4 Tage
- jeder Wert mit den Werten der 3 vorhergehenden Tage gemittelt
- Punktschätzer des 7-Tage-R-Werts
Zu jeder dieser Variablen ist darüber hinaus das 95%-Prädiktionsintervall mit einer Ober- und einer Untergrenze angegeben.
Die Datei NowcastRaktuell.csv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschemaNowcastR_aktuell.json hinterlegt:
| Variable | Typ | Ausprägungen | Beschreibung |
|:-----------------------|:--------|:---------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------|
| Datum | date | Format: YYYY-MM-DD | Datum (im Format JJJJ-MM-TT) der geschätzten Neuinfektionen und der sich ergebenden R-Werte. JJJJ entspricht der Jahreszahl, MM dem Monat und TT dem Tag. |
| PSCOVIDFaelle | integer | Werte: ≥0 | Punktschätzer der Anzahl an Neuerkrankungen (ohne Glättung) |
| UGPICOVIDFaelle | integer | Werte: ≥0 | Untere Grenze des 95%-Prädiktionsintervalls der Anzahl an Neuerkrankungen (ohne Glättung |
| OGPICOVIDFaelle | integer | Werte: ≥0 | Obere Grenze des 95%-Prädiktionsintervalls der Anzahl an Neuerkrankungen (ohne Glättung) |
| PSCOVIDFaellema4 | integer | Werte: ≥0 | Punktschätzer der Anzahl an Neuerkrankungen (mit Glättung) |
| UGPICOVIDFaellema4 | integer | Werte: ≥0 | Untere Grenze des 95%-Prädiktionsintervalls der Anzahl an Neuerkrankungen (mit Glättung) |
| OGPICOVIDFaellema4 | integer | Werte: ≥0 | Obere Grenze des 95%-Prädiktionsintervalls der Anzahl an Neuerkrankungen (mit Glättung) |
| PS7TageRWert | number | Werte: ≥0 | Punktschätzer des 7-Tage-R-Werts |
| UGPI7TageRWert | number | Werte: ≥0 | Untere Grenze des 95%-Prädiktionsintervalls des 7-Tage-R-Werts |
| OGPI7TageR_Wert | number | Werte: ≥0 | Obere Grenze des 95%-Prädiktionsintervalls des 7-Tage-R-Werts |
Formatierung der Nowcasting-und-R-Schätzung-Tabelle
Das Nowcasting und die R-Schätzung sind im Datensatz als kommaseparierte .csv-Datei enthalten. Der verwendete Zeichensatz der .csv-Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",". Datumsangaben sind im ISO-8601-Standard formatiert.
- Zeichensatz: UTF-8
- Datumsformat: ISO 8601
- .csv-Trennzeichen: Komma ","
Metadaten
Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben dem Publikationsdatum ("publication_date") auch der Datenstand in folgendem Format enthalten (Beispiel):
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Zusätzlich beschreiben wir tabellarische Daten mithilfe des Data Package Standards. Ein Data Package ist eine strukturierte Sammlung von Daten und zugehörigen Metadaten, die den Austausch und die Wiederverwendung von Daten erleichtert. Es besteht aus einer datapackage.json-Datei, die zentrale Informationen wie die enthaltenen Ressourcen, ihre Formate und Schema-Definitionen beschreibt.
Der Data Package Standard wird von der Open Knowledge Foundation bereitgestellt und ist ein offenes Format, das eine einfache, maschinenlesbare Beschreibung von Datensätzen ermöglicht.
Die Liste der in diesem Repository enthaltenen Daten ist in folgender Datei hinterlegt:
Für tabellarische Daten definieren wir zusätzlich ein Table Schema, das die Struktur der Tabellen beschreibt, einschließlich Spaltennamen, Datentypen und Validierungsregeln. Diese Schema-Dateien finden sich unter:
Hinweise zur Nachnutzung der Daten
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Lizenz
Der Datensatz "SARS-CoV-2-Nowcasting und -R-Schaetzung" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.
<!-- FOOTER_END -->
Owner
- Name: Robert Koch-Institut
- Login: robert-koch-institut
- Kind: organization
- Location: Berlin
- Website: http://www.rki.de
- Twitter: rki_de
- Repositories: 16
- Profile: https://github.com/robert-koch-institut
Das RKI ist die zentrale Einrichtung der deutschen Bundesregierung auf dem Gebiet der Krankheitsüberwachung und -prävention.
Citation (citation.cff)
cff-version: 1.2.0
type: dataset
title: SARS-CoV-2-Nowcasting und -R-Schaetzung
abstract: >-
Das Nowcasting erstellt eine Schätzung des Verlaufs der Anzahl von bereits
erfolgten SARS-CoV-2-Erkrankungsfällen in Deutschland unter Berücksichtigung
des Diagnose-, Melde- und Übermittlungsverzugs. Aufbauend auf dem Nowcasting
kann eine Schätzung der zeitabhängigen Reproduktionszahl R durchgeführt
werden. Die Reproduktionszahl beschreibt, wie viele Menschen eine infizierte
Person im Mittel ansteckt. Sie kann nicht alleine als Maß für
Wirksamkeit/Notwendigkeit von Maßnahmen herangezogen werden. Wichtig sind
außerdem u.a. die absolute Zahl der täglichen Neuinfektionen sowie die Schwere
der Erkrankungen. Die absolute Zahl der Neuinfektionen muss klein genug sein,
um eine effektive Kontaktpersonennachverfolgung zu ermöglichen und die
Kapazitäten von Intensivbetten nicht zu überlasten.
date-released: '2023-06-21'
keywords:
- COVID-19
- SARS-CoV-2
- Infektion
- Basis-Reproduktionszahl
- Vorhersage
- Deutschland
- Infections
- Forecasting
- Basic Reproduction Number
- Germany
- RKI
- Gesundheitsberichterstattung
- Epidemiologie
- Public health surveillance
- Epidemiology
message: Cite me!
url: >-
https://robert-koch-institut.github.io/SARS-CoV-2-Nowcasting_und_-R-Schaetzung/
license: CC-BY-4.0
doi: 10.5281/zenodo.8062328
authors:
- family-names: an der Heiden
given-names: Matthias
affiliation: Robert Koch-Institut
orcid: 0000-0001-5863-4549
GitHub Events
Total
- Delete event: 1
- Push event: 11
- Pull request review event: 1
- Pull request event: 3
- Create event: 2
Last Year
- Delete event: 1
- Push event: 11
- Pull request review event: 1
- Pull request event: 3
- Create event: 2
Committers
Last synced: about 2 years ago
Top Committers
| Name | Commits | |
|---|---|---|
| anderHeidenM | A****M@r****e | 608 |
| RKIOpenData | R****a | 287 |
| Robert Koch-Institut | m****4@r****e | 114 |
| Hannes Wünsche | W****H@r****e | 63 |
| RKIOpenData | o****a@r****e | 39 |
| HannesWuensche | H****e | 8 |
| Opendata | w****h@r****e | 6 |
| Thomas Arend | t****s@a****e | 2 |
| RKI | Forschungsdatenmanagement | 7****t | 2 |
| Hannes Wuensche | w****e@r****e | 2 |
| heziegl | h****l | 1 |
Committer Domains (Top 20 + Academic)
Issues and Pull Requests
Last synced: about 2 years ago
All Time
- Total issues: 14
- Total pull requests: 3
- Average time to close issues: 1 day
- Average time to close pull requests: 11 days
- Total issue authors: 5
- Total pull request authors: 3
- Average comments per issue: 1.29
- Average comments per pull request: 0.67
- Merged pull requests: 2
- Bot issues: 0
- Bot pull requests: 0
Past Year
- Issues: 2
- Pull requests: 0
- Average time to close issues: 1 day
- Average time to close pull requests: N/A
- Issue authors: 2
- Pull request authors: 0
- Average comments per issue: 0.5
- Average comments per pull request: 0
- Merged pull requests: 0
- Bot issues: 0
- Bot pull requests: 0
Top Authors
Issue Authors
- icestorm972 (7)
- Rutger265 (4)
- jenuk (1)
- volviq (1)
- HannesWuensche (1)
Pull Request Authors
- SimonScholler (2)
- johannes-darms (1)
- Byggvir (1)
- heziegl (1)
Top Labels
Issue Labels
Pull Request Labels
Dependencies
- robert-koch-institut/OpenData-Website main composite
- actions/checkout v3 composite
- actions/create-release v1 composite
- actions/checkout v3 composite
- dmnemec/copy_file_to_another_repo_action main composite
- actions/checkout v3 composite