german_index_of_socioeconomic_deprivation_gisd
Der German Index of Socioeconomic Deprivation (GISD) ist ein am Robert Koch-Institut entwickelter Index zur Erfassung regionaler sozioökonomischer Benachteiligung. Er wird verwendet, um regionale sozioökonomische Ungleichheiten in der Gesundheit sichtbar zu machen und Ansatzpunkte zur Erklärung regionaler Unterschiede in der Gesundheit aufzeigen...
https://github.com/robert-koch-institut/german_index_of_socioeconomic_deprivation_gisd
Science Score: 49.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
○CITATION.cff file
-
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
✓DOI references
Found 18 DOI reference(s) in README -
✓Academic publication links
Links to: zenodo.org -
○Committers with academic emails
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (1.1%) to scientific vocabulary
Keywords
Keywords from Contributors
Repository
Der German Index of Socioeconomic Deprivation (GISD) ist ein am Robert Koch-Institut entwickelter Index zur Erfassung regionaler sozioökonomischer Benachteiligung. Er wird verwendet, um regionale sozioökonomische Ungleichheiten in der Gesundheit sichtbar zu machen und Ansatzpunkte zur Erklärung regionaler Unterschiede in der Gesundheit aufzeigen...
Basic Info
- Host: GitHub
- Owner: robert-koch-institut
- License: cc-by-4.0
- Language: R
- Default Branch: main
- Homepage: https://robert-koch-institut.github.io/German_Index_of_Socioeconomic_Deprivation_GISD/
- Size: 321 MB
Statistics
- Stars: 12
- Watchers: 5
- Forks: 4
- Open Issues: 0
- Releases: 4
Topics
Metadata Files
Readme.md
Dokumentation
German Index of Socioeconomic Deprivation (GISD)
Niels Michalski¹, Lola Omar Soliman¹, Marvin Reis¹, Fabian Tetzlaff¹, Enno Nowossadeck¹, & Jens Hoebel¹
¹ Robert Koch-Institut | Fachgebiet 28
Zitieren
Michalski, N., Soliman, L., Reis, M., Tetzlaff, F., Nowossadeck, E., & Hoebel, J. (2025). German Index of Socioeconomic Deprivation (GISD) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.14781119
Zusammenfassung
Der "German Index of Socioeconomic Deprivation (GISD)", entwickelt am Robert Koch-Institut, bietet eine umfassende Messgre fr die regionalen soziokonomischen Ungleichheiten in der Gesundheit in Deutschland. Der Index bercksichtigt drei wesentliche Dimensionen: Bildung, Beschftigung und Einkommen. Hierbei werden Indikatoren herangezogen, die in enger Beziehung zum soziokonomischen Status (SES) auf individueller Ebene stehen. Die verwendeten Daten stammen aus ffentlich zugnglichen Quellen, vor allem aus der INKAR-Datenbank des Bundesinstituts fr Bau-, Stadt- und Raumforschung (BBSR). Zur Berechnung des Indexwerts kommen Hauptkomponentenanalyse und Faktor-Scoring-Verfahren zum Einsatz, um ein differenziertes Bild der regionalen soziokonomischen Lage zu erhalten. Die GISD-Daten werden auf verschiedenen regionalen Ebenen, von Gemeinden bis zu NUTS-2-Regionen, aggregiert und fr den Zeitraum von 1998 bis 2021 bereitgestellt. Als ein bedeutendes Instrument in der epidemiologischen Forschung und Gesundheitsberichterstattung ermglicht der GISD eine fundierte Analyse der sozialen Ungleichheit und ihrer Auswirkungen auf die Gesundheit in Deutschland.
Inhaltsverzeichnis <!-- TOCSTART: {"headingdepth": 2} --> - Informationen zum Forschungskontext - Zielkriterien und Datengrundlage - Datenaufbereitung - Datenbereitstellung - Updates und Bugfixes - Hinweise zur Nachnutzung der Daten <!-- TOC_END -->
Informationen zum Forschungskontext
Im Datensatz "German Index of Socioeconomic Deprivation (GISD)" werden die Daten des gleichnamigen Indexes bereitgestellt und dokumentiert. Er dient als Ma relativer regionaler soziokonomischer Benachteiligung. Der German Index of Socieoeoconomic Deprivation (GISD) wird seit 2017 am Robert Koch-Institut erstellt, um regionale soziokonomische Ungleichheiten in der Gesundheit sichtbar zu machen und Ansatzpunkte zur Erklrung regionaler Unterschiede in der Gesundheit aufzeigen zu knnen. Die Indikatoren des GISD werden so gewhlt, dass sie eine Analogie zum in der Sozialepidemiologie etablierten individuellen soziokonomischen Status (SES) zulassen, der die Dimensionen Bildung, Beruf und Einkommen zusammenfasst. Durch diese Konzeption wird es mglich mit dem GISD soziokonomische Unterschiede in den Gesundheitschancen, Krankheits- und Sterberisiken in Deutschland auch anhand von Daten untersuchen zu knnen, die auf individueller Ebene keine Information zum soziokonomischen Status enthalten. Der Begriff regionale Deprivation wird hier in Anlehnung an den Begriff der sozialen Deprivation verwendet und bezeichnet den Grad der Benachteiligung, der aus einem relativen Mangel an soziokonomischen Ressourcen und aus einem hohen Niveau sozialrumlicher Belastungen in der jeweiligen Wohnregion resultiert, der Einschrnkungen der gesellschaftlichen Teilhabechancen zur Folge hat.
Fr die Referenzierung des GISD wird empfohlen zustzlich zur Datenzitation folgende Publikation im Journal of Health Monitoring zu zitieren. Diese enthlt eine ausfhrliche Einfhrung in den GISD. Einige Textbausteine dieser Onlinedokumentation wurden dieser Publikation entnommen:
Michalski N, Reis M, Tetzlaff F, Herber M, Kroll LE, Hvener C, Nowossadeck E, Hoebel J (2022) German Index of Socioeconomic Deprivation (GISD): Revision, Aktualisierung und Anwendungsbeispiele. J Health Monit 7(S5): 224. DOI: 10.25646/10640
Die englische Version ist verfgbar unter:
Michalski N, Reis M, Tetzlaff F, Herber M, Kroll LE et al. (2022) German Index of Socioeconomic Deprivation (GISD): Revision, update and applications. J Health Monit 7(S5): 223. DOI 10.25646/10641
Die Begleitpublikation zur Ursprungsversion des GISD findet sich hier:
Kroll LE, Schumann M, Hoebel J et al. (2017) Regionale Unterschiede in der Gesundheit Entwicklung eines soziokonomischen Deprivationsindex fr Deutschland. J Health Monit 2(2):103-120 DOI: 10.25646/2573.2
Administrative und organisatorische Angaben
Der "German Index of Socioeconomic Deprivation (GISD)" dient im Rahmen der epidemiologischen Forschung und Gesundheitsberichterstattung am Robert Koch-Institut zur Bearbeitung der Themenschwerpunkte regionale Unterschiede in der Gesundheit und soziale Ungleichheit der Gesundheitschancen und Erkrankungsrisiken.
Die Federfhrung der Entwicklung, Betreuung und Primranwendung liegt im Fachgebiet 28 | Sozialen Determinanten der Gesundheit. Autoren des aktuellen Datensatzes sind Niels Michalski und Lola Omar Soliman. Die Projektleitung liegt bei Jens Hoebel. Die Ursprungsversion des GISD wurde von Lars E. Kroll erstellt. Aktualisierungen und Revisionen des GISD erscheinen in regelmigen Abstnden. Fragen zur Generierung und Verwendung des GISD knnen an GISD@rki.de gerichtet werden.
Die Verffentlichung der Daten, die Datenkuration sowie das Qualittsmanagement der (Meta-)Daten erfolgt durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement. Fragen zum Datenmanagement knnen an das Open Data Team des Fachgebiets MF4 gerichtet werden OpenData@rki.de.
Zielkriterien und Datengrundlage
Beschreibung der Zielkriterien
Die Erstellung des GISD erfolgte mit dem Ziel, ein Ma fr die relative soziokonomische Schlechterstellung von Regionen in Deutschland zu entwickeln. Der Index sollte eine Analogie zum soziokonomischen Status (SES) auf Individualebene zulassen und auch Entwicklungen ber die Zeit abbilden knnen. Der Index sollte soziokonomische Unterschiede dabei mglichst feingliedrig, d.h. auf mglichst kleinrumiger regionaler Ebene, abbilden. Primrer Bezugsrahmen des Indexes sollte das gesamte Bundesgebiet sein, um Gesundheitsdaten mit Regionalbezug aus unterschiedlichen Quellen analysieren und fr Deutschland reprsentative Aussagen treffen zu knnen. Als Datengrundlage sollten Sekundrdaten aus Quellen verwendet werden, die frei zugnglich sind und deren datenschutz- und urheberrechtliche Verwendung unproblematisch ist.
Regionale Ebenen
Gem dieser Kriterien wird der GISD auf Ebene der Gemeinden jahresweise fr den Zeitraum 1998 bis 2021 generiert und fr die unterschiedliche Raumabgrenzungen (Gemeindeverbnde, Kreis, Raumordnungsregionen, NUTS-2) bevlkerungsgewichtet aggregiert. Auf jeder rumlichen Ebene wird jeder Region des Gebietsstands ein Wert zugeordnet.
|Ebene | Anzahl (Stand 31.12.2022) | |:--------------------------------------------------|------:| |Gemeinden | 10786| |Gemeindeverbnde und verbandsfreie Gemeinden (GVB) | 4396| |Kreise und kreisfreie Stdte (Kreise) | 400| |Raumordnungsregionen (ROR) | 96| |NUTS-2 | 38|
Datengrundlage
Fr die Generierung des GISD werden bevorzugt Daten aus der Datenbank INKAR (Indikatoren und Karten zur Raum- und Stadtentwicklung) des Bundesinstituts fr Bau-, Stadt- und Raumforschung (BBSR) verwendet. Bei INKAR handelt es sich um einen interaktiven Online-Atlas mit regionalstatistischen Informationen zu den Themen Bevlkerungsentwicklung, Arbeitsmarkt, Bildung, Wirtschaft, Wohnen, Verkehr und Umwelt. In der Datenbank sind rund 600 Indikatoren fr verschiedene regionale Ebenen hinterlegt, so dass Vergleiche zwischen europischen Regionen, Bundeslndern, Kreisen, Gemeindeverbnden und verbandsfreien Gemeinden ermglicht werden. Die Untergliederung der regionalen Einheiten basiert auf der administrativen Gliederung Deutschlands. Die Zeitreihen der Statistiken reichen zum Teil bis ins Jahr 1995 zurck. Die INKAR-Daten bieten durch ihre ffentliche Verfgbarkeit und gute Dokumentation ein hohes Ma an Transparenz. Zudem werden die Daten ber die Zeit harmonisiert und auf die aktuellen Gebietsstnde bezogen, so dass zeitliche Trends analysiert werden knnen. Aufgrund der genannten Eigenschaften werden Daten aus der INKAR-Datenbank gegenber anderen Datenquellen bevorzugt. Die Zeitreihen fr zwei Indikatoren wurden fr frhere Jahre (bis 2011) von der Statistik der Bundesagentur fr Arbeit bezogen.
Auswahl der Indikatoren
Der Index greift im Wesentlichen auf die Indikatoren zurck, deren Auswahl in einer frheren Version des GISD auf Grundlage der Ergebnisse einer systematischen Literaturrecherche in den Literaturdatenbanken von PubMed und Google Scholar getroffen wurde Kroll et al 2017. Die Indikatoren sollten auerdem drei weitere Kriterien erfllen: Erstens die regionale Auflsung der Daten sollte mglichst fein sein. Sie sollten mindestens auf Kreisebene, idealerweise auf Ebene der Gemeinden oder Gemeindeverbnde und verbandsfreien Gemeinden (GVB) vorliegen. Zweitens sollten die Indikatoren mglichst ber einen Zeitraum von derzeit rckblickend 20 Jahren verfgbar und auf aktuelle Gebietsstnde bezogen sein. Drittens sollten die Indikatoren ausreichend hoch mit anderen Indikatoren der gleichen Teildimension korrelieren, um eine Zusammenfassung zu einer Dimension zu rechtfertigen. Fr die aktuelle Version des GISD wurden die derzeit in der INKAR-Datenbank bereitgestellten Indikatoren auf ihre Eignung hin berprft. Hierbei stellte sich heraus, dass alle acht ursprnglich verwendeten Indikatoren auch weiterhin in der INKAR-Datenbank enthalten sind. Der Indikator Anteil sozialversicherungspflichtig Beschftigter ohne Berufsabschluss an allen sozialversicherungspflichtig Beschftigten wurde seit der Version GISD Release 2022 v1.0 in die Liste der Indikatoren aufgenommen. Dadurch kann die Bildungsdimension in der vorliegenden Revision wie die Einkommens- und Beschftigungsdimension durch drei Indikatoren reprsentiert werden. Um der mangelnden Analogie der Indikatoren der Beschftigungsdimension mit denen des Berufsstatus im soziokonomischen Status (SES) gerecht zu werden, weicht die Bezeichnung dieser GISD-Dimension von der des SES ab. In folgender Tabelle sind die Dimensionen mit ihren Indikatoren und der jeweiligen Ursprungsquelle der Daten dargestellt:
|Dimension |Name des Indikators |Indikator |Regionale Tiefe |Quelle | |:-------------|:------------------------------------------|:---------------------------------------------------------------------------------------------------------|:---------------|:---------------------------------------------------------------------| |Bildung |Beschftigte mit (Fach-)Hochschulabschluss |Anteil der SV-Beschftigten am Wohnort mit akademischem Abschluss an den SV-Beschftigten am Wohnort in % |Kreis |Statistik der Bundesagentur fr Arbeit | |Bildung |Beschftigte ohne Abschluss |Anteil der SV-Beschftigten am Wohnort ohne Berufsabschluss an den SV-Beschftigten am Wohnort in % |Kreis |Statistik der Bundesagentur fr Arbeit | |Bildung |Schulabgnger:innen ohne Abschluss |Anteil der Schulabgnger:innen ohne Hauptschulabschluss an den Schulabgnger:innen in % |Kreis |Statistik der allgemeinbildenden Schulen des Bundes und der Lnder | |Beschftigung |Arbeitslosigkeit |Anteil der Arbeitslosen an den Einwohner:innen im erwerbsfhigen Alter |Gemeinde |Statistik der Bundesagentur fr Arbeit | |Beschftigung |Beschftigtenquote |SV-Beschftigte am Wohnort je 100 Einwohner:innen im erwerbsfhigen Alter |Gemeinde |Statistik der Bundesagentur fr Arbeit | |Beschftigung |Bruttolohn und -gehalt |Monatlicher Bruttoverdienst der Arbeitnehmer:innen in Euro |Kreis |Volkswirtschaftliche Gesamtrechnung der Lnder | |Einkommen |Steuereinnahmen |Einkommensteuer in je Einwohner:in |Gemeindeverband |Volkswirtschaftliche Gesamtrechnung der Lnder | |Einkommen |Haushaltsnettoeinkommen |Durchschnittliches Haushaltseinkommen in je Einwohner:in |Kreis |Schuldneratlas Deutschland des Verbands der Vereine Creditreform e.V. | |Einkommen |Schuldner:innenquote |Private Schuldner:innen je 100 volljhrige Einwohner:innen in % |Kreis |Realsteuervergleich des Bundes und der Lnder + INKAR |
Quellen: INKAR 2024, Statistik der Bundesagentur fr Arbeit
GVB = Gemeindeverbnde und verbandsfreie Gemeinden
SV = sozialversicherungspflichtig
*Datenquelle: Fr die Anteile der sozialversicherungspflichtig Beschftigten ohne Abschluss und mit akademischem Abschluss wurden die Daten fr die Jahre 2001 bis 2011 direkt ber die Statistik der Bundesagentur fr Arbeit bezogen Statistik der Bundesagentur fr Arbeit. Alle weiteren Daten wurden aus INKAR 2024 bezogen.
*Fr die Beschftigtenquote standen Werte fr die Gemeindeebene erst ab 2001 zur Verfgung. Fr die Jahre 1998 bis 2000 wurden den Gemeinden die Werte der Kreisebene zugeordnet.
Datenaufbereitung
Zeitreihenimputation und Datenharmonisierung
Fr zwei der neun Indikatoren sind Daten auf der Ebene der Gemeinden verfgbar, fr einen Indikator auf Ebene der Gemeindeverbnde und verbandsfreien Gemeinden (GVB), so dass der Index auch Unterschiede in der soziokonomischen Deprivation zwischen Gemeinden innerhalb von Kreisen feststellen kann. Fr die Bildungsindikatoren Beschftigte ohne Abschluss und Beschftigte mit (Fach-)Hochschulabschluss gibt es aufgrund einer Umstellung im Meldeverfahren zur Sozialversicherung keine Werte fr das Jahr 2012 (Statistik der Bundesagentur fr Arbeit). Um diese Zeitreihenlcke zu fllen wurden die Daten fr 2011 auch auf 2012 bertragen. Fr einige Indikatoren beginnen die Zeitreihen nicht im Basisjahr 1998. Fr diese Indikatoren wurden fehlende Werte auf Grundlage der vorhandenen Zeitreihen geschtzt (lineare Random-Intercept-Modelle fr Zeitreihen). Das betrifft die Jahre vor 2004 und insbesondere die Jahre 1998 bis 2000, fr die Werte von fnf Indikatoren auf diese Weise imputiert wurden. Von 2001 bis 2003 mussten nur fehlende Werte eines Indikators geschtzt werden. Um die Informationen der Rohdaten als Zeitreihe verwenden zu knnen und fr die Hauptkomponentenanalyse aufzubereiten, wurden einige Indikatoren um Artefakte der Erhebung und statistische Artefakte bereinigt: 1) Die Indikatoren mit whrungsbasierten, nach oben offenen Skalen (Steuereinnahmen, Bruttolohn und mittleres Haushaltsnettoeinkommen) wurden kaufkraftbereinigt und logarithmiert. 2) Fr die Indikatoren Beschftigte ohne Abschluss und Beschftigte mit (Fach-)Hochschulabschluss fhrte die bereits erwhnte Umstellung im Meldeverfahren zur Sozialversicherung zu einer Vernderung der Niveaus der Zeitreihe. Die durchschnittliche Vernderung des Niveauparameters durch die Umstellung des Meldeverfahrens wurde statistisch identifiziert und die Zeitreihe vor der Umstellung auf das Niveau nach der Umstellung angepasst. 3) Der Indikator Schulabgngerinnen und -abgnger ohne Abschluss wurde um Einflsse der G8-Reformen auf die jhrlichen Zahlen der Schulabgngerinnen und -abgnger bereinigt. Diese Korrektur war notwendig, da die Schulabschlussjahrgnge in den Jahren, in denen die ersten Schlerinnen und Schler im neu eingefhrten G8-System nach zwlf Jahren ihr Abitur machen, doppelt besetzt sind und der Anteil der Schulabgngerinnen und -abgnger ohne Abschluss deshalb aufgrund der insgesamt hheren Abschlusszahlen geringer ausfllt. Umgekehrtes gilt in den Jahren, in denen die Rcknahme der G8-Reform griff. Um diese Artefakte herauszurechnen wurde die statistischen Effekte der G8-Reformen mit den Daten regressionsanalytisch geschtzt und fr die betroffenen Bundeslnder in den betreffenden Jahren abgezogen. 4) Bei der Betrachtung des Indikators Anteil der Beschftigten ohne Abschluss fiel eine bimodale Verteilung auf, die auf den deutlich geringeren Anteil an Beschftigten ohne Abschluss in den ostdeutschen Bundeslndern zurckzufhren ist. Inhaltlich sollte der Indikator als Proxy fr den Bildungsstand der Bevlkerung dienen. Historische gewachsene Unterschiede zwischen den Landesteilen sowie die Einbindung der DDR-Bevlkerung ins Erwerbssystem der BRD sorgen in dieser Frage allerdings fr unterschiedliche Vergleichsmastbe. Um fr diese historisch geprgten und demografischen Unterschiede zu korrigieren, wurde die mittlere Differenz der entsprechenden Anteile zwischen ost- und westdeutschen Bundeslndern bestimmt und den Regionen in den ostdeutschen Bundeslndern zugeschlagen, wodurch eine unimodale Verteilung der Werte erzeugt wurde.
Indexbildung
Die Bestimmung der Indexwerte erfolgt in drei Schritten. In einem ersten Schritt werden separate Hauptkomponentenanalysen fr jede der drei Teildimension durchgefhrt. Aus diesen werden in einem zweiten Schritt Werte fr die Teildimensionen ber das Faktor-Scoring-Verfahren generiert. In einem dritten Schritt werden die Werte fr die Teildimensionen normalisiert und zum GISD-Score aufsummiert. Fr die Hauptkomponentenanalysen werden die Daten der GISD-Indikatoren fr die 20 aktuellsten Jahre (2002-2021) gepoolt. Dadurch kann neben der Variation zwischen den regionalen Einheiten auch die Variation ber die Zeit genutzt werden, um die Zusammenhnge zwischen den Indikatoren zu bestimmen. Durch den Einschlussbeschrnkung der Daten bis 2001 wird auerdem potenziellen Verzerrungen der Gewichte durch imputierte Werte vorgebeugt. Die Hauptkomponentenanalysen besttigen fr jede Teildimension eine eindimensionale Struktur. Die Faktorladungen, die als Korrelation der Indikatoren mit der Hauptkomponente gelesen werden knnen, erreichen zufriedenstellende bis gute Werte:
|Dimension|Variable|Faktorladung|Anteil am Teilscore|Anteil GISD | --- | --- | ---: | ---: | ---: | |Bildung |Beschftigte mit akad. Abschluss (adj.) | 0.71| 34.3| 11.4| |Bildung |Beschftigte ohne Abschluss (adj.) | -0.71| 34.3| 11.4| |Bildung |Schulabgnger ohne Abschluss (adj.) | -0.67| 31.4| 10.5| |Beschftigung |Arbeitslosigkeit | -0.83| 39.5| 13.2| |Beschftigung |Beschftigtenquote | 0.58| 19.5| 6.5| |Beschftigung |Bruttoverdienst (log.) | 0.84| 40.9| 13.6| |Einkommen |Einkommensteuer (log.) | 0.92| 40.3| 13.4| |Einkommen |Haushaltseinkommen (log.) | 0.92| 40.8| 13.6| |Einkommen |Schuldnerquote | -0.63| 18.9| 6.3|
log. = logarithmiert,
adj. = adjustiert
*Darstellung der Faktorladungen auf der ersten Hauptkomponente fr die einzelnen Dimensionen. Eigenwerte der ersten Komponenten: (Beschftigung) = 1.7; (Einkommen) = 2.1; (Bildung) = 1.5. Die Eigenwerte der zweiten und dritten Komponenten liegen jeweils unter 0,85. Korrelationen zwischen den Scores der Teildimensionen fr das Jahr 2021: r(Beschftigung|Einkommen) = 0.69; r(Beschftigung|Bildung) = 0.52; r(Einkommen|Bildung) = 0.75
Mit Hilfe des Faktor-Scorings werden fr jede Gemeinde im Datensatz Werte (GISD-Scores) berechnet. Auch fr die Jahre 1998 bis 2001 wurden dabei GISD-Scores generiert. Die Faktorwerte der drei Teildimensionen werden anschlieend jahresweise jeweils auf einen Wertebereich zwischen 0 (niedrigste Deprivation) und 1 (hchste Deprivation) normiert. Danach wurden die drei Teilscores aufaddiert, so dass jede Teildimension mit einem Gewicht von etwa einem Drittel in den Gesamt-Index eingeht. Die so entstandenen GISD-Scores der Gemeinden werden anschlieend jeweils fr hhere regionale Einheiten (GVB, Landkreise und kreisfreie Stdte, Raumordnungsregionen und die statistischen Regionen gem der amtlichen europischen Statistik NUTS-2) bevlkerungsgewichtet aggregiert. Die Berechnung der GISD-Scores fr die hheren regionalen Ebenen mittels bevlkerungsgewichteter Aggregation sorgt dafr, dass zur Berechnung der GISD-Scores fr jede rumliche Ebene die gleiche Gewichtung der Indikatoren zur Anwendung kommt. Ausgehend von der Gemeindeebene werden auf diese Weise auch Werte fr weitere Raumbezge wie Postleitzahlgebiete generiert. Die Werte werden auf den jeweiligen Ebenen jahresweise so normiert, dass die soziokomische Deprivation der Regionen Werte zwischen 0 (niedrigste Deprivation) und 1 (hchste Deprivation) annehmen kann. Zudem werden die Einheiten der genannten Raumebenen fr die weiteren Analysen gem der Verteilung ihrer Indexwerte fr jedes Jahr in fnf Gruppen von je zwanzig Prozent (Quintile, Fnftel) eingeteilt, wobei jeweils das unterste Fnftel niedrige und das oberste Fnftel hohe soziokonomische Deprivation kennzeichnet.
Zu beachten ist, dass die jahresweise Normierung der Scores Folgen fr die Interpretation der GISD-Scores ber die Zeit hat. Die Scores geben das Ausma der soziokonomischen Deprivation in einem Jahr immer relativ zu den Regionen mit dem hchsten und niedrigsten Wert in dem entsprechenden Jahr wider. Weil der GISD-Score einer Region also von den extremen Werten eines Jahres anhngt, steht ein niedrigerer Wert im Vergleich zwischen zwei Jahren, nicht notwendigerweise fr einen Verringerung der absoluten Deprivation.
Datenbereitstellung
Im Repositorium werden die GISD-Daten bestehend aus den GISD-Scores fr die jeweiligen regionalen Ebenen und Jahre bereitgestellt. Im Ordner "Bund" befinden sich die GISD-Daten mit Bezugsrahmen Bundesebene. Im Ordner "Bundesland" sind die GISD-Daten bezogen auf die jeweiligen Bundeslnder mit Ausnahme der Stadtstaaten Bremen, Hamburg und Berlin abgelegt. Innerhalb der Stadtstaaten kann bisher nicht regional differenziert werden. Das aktuelle Release entspricht der Version GISD Release 2025 v1.0. Frhere Versionen finden sich im Archiv.
Die Dateinamen sind nach dem Schema GISD_Bezugsrahmen_Raumabgrenzung.csv bezeichnet. Die Sequenz "Bezugsrahmen" reprsentiert, ob als Bezugsrahmen die Bundesebene "Bund" oder ein bestimmtes Bundesland "Name des Bundeslandes" ausgewhlt werden soll. Die Sequenz "Raumabgrenzung" markiert die "regionale Ebene" auf der der GISD verwendet werden soll.
Beispiel: Die Datei GISD_Sachsen_Gemeinde.csv enhlt die Daten des GISD auf Gemeindeebene mit dem Bezugsrahmen Sachsen.
Variablen und Variablenausprgungen
Die Datenstze enthalten folgende Merkmale:
- Information zur regionalen Einheit (IDs und Namen)
- GISD-Score
- GISD-Quintil fr den jeweiligen Bezugsrahmen
- GISD-Perzentil fr den jeweiligen Bezugsrahmen
- GISD-Kategorien
- Beobachtungsjahr
Die GISD-Daten enthalten die in der folgenden Tabelle abgebildeten Variablen und deren Ausprgungen:
| Variable |Typ | Ausprgung | Beschreibung |
|---|---|---|---|
|gemeindeid, gvbid, kreisid, nuts2id, rorid, plz2, plz3, plz4, plz5 | String | 01001
DE01
... |ID der regionalen Einheit basierend auf dem amtlichen Regionalschlssel fr Gemeinden, Gemeindeverbnde , Stadt- und Landkreise, NUTS-2, Raumordnungsregion sowie Postleitzahl 2-, 3-, 4-, 5-Steller|
|gisdscore |Dezimalzahl |0 bis 1 |Berechneter Score Soziokonomischer Deprivation fr die jeweilige Raumheinheit |
|gisd5 |Natrliche Zahl |1,2,3,4,5 |Zugewiesenes GISD-Quintil der Raumeinheit gem der jhrlichen Verteilung auf der jeweiligen rumlichen Ebene |
|gisd10 |Natrliche Zahl |1,2,3,4,5, 6,7,8,9,10 |Zugewiesenes GISD-Dezil der Raumeinheit gem der jhrlichen Verteilung auf der jeweiligen rumlichen Ebene |
|gisdk |Natrliche Zahl |1,2,3 |1 unterstes Quintil, 2 drei mittlere Qunitile, 3 oberstes Qunitil | |
|gemeindename, gvbname, kreisname, nuts2name, rorname | String |Flensburg, Stadt,Kiel, Landeshauptstadt, ..., Windischleuba | Name der Raumeinheit |
|year |Natrliche Zahl |1998 bis 2019 | Beobachtungsjahr | |
Formatierung der Daten
Die Daten sind im Datensatz als kommaseparierte .csv-Datei enthalten. Der verwendete Zeichensatz der .csv-Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",".
- Zeichensatz:
UTF-8 - Datumsformat:
ISO8601 - .csv-Trennzeichen:
,
Zustzlich wurden die Daten im Format .dta des Softwarepakets Stata v17 bereitgestellt.
Kontextmaterialien
Fr die Reproduzierbarkeit werden die Rohdaten aus der INKAR-Datenbank und die Syntax zur Generierung des GISD als Kontexmaterialien zur Verfgung gestellt.
Im Repositorium werden auerdem frhere Versionen (Releases) fr Replikationszwecke zum Download angeboten.
Metadaten
Zur Erhhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. ber GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Fr jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadaten-Ordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt ber Zenodo.org. Die fr den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben der Publikationsdatum ("publication_date") auch der Datenstand enthalten:
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Updates und Bugfixes
Aktualisierung & Bugfixes in der Version 2025-01-31:
- Die Aktualisierung fhrt eine neue GISD-Version GISDRelease2025_v1.0 ein.
- GISDRelease2025v1.0 ersetzt die GISD-Version GISDRelease2022v1.1 als aktuelles Release. GISDRelease2022_v1.1 wird dem Archiv hinzugefgt.
- Entsprechend wurden auch die Syntax zur Replikation der GISD Generierung und die Rohdaten aktualisiert.
- GISDRelease2025_v1.0 enthlt nun GISD-Scores fr die Jahre bis 2021. Im Zuge der Generierung wurden auch die Werte aller weiteren Jahre revidiert.
- Die GISD-Scores im GISDRelease2025_v1.0 differenzieren nun auf Gemeindeebene innerhalb von Gemeindeverbnden.
- In GISDRelease2025_v1.0 nimmt Glttungen von Ausreiern bei den Teildimensionen Beschftigung und Einkommen vor, die bisher zu Brchen in den Zeitreihen fr die Teildimensionen und fr den GISD gefhrt haben.
- Die Teilscores werden nun jahresweise normiert, bevor sie zum GISD-Score aufsummiert werden. Dadurch wird die Gleichgewichtung der Teildimensionen abgesichert.
- Die Zuordnung der Werte zu Postleitzahlbereichen wurde erneuert und verwendet nun amtliche PLZ-Daten.
- Neben der Revision der GISD-Scores in GISDRelease2025v1.0 wird auch GISDRelease2022v1.1 fortgefhrt und um die Jahre 2020 und 2021 ergnzt. Die Fortschreibung der GISDRelease2022v1.1 findet sich in der Version GISDRelease2022v1.2Fortschreibung. Sie wendet die Gewichtung der Indikatoren und den Gebietsstand (31.12.2019) aus der GISD-Version GISDRelease2022v1.1 auf die Rohdaten der Jahre 2020 und 2021 an.
Ergnzung & Bugfix in der Version vom 03.01.2024:
- Dem Archiv wurde die Version GISDRelease2022_v1.1 hinzugefgt
- Bei der Generierung der GISD-Scores fr die Postleitzahlebene blieben Postleitzahlen aus dem Kreis Gttingen unbercksichtigt. Die fehlenden Werte wurden eingefgt.
- Die Syntax zur Replikation der GISD Generierung wurde berarbeitet
- Die Rohdaten sind nun vollstndig verfgbar. In den frheren Versionen waren die Zeitreihen der Rohdaten fr die Indikatoren Beschftigte ohne Abschluss und Beschftigte mit akademischem Abschluss wegen unklarer Berechtigung der Weitergabe der Daten nicht vollstndig.
Ergnzung in der Version vom 26.5.2023:
- Dem Archiv wurde die Version GISDRelease2022_v0.1 hinzugefgt
Metadaten
Zur Erhhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. ber GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Fr jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt ber Zenodo.org. Die fr den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben dem Publikationsdatum ("publication_date") auch der Datenstand in folgendem Format enthalten (Beispiel):
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Hinweise zur Nachnutzung der Daten
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Lizenz
Der Datensatz "German Index of Socioeconomic Deprivation (GISD)" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfgbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verndern, Derivate des Datensatzes zu erstellen und sie fr kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.
<!-- FOOTER_END -->
Owner
- Name: Robert Koch-Institut
- Login: robert-koch-institut
- Kind: organization
- Location: Berlin
- Website: http://www.rki.de
- Twitter: rki_de
- Repositories: 16
- Profile: https://github.com/robert-koch-institut
Das RKI ist die zentrale Einrichtung der deutschen Bundesregierung auf dem Gebiet der Krankheitsüberwachung und -prävention.
GitHub Events
Total
- Create event: 1
- Issues event: 1
- Release event: 1
- Watch event: 4
- Issue comment event: 2
- Push event: 12
- Pull request review event: 1
- Pull request event: 3
Last Year
- Create event: 1
- Issues event: 1
- Release event: 1
- Watch event: 4
- Issue comment event: 2
- Push event: 12
- Pull request review event: 1
- Pull request event: 3
Committers
Last synced: about 2 years ago
Top Committers
| Name | Commits | |
|---|---|---|
| Hannes Wünsche | W****H@r****e | 12 |
| RKIOpenData | o****a@r****e | 5 |
| Knut Perseke | P****K@r****e | 2 |
| HannesWuensche | H****e | 1 |
| RKIOpenData | R****a | 1 |
Committer Domains (Top 20 + Academic)
Issues and Pull Requests
Last synced: 7 months ago
All Time
- Total issues: 1
- Total pull requests: 1
- Average time to close issues: 5 months
- Average time to close pull requests: 15 minutes
- Total issue authors: 1
- Total pull request authors: 1
- Average comments per issue: 3.0
- Average comments per pull request: 0.0
- Merged pull requests: 1
- Bot issues: 0
- Bot pull requests: 0
Past Year
- Issues: 1
- Pull requests: 1
- Average time to close issues: 5 months
- Average time to close pull requests: 15 minutes
- Issue authors: 1
- Pull request authors: 1
- Average comments per issue: 3.0
- Average comments per pull request: 0.0
- Merged pull requests: 1
- Bot issues: 0
- Bot pull requests: 0
Top Authors
Issue Authors
- lekroll (1)
Pull Request Authors
- RKIOpenData (1)
Top Labels
Issue Labels
Pull Request Labels
Dependencies
- robert-koch-institut/OpenData-Website main composite
- EndBug/add-and-commit v9.0.1 composite
- HannesWuensche/zenodo-new-version e0dd7918d62495e8d294984293c90b0dd544882f composite
- actions/checkout v3 composite
- actions/create-release v1 composite
- baileyjm02/markdown-to-pdf v1.2.0 composite
- kykrueger/zenodo-publish v1.0.5 composite