Analysen

In der den Analysen zu Grunde liegenden Studie werden die Daten der Volks- und Betriebszählungen von 1925 und 1933 ausgewertet, die es möglich machen, die Auswirkungen der Krise in der Region zu studieren. Sie liegen auf Ebene der kreisfreien Städte und Landkreise vor. Die Daten wurden von mir digitalisiert und stehen jetzt in einer umfangreichen Datenbank für die statistisch-geografische Auswertung zur Verfügung.

Wie kommen die Daten in den Computer?

Sie werden eingescannt und durch ein OCR-Programm in „maschinenlesbaren“ Code umgewandelt. Die Fehleranfälligkeit dieser Programme ist inzwischen verblüffend gering.

Wie stelle ich sicher, dass die Daten auch korrekt übertragen wurden?

Dafür habe ich ein kleines System auf excel-Basis entwickelt, das die Fehlersuche und Kontrolle mathematisch durchführt, durch gekreuzte Summenkontrolle. Dabei werden alle in den Daten vorhandene Zwischensummen (in den Zeilen und Spalten) mit den Summen der Einzeldaten verglichen, wobei auch der Vergleich nicht optisch sondern durch Subtraktion der Summen erfolgt. Das ist viel sicherer, da Zahlendreher und ähnliches viel zu leicht übersehen werden.

Wie werden die Zahlen in Diagramme umgewandelt?

Das ist völlig unproblematisch, denn dafür kann man auf die in Excel angebotenen Grafikfunktionen zurückgreifen.

Wie werden die Daten in Karten umgewandelt?

Dafür gibt es auch Programme, aber die basieren fast immer auf aktuellem Kartenmaterial. Deshalb musste ich für diese historischen Karten ein eigenes Programm entwickeln (mit Hilfe der Programmiersprache Excel-VBA). Dabei waren mir einige auf you-tube angebotene Tutorials sehr hilfreich. Excel-VBA hat gegenüber anderen Programmiersprachen zwei enorme Vorteile. Zum einen kann man das ganze komplizierte Variablen-Management in die Tabellen verlagern. Zum anderen gibt es die Macro-Programmierung, wo man Vorgänge einfach durchführt und aufzeichnen lässt, um dann den dabei eingesetzten Code zu studieren und an die eigenen Ziele anzupassen.

Die Skalierung der Daten in den Karten kann durch frei wählbare, fixe oder flexible Schwellenwerte erfolgen. Standardmäßig verwende ich flexible Schwellen in Fünfer-Unterteilungen („Quintile“), die jedoch nicht gleich groß sind, sondern die durch einen kleinen Algorithmus an die jeweiligen Variablen angepasst werden. Dieser stellt sicher, dass das mittlere Quintil immer um den Mittelwert schwankt („oszilliert“).

Sind die Daten aus unterschiedlichen Volks- und Betriebszählungen überhaupt vergleichbar?

Was die Volkszählungen betrifft, so ist dies kein Problem, wohl aber bei den Betriebszählungen. 1933 wurden manche Branchen (z.B. das Gesundheitswesen) gar nicht mehr erfasst, andere wurden aufgeteilt, oder neu zusammengestellt. Auch das ist meist ein lösbares Problem, am kompliziertesten ist die Situation beim Handel. Doch enthalten die Zählungen immer auch die Angaben für die Untergruppierungen (Sparten) innerhalb der Branche, sodass man – mit einem gewissen Aufwand – die Vergleichbarkeit herstellen kann, auch für den Handel.