Stichprobenmethodischer Ansatz
Die methodischen Anforderungen, die an die Stichprobenziehung und damit an das Stichprobendesign zu stellen sind, leiten sich aus dem inhaltlichen Erkenntnisinteresse des Forschungsprojekts ab. Ziel und Zweck ist es demnach, den strukturell weitestgehend unbekannten Nichtwohngebäudebestand Deutschlands flächendeckend hinreichend genau zu beschreiben.
Die zu ziehende Stichprobe muss deshalb so konzipiert sein, dass sie „repräsentativ“ ist, also einen erwartungstreuen und damit unverzerrten Rückschluss auf die unbekannten Verhältnisse der Grundgesamtheit – die Gesamtheit aller Nichtwohngebäude in Deutschland – zulässt. Ein solcher Rückschluss ist naturgemäß mit Unsicherheit behaftet. Diese Unsicherheit sollte bei gegebenem Stichprobenumfang zum einen so niedrig wie möglich sein. Zum anderen ist das verbleibende Ausmaß an Ergebnisunsicherheit zu quantifizieren. Alle drei Ziele, also Repräsentativität, Minimierung und Quantifizierung der stichprobenbedingten Ergebnisunsicherheit zu erreichen, entspricht nicht nur dem wissenschaftlichen Standard, sondern ist in dem Maße wichtig, in dem die aus der Stichprobe abgeleiteten Ergebnisse direkt oder indirekt (über weiterführende Forschungsanstrengungen) weitreichende Entscheidungen, z.B. in der politischen Steuerung der Energiewende im Gebäudebereich, nach sich ziehen.
Ein erwartungstreuer Rückschluss von einer Nichtwohngebäudestichprobe auf die Verhältnisse der Grundgesamtheit aller Nichtwohngebäude sowie die damit einhergehende Quantifizierung der Ergebnisunsicherheit sind nur möglich, wenn
- über die Aufnahme eines Nichtwohngebäudes in die Stichprobe allein der Zufall entscheidet,
- die Ziehungswahrscheinlichkeiten aller Stichprobengebäude bekannt sind (ohne dass diese Wahrscheinlichkeiten identisch sein müssen) und
- vom Grundsatz her jedes Nichtwohngebäude in Deutschland eine Chance (d. h. positive Wahrscheinlichkeit) auf Aufnahme in die Stichprobe hat.
Nur wenn diese drei Kriterien gemeinsam erfüllt sind, kann Repräsentativität im statistischen Sinne erreicht und die Ergebnisunsicherheit quantifiziert werden. Es ist ein zentrales Ziel des Forschungsvorhabens, genau dies zu leisten. Neben den Zielen der
- Repräsentativität und der
- Quantifizierung und Minimierung der stichprobenbedingten Ergebnisunsicherheit
ist ein weiteres Kriterium an das Stichprobenkonzept anzulegen, nämlich
- eine befriedigende deutschlandweite Flächenabdeckung der Stichprobengebäude sicherzustellen,
denn nur dann sind eigenständige landesteilspezifische Auswertungen möglich.
Die Stellschrauben des stichprobenmethodischen Konzepts zur Erreichung dieser Ziele bzw. zur Erfüllung der Kriterien sind Festlegungen im Hinblick auf
- die Auswahlgrundlage für die Stichprobenziehung,
- das Ziehungsverfahren,
- den Stichprobenumfang und
- die Strategien zum Umgang mit Antwortausfällen (Unit Nonresponse).
-
Auswahlgrundlage
Da es keine Adressliste oder -datenbank aller Nichtwohngebäude Deutschlands gibt, erfolgt die Stichprobenziehung auf der Grundlage einer vom Projektpartner IÖR aufgebauten Geodatenbank (GDB) von aufbereiteten Hausumringen (HU-DE). Trotz der erhebungspraktischen und methodischen Vorzüge eines Rückgriffs auf Hausumringe sind damit im Wesentlichen jedoch drei Problemen verbunden, die es zu lösen gilt.
Erstens bestehen zwischen Hausumringen als Erhebungseinheiten und Nichtwohngebäuden als Untersuchungseinheiten nicht notwendigerweise wechselseitig eindeutige Beziehungen. Vielmehr ist zu erwarten, dass in nicht wenigen Fällen mehrere Hausumringe zum selben Gebäude gehören oder umgekehrt ein Hausumring mehrere Gebäude umschließt. Dies macht es erforderlich, zunächst das spezifische Beziehungsgeflecht zwischen dem gezogenen Hausumring und dem (bzw. den) dahinter stehenden Nichtwohngebäude(n) zu identifizieren und ausgehend vom jeweiligen Beziehungsgeflecht die den Hausumringen zugeordneten Ziehungswahrscheinlichkeiten auf Nichtwohngebäude umzurechnen.
Zweitens stehen nur für einen Teil der Hausumringe LOD1-Daten und über diese Informationen zur Gebäudefunktion zur Verfügung. Aber auch diese Informationen erlauben nur bedingt eine trennscharfe und sichere Unterscheidung zwischen tatsächlicher Wohn- und tatsächlicher Nichtwohngebäudenutzung. Die Frage, ob ein Hausumring zu einem untersuchungsrelevanten Nichtwohngebäude oder aber zu einem untersuchungsirrelevanten Wohngebäude gehört, lässt sich mit LOD1-Daten nicht mit abschließender Sicherheit beantworten.
Drittens liegen keinerlei Angaben zu geeigneten Gebäudeansprechpartnern vor.
Die Lösung der skizzierten Probleme besteht in einer Vor-Ort-Begehung der in die Stichprobe aufgenommenen Hausumringe. Es wird daher eine Screening-Phase vorgeschaltet, die der Projektpartner BUW durchführt. Eine solche Vor-Ort-Begehung ist allerdings mit Aufwand verbunden, den es auf ein notwendiges Mindestmaß zu begrenzen gilt. Die hierzu ergriffenen Maßnahmen stellen sich wie folgt dar.
Die gezogene Hausumring-Stichprobe wird so konzipiert, dass am Ende des Screenings eine vorab kalkulierte Mindestzahl an identifizierten Nichtwohngebäuden vorliegt. Dies ist jedoch nur möglich, wenn jedem Hausumring der Geodatenbank eine Wahrscheinlichkeit zugewiesen wird, mit der es sich um ein Nichtwohngebäude handelt. Dies gilt vor allem für Hausumringe, für die keine (bzw. keine aussagekräftigen) LOD1-Daten und damit keine Informationen zur Gebäudefunktion vorliegen. Die gebotene Wahrscheinlichkeitszuspielung erfolgt im Rahmen einer binär-logistischen Regressionsimputation. Dabei handelt es sich um ein statistisches Verfahren, dessen Ergebnis eine Schätzgleichung ist, durch die jedem beliebigen Hausumring in Abhängigkeit von angereicherten Merkmalen die Wahrscheinlichkeit für die Zugehörigkeit zum Nichtwohngebäudesektor zugeordnet werden kann. Die Anreicherung mit diversen Merkmalen fällt dabei in den Aufgabenbereich des Projektpartners IÖR. Die Ermittlung der benötigten Schätzgleichung erfordert für eine ausreichende Zahl von Hausumringen Realdaten, d. h. Feststellungen, ob es sich tatsächlich jeweils um ein Nichtwohngebäude handelt. Als Realdaten werden diejenigen Hausumringe herangezogen, für die im Hinblick auf die Unterscheidung zwischen Wohn- und Nichtwohnnutzung besonders aussagekräftige LOD1-Daten vorliegen.
Zur Reduzierung der Wegekosten der Erhebungspersonen wird ein zweistufiges Ziehungsverfahren installiert, bei dem auf der ersten Ziehungsstufe zunächst deutschlandweit eine ausreichende Zahl von relativ eng geschnittenen Erhebungsbezirken und erst auf der zweiten Ziehungsstufe Hausumringe innerhalb dieser Erhebungsbezirke zufällig ausgewählt werden. Die Zufallsauswahl von Erhebungsbezirken bedingt die vorherige Zerlegung der Fläche Deutschlands in überschneidungsfreie Erhebungsbezirke, für die der Projektpartner IÖR verantwortlich zeichnet. Auch wenn sich der räumliche Zuschnitt der Erhebungsbezirke primär am Ziel der Wegekostenminimierung orientiert, bleiben dabei aber stichprobenmethodische Aspekte nicht außen vor. Denn aus stichprobenmethodischen Gründen (Minimierung der Ergebnisunsicherheit und damit der Stichprobenfehler) wird dafür Sorge getragen, dass die zu bildenden Erhebungsbezirke im Erwartungswert ungefähr dieselbe Zahl von Nichtwohngebäuden umfassen, wofür auf die beschriebene Wahrscheinlichkeitsanreicherung der Hausumringe zurückgegriffen wird.
Es gibt somit zwei eigens für das Projekt erstellte Auswahlgrundlagen für die Stichprobenziehung, zum einen eine Liste von Erhebungsbezirken und zum anderen eine Geodatenbank aufbereiteter Hausumringe.
-
Ziehungsverfahren
Die Stichprobenziehung erfolgt zweistufig. Auf der ersten Ziehungsstufe wird eine Zufallsstichprobe von Erhebungsbezirken gezogen und auf der zweiten Ziehungsstufe innerhalb zuvor ausgewählter Erhebungsbezirke eine Zufallsstichprobe von Hausumringen. Erhebungsbezirke fungieren somit als primäre Erhebungseinheiten (primary sampling units) und Hausumringe als sekundäre Erhebungseinheiten (secondary sampling units).
Damit die zu ziehende Erhebungsbezirksstichprobe keine regionale Schieflage aufweist, wird die Stichprobe der Erhebungsbezirke nach Landesteilen geschichtet gezogen, d. h. die Gesamtheit aller potentiellen Erhebungsbezirke wird nach Landesteilen gruppiert und aus jeder Gruppe wird eine eigene Stichprobe gezogen.
Auch die Stichprobenziehung von Hausumringen auf der zweiten Ziehungsstufe innerhalb eines zuvor ausgewählten Erhebungsbezirks erfolgt geschichtet. Ein Schichtungskriterium sind in jedem Fall klassifizierte Wahrscheinlichkeiten für die Zugehörigkeit zum Nichtwohngebäudesektor, da nur so vorab sichergestellt werden kann, dass in der gezogenen Stichprobe eine kalkulierbare Mindestzahl von Nichtwohngebäuden enthalten ist. Gegebenenfalls treten zu diesen noch weitere Schichtungskriterien hinzu, beispielsweise Indikatoren zur Unterscheidung bestimmter Nichtwohngebäudetypen.
-
Stichprobenumfänge
Die Festlegung der Stichprobenumfänge ergibt sich aus dem Ziel, die Strukturen und Entwicklungstendenzen im Nichtwohngebäudesektor differenziert offen zu legen. Insbesondere die typischerweise im unteren einstelligen Prozentbereich liegenden, bauteilbezogenen energetischen Modernisierungsquoten sollen mit noch vertretbarer statistischer Unsicherheit bestimmt werden. Hierfür wird eine Fallzahl von 10.000 zu erhebenden Nichtwohngebäuden als erstrebenswert angesehen. Die entsprechenden Informationen werden im Rahmen der nach dem Screening zweiten Stufe der Erhebung, der Breitenerhebung, in kombinierten Telefon- und Online-Interviews durch den Unterauftragnehmer IFAK erhoben.
Aus der Zielvorgabe von 10.000 zu generierenden Gebäudedatensätzen leitet sich aufgrund zu erwartender Gebäudeausfälle (Unit Nonresponse) die Notwendigkeit ab, im Screening mindestens 50.000 untersuchungsrelevante Nichtwohngebäude zu identifizieren. Die Unmöglichkeit, einen Hausumring ex ante eindeutig als zu einem Nichtwohngebäude gehörend zu identifizieren, impliziert jedoch einen Stichprobenumfang für das Screening und damit für die zweite Ziehungsstufe, der deutlich über 50.000 Screening-Fälle hinausgeht. Konkret sollen im Screening 100.000 Hausumringe vor Ort aufgesucht werden.
Zur Reduzierung des Klumpeneffekts, d. h. des sich negativ auf die Ergebnissicherheit auswirkenden Effekts der räumlichen Konzentration der zu erhebenden Hausumringe auf eine begrenzte Zahl von Erhebungsbezirken, verteilen sich die 100.000 Hausumringe gleichmäßig auf eine ausreichend große, aber organisatorisch und kostenmäßig noch zu steuernde Zahl von 500 Erhebungsbezirken. Für jeden Erhebungsbezirk werden somit 200 Hausumringe zufällig ausgewählt. Dabei wird ziehungstechnisch, d. h. durch Schichtung unter Rückgriff auf die erwähnte Wahrscheinlichkeitszuspielung, dafür Sorge getragen, dass unter diesen Hausumringen im Erwartungswert jeweils mindestens 100 Nichtwohngebäude enthalten sind, so dass im Zuge des Screenings in allen 500 Erhebungsbezirken zusammengenommen mindestens 50.000 Nichtwohngebäude identifiziert werden.
Zur Erhebung von Energieverbrauch und -bedarf ist ein deutlich kleineres Erhebungssoll von bis zu 1.000 Gebäuden ausreichend, zumal die Erhebung der entsprechenden Daten mit einem ungleich höheren Aufwand verbunden ist, und zwar in Bezug auf die benötigte Interviewdauer als auch in Bezug auf die Fachkompetenz des Interviewers. Die Gebäude mit Erhebung von Energieverbrauch und -bedarf sollen aus der Menge derjenigen Gebäude stammen, über die Daten aus der Breitenerhebung vorliegen.
Es ergeben sich für die beiden Ziehungsstufen sowie innerhalb der zweiten Ziehungsstufe für die einzelnen Befragungsphasen folgende Stichprobenumfänge:
1. Ziehungsstufe:
- Zufallsauswahl von 500 Erhebungsbezirken
2. Ziehungsstufe:
- Screening: Zufallsauswahl von 100.000 aufbereiteten Hausumringen
- Breitenerhebung: Datenerhebung in bis zu 10.000 Nichtwohngebäuden
- Tiefenerhebung: Datenerhebung in bis zu 1.000 Nichtwohngebäuden
-
Strategien zum Umgang mit Nonresponse
Wie alle Befragungen mit freiwilliger Teilnahmeoption wird auch die Breitenerhebung von Nichtwohngebäuden trotz aller Anstrengungen erfahrungsgemäß nicht von Ausfällen (Unit Nonresponse) verschont bleiben. Die hier verfolgte Strategie ist dabei, auch von den erfolglos „kontaktierten“ Nichtwohngebäuden einige Basismerkmale zu erheben, um auf diese Weise systematische und damit verzerrende Ausfälle identifizieren und bei Bedarf durch den Einsatz geeigneter Gewichtungsverfahren stichprobenmethodisch kompensieren zu können. Die Erhebung dieser Basismerkmale ist eine weitere Aufgabe des Screenings.
Aus erhebungsmethodischer Sicht kommen dem Screening zusammenfassend somit folgende Aufgaben zu:
- Relevanzfeststellung für die sich anschließende Breitenerhebung,
- Recherche von Gebäudenutzer- bzw. Gebäudeeigentümerangaben zur leichteren Recherche geeigneter Ansprechpartner für die Breitenerhebung und
- Sammeln von Gebäudebasismerkmalen zur Identifizierung und ggf. Korrektur von systematischen und damit verzerrenden Gebäudeausfällen bei der Breitenerhebung.
Gleichzeitig erlaubt das Sammeln von Gebäudebasismerkmalen eigenständige und – dank des großen Stichprobenumfangs – statistisch in besonderem Maße belastbare Hochrechnungen auf die Grundgesamtheit der Nichtwohngebäude in Deutschland.