Zum Oldenbourg Wissenschaftsverlag

Titelbild zum Beitrag: Zu Beginn das Eis brechen
.

Zu Beginn das Eis brechen

Wissenswertes zur Fragebogenentwicklung

Ein Fragebogen ist weit mehr als eine Ansammlung von Fragen. Er ist ein Instrument, um letztendlich genau das zu messen, was auch gemessen werden soll. Hierfür muss eine Dramaturgie beim Entwickeln beachtet werden: Am Beginn gilt es das Eis zu brechen, heikle Fragen nie zu Anfang stellen und das Alter eher zum Schluss erfragen. Mehr Wissenswertes über Fragebögen und warum man Befragten keine Möglichkeit zur Flucht geben sollte, erklärt ein Professor aus Vorarlberg.

Von Professor Dr. Horst Otto Mayer, Fachhochschule Vorarlberg

.

PDFDiesen Beitrag als PDF.

.

Fragebogen werden allzu oft ohne Berücksichtigung von Regeln entwickelt. Das Resultat ist meist die Aneinanderreihung von irgendwie als relevant erscheinenden Fragen. Häufig wird also befragt, ohne zu wissen, was man eigentlich genau will. Die Ergebnisse solcher Befragungen sind dann zufällig - mehr noch, sie sind willkürlich.

Ein Fragebogen stellt ein Messinstrument dar. Er muss deswegen entsprechend sorgsam entwickelt werden. Unabhängig von der Forschungsfrage ist es sinnvoll und zugleich hilfreich, bei der Entwicklung eines Fragebogens eine strukturierte Vorgehensweise zu wählen. Doch welche Vorgehensweise ist dabei sinnvoll?[1] 

Vor der Entwicklung eines Fragebogens ist es unerlässlich, den Untersuchungsgegenstand genauer zu analysieren. Es geht darum, die wichtigsten Einflussgrößen sowie Auswirkungen zu benennen, relevante Begriffe zu definieren und nicht direkt beobachtbare Variablen dimensional aufzulösen. So können zum Beispiel der Variablen "Kundenzufriedenheit mit den Verkaufspersonal" unter anderem die Dimensionen „Freundlichkeit" und „Kompetenz" zugeordnet werden.

Das Geflecht der Beziehungen

Hilfreich für die Entwicklung eines Fragebogens und dessen Auswertung ist es, die relevanten Variablen in einem Messmodell zusammen zu fassen. Ein Messmodell, auch als Kausalmodell oder im Englischen als Theoretical Model bezeichnet, stellt die Beziehung der Variablen zueinander dar. Es handelt sich dabei gewissermaßen um die grafische Darstellung des (vermuteten) Beziehungsgeflechts. Das Messmodell beinhaltet jedoch immer nur einen - allerdings für die Forschungsfrage als relevant gehaltenen - Ausschnitt der Wirklichkeit. Genauer gesagt, handelt es sich um einen Ausschnitt der Vorstellung von der Wirklichkeit.

Ein Beispiel: Im Rahmen einer Untersuchung gilt es, die „Kundenzufriedenheit" sowie deren Einflussgrößen, also die so genannten Determinanten, und Auswirkungen zu erforschen. Aus anderen Untersuchungen, dem Literaturstudium und Felderkundungen wurden folgende Aspekte als wesentlich erachtet:

 

Vermutungen (Hypothesen) in diesem Beispiel könnten sein: Je höher das Alter, desto größer die Kundenzufriedenheit. Je größer die Kundenzufriedenheit, desto wahrscheinlicher wird das Geschäft weiter empfohlen etc.

Oft unreichend: Messen mittels Meterstab

Die einzelnen in einem Messmodell verwendeten Variablen müssen operationalisiert, das heißt messbar gemacht werden. Die Operationalisierung eines Begriffes besteht in der Angabe, wie Sachverhalte, die der Begriff bezeichnet, gemessen werden können (vgl. Mayer 2008 sowie Schnell u.a. 1999, S. 121). So kann ein Begriff wie zum Beispiel „Körpergröße" durch die Anweisung „Messung mittels Meterstab" operationalisiert werden oder durch die Anweisung „Aufstellen in einer Reihe nach der Größe".

Bei der Körpergröße handelt es sich um eine direkt wahrnehmbare, also manifeste, Variable. Schwieriger wird es jedoch bei solchen Variablen, die nur indirekt wahrnehmbar sind - so genannte latente Variablen. Hierzu zählen unter anderem die Einstellung, das Image, das Involvement oder die Kundenzufriedenheit. Zur Messung dieser latenten Variablen ist eine gedankliche Hilfskonstruktion notwendig, die die Beziehung zwischen latenten Variablen und den beobachtbaren Indikatoren, den manifesten Variablen, angibt (vgl. Denz 1989, S. 9 sowie Schnell u.a. 1999, S. 125). 

Gibt es eine Skala für Zufriedenheit?

Vielfach setzen sich theoretische Begriffe aus mehreren Dimensionen zusammen. So kann beispielsweise der theoretische Begriff „Produktzufriedenheit" mit einem Waschmittel als eine zweidimensionale Eigenschaft bestehend aus den zwei Teildimensionen „Waschkraft" und „Hautverträglichkeit" aufgefasst werden. Diese beiden Teildimensionen stellen Indikatoren des Begriffes „Produktzufriedenheit" dar. Die „Produktzufriedenheit" ist erst dann vollständig erfasst, wenn die Merkmalsausprägung auf beiden Teildimensionen ermittelt worden ist. (vgl. Berekhoven u.a. 1999, S. 77)

Ähnlich verhält es sich mit dem theoretischen Begriff „Kundenzufriedenheit". Die Zufriedenheit von Kunden kann von verschiedenen Faktoren, wie dem Preis, dem Produktangebot, dem Verkaufspersonal aber auch zum Beispiel der Parkplatzsituation abhängig sein. Die relevanten Dimensionen müssen von Fall zu Fall entwickelt werden. Dabei ist es wichtig und hilfreich, sich auf die Fachliteratur und andere ähnliche Untersuchungen zu beziehen.

Der Zusammenhang zwischen theoretischem Begriff, Dimensionen, Variablen, Indikatoren, Items und Skalen am Beispiel "Kundenzufriedenheit" wird in der folgenden Abbildung dargestellt:

 

Zu beachten ist auch, dass es sich bei theoretischen Begriffen wie beispielsweise „Kundenzufriedenheit" um hypothetische Konstrukte handelt. Es sind dies Vorstellungen über die Wirklichkeit und nicht die Wirklichkeit als solche. Gemessen werden somit die Indikatoren von theoretischen Begriffen. Man erhält daher lediglich indirekt Aussagen zu den Vorstellungen und nicht zu tatsächlich existierenden Gegenständen.

Skala ist nicht gleich Skala

Ein wesentlicher Aspekt bei der Frageformulierung ist das Skalenniveau der dadurch gewonnenen Daten. Die Skalenniveaus lassen sich in die folgenden vier Kategorien einteilen: Nominalskalen, Ordinalskalen, Intervallskalen und Ratioskalen. Für jede Skalenart gelten bestimmte mathematische Eigenschaften. Auch hängt der Informationsgehalt der Daten ganz wesentlich von ihrem Messniveau ab. So besteht für Daten auf Nominalskalenniveau lediglich die Möglichkeit, sie auf ihre Gleichheit hin zu unterscheiden (zum Beispiel männlich oder weiblich). Daten auf Ordinalskalenniveau bieten zusätzlich die Möglichkeit einer Rangordnung (z.B. Unterschicht, Mittelschicht, Oberschicht).

Bei Daten auf Intervallskalenniveau sind die Abstände (Intervalle) zwischen den einzelnen Merkmalsklassen gleich groß. Daten auf Ratioskalenniveau haben neben der Unterscheidungs- und Rangordnungsmöglichkeit sowie der gleichen Intervallgröße einen absoluten Nullpunkt. Der Messwert Null entspricht der tatsächlichen Abwesenheit des Merkmals. Daten auf Intervall- sowie Ratioskalenniveau werden vielfach auch als quantitative bzw. metrische Daten bezeichnet (vgl. Berekhoven u.a. 1999, S. 71 sowie Denz 1989).


Celsius und Kelvin

Die Kelvinskala ist eine Ratioskala. So entspricht die Temperatur von 0 Kelvin dem absoluten Nullpunkt, d.h. es ist keine Temperatur mehr vorhanden. 0º C hingegen stellt keinen absoluten Nullpunkt dar. 20 Kelvin sind doppelt so warm wie 10 Kelvin. Dies gilt bei der Celsiusskala nicht. 


Mit zunehmendem Messniveau steigen die Aussagekraft und der Informationsgehalt der Daten. Die zentrale Bedeutung der mathematischen Eigenschaften der Skalenniveaus ist, dass sie auch die Rechenmöglichkeiten bestimmen. Alle statistischen Verfahren in der Datenauswertung richten sich nach dem Skalenniveau. Erinnern wir uns an das oben angeführte Beispiel mit der Körpergröße: Sie kann beispielsweise durch die Anweisung „Messung mittels Meterstab" operationalisiert werden oder durch die Anweisung „Aufstellen in einer Reihe nach der Größe". Im ersten Fall haben die Daten ein Ratioskalenniveau, es kann zum Beispiel der arithmetische Mittelwert der Körpergröße berechnet werden. Im zweiten Fall haben wir es mit Daten auf Ordinalskalenniveau zu tun. Die Berechnung des arithmetischen Mittelwertes ist hier nicht zulässig.[2]

Richtig fragen: geschlossen, offen und halboffen

Hinsichtlich der Antwortvorgaben wird zwischen offenen, halboffenen und geschlossenen Fragen unterschieden (vgl. Diekmann 2000, S. 408). Bei einer offenen Frage sind keine Antwortvorgaben vorhanden. Geschlossene Fragen verlangen vom Befragten sich zwischen Antwortalternativen zu entscheiden. Dabei ist zu beachten, dass die Zahl der Antwortalternativen für den Befragten überschaubar bleibt. Die vorgegebenen Antwortmöglichkeiten müssen jedoch erschöpfend sein. Ist eine erschöpfende Aufzählung der Antwortalternativen nicht möglich, dann muss eine Kategorie „Sonstige" vorgesehen werden. Diese Frageform wird als halboffene Frage oder Hybridfrage bezeichnet (vgl. Diekmann 2000, S. 409). Die Befragten müssen in der Kategorie „Sonstiges" wie bei einer offenen Frage die entsprechende Antwort verbalisieren.

Die vorgegebenen Antwortmöglichkeiten bei geschlossenen und halboffenen Fragen können so formuliert sein, dass nur eine Antwort sinnvoll ist oder sie ermöglichen Mehrfachnennungen, das heißt das gleichzeitige Ankreuzen mehrerer Antwortvorgaben. Die Tatsache, dass Mehrfachnennungen möglich sind, muss in der Fragestellung angegeben werden.


Macht vieles bei der Auswertung leichter: Geschlossene Fragen

Aus der Sicht der Fragebogenauswertung sind geschlossene Fragen den offenen vorzuziehen. Bei den offenen Fragen müssen die verschiedenen Antworten erst in Kategorien eingeteilt werden, ehe eine Auswertung möglich ist. Dazu müssen oft viele Fragebögen durchgesehen werden, um zu erkennen, wie die Kategorien gebildet werden können (vgl. Mayntz u.a. 1978, S. 109).


Welche Antwortvorgaben bei Rating-Skalen?

Eine in der Marktforschung sehr häufig verwendete Antwortvorgabe bei geschlossenen Fragen ist die Rating-Skala (vgl. Berekhoven u.a. 1999, S. 72). Es geht hier darum, dass die Befragten die subjektiv empfundenen Ausprägungen eines Merkmales (zum Beispiel das Produkt wirkt modern) angeben (zum Beispiel von „stimme stark zu" bis „lehne stark ab" oder von „trifft absolut zu" bis „trifft überhaupt nicht zu" etc.). Bei der Verwendung von Rating-Skalen sind immer wieder die folgenden zwei Fragen zu beantworten: Die Frage nach der Anzahl der Antwortvorgaben sowie die Frage, ob gerade oder ungerade Antwortvorgaben verwendet werden sollen.

Genau genommen liefern Rating-Skalen lediglich ordinale Daten. Bei einer genügend großen Anzahl von Ausprägungen kann jedoch angenommen werden, dass die Abstände auf der Skala von den Befragten als gleiche Intervalle aufgefasst werden (vgl. Holm 1986, S. 43 ff. sowie Berekhoven u.a. 1999, S. 74). Daher sollte das Antwortschema einerseits möglichst fein gehalten werden, jedoch darf man dabei andererseits das Differenzierungsvermögen der Befragten nicht überfordern. Die häufig verwendeten Antwortvorgaben mit fünf bis sieben Ausprägungen erfüllen in der Regel beide Anforderungen (vgl. Nieschlag u.a. 1994, S. 693 f.). Mit diesen Skalen gewonnene Daten entsprechen weitgehend den Voraussetzungen für ein Intervallskalenniveau. 

Die Flucht in die Mitte

Ob eine gerade oder eine ungerade Anzahl von Antwortvorgaben gewählt werden soll, hängt von verschiedenen Umständen ab. Die Mittelkategorie von Antwortvorgaben wird oft als Fluchtkategorie bezeichnet. Befragte flüchten sich in diese Kategorie („teils/teils", „weiß nicht" etc.), entweder aus Unsicherheit oder um eine tatsächlich vorhandene, aber sozial inopportune Haltung zu verbergen. Ist jedoch zu befürchten, die Befragten können oder wollen sich nicht entscheiden, so wählt man eine ungerade Anzahl von Antwortvorgaben, um Antwortverweigerungen oder gar Abbrüche zu vermeiden. Ist eine Entscheidung für Befragte in der Regel problemlos möglich und sind neutrale Antwortvorgaben nicht von Interesse bzw. soll eine „Flucht" verhindert werden, so ist es sinnvoll, gerade Antwortvorgaben zu verwenden (vgl. Holm 1986, S. 59).  


Wissenswertes zu Fragen

Für die Frageformulierung selbst geben Schnell u.a. (1999, S. 312 f.) verschiedene Regeln an (siehe dazu auch Kirschhofer-Bozenhardt u. Kaplitza 1986, S. 98). Danach sollen Fragen

  1. einfache Worte enthalten (keine Fachausdrücke oder Fremdwörter);
  2. kurz formuliert sein;
  3. konkret sein;
  4. keine bestimmten Antworten provozieren (Vermeidung von Suggestivfragen);
  5. keine belasteten Worte wie „Bürokrat", „Boss", „Ehrlichkeit" etc. enthalten;
  6. nicht hypothetisch formuliert werden (Beispiel: „Angenommen, sie würden im Lotto gewinnen, ...");
  7. sich nur auf einen Sachverhalt beziehen;
  8. keine doppelte Verneinung enthalten;
  9. den Befragten nicht überfordern (Beispiel: „Wie viel Prozent Ihres monatlichen Einkommens geben Sie für Nahrungsmittel aus?");
  10. zumindest formal „balanciert" sein (negative und positive Antwortmöglichkeiten sollten für den Befragten gleichwertige Berechtigung haben, beispielsweise „stimme stark zu" oder „lehne stark ab".


Die Beantwortung von Fragen kann durch verschiedene psychologische Effekte verfälscht werden. Einen solchen psychologischen Effekt stellt die soziale Wünschbarkeit dar (vgl. Edwards 1957 sowie Holm 1986, S. 82 ff.). Dabei handelt es sich um die Abgabe sozial erwünschter Antworten durch den Befragten wie z.B. die Untertreibung des eigenen Alkohol- oder Zigarettenkonsums. 

Der Fragebogen und seine Dramaturgie

Am Beginn des Fragebogens ist in der Regel das Ziel der Untersuchung zu beschreiben sowie die voraussichtliche Dauer der Befragung, die fragende Institution und gegebenenfalls das Datum für eine Rücksendung. Auch eine E-Mail-Adresse, beispielsweise für Rückfragen, ist anzugeben.

Die eigentliche Befragung sollte mit keinen heiklen Fragen begonnen werden, sondern solchen, die das Interesse der Befragten wecken. Einleitungsfragen werden auch Eisbrecherfragen genannt. Sie haben die Aufgabe, ein Vertrauensklima zu erzeugen und die Antwortbereitschaft auf die eigentlichen Befragungsthemen zu erhöhen. 

Demographische Fragen nach Alter, Geschlecht etc. sollten eher nicht als Einleitungsfragen verwendet werden. Eine solche Einführung lässt die Befragten zu lange im Unklaren über den Inhalt der Befragung. Es ist vorteilhaft, Fragen nach demographischen Merkmalen am Ende des Fragebogens zu platzieren, da hier manchmal Ermüdungen auftreten können, das heißt das Interesse an den Fragen oder der Befragungssituation lässt nach. Die Befragten sind dann in der Regel eher bereit, Fragen zur Person zu beantworten.

Fragen zum gleichen Themenkreis sollten nacheinander folgen, damit die Befragten nicht zu ständigen Gedankensprüngen gezwungen sind. Dabei kommt das Allgemeine vor dem Besonderen, das Vertraute vor dem Unvertrauten, das Einfache vor dem Komplizierten. Zum Teil werden neue Themenkomplexe mit so genannten Überleitungsfragen eingeleitet. Oft ist es notwendig, neue Themenkomplexe mit Erklärungen bzw. Aufforderungen einzuleiten. 

Auf die richtige Reihenfolge kommt es an

Bei der Anordnung der Fragen sind auch psychologische Aspekte zu berücksichtigen. So können Fragen die Beantwortung nachfolgender Fragen beeinflussen (Halo-Effekt). Einmal wird dieser Halo-Effekt dadurch hervorgerufen, dass jede Frage durch andere Fragen in einen Sinnzusammenhang gestellt wird und andererseits durch das Bemühen des Befragten, seine Antworten konsistent zu halten (vgl. Schnell u.a. 1999, S. 320). Es kann beispielsweise davon ausgegangen werden, dass die Frage, ob jemand gläubiger Katholik ist, die nachfolgende Frage nach der Einstellung zum Schwangerschaftsabbruch beeinflusst.


Ausstrahlungen vermeiden

Der Halo-Effekt wird in Anlehnung an den Hof des Mondes auch als Hofeffekt bezeichnet und meint eine verzerrende Urteilstendenz. Bei der Fragebogenentwicklung bedeutet dieser Effekt, dass eine Frage auf eine nachfolgende Frage ausstrahlen und deren Beantwortung beeinflussen kann. 


Eine maximale Dauer der Befragung ist nur schwer anzugeben, da diese unter anderem von der Betroffenheit und der momentanen Verfassung der Befragten, der Bedeutung des Auftraggebers für die Befragten, etc. abhängt. Da viele Einflussfaktoren nicht bekannt sind, kann lediglich eine Faustregel angegeben werden, nach der die Dauer einer Befragung einen Zeitraum von 40 Minuten möglichst nicht überschreiten soll (vgl. Kirschhofer-Bozenhardt u. Kaplitza 1986, S. 94 sowie Noelle-Neumann u. Petersen 1998, S. 125 ff.). 


Fragebogen kürzer erscheinen lassen

Es ist nicht immer leicht den Fragebogen kurz zu halten und dennoch die Problemstellung umfassend zu behandeln. Um das Interview kürzer erscheinen zu lassen, kann mit zwei Abschlüssen gearbeitet werden (vgl. Kirschhofer-Bozenhardt u. Kaplitza 1986, S. 95). Dabei wird dem Befragten ein Abschluss suggeriert, indem der letzte Themenkomplex mit einer entsprechenden Formulierung wie zum Beispiel „Nun noch einige Fragen zum Schluss" beginnt. Nachdem dem Befragten der baldige Schluss angekündigt wurde, verringert sich der innere Widerstand bei der Weiterführung der Befragung. Erst nach Beantwortung dieser Fragen erfolgt die Erhebung demographischer Daten mit der Einleitung: „Nun am Schluss noch einige Angaben zu Ihrer Person".


Eine weitere Möglichkeit, die subjektive Zeit der Befragung kürzer erscheinen zu lassen, ist eine entsprechende Gestaltung des Fragebogens. Dazu ist der Fragebogen vom Format her großzügig anzulegen. Dies erweckt beim Befragten den Eindruck, dass der Fragebogen schnell abgearbeitet werden kann. 

Spannungen abbauen

Der Fragebogen sollte mit einem Dank für die Mitarbeit abgeschlossen werden. Davor ist es vielfach sinnvoll, eine offene Frage in der Form von „Haben Sie noch weitere Anmerkungen?" einzufügen. Im Verlaufe der Beantwortung der Fragen aufgestaute Äußerungswünsche können hier niedergeschrieben werden. Diese allgemeine Frage wird meist nicht beantwortet, alleine schon die Möglichkeit einer solchen Beantwortung hilft jedoch oft, Spannungen abzubauen.

Am Ende der Fragebogenkonstruktion ist mit Hilfe des Messmodells und der dimensionalen Analysen nochmals zu überprüfen, ob alle Themenbereiche ausreichend im Fragebogen behandelt werden. Zudem sollte man den Fragebogen auch in Hinblick auf zusätzlich eingefügte „interessante" Fragen hin untersuchen. Es ist kritisch zu hinterfragen, ob diese auch einen Bezug zur Problemstellung aufweisen.

Am Schluss danken

Ein Fragebogen stellt ein Messinstrument dar und ist dementsprechend sorgsam zu entwickeln. Bei seiner Konstruktion ist es wichtig andere, ähnlich gelagerte Untersuchungen heranzuziehen sowie die Definitionen, die dimensionalen Analysen, das vermutete Beziehungsgeflecht etc. theoretisch zu fundieren. Vielfach ist es hilfreich, sich mit Hilfe eines Messmodells eine grafische Übersicht über den Untersuchungsgegenstand zu verschaffen. Das Messmodell beinhaltet vermutete Einflussgrößen, die zu untersuchenden theoretischen Begriffe (zum Beispiel Kundenzufriedenheit), die Auswirkungen sowie die vermuteten Beziehungen untereinander. 

Nach der Definition der zu untersuchenden Variablen gilt es, die theoretischen Begriffe dimensional aufzulösen und zu operationalisieren. Als Ergebnis der Operationalisierung erhält man Fragen, die unter Berücksichtung der Themenbereiche und psychologischer Aspekte wie zum Beispiel des Halo-Effektes in einen Fragebogen angeordnet werden. Themenbereiche können durch Überleitungsfragen sowie Erklärungen oder Aufforderungen eingeleitet werden. Besonderes sorgsam ist die Einleitung eines Fragebogens zu gestalten. Am Anfang des Fragebogens gilt es, die Befragten durch einen entsprechenden Hinweis auf die Untersuchung und deren Ziele zu motivieren. Die Befragung selbst sollte mit Eisbrecherfragen begonnen und mit einem Dank abgeschlossen werden.

 

Autor

Professor Dr. Horst Otto Mayer ist Leiter des Departments für Management- und Sozialwissenschaften der Fachhochschule Vorarlberg.

 

Literatur

Berekhoven, L., Eckert, W. u. Ellenrieder, P. 1999: Marktforschung. Wies­baden

Denz, H. 1989: Einführung in die empirische Sozialforschung. Wien/New York

Diekmann, A. 2000: Empirische Sozialforschung. Grundlagen, Methoden, Anwendung. Reinbek

Holm, K. 1986: Die Frage. In: Holm, K. (Hg.): Die Befragung 1, Tübingen, S. 32-91

Kirschhofer-Bozenhardt, A. u. Kaplitza, G. 1986: Der Fragebogen. In: Holm, K. (Hg.): Die Befragung 1, Tübingen, S. 92-126

Mayer, H.O. 2008: Interview und schriftliche Befragung. München/Wien

Mayntz, R., Holm, K. u. Hübner, P. 1978: Einführung in die Methoden der empirischen Soziologie. Opladen

Nieschlag, R., Dichtl, E. u. Hörschgen, H. 1994: Marketing. Berlin

Noelle-Neumann, E. u. Petersen, Th. 1998: Alle, nicht jeder. Einführung in die Methoden der Demoskopie. München

Schnell, R., Hill, P.B. u. Esser, E. 1999: Methoden der empirischen Sozialforschung. München  

 


 

[1]       Ausführlich behandelt werden die Entwicklung und die Auswertung von Fragebogen in Mayer 2008.

[2]     Weitere Ausführungen zum Thema Skalenniveau mit Beispielen sind beispielsweise in Mayer 2008 zu finden.

 

.
.