Donnerstag, 20 August 2015 14:21

Skalenstruktur

Für Skalen existieren wichtige Kriterien für eine optimale Operationalisierung der Forschungsfrage, also für die Entscheidung des Forschers welche Skala die beste Option hinsichtlich deren Art und Struktur darstellt. Für die Formulierung von Items (Antwortmöglichkeiten als Skalenpunkte) bestehen die gleichen Regeln wie für die Frageformulierung (siehe Schnell, Hill & Esser 2011 basierend auf Edwards 1957), also hinsichtlich Verständlichkeit, Eindeutigkeit, Dimensionalität u.a. wie zuvor beschrieben. Es müssen sich aber ferner grundlegende Fragen zur Skala (z.B. zur Skalenbreite, Verbalisierung, Ausgeglichenheit, Dimensionalität und Ausrichtung der Skala) gestellt werden. Diese folgen zugegebenermaßen häufig eher der Philosophie des Fragebogenkonstrukteurs. Denn eine genau passende Skala basierend auf den wissenschaftlichen Erkenntnissen existiert pauschal nicht, erst im Kontext zur Fragestellung kann häufig eine Entscheidung aufgrund der Vor- und Nachteile für die bestmögliche Alternative getroffen werden.

Anzahl an Skalenpunkten und Skalenbreite

Als Erstes müssen Sie sich für die Anzahl an Skalenpunkten zu Ihrer Frage entscheiden, also ob diese über eine ungerade oder gerade Anzahl sowie über wie viele Skalenpunkte insgesamt sie verfügen soll. Es gilt dabei je höher die Anzahl der Skalenpunkte desto so mehr kann der Befragte seine Antwort differenzieren. In der Regel sollten bei einer angehenden Intervallskala zwischen vier und sieben Skalenpunkte vorgegeben werden, wobei manchmal auch bis zu zehn Skalenpunkte eingesetzt werden. Zwar bietet eine höhere Anzahl auch mehr Variationen bei der Beantwortung der Frage an, so kann aber diese den Befragten auch die Auswahl entsprechend seiner Meinung erschweren, denn meiner Erfahrung nach sind diese längeren Skalen intuitiv schwerer zu erfassen. Aus diesem Grund würde ich keine Skalenbreite mit mehr als zehn Punkten empfehlen, weil ein Unterschied zwischen beispielsweise dem 18. und 19. Punkt kaum mehr wahrgenommen wird und daher auf den Befragten viel zu abstrakt und theoretisch wirkt. Während der Befragung wird dann von der Mehrheit der Probanden die volle Breite der Skala gar nicht genutzt, sondern es ist eine Ballung an Antworten an den Extremen der Skala zu erkennen, d.h. die Probanden „schauen“ vermehrt nur auf die Endpunkte und auf die zwei davorstehenden Punkte, um ihre Einschätzung einordnen zu können.
Anzahl an Skalenpunkten

Mit der Entscheidung für eine ungerade Anzahl gibt man als Forscher einen Skalenmittelpunkt vor, z.B. bei einer mit fünf Ausprägungen ist die Dritte dieser Mittelpunkt. Ist eine Skala zweidimensional (z.B. von „lehne ich ab“ bis „stimme ich zu“), dann wird diese Mitte als neutraler Punkt zwischen den beiden Richtungen (vergleichsweise wie ein Nullpunkt) identifiziert. Eine eindimensionale Skala dagegen lässt nur Antworten in eine Richtung (z.B. von keiner bis absoluter Zustimmung) zu, so dass sie eigentlich keinen neutralen Punkt impliziert, aber trotzdem nehmen die Befragten diesen mittlerer Punkt innerhalb der Skala als einen solchen wahr. Sie bieten dem Befragten somit die Möglichkeit, eine „unentschiedene“ Meinung äußern zu können. Leider zu häufig nutzen die Befragten diese Option, um einer Antwort auszuweichen, um sich persönlich gar nicht entscheiden zu müssen. Bei einer geraden Anzahl zwingt man den Befragten dagegen eine Tendenz zu entwickeln, also eine eigene Position zu beziehen. Nur gibt es real eben die Situation, dass der Befragte keine Meinung dazu hat, oder sich einfach für keine Tendenz entscheiden kann. Aber aufgrund der Skala wird keine neutrale Option zugelassen, was dann leider zu einer „wahllosen“ Falschangabe durch den Befragten führen kann, oder falls die Möglichkeit besteht zu einer Antwortverweigerung. Mit der Anfügung einer Art „Restkategorie“ an die Skala mit der Option „weiß nicht“ könnte man der Problematik der motivierten Falschangabe entgehen, aber ich persönlich empfehle deren Einsatz nicht gern. Einerseits bietet man den bequemeren Befragten wieder eine Möglichkeit der mangelnden Auseinandersetzung mit der Frage, andererseits gewöhnen sich alle Befragten während der Umfrage daran, dass eine ausweichende Antwort durchaus legitim ist, und somit wird diese im Laufe der Befragung immer häufiger auch genutzt, obwohl grundsätzlich eine Meinung zu den Fragen vorhanden oder möglich gewesen wäre. Beide vorliegenden Varianten haben also ihren Vorteile aber auch Nachteile, daher ist jeweils eine Entscheidung nicht leicht, aber allein Ihr Wissen darum kann für die Datenanalyse von Bedeutung sein. Bei den von mir entwickelten Fragebögen zwinge ich die Befragten zu einer Entscheidung, also ich persönlich nehme zumeist gerade Skalen mit sechs Punkten ohne ausweichende Option auf. Ich gehe dabei von der Philosophie aus, dass wir zu allem eine Meinung haben, auch wenn sie eher schwach ausgeprägt ist, und ich eine kognitive Auseinandersetzung beim Probanden provozieren möchte. Durch eine Zeitmessung während der Online-Umfrage erhalte ich zudem ein Indiz für die Solidität der Antwortangaben zu jedem Befragten. Benötigt ein Proband nur wenige Sekunden für das Beantworten einer Frage, hat er vermutlich wahllos oder aber in jedem Fall nicht adäquat auf die Fragestellung geantwortet, und ich kann dessen Antworten für die Auswertung unberücksichtigt lassen. Interessant aber konträr gegenüber meiner Philosophie der Fragebogenkonstruktion ist, dass im angloamerikanischen Raum gern bei jeder Frage die Option „weiß nicht“ angeboten wird, aber nur um diese Befragten dann als unqualifiziert zu identifizieren, und entweder die Umfrage für sie vorzeitig zu beenden oder diejenigen später, vor der Datenanalyse aus dem Datensatz zu entfernen.

Verbalisierung der Skalenpunkte

Es stellt sich nun die Frage sollen alle Skalenpunkte oder nur die Endpunkte verbalisiert werden. In der Praxis wird eine vierstufige Skala beispielsweise zur Zustimmung gern (mit „stimme voll und ganz zu“, „stimme eher zu“, „stimme eher nicht zu“, „stimme überhaupt nicht zu“) verbalisiert. Dem Befragten soll damit der „Wert“ der jeweiligen Skalenpunkte eindeutig vermittelt werden. Es dient in jedem Fall dem Befragten für ein einfacheres Verständnis der Skala. Und weil die Skala zu diesen Fragen meistens eine Rangordnung aufweist, beschränken sie kaum die Anwendung von Analyseverfahren während der Datenauswertung.
Verbalisierung von Skalenpunkten

Bei einer höheren Anzahl an Skalenpunkten wird die angemessene Beschriftung der einzelnen Punkte aber schon schwieriger, um noch eine allgemein verständliche Rangordnung der Skala zu vermitteln. Und bei ungeraden Skalen wird die Benennung des mittleren Skalenpunkt nie vollends glücken, es wird sich häufig mit Begriffen wie „weder noch“, „teils/teils“ oder „sowohl als auch“ beholfen. Von einer Nutzung der ausweichenden Optionen als Mittelpunktbeschriftung (wie „weiß nicht“ oder „keine Meinung“) ist vollständig abzuraten, weil es den ordinalen Charakter der Skala zerstört, da die Rangordnung verloren geht. Aus diesem Grund empfiehlt es sich nur die Endpunkte der Skala mit den Extremen zu benennen. Damit überlässt man aber den Befragten die Bedeutung der Punkte dazwischen zu definieren, was natürlich nicht jeder gleichermaßen macht. Aus diesem Grund empfehle ich nur kurze Skalen mit drei oder vier Punkten zu verbalisieren. Bei längeren Skalen empfiehlt sich dagegen nur die Endpunkte zu beschreiben, aber dann die Skala auch nicht zu breit zu gestalten, eher nur mit bis zu sieben Punkten zu definieren, um die Vielfalt an Interpretationen zur Skala seitens der Befragten geringer zu halten.

Zum Abschluss muss man sich noch für eine Richtung der Skala entscheiden, d.h. ob der niedrigste Skalenwert links und der Höchste am rechten Ende stehen soll (oder eben andersherum). In unserem Kulturkreis denken wir intuitiv von links nach rechts, daher empfiehlt sich auch eine Skala von links nach rechts (von niedrigen nach hohen Skalenwerten, von schlechten nach guten Wertungen). Nur bei mündlich vorzulesenden Fragebögen kann es manchmal Sinn machen, die Skala andersherum zu präsentieren, weil es eher dem Verständnis von gesprochener Sprache entspricht, zuerst mit dem positiven Aspekt zu beginnen.

Eine mögliche, optimale Skala

Eine eindeutige Empfehlung für die optimale Skala konnte ich Ihnen leider nicht geben, aber meiner Erfahrung nach hat sich eher eine vierstufige, verbalisierte Skala oder eine sechsstufige Skala mit Benennung der Endpunkte ohne Mittelpunkt von links nach rechts ausgerichtet in der Praxis bewährt. Trotzdem erscheint manchmal auch der Einsatz eines Skalenmittelpunkts oder einer „weiß nicht“ Option abhängig von der Frage und Thema sogar notwendig. Ich will damit keinen Skalentyp grundlegend ablehnen.
Das Wichtigste dabei ist, dass der von Ihnen entwickelte Skalentyp im Fragebogen fort während eingesetzt wird. Denn ein häufiger Wechsel der Skalen innerhalb eines Fragebogens verwirrt den Befragten und führt im Laufe der Umfrage zu unabsichtlichen Fehlantworten, weil während der Befragung ein Lernen hinsichtlich der Skalentypen stattfindet, also der Proband deren Funktion verstanden hat und nun unterstellt, dass das Prinzip beibehalten wird. Trotzdem kann man häufig nicht alle Fragen mit der gleichen Skala abdecken, daher ist eine zweite oder auch dritte Variante legitim, aber versuchen sie diese so ähnlich wie möglich zu halten.

Besonderheiten bei mündlichen Befragungen und Rotationen

Bei mündlichen Befragungen (z.B. per Telefon) können Skalen mit mehreren bis vielen Ausprägungen die Assoziationsfähigkeit des Probanden überfordern. Denn die Befragten müssen sich die durch den Interviewer nur vorgelesene Skala auch merken können, wohingegen sie sich die Skala bei einer schriftlichen Umfrage immer wieder ansehen können, wenn sie in Vergessenheit geraten ist. Aus diesem Grund werden grundsätzlich eher kurze und einfache Fragen und Skalen bei mündlichen Befragungen empfohlen. Der Einsatz von Ziffern zu den Skalenpunkten soll dabei das Antwortverhalten erleichtern, aber eine regelmäßige Wiederholung der Definitionen zur Skala ist trotzdem notwendig. Bei der Nennung von mehreren Antwortalternativen innerhalb einer Frage besteht grundsätzlich die Tendenz beim Befragten auf die später aufgeführten Angaben (recency-effect) auszuweichen. In Online-Umfragen herrscht seitens der Probanden, ähnlich wie bei schriftlichen Befragung, dagegen eine Antworttendenz zu früher aufgeführten Angaben (primacy-effect). Aus diesem Grund ist eine automatische Rotation von Items (und sogar auch Fragen) mittels Zufallsgenerator bei computergestützten Umfragen sehr wichtig, wie auch eine zufällige Anordnung der Items innerhalb einer Batterie (ein Set an Aussagen zur Bewertung) realisierbar sein sollte. Bei mündlichen Umfragen ohne Computerunterstützung wird dafür ein Aufteilen der Frage in eine Haupt- und in eine differenzierende Folgefrage empfohlen. Dabei sollte die Hauptfrage dichotom skaliert sein, und erst die Folgefrage den Grad bzw. das Ausmaß der Antwort (z.B. der Zustimmung oder Ablehnung) messen. Generell ist bei mündlichen Umfragen der Einsatz von allgemeingültigen Hilfsmitteln ratsamer, wie z.B. die Anwendung von Schulnoten als Skala.

Donnerstag, 20 August 2015 14:15

Frageformulierung

Für die Formulierung von Fragen besteht in der Forschung traditionellerweise eine Reihe von Faustregeln (siehe Schnell, Hill & Esser 2011 basierend auf Payne 1951), um ein standardisiertes und unabhängiges Ergebnis mittels der Befragung zu erhalten.
Ein Fragebogen sollte für jeden Befragten gleichermaßen sowohl hinsichtlich der Fragen als auch der Antwortvorgaben verständlich sein. Aus diesem Grund sollte man nur einfache und uneindeutige Worte wählen. Also ohne die Verwendung von nicht allgemein bekannten Fachausdrücken und Fremdworten auskommen, sowie keine Abkürzungen und auch keine Umgangssprache oder Slangausdrücke nutzen. Ferner wird auch von doppelten Negationen und Verneinung innerhalb der Frageformulierung abgeraten. Wenn der Befragte die Frage wegen der Wortwahl nicht verstehen kann, dann ist von ihm auch keine adäquate Antwort auf die Frage zu erwarten. Es gilt hier den kleinsten gemeinsamen Nenner zu wählen, so dass auch weniger gebildete Personen den Fragebogen verstehen können. In der Praxis ist es manchmal leichter gesagt als getan, denn Personen definieren beispielsweise einfache Gefühlszustände sehr unterschiedlich.

Ferner sollten Fragen konkret gestellt werden, daher darf die Ausführung auch nicht zu allgemein beschreibend ausfallen, wobei entsprechend abstrakte Begriffe (wie z.B. „diese Sache“, „in etwa“) vermieden werden sollten. Die Regeln der deutschen Sprache müssen eingehalten werden, und die Fragen sollte eher kurz formuliert werden, um für die Befragten verständlich zu bleiben. Zu lange und komplexe Satzstrukturen können den Probanden verwirren. Auch aufwendige Erklärungen zur Frage schaden eher, weil sie entweder gar nicht erst gelesen werden, oder eine zu hohe kognitive Herausforderung für den Befragten darstellen. Überfordern Sie Ihre Befragten nicht, in dem Sie zu aufwendige Aufgaben stellen. Trotzdem müssen Sie vielleicht unklare, aber für die Frage notwendige Begriffe für den Befragten definieren.
Schlechtes Beispiel für eine Frage

Generell sollten Fragen neutral und eindeutig formuliert werden, also einen klaren Bezug zu dem darzustellenden Sachverhalt in der Frage herstellen. Neutral bedeutet keine bereits bewerteten Formulierungen oder belastete Wörter zu verwenden, wie z.B. „unglaubwürdige Politiker“, denn damit beeinflussen Sie den Probanden hinsichtlich seines Antwortverhaltens. Eindeutig sollte der Bezug der Frage hinsichtlich Zeit und Gegenstand sein, also auch keine doppelten Stimuli in einer Frage verwenden. Eine Frage, wie z.B. „wie bewerten Sie die Politik und Wirtschaft in Deutschland?“, muss getrennt und zeitlich konkreter formuliert werden („wie bewerten Sie die Politik in Deutschland in den letzten 12 Monaten?“). Eine Mehrdimensionalität der Frage gilt es unbedingt zu vermeiden, weil sonst während der Datenanalyse nicht erkennbar wird, auf welchen Teil die Antwort des Probanden sich bezieht.

Soziale Erwünschtheit bei kritischen Fragen

Ein Fragebogen sollte unabhängig auf das Antwortverhalten des Befragten wirken. Aus diesem Grund müssen Unterstellungen und suggestive Fragen vermieden werden, wie z.B. „haben auch Sie schon …“, „gehören Sie auch zu den wenigen Personen…“. Diskriminieren Sie den Befragten nicht, indem Sie ihn als Minderheit oder unnormal darstellen. Der Befragte wird durch seine Antwort sonst bemüht sein, sich sozial anzupassen und konform der Mehrheit zu antworten. Auch Zitate von Autoritäten und Experten rufen entsprechende Reaktionen beim Probanden hervor, so dass diese sich minderwertiger fühlen könnten, und die Motivation an der weiteren Umfrageteilnahme verlieren. Provozieren Sie niemals bereits aufgrund der Frageformulierung ein vermutetes oder wünschenswertes Ergebnis.
Es existiert allgemein eine Tendenz zur Abgabe sozial erwünschter Antworten durch den Befragten, d.h. bei kritischen Fragen (z.B. zum Alkoholkonsum) wird der tatsächliche Sachverhalt häufig verschwiegen oder beschönigt, um keine sozialen Konsequenzen befürchten zu müssen, oder um im Interview soziale Anerkennung zu erlangen. Dieses Antwortverhalten zu identifizieren, um eine Verzerrung der Studienergebnisse zu vermeiden, stellt sich als sehr schwierig dar. Es wird angenommen, dass speziell Personen mit geringem Selbstbewusstsein entsprechend den vermuteten Erwartungen antworten. Ich musste ferner feststellen, dass beispielsweise bei Akademikern mit einem ausgeprägten Selbstbewusstsein ebenfalls häufiger soziale Erwünschtheit nachweisbar war, weil zu dem Bild eines erfolgreichen Menschen kein Übermaß an Konsum (z.B. Alkohol oder Essen) akzeptiert ist. Der Einsatz von sogenannten „kritische Fragen“, die dem Befragten unangenehm sind zu beantworten, weil sie ein tabuisiertes Thema (wie Sexualleben, Krankheiten, Drogenkonsum etc.) ansprechen, stellt grundsätzlich ein Problem der Befragung dar. Daher sollten kritische Fragen auch eher an das Ende eines Fragebogens gestellt werden, aber trotzdem muss man mit Falschangaben oder einer Verweigerung der Antwort rechnen. Aus diesem Grund eignet sich für solche Befragungsthemen auch die Durchführung einer Online-Umfrage, wo dem Probanden eine höhere Anonymität suggeriert wird. Denn kein Interviewer beeinflusst die Aussagen des Probanden allein durch seine Anwesenheit, da der Befragte seine Angaben allein vor dem Computer tätigen kann.
Suggestivfrage und unausgeglichene Skala

Hypothetische und fiktive Fragen

Es wird ferner empfohlen keine hypothetischen Fragen zu stellen, wie z.B. „stellen Sie sich vor …“ oder „angenommen Sie hätten gestern …“, weil sich nicht jeder gleichermaßen in eine ihm unbekannte Situationen hineinversetzen kann, und das Antwortverhalten primär von der Phantasie des Befragten und dessen Fähigkeit zum abstrakten Denkens abhängt. Ich persönlich finde diesen Ansatz aber legitim, insoweit die hypothetische Situation vom Probanden bereits in der Vergangenheit erfahren worden ist. Ich versetze beispielsweise kaufentscheidende Computeranwender gern in die Situation „Wenn Sie heute einen Computer kaufen würden …“, aber ich würde niemals fragen „Wenn Sie heute 6 Richtige im Lotto gewinnen würden …“. Weil jeder kaufentscheidende Computeranwender über die eigene Erfahrung zu einem Computerkauf verfügt, aber kaum jemand bereits einen Lottogewinn erlebt hat. Bei dieser Art der hypothetischen Frage ist für mich die situative Anwendung von Erfahrungen relevant, und nicht die Fähigkeit des abstrakten Denkens seitens des Befragten.

Zur Kontrolle des Antwortverhaltens der Befragten werden manchmal fiktive Fragen, die keine real existierende Situation abbilden, im Fragebogen aufgenommen. Zum Beispiel wird bei einer Liste an möglichen bekannten Markennamen eine nicht existente Marke mit aufgeführt. Nun lässt sich aber beobachten, dass diese gar nicht existente Marke einigen Personen bekannt ist, und jene sogar eher unzufrieden mit deren Angeboten sind. Die Ursache liegt aber nicht in einer mangelnden Aufmerksamkeit der Befragten, sondern sie gehen grundsätzlich davon aus, dass eine Umfrage Sinn ergibt, und auch alle darin enthaltenden Fragen. Also geht der Proband von der Existenz dieser Marke aus, und um nicht seine Unkenntnis zu zeigen, wird diese Marke auch als bekannt markiert. Bei der Nachfrage zur Zufriedenheit mit dieser Marke kann die Person keine Angaben tätigen, aber deren Angebote können kaum vorteilhaft sein, sonst hätte man als Befragter bereits davon gehört.
Meiner Meinung nach muss das Antwortverhalten dieser Personen nicht auch zwingend für die restliche Umfrage angezweifelt werden, nur weil bei dieser Frage Wissen vorgetäuscht wurde. Denn mit dieser Art der Fragestellung wurde ein solches Verhalten provoziert, weil der Proband nun eben an die Sinnhaftigkeit der Frage glaubt, und die Reaktion in der Natur des Menschen - genauso wie z.B. die soziale Erwünschtheit - liegen kann. Ich persönlich empfehle Ihnen nicht nur solche fiktiven Fragen zu vermeiden, sondern ich warne Sie sogar vor deren Einsatz. Ich musste in der Praxis immer wieder erfahren, dass Auftraggeber eine ganze Studie grundsätzlich in Frage gestellt haben, weil 5% der Befragten angaben, etwas zu kennen oder sogar zu nutzen, das noch gar nicht existierte. Sie könnten sich mit einer einzigen Frage und dessen zweifelhaften Ergebnis Ihre ganze Forschungsarbeit zu Nichte machen. Und leider wird Ihre Arbeit eine Erklärung dieser Diskrepanz mittels der Kognitionspsychologie auch nicht retten.