Kapitel III · § 3.10 · Methodik und wissenschaftliches Arbeiten · 10 Min Lesezeit

Quantitative Inhaltsanalyse

Systematische Auszählung von Textmerkmalen — Kategoriensystem, Codebuch, Intercoder-Reliabilität

Julius Wittenberg

2026-04-24 · Lesezeit: ca. 10 Minuten


Abstract

Die quantitative Inhaltsanalyse zählt in Texten, was zuvor klar definiert wurde: Wörter, Themen, Bewertungen, Akteure, Argumentationsmuster. Ihre Stärke liegt in der Vergleichbarkeit großer Textmengen, ihre Schwäche in der Reduktion auf das, was sich in Kategorien fassen lässt. Dieser Artikel führt durch das Vorgehen, erklärt das Codebuch, zeigt den Umgang mit Intercoder-Reliabilität und grenzt die Methode sauber von ihrem qualitativen Gegenstück ab.

Schlüsselwörter: Quantitative Inhaltsanalyse · Codebuch · Kategoriensystem · Intercoder-Reliabilität · Medienanalyse · Cohens Kappa

Was die quantitative Inhaltsanalyse leistet

Die quantitative Inhaltsanalyse ist ein Verfahren zur systematischen, regelgeleiteten Auszählung von Merkmalen in Texten. Der Gegenstand kann eine Zeitungsartikel-Kollektion sein, eine Sammlung von Tweets zu einem politischen Ereignis, Parteiprogramme oder Geschäftsberichte. Jedes Textstück wird auf definierte Merkmale geprüft, das Ergebnis in Zahlen überführt und statistisch ausgewertet.

Die Methode hat ihre Wurzeln in der Medien- und Kommunikationswissenschaft der ersten Hälfte des 20. Jahrhunderts. Ihre heutige Verbreitung reicht von der politischen Kommunikationsforschung über Marktforschung bis zur Analyse sozialer Medien. In wirtschaftswissenschaftlichen Arbeiten kommt sie zum Einsatz, wenn Geschäftsberichte, Pressemitteilungen oder CEO-Briefe systematisch verglichen werden sollen; in soziologischen Arbeiten bei der Analyse von Mediendiskursen oder historischen Dokumenten.

Die Abgrenzung zur qualitativen Inhaltsanalyse nach Mayring ist fließend: Beide verwenden Kategoriensysteme und systematische Kodierung. Der Unterschied liegt im Erkenntnisziel. Quantitativ arbeiten Sie, wenn Sie wissen wollen, wie oft etwas vorkommt, wie sich Häufigkeiten zwischen Gruppen unterscheiden und ob sich ein Muster statistisch absichern lässt. Qualitativ arbeiten Sie, wenn Sie verstehen wollen, was etwas bedeutet, wie es argumentativ gerahmt wird und welche Varianten auftreten.

Vergleich der beiden Ansätze

Die Unterschiede lassen sich tabellarisch festhalten. Im Abstract heißt es »fließend« — das gilt für die Grauzone dazwischen, nicht für die Prototypen.

Quantitative und qualitative Inhaltsanalyse im Vergleich Vergleichstabelle mit sechs Zeilen. Erste Zeile Erkenntnisziel: Häufigkeiten bei quantitativ, Bedeutungen bei qualitativ. Zweite Zeile Datenbasis: große Fallzahl versus kleinere, tiefere Analyse. Weitere Zeilen Kategorien, Auswertung, Gütekriterium, typische Disziplinen. Aspekt Quantitativ Qualitativ Erkenntnisziel Häufigkeit, Vergleich zwischen Gruppen, statistische Muster Bedeutungen, Deutungs- muster, Argumentationen, Varianten Datenbasis große Textmengen hunderte bis tausende Einheiten kleinere Fallzahl 6 – 30 Interviews oder Dokumente Kategorien vorab festgelegt kein Nachträgliches vorab + induktiv fortlaufend überarbeitet Auswertung Häufigkeiten, Tests, Korrelation, Regression Zusammenstellung, vergleichende Interpretation Gütekriterium Intercoder-Reliabilität Cohens Kappa ≥ 0,7 intersubjektive Nachvoll- ziehbarkeit, Transparenz Typische Felder Medienforschung, Politik, Marktanalyse Soziologie, Erziehungs- wissenschaft, Pflege
Abbildung 1: Quantitative und qualitative Inhaltsanalyse im direkten Vergleich. Die Wahl zwischen den Ansätzen hängt am Erkenntnisziel, nicht am Material.

Das Codebuch als Herzstück

Das Codebuch ist die genaue Anweisung, wie das Textmaterial in Zahlen übersetzt wird. Es enthält für jede Kategorie eine Definition, die gültigen Ausprägungen und Regeln für Zweifelsfälle. Ein Beispiel für eine Variable in einer Medienanalyse: »V3: Bewertung des Gegenstands. 1 = positiv, 2 = neutral, 3 = negativ, 9 = nicht anwendbar. Zuordnungsregel: Die Bewertung ergibt sich aus Adjektiven und Argumentationsrichtung des Artikels. Bei gemischten Bewertungen wird die dominante Richtung kodiert.«

Ein Codebuch einer abschlussarbeitstauglichen Studie hat typischerweise zwischen 15 und 40 Variablen. Dazu gehören immer formale Variablen (Datum, Medium, Seitenumfang, Autorin), inhaltliche Variablen (Thema, Akteure, Bewertung) und ggf. Spezial-Variablen (Ton, Argumentationsmuster, Framing). Das Codebuch wird vor Beginn der Kodierung fertiggestellt und danach möglichst nicht mehr geändert — Änderungen zwingen dazu, bereits kodiertes Material erneut zu bearbeiten.

Ein häufiger Fehler in studentischen Arbeiten: Das Codebuch ist zu kurz und enthält nur Variablennamen mit Ausprägungen, aber keine Definitionen und keine Entscheidungsregeln für Zweifelsfälle. Das Ergebnis ist eine unzuverlässige Kodierung, bei der die gleiche Textpassage je nach Tagesform unterschiedlich eingeordnet wird. Spätestens im zweiten Kodierdurchgang wird das sichtbar — und dann muss die Hälfte der Arbeit noch einmal gemacht werden.

Intercoder-Reliabilität

Die zentrale Gütefrage der quantitativen Inhaltsanalyse lautet: Würden zwei unabhängige Kodierer bei demselben Text zu denselben Zuordnungen kommen? Um das zu prüfen, kodieren zwei Personen einen Teil des Materials (üblich: 10–20 Prozent) unabhängig voneinander. Die Übereinstimmung wird mit einem Reliabilitätskoeffizienten berechnet.

Cohens Kappa ist das am häufigsten genannte Maß. Es korrigiert die prozentuale Übereinstimmung um den Zufallsanteil — ein Verfahren, das bei Kategorien mit sehr schiefer Verteilung wichtig wird, weil zwei Kodierer bei einer Variable mit 90 Prozent einer Ausprägung rein zufällig in 81 Prozent der Fälle übereinstimmen würden. Werte von 0,8 und darüber gelten als gut, 0,6 bis 0,8 als akzeptabel, darunter als problematisch.

Für Bachelorarbeiten wird Intercoder-Reliabilität nicht immer verlangt, zählt aber zu den Qualitätsmerkmalen, die eine Arbeit methodisch deutlich aufwerten. Wer sie einsetzt, sollte das Vorgehen sauber dokumentieren: Auswahl des Teilsamples, Unabhängigkeit der Kodierung, verwendetes Reliabilitätsmaß, Umgang mit Diskrepanzen.

Software und Auswertung

Für die Kodierung selbst reicht oft eine Tabellenkalkulation (Excel, LibreOffice Calc), in die Kodierer zeilenweise die Werte eintragen. Spezialsoftware wie MAXQDA oder ATLAS.ti bietet Komfort bei der Verwaltung großer Dokumentensammlungen und automatische Kodier-Hilfen.

Die statistische Auswertung findet typischerweise in SPSS, R oder Jamovi statt. Beginnt wird meist mit Häufigkeitsauszählungen: Wie oft kommt jede Ausprägung vor? Wie verteilt sich ein Merkmal über die Stichprobe? Es folgen bivariate Analysen: Kreuztabellen mit Chi-Quadrat-Test, Mittelwertvergleiche mit t-Test oder ANOVA. Fortgeschrittene Analysen nutzen Regressionen oder Hauptkomponentenanalyse, um Muster in den Kodierdaten zu identifizieren.

Für die Präsentation der Ergebnisse in der Abschlussarbeit sind Häufigkeitstabellen und Balkendiagramme der Kernfall. Bei umfangreichen Variablensets lohnen sich Heatmaps oder Netzwerkdiagramme, die Zusammenhänge zwischen Kategorien visualisieren. Die Diagramm-Beschriftung folgt denselben Konventionen wie in jeder wissenschaftlichen Arbeit — siehe dazu Automatisches Abbildungsverzeichnis in Word.

Das Vorgehen in acht Schritten

Die Methodenliteratur beschreibt den Ablauf einer quantitativen Inhaltsanalyse in leicht unterschiedlichen Schrittfolgen; der Kern ist immer derselbe. Erstens die Forschungsfrage: Was soll mit welcher Textmenge untersucht werden? Zweitens die Grundgesamtheit: Welche Texte kommen grundsätzlich in Frage, und wie wird die Stichprobe daraus gezogen? Drittens die Analyseeinheit: Wird der einzelne Artikel kodiert, der Absatz oder die einzelne Aussage innerhalb des Artikels? Die Wahl der Einheit bestimmt die Interpretation der Ergebnisse maßgeblich.

Viertens das Kategoriensystem: Welche Variablen werden erfasst, mit welchen Ausprägungen? Fünftens das Codebuch: Definitionen, Ankerbeispiele, Entscheidungsregeln. Sechstens der Pretest: Zwei Kodierer kodieren einen kleinen Teil der Stichprobe, die Reliabilität wird berechnet, das Codebuch falls nötig überarbeitet. Siebentens die eigentliche Kodierung der gesamten Stichprobe. Achtens die statistische Auswertung und die Rückkopplung zur Forschungsfrage.

In studentischen Arbeiten ist Schritt 6 häufig der unterschätzte. Ein Pretest mit zehn Texten zeigt Schwächen des Codebuchs, die im Hauptdurchgang sonst zu systematischen Verzerrungen führen. Der Zeitaufwand für einen Pretest liegt bei einem bis drei Tagen — deutlich weniger als die Nacharbeit bei einem schlecht kodierten Haupt-Durchgang.

Typische Anwendungsfelder

In der Medien- und Kommunikationswissenschaft ist die quantitative Inhaltsanalyse das klassische Instrument für Fragen nach Medienagenda-Setting, Akteurs-Repräsentation oder Framing politischer Themen. Eine typische Bachelorarbeit untersucht etwa, wie zwei überregionale Tageszeitungen über die Klimaberichterstattung eines bestimmten Jahres berichten — mit welchen Akteuren, welchen Argumentationsmustern, welchem Grundton.

In den Wirtschaftswissenschaften hat sich die Methode für die Analyse von CEO-Briefen, Aktionärsbriefen und Geschäftsberichten etabliert. Untersucht wird, wie Unternehmen kommunizieren, wie sie Krisen beschreiben, welche strategischen Leitbilder sie verwenden. Die Erweiterung in den letzten Jahren geht Richtung automatisierte Inhaltsanalyse mit computerlinguistischen Verfahren — eine Option, die für Bachelorarbeiten allerdings in der Regel zu voraussetzungsvoll ist.

In den Politikwissenschaften liegt ein Schwerpunkt auf der Analyse von Parteiprogrammen, Wahlkampfmaterialien und Reden. In der Rechtswissenschaft, wo quantitative Arbeiten seltener sind, findet die Methode dort Anwendung, wo Urteilskorpora systematisch auf Muster untersucht werden — etwa die Häufigkeit bestimmter Argumentationsfiguren in der BGH-Rechtsprechung zu einem Rechtsgebiet.

Häufige Probleme

Zu viele Kategorien mit zu geringer Trennschärfe. Kodierer können nicht zuverlässig zwischen 15 Nuancen der Bewertung unterscheiden. Faustregel: Ordinale Variablen maximal fünfstufig, nominale Variablen mit klaren Abgrenzungen.

Unpassende Stichprobe. Wer zur Medienberichterstattung über ein Ereignis forscht, darf nicht nur die drei größten Tageszeitungen nehmen — das verzerrt systematisch. Die Stichprobe muss die relevante Grundgesamtheit abbilden. Mehr dazu in Stichprobenauswahl — Methoden und Fehler.

Überschätzung der Ergebnisse. Eine quantitative Inhaltsanalyse misst, was im Text steht, nicht was gemeint ist und erst recht nicht, was die Leserinnen daraus verstehen. Die Interpretation muss diese Grenze respektieren. Eine Häufigkeitsauszählung politischer Akteure ist kein Nachweis ihres gesellschaftlichen Einflusses.

Automatisierte Inhaltsanalyse als Ergänzung

Die Grenze zwischen klassischer quantitativer Inhaltsanalyse und automatisierter Textanalyse verschwimmt zunehmend. Wörterbuch-basierte Verfahren, topic models und in den letzten Jahren Sprachmodelle eröffnen neue Möglichkeiten der Textauszählung — und werden in Dissertationen und zunehmend in Masterarbeiten genutzt. Für Bachelorarbeiten bleibt der klassische Weg mit manueller Kodierung in der Regel die bessere Wahl, weil die methodische Kontrolle höher ist und weniger Zusatzwissen voraussetzt.

Wer automatisierte Verfahren nutzt, sollte die Ergebnisse immer gegen eine manuell kodierte Teilstichprobe validieren. Eine automatisch klassifizierte Textsammlung von zehntausend Artikeln ohne Validierung ist methodisch schwach; mit einer manuell kodierten Validierungsstichprobe von einigen hundert Fällen wird sie belastbar. Diese Kombination aus maschineller Breite und manueller Tiefe gilt inzwischen als methodischer Standard in größer angelegten Studien.

Zusammenfassung

Die quantitative Inhaltsanalyse zählt regelgeleitet aus, was ein zuvor festgelegtes Codebuch definiert. Ihre Stärke ist die Vergleichbarkeit über große Textmengen; ihre methodische Mitte ist das Codebuch mit präzisen Kategorien, Definitionen und Entscheidungsregeln; ihre Gütefrage ist die Intercoder-Reliabilität. Eingesetzt wird sie vor allem in Medien- und Kommunikationswissenschaft, zunehmend auch in der Analyse sozialer Medien. Wer die Grenzen der Methode respektiert — Zählbares statt Verstehen — gewinnt belastbare Aussagen über Muster, die durch qualitative Interpretation allein nicht sichtbar werden.

Unterstützung beim Codebuch, der Kodierung oder der statistischen Auswertung?

Kostenlos anfragen WhatsApp →