Zum Inhalt springen
Wissenschaftliches SchreibenAllgemeinBachelor · Master

Sekundärdatenanalyse: vorhandene Datensätze und Dokumente wissenschaftlich nutzen

Wie du Sekundärdaten und Dokumente in Seminararbeiten, Hausarbeiten, Forschungsarbeiten und Abschlussprojekten sauber als Evidenz nutzt.

Texio Akademisches Schreibteam20 Min. Lesezeit
Daten- und Dokumentknoten laufen zu einem orangefarbenen Evidenzpunkt — Sekundärdatenanalyse
Vorhandene Datensätze und Dokumente werden zu prüfbarer Evidenz für eine Forschungsfrage zusammengeführt.

Sekundärdatenanalyse bedeutet, vorhandene Datensätze, Dokumente oder Archivmaterialien systematisch für eine eigene Forschungsfrage auszuwerten. Für Bachelor- und Masterarbeiten ist sie geeignet, wenn Quelle, Auswahl, Auswertungslogik und Grenzen transparent beschrieben werden.

Sekundärdatenanalyse: vorhandene Datensätze und Dokumente wissenschaftlich nutzen

Du hast ein Thema, aber keine Zeit, eigene Interviews zu führen, einen Fragebogen zu verteilen oder Feldzugang zu organisieren — und trotzdem soll deine Arbeit empirisch nachvollziehbar sein. Genau hier wirkt die Sekundärdatenanalyse attraktiv: Es gibt Statistiken, Geschäftsberichte, Leitlinien, Schulprogramme, Gesetzestexte, Social-Media-Beiträge, Protokolle oder Forschungsdatensätze, die scheinbar schon alles enthalten. Das Problem beginnt meistens nicht beim Material, sondern bei der Frage, ob du es wissenschaftlich sauber auswählen, begründen und auswerten kannst. Viele Studierende sammeln zu viele Dokumente, zitieren einzelne Zahlen ohne Kontext oder schreiben „Dokumentenanalyse“ in den Methodikteil, ohne ein Verfahren zu nennen. Dann wirkt die Arbeit wie eine Materialsammlung statt wie Forschung.

Sekundärdatenanalyse bedeutet, vorhandene Datensätze, Dokumente oder Archivmaterialien für eine eigene Forschungsfrage systematisch auszuwerten. Sie eignet sich für Bachelor- und Masterarbeiten, wenn du transparent erklärst, warum genau dieses Material passt, nach welchen Kriterien du es auswählst und wie du daraus belastbare Aussagen ableitest.

In diesem Leitfaden

Was ist Sekundärdatenanalyse und wann passt sie zu deiner Arbeit?

Sekundärdatenanalyse ist die Auswertung bereits vorhandener Daten für eine neue oder präzisierte Forschungsfrage. Sie passt, wenn die vorhandenen Daten inhaltlich zur Frage passen, methodisch nachvollziehbar entstanden sind und du ihre Grenzen offen benennen kannst. Für Studierende ist sie oft realistisch, weil Datenerhebung, Feldzugang und Rekrutierung entfallen, die analytische Verantwortung aber bleibt.

Kurze Begriffsabgrenzung

Sekundärdaten sind Daten, die nicht von dir selbst für deine aktuelle Arbeit erhoben wurden. Dazu gehören amtliche Statistiken, öffentlich zugängliche Forschungsdatensätze, Registerdaten, Geschäftsberichte, Jahresberichte, Richtlinien, Gerichtsentscheidungen, Medienbeiträge oder Organisationsdokumente.

Primärdaten sind Daten, die du selbst erhebst, etwa durch Interviews, Umfragen, Beobachtungen oder Experimente. Eine Sekundärdatenanalyse ist also nicht „weniger empirisch“, nur weil du nicht selbst ins Feld gehst. Empirisch ist sie dann, wenn du beobachtbare Daten oder Dokumente nach einer nachvollziehbaren Methode analysierst.

Dokumentenanalyse bezeichnet eine Methode, bei der schriftliche, visuelle oder digitale Dokumente als Datenmaterial untersucht werden. Eine Dokumentenanalyse Methode kann qualitativ sein, etwa durch Kategorienbildung, oder quantitativ, etwa durch Häufigkeitszählungen bestimmter Merkmale.

Wann die Methode gut passt

Sekundärforschung ist besonders sinnvoll, wenn deine Forschungsfrage auf bereits dokumentierte Prozesse, Entscheidungen, Diskurse oder Kennzahlen zielt. In der Psychologie könntest du etwa vorhandene Befragungsdaten zur Einsamkeit von Studierenden nach Altersgruppen auswerten, statt eine eigene Befragung aufzusetzen. In der Pflegewissenschaft könntest du Entlassungsleitlinien verschiedener Kliniken daraufhin untersuchen, wie Medikamentenadhärenz bei älteren Patient:innen angesprochen wird.

Auch in BWL, Bildungswissenschaft oder Recht funktioniert die Methode gut. Eine betriebswirtschaftliche Seminararbeit kann Nachhaltigkeitsberichte von Unternehmen vergleichen, während eine bildungswissenschaftliche Arbeit Schulprogramme auf Inklusionskonzepte untersucht. Eine rechtswissenschaftlich geprägte Arbeit kann Urteile oder Gesetzesmaterialien systematisch nach Argumentationsmustern analysieren.

Nicht passend ist Sekundärdatenanalyse, wenn deine Frage etwas verlangt, das im Material gar nicht beobachtbar ist. Wenn du „Warum fühlen sich Erstsemester überfordert?“ fragst, aber nur Hochschulstatistiken zu Abbruchquoten nutzt, fehlen dir Daten zu subjektiven Gründen. Dann musst du entweder die Frage anpassen oder eine andere Methode wählen; hilfreich ist dabei oft ein Blick auf Methodenwahl als klarer Entscheidungsprozess.

Welche Daten und Dokumente eignen sich für Sekundärforschung in Bachelorarbeit und Masterarbeit?

Geeignet sind Daten und Dokumente, die zugänglich, zitierbar, thematisch passend und methodisch einschätzbar sind. Für eine Sekundärforschung Bachelorarbeit reichen oft kleinere, klar abgegrenzte Korpora, während Masterarbeiten meist eine anspruchsvollere Auswahl- und Auswertungslogik brauchen. Entscheidend ist nicht die Materialmenge, sondern die Passung zwischen Frage, Datenquelle und Auswertungsverfahren.

Typische Materialarten

Studierende denken bei Sekundärdaten oft zuerst an Statistikportale. Das ist naheliegend, aber zu eng. Du kannst Sekundärdaten nutzen, wenn dein Material bereits vorliegt und für deine Fragestellung neu ausgewertet wird.

Typische Materialarten sind:

  • amtliche Statistiken, etwa Arbeitslosenquoten, Bildungsberichte oder Gesundheitsindikatoren
  • Forschungsdatensätze aus Datenarchiven
  • Organisationsdokumente wie Jahresberichte, Leitbilder, Compliance-Richtlinien oder Nachhaltigkeitsberichte
  • politische Dokumente wie Strategiepapiere, Parlamentsdebatten oder Gesetzesbegründungen
  • Medienmaterial wie Pressemitteilungen, Artikel, Podcasts oder Social-Media-Posts
  • fachliche Dokumente wie Leitlinien, Standards, Curricula oder Prüfungsordnungen
  • juristische Dokumente wie Urteile, Verordnungen oder Kommentierungen

Nicht jedes öffentlich verfügbare Dokument ist automatisch gutes Forschungsmaterial. Ein Instagram-Post kann relevant sein, wenn deine Frage digitale Gesundheitskommunikation betrifft; er ist ungeeignet, wenn du daraus allgemeine Aussagen über Patient:innenverhalten ableiten willst.

Vergleich: schwache und tragfähige Materialwahl

Schwache MaterialwahlTragfähigere Materialwahl
„Ich analysiere verschiedene Webseiten zum Thema Nachhaltigkeit.“„Ich analysiere die Nachhaltigkeitsberichte der fünf umsatzstärksten deutschen Lebensmitteleinzelhändler aus den Jahren 2021 bis 2023.“
„Ich nutze Statistiken über Studierende.“„Ich werte Daten des Studierendensurveys zu Erwerbsarbeit und Studienbelastung bei Bachelorstudierenden aus.“
„Ich schaue mir Leitlinien in der Pflege an.“„Ich vergleiche drei nationale Pflegeleitlinien daraufhin, wie sie Entlassungsmanagement für ältere Patient:innen mit Polypharmazie beschreiben.“
„Ich nehme Zeitungsartikel über KI.“„Ich untersuche Leitartikel aus drei überregionalen Tageszeitungen im Zeitraum Januar bis Juni 2025 auf Deutungsmuster zu KI in Prüfungen.“

Die rechte Spalte ist nicht automatisch „perfekt“, aber sie macht Auswahl, Zeitraum, Einheit und Erkenntnisinteresse sichtbar. Genau diese Angaben braucht deine Methodik.

Zugang, Zitierbarkeit und Stabilität

Für wissenschaftliches Arbeiten brauchst du Quellen, die deine Leser:innen grundsätzlich nachvollziehen können. Öffentliche Statistiken, Datenarchive, institutionelle Berichte und juristische Datenbanken sind dafür meist besser geeignet als zufällig gefundene Webseiten. Wenn sich Webseiten häufig ändern, solltest du Abrufdatum, Archivversion oder Dokumentversion angeben.

Bei Datensätzen prüfst du, ob Codebuch, Variablenbeschreibung und Erhebungsinformationen verfügbar sind. Ohne diese Metadaten kannst du Zahlen zwar übernehmen, aber kaum sauber interpretieren. Bei Dokumenten prüfst du Autor:in, Herausgeber:in, Zweck, Zielgruppe, Veröffentlichungsdatum und institutionellen Kontext.

Wenn du noch unsicher bist, welche Quellen vertrauenswürdig sind, hilft die Systematik aus Geprüfte Quellen für ein Literaturreview, auch wenn du nicht nur Literatur, sondern Daten und Dokumente suchst.

Wie grenzt du Forschungsfrage und Materialkorpus für die Dokumentenanalyse Methode ein?

Eine brauchbare Forschungsfrage sagt, welches Phänomen du an welchem Material mit welchem Erkenntnisinteresse untersuchst. Der Materialkorpus ist die begründete Menge der Daten oder Dokumente, die du tatsächlich analysierst. Ohne diese Eingrenzung wird die Dokumentenanalyse Methode schnell zu breit, zufällig oder nicht prüfbar.

Vom Thema zur analysierbaren Frage

Viele Arbeiten starten mit Themen wie „Digitalisierung im Gesundheitswesen“ oder „Nachhaltigkeit in Unternehmen“. Für Sekundärdatenanalyse sind solche Themen noch nicht arbeitsfähig. Du brauchst eine Frage, die an vorhandenen Daten beobachtbar ist.

Schwache Version:

Schwach: „Wie wirkt sich Digitalisierung auf Krankenhäuser aus?“

Stärkere Version:

Stärker: „Wie beschreiben die Digitalisierungsstrategien von fünf deutschen Universitätskliniken zwischen 2020 und 2024 den Einsatz digitaler Patientenportale?“

Die stärkere Version benennt Dokumenttyp, Organisationstyp, Zeitraum und Fokus. Du kannst nun prüfen, ob die Dokumente existieren, ob sie vergleichbar sind und welche Kategorien du anlegen könntest. Für die Eingrenzung von Themen und Fragen passt auch Vom breiten Themenfeld zur eingegrenzten Forschungsfrage.

Korpusregeln statt Bauchgefühl

Ein Materialkorpus ist die festgelegte Gesamtheit der Dokumente oder Dateneinheiten, die du analysierst. Er entsteht nicht dadurch, dass du „alles Relevante“ sammelst, sondern durch klare Einschluss- und Ausschlusskriterien.

Für eine Dokumentenanalyse könntest du festlegen:

  1. Welche Dokumentart wird untersucht, z. B. Jahresberichte, Leitlinien oder Urteile?
  2. Welcher Zeitraum gilt, z. B. 2020 bis 2024?
  3. Welche Fälle oder Organisationen werden einbezogen?
  4. Welche Sprache, Region oder Rechtsordnung ist relevant?
  5. Welche Dokumente werden ausgeschlossen, z. B. Blogbeiträge, Werbematerial oder doppelte Versionen?
  6. Wie dokumentierst du die Suche und Auswahl?

Diese Regeln schützen dich vor dem Vorwurf, du hättest nur Material genommen, das deine Vermutung stützt. Sie machen außerdem sichtbar, warum dein Korpus zur Forschungsfrage passt.

Beispiel aus drei Fächern

In der Sozialpsychologie könnte eine Arbeit untersuchen, wie Universitäten in öffentlich zugänglichen Beratungsseiten mentale Gesundheit von Studierenden rahmen. Der Korpus wären etwa Beratungsseiten von zehn Hochschulen, ausgewählt nach Hochschultyp und Region.

In der Pflegewissenschaft könnte eine Masterarbeit vorhandene Leitlinien zum Umgang mit Sturzrisiken in der ambulanten Pflege vergleichen. Der Korpus wären klar benannte Leitlinienversionen, nicht beliebige Informationsseiten.

In der Betriebswirtschaft könnte eine Arbeit Nachhaltigkeitsberichte börsennotierter Unternehmen daraufhin analysieren, wie Lieferkettenrisiken beschrieben werden. Der Korpus müsste Branche, Zeitraum und Unternehmensauswahl offenlegen.

Wie kannst du vorhandene Daten auswerten, ohne nur zusammenzufassen?

Du wertest vorhandene Daten wissenschaftlich aus, indem du aus einer Frage heraus Kriterien, Variablen oder Kategorien bildest und diese systematisch auf das Material anwendest. Eine bloße Inhaltsangabe zählt nicht als Analyse. Analyse beginnt dort, wo du Muster, Unterschiede, Zusammenhänge oder Brüche anhand einer transparenten Auswertungslogik zeigst.

Quantitative Sekundärdatenanalyse

Bei quantitativer Sekundärdatenanalyse arbeitest du mit numerischen Daten. Du übernimmst nicht einfach Tabellen, sondern prüfst, welche Variablen zu deiner Frage passen, wie sie gemessen wurden und welche Vergleiche möglich sind.

Ein Beispiel aus der Bildungsforschung: Du möchtest untersuchen, ob Studierende mit regelmäßiger Erwerbsarbeit häufiger von Zeitdruck berichten. Wenn ein vorhandener Datensatz Variablen zu Wochenarbeitszeit, Studienfach, Semesterzahl und Belastungsskala enthält, kannst du Gruppen vergleichen oder Zusammenhänge berechnen. Du musst aber erklären, wie „regelmäßige Erwerbsarbeit“ im Datensatz gemessen wurde und welche Skala „Zeitdruck“ abbildet.

Typische Schritte sind:

  1. Forschungsfrage in messbare Variablen übersetzen.
  2. Codebuch lesen und Variablenauswahl begründen.
  3. Fälle prüfen, etwa nach Studienniveau, Land oder Altersgruppe.
  4. Daten bereinigen, fehlende Werte dokumentieren und Ausreißer prüfen.
  5. Deskriptive Auswertung durchführen.
  6. Falls passend, Gruppenvergleiche oder Zusammenhangsanalysen berechnen.
  7. Ergebnisse mit Grenzen der Datenerhebung interpretieren.

Wenn du Hypothesen brauchst, sollte die Verbindung zwischen Variablen, Forschungsziel und Annahme klar sein; dazu passt Variablenmodell für Forschungsziel, Forschungsfragen und Hypothesen.

Qualitative Dokumentenanalyse

Bei qualitativer Dokumentenanalyse arbeitest du häufig mit Kategorien. Diese können aus Theorie, aus Vorarbeiten oder aus dem Material selbst entstehen. Wichtig ist, dass du nicht nur spannende Zitate auswählst, sondern beschreibst, wie du codierst.

Ein Beispiel aus der Gesundheitskommunikation: Du untersuchst Informationsbroschüren zur Impfberatung in drei Bundesländern. Kategorien könnten „Risikodarstellung“, „Adressierung von Unsicherheit“, „Handlungsempfehlung“ und „Verweis auf Fachpersonal“ sein. Du zeigst dann nicht nur einzelne Formulierungen, sondern vergleichst, wie diese Kategorien in den Dokumenten auftreten.

Eine qualitative Analyse braucht meist ein Kategoriensystem, Codierregeln und Beispielstellen. Bei kleinen Haus- oder Seminararbeiten reicht oft ein überschaubares Kategoriensystem mit vier bis acht Kategorien. Bei Masterarbeiten wird erwartet, dass du die Kategorienbildung und Materialdurchsicht genauer beschreibst.

Schwach gegen stärker: Analyseformulierung

Schwache studentische FormulierungStärkere wissenschaftliche Formulierung
„Viele Berichte reden über Nachhaltigkeit, deshalb ist das Thema wichtig.“„In vier von fünf Berichten wird Nachhaltigkeit vor allem über Emissionsreduktion beschrieben; soziale Lieferkettenrisiken erscheinen dagegen nur in kurzen Abschnitten ohne messbare Zielgrößen.“
„Die Statistik zeigt, dass Studierende gestresst sind.“„Der Anteil der Studierenden mit hoher Belastungsangabe ist in der Gruppe mit mehr als 15 Erwerbsarbeitsstunden pro Woche höher als in der Vergleichsgruppe; die Daten erlauben jedoch keine Kausalaussage.“
„Die Leitlinien sind ähnlich.“„Alle drei Leitlinien nennen Sturzrisikoerfassung, unterscheiden sich aber darin, ob sie Verantwortlichkeiten im ambulanten Übergang konkret benennen.“

Die stärkeren Versionen zeigen Befund, Vergleich und Grenze. Sie klingen nicht spektakulärer, sondern prüfbarer.

Wie schreibst du den Methodikteil für Sekundärdatenanalyse nachvollziehbar?

Der Methodikteil erklärt, welches Material du warum ausgewählt hast, wie du es ausgewertet hast und welche Grenzen daraus folgen. Leser:innen müssen deine Entscheidungen gedanklich nachprüfen können. Ein guter Methodikteil ist deshalb weniger eine Rechtfertigung der Methode als ein Protokoll deiner Forschungslogik.

Aufbau des Methodikteils

Ein Methodikteil zur Sekundärdatenanalyse kann je nach Arbeit unterschiedlich lang sein, folgt aber meist derselben Grundstruktur. Du beginnst mit dem Forschungsdesign, beschreibst dann Datenquelle oder Korpus und erklärst anschließend Auswertung und Qualitätssicherung.

Eine mögliche Struktur:

  1. Forschungsdesign: qualitative Dokumentenanalyse, quantitative Sekundärdatenanalyse oder kombinierter Ansatz.
  2. Datenquelle und Material: Herkunft, Zeitraum, Fallauswahl, Dokumenttyp oder Datensatzversion.
  3. Einschluss- und Ausschlusskriterien: welche Daten einbezogen wurden und warum andere nicht.
  4. Auswertungsschritte: Variablenauswahl, Kategorienbildung, Codierung, statistische Verfahren oder Vergleichslogik.
  5. Nachvollziehbarkeit: Codebuch, Kategoriensystem, Suchprotokoll, Tabellen oder Anhang.
  6. Limitationen: Grenzen der Datenqualität, Aktualität, Vergleichbarkeit und Aussagekraft.

Für eine wissenschaftliche Arbeit reicht „Ich habe eine Dokumentenanalyse durchgeführt“ nicht. Du musst sagen, welche Art von Dokumentenanalyse es ist und was du konkret getan hast. Wenn du beim Methodikteil hängst, ist Methodikteil schreiben als klarer Forschungsablauf eine passende Vertiefung.

Formulierungen, die funktionieren

Statt allgemeiner Methodensätze brauchst du präzise Beschreibungen. Ein Satz wie „Die Daten wurden ausgewertet“ bleibt leer, weil niemand erfährt, nach welcher Logik.

Besser wäre:

„Der Korpus umfasst 18 Nachhaltigkeitsberichte von sechs Unternehmen aus den Jahren 2021 bis 2023. Die Berichte wurden mithilfe eines theoriegeleiteten Kategoriensystems analysiert, das drei Kategorien zu ökologischen Zielgrößen, Lieferkettenrisiken und sozialer Verantwortung enthält.“

Oder bei quantitativen Daten:

„Aus dem Datensatz wurden Fälle von Bachelorstudierenden im Alter von 18 bis 29 Jahren ausgewählt. Analysiert wurden die Variablen Wochenarbeitszeit, subjektive Studienbelastung und Fachgruppe; fehlende Werte wurden vor der deskriptiven Auswertung dokumentiert.“

Solche Formulierungen zeigen Auswahl, Einheit und Verfahren. Genau das braucht die methodische Transparenz.

Tabellen, Anhänge und Replizierbarkeit

Du musst nicht jeden Arbeitsschritt im Fließtext ausbreiten. Viele Details gehören in Tabellen oder Anhänge: Korpusliste, Variablenübersicht, Suchprotokoll, Kategoriensystem oder Codierbeispiele.

Bei Dokumenten ist eine Korpustabelle nützlich. Sie enthält Dokumenttitel, Herausgeber:in, Jahr, Dokumenttyp, Umfang und Begründung der Aufnahme. Bei Datensätzen ist eine Variablentabelle sinnvoll, die Variablenname, Bedeutung, Skalenniveau und Verwendung in der Analyse zeigt.

Replizierbarkeit bedeutet in studentischen Arbeiten nicht, dass jemand deine Arbeit identisch neu durchführen muss. Es bedeutet, dass deine Auswahl und Auswertung so klar beschrieben sind, dass die Logik prüfbar ist. Gerade bei vorhandenen Daten ist das wichtig, weil dein eigener Beitrag in Auswahl, Zuschnitt und Interpretation liegt.

Welche Fehler machen Studierende häufig bei Sekundärdaten und Dokumentenanalyse?

Studierende scheitern bei Sekundärdaten selten daran, dass kein Material vorhanden ist, sondern daran, dass Material, Frage und Methode nicht zusammenpassen. Häufig werden Dokumente gesammelt, aber nicht systematisch ausgewertet. Die folgenden Fehler sind typisch und lassen sich durch klare Auswahlregeln, saubere Begriffe und transparente Auswertung vermeiden.

Fehler mit Beispielen und Korrektur

  1. Fehler: Material als Methode ausgeben
    Beispiel: „Als Methode nutze ich Geschäftsberichte.“
    Korrektur: Geschäftsberichte sind Material, keine Methode. Formuliere: „Ich führe eine qualitative Dokumentenanalyse von Geschäftsberichten durch und werte sie anhand eines Kategoriensystems zu Zielgrößen, Risiken und Verantwortlichkeiten aus.“

  2. Fehler: Zu breite Dokumentenauswahl ohne Zeitraum
    Beispiel: „Ich analysiere Medienberichte über künstliche Intelligenz in Schulen.“
    Korrektur: Lege Medium, Zeitraum und Textsorte fest, etwa: „Leitartikel aus drei überregionalen Tageszeitungen von Januar bis Juni 2025.“

  3. Fehler: Zahlen ohne Messkontext interpretieren
    Beispiel: „Die Statistik zeigt, dass Studierende mit Nebenjob schlechter studieren.“
    Korrektur: Prüfe, welche Variable überhaupt gemessen wurde. Vielleicht enthält der Datensatz nur Selbsteinschätzung der Belastung, nicht Studienleistung; dann darfst du nicht über Leistung urteilen.

  4. Fehler: Einzelzitate als Beweis verwenden
    Beispiel: „Eine Klinik schreibt, Entlassungsmanagement sei wichtig, also ist das in der Pflege gut umgesetzt.“
    Korrektur: Ein Zitat zeigt eine Formulierung, keine Umsetzung. Vergleiche mehrere Dokumente und unterscheide zwischen Anspruch, Regelung und nachweisbarer Praxis.

  5. Fehler: Dokumente ohne Entstehungskontext lesen
    Beispiel: „Der Nachhaltigkeitsbericht zeigt objektiv, wie nachhaltig das Unternehmen ist.“
    Korrektur: Ein Nachhaltigkeitsbericht ist auch Selbstdarstellung. Analysiere, welche Aussagen messbar sind, welche strategisch formuliert wirken und welche Themen fehlen.

Warum diese Fehler die Note drücken

Solche Fehler schwächen nicht nur den Methodikteil, sondern auch deine Ergebnisse. Wenn die Daten nicht zur Frage passen, wirken spätere Befunde zufällig. Wenn du Zahlen oder Dokumente ohne Kontext liest, entstehen Aussagen, die stärker klingen, als das Material erlaubt.

Prüfer:innen achten besonders darauf, ob du Sekundärdaten nutzen kannst, ohne sie wie neutrale Fakten zu behandeln. Vorhandene Daten sind immer unter bestimmten Bedingungen entstanden: mit bestimmten Kategorien, Interessen, Messinstrumenten, Dokumentzwecken oder Auswahlregeln. Deine Aufgabe ist es, diese Bedingungen sichtbar zu machen.

Wie prüfst du Qualität, Ethik und Grenzen vorhandener Daten?

Die Qualität vorhandener Daten prüfst du über Herkunft, Erhebungs- oder Entstehungskontext, Aktualität, Vollständigkeit und Passung zur Forschungsfrage. Ethische Fragen entstehen auch bei Sekundärdaten, besonders wenn personenbezogene Informationen, sensible Gruppen oder digitale Spuren betroffen sind. Grenzen gehören nicht als Entschuldigung ans Ende, sondern als Teil deiner Forschungslogik in Methode und Diskussion.

Qualitätsfragen an Datensätze

Bei quantitativen Datensätzen solltest du nicht nur fragen, ob die Daten „seriös“ wirken. Du brauchst konkrete Prüfpunkte:

  • Wer hat die Daten erhoben?
  • Für welchen Zweck wurden sie erhoben?
  • Welche Grundgesamtheit und Stichprobe liegen vor?
  • Welche Variablen sind für deine Frage nutzbar?
  • Wie wurden zentrale Begriffe operationalisiert?
  • Gibt es fehlende Werte oder Filterführungen?
  • Welche Gewichtungen oder Bereinigungsschritte sind dokumentiert?
  • Welche Zeitpunkte oder Länder sind vergleichbar?

Wenn ein Datensatz etwa Erwerbsarbeit von Studierenden nur als Ja-Nein-Variable erfasst, kannst du keine differenzierten Aussagen zu Arbeitsumfang treffen. Wenn Belastung nur über eine einzelne Selbsteinschätzungsfrage gemessen wird, solltest du nicht von klinischem Stress sprechen.

Qualitätsfragen an Dokumente

Dokumente entstehen nicht im luftleeren Raum. Ein Leitbild, ein Jahresbericht, eine Richtlinie und ein Gerichtsurteil haben unterschiedliche Zwecke. Deshalb musst du Dokumente als kommunikative und institutionelle Produkte lesen.

Frage bei Dokumenten:

  • Wer ist Herausgeber:in oder Autor:in?
  • An wen richtet sich das Dokument?
  • Welcher Anlass führte zur Veröffentlichung?
  • Ist das Dokument normativ, informierend, werbend oder berichtend?
  • Welche Version oder welches Datum liegt vor?
  • Gibt es vergleichbare Dokumente derselben Art?
  • Welche Perspektiven fehlen?
  • Welche Aussagen sind überprüfbar, welche bleiben programmatisch?

In einer Arbeit über Schulprogramme zur Inklusion wäre es ein Fehler, aus programmatischen Aussagen direkt auf Unterrichtspraxis zu schließen. Du kannst aber analysieren, wie Inklusion sprachlich, organisatorisch und normativ dargestellt wird.

Datenschutz und Forschungsethik

Öffentlich zugänglich heißt nicht automatisch ethisch unproblematisch. Besonders bei Social-Media-Daten, Forenbeiträgen oder Bewertungsportalen musst du prüfen, ob Personen identifizierbar sind und ob sensible Informationen berührt werden. Auch wenn du keine Namen nennst, können Kombinationen aus Ort, Ereignis und Zitat identifizierend wirken.

Bei amtlichen oder anonymisierten Forschungsdatensätzen sind ethische Risiken meist geringer, aber nicht verschwunden. Du solltest Nutzungsbedingungen, Lizenz und Zitationsvorgaben beachten. Bei Dokumenten aus Organisationen kann die Frage entstehen, ob interne Unterlagen überhaupt verwendet werden dürfen.

Grenzen formulierst du konkret. Nicht: „Die Arbeit hat Limitationen.“ Besser: „Die Analyse erfasst veröffentlichte Selbstdarstellungen der Unternehmen, nicht interne Entscheidungsprozesse oder tatsächliche Lieferkettenpraktiken.“

Wie machst du aus Sekundärdaten eine tragfähige wissenschaftliche Argumentation?

Aus Sekundärdaten entsteht eine Argumentation, wenn du Befunde nicht nur berichtest, sondern auf deine Forschungsfrage beziehst, mit Theorie oder Literatur verbindest und die Aussagekraft begrenzt. Gute Ergebnisse zeigen Muster im Material und erklären, was daraus folgt. Die Diskussion darf weder mehr behaupten, als die Daten tragen, noch bei einer bloßen Wiederholung der Befunde stehen bleiben.

Vom Befund zur Aussage

Ein Befund ist zunächst nur das, was du im Material beobachtest. Eine wissenschaftliche Aussage entsteht, wenn du diesen Befund einordnest.

Beispiel aus der Pflegewissenschaft:

  • Befund: Drei Leitlinien nennen Entlassungsgespräche, aber nur eine beschreibt Verantwortlichkeiten für Medikamentenabgleich.
  • Aussage: Das Material deutet auf eine Lücke zwischen allgemeiner Empfehlung und konkreter Prozessverantwortung hin.
  • Grenze: Die Dokumentenanalyse zeigt Richtlinienlogik, nicht tatsächliche Umsetzung im Pflegealltag.

Beispiel aus der BWL:

  • Befund: Unternehmen berichten Emissionsziele mit Kennzahlen, aber Lieferkettenrisiken meist narrativ.
  • Aussage: Ökologische Verantwortung wird im Korpus stärker quantifiziert als soziale Verantwortung.
  • Grenze: Die Analyse prüft Berichtspraktiken, nicht reale Nachhaltigkeitsleistung.

Diese Unterscheidung macht deine Arbeit analytisch. Du gibst nicht nur wieder, was im Material steht, sondern zeigst, welche Schlussfolgerung mit welcher Reichweite möglich ist.

Verbindung mit Literatur und Theorie

Sekundärdatenanalyse ersetzt nicht die Literaturarbeit. Du brauchst theoretische Begriffe, Forschungsstand oder fachliche Modelle, damit deine Befunde nicht isoliert bleiben. Wenn du etwa Dokumente zur Hochschulkommunikation über mentale Gesundheit untersuchst, brauchst du Literatur zu Gesundheitskommunikation, Stigma oder Beratungszugang.

Dabei geht es nicht darum, möglichst viele Quellen einzubauen. Es geht darum, deine Kategorien und Interpretationen zu begründen. Eine Kategorie wie „Individualisierung von Verantwortung“ wirkt stärker, wenn du sie aus Forschungsliteratur herleitest und dann im Material prüfst.

Für den Aufbau deines Literaturteils helfen thematische Cluster. Statt Quelle für Quelle abzuarbeiten, ordnest du Forschungsstränge so, dass deine spätere Datenanalyse vorbereitet wird; dazu passt Thematische Quellencluster mit Forschungslücke.

Ergebnisdarstellung ohne Datenfriedhof

Bei Sekundärdatenanalyse besteht die Gefahr, zu viele Tabellen, Zitate oder Dokumentdetails zu zeigen. Wähle Ergebnisse nach ihrer Relevanz für die Forschungsfrage aus. Nicht jedes codierte Detail gehört in den Haupttext.

Eine sinnvolle Ergebnisdarstellung folgt oft dieser Reihenfolge:

  1. Kurze Erinnerung an Auswertungslogik oder Kategorie.
  2. Darstellung des zentralen Musters.
  3. Beleg durch Zahl, Tabelle, Dokumentstelle oder Zitat.
  4. Vergleich zwischen Fällen, Gruppen oder Zeitpunkten.
  5. Zwischenaussage zur Forschungsfrage.

Wenn du vorhandene Daten auswerten willst, musst du außerdem zwischen Beschreibung und Interpretation trennen. Eine Tabelle zeigt Werte; deine Interpretation erklärt, warum diese Werte für die Frage relevant sind und welche Grenzen sie haben.

Was gehört auf deine Checkliste, bevor du weiterarbeitest?

Bevor du mit der Auswertung oder dem Schreiben beginnst, sollte deine Sekundärdatenanalyse als Forschungsdesign prüfbar sein. Die wichtigsten Punkte betreffen Frage, Material, Auswahl, Methode, Qualität und Grenzen. Wenn mehrere Punkte unklar bleiben, solltest du zuerst den Zuschnitt überarbeiten, statt direkt Ergebnisse zu schreiben.

Before you move on: Checkliste für Sekundärdatenanalyse

  • Meine Forschungsfrage lässt sich mit vorhandenen Daten oder Dokumenten tatsächlich beantworten.
  • Ich habe klar benannt, ob ich eine quantitative Sekundärdatenanalyse, eine qualitative Dokumentenanalyse oder eine Kombination nutze.
  • Mein Materialkorpus ist nach Zeitraum, Dokumenttyp, Fällen und Auswahlkriterien abgegrenzt.
  • Ich kann erklären, warum genau diese Daten oder Dokumente zur Frage passen.
  • Ich habe Einschluss- und Ausschlusskriterien schriftlich festgehalten.
  • Bei Datensätzen habe ich Codebuch, Variablen, fehlende Werte und Messlogik geprüft.
  • Bei Dokumenten habe ich Herausgeber:in, Zweck, Zielgruppe, Version und Kontext geprüft.
  • Meine Auswertungsmethode geht über Zusammenfassung oder Inhaltsangabe hinaus.
  • Ich kann mindestens eine Grenze der Aussagekraft konkret formulieren.
  • Datenschutz, Nutzungsrechte und Zitierbarkeit sind geklärt.
  • Ergebnisse, Literatur und Forschungsfrage sind logisch miteinander verbunden.

Letzter Plausibilitätscheck

Stell dir vor, eine andere Person liest nur Forschungsfrage, Korpusbeschreibung und Auswertungsschritte. Könnte sie verstehen, warum du dieses Material gewählt hast und wie du zu deinen Befunden kommst? Wenn ja, ist deine Methode wahrscheinlich nachvollziehbar.

Wenn nein, liegt das Problem meist an einer von drei Stellen: Die Frage ist zu breit, das Material ist nicht sauber begrenzt oder die Auswertung bleibt zu beschreibend. Korrigiere zuerst diese Grundlage. Danach wird auch das Schreiben von Ergebnis- und Diskussionsteil deutlich leichter.

(Build-System-Metadaten — diesen Abschnitt nicht entfernen)

Häufig gestellte Fragen

Was ist der Unterschied zwischen Sekundärdatenanalyse und Dokumentenanalyse?

Sekundärdatenanalyse ist der Oberbegriff für die Auswertung bereits vorhandener Daten. Dokumentenanalyse ist eine konkrete Methode, bei der Dokumente wie Berichte, Leitlinien, Urteile oder Webseiten als Material untersucht werden. Eine Dokumentenanalyse kann also eine Form der Sekundärdatenanalyse sein.

Wie viele Dokumente brauche ich für eine Bachelorarbeit?

Die Anzahl hängt von Forschungsfrage, Dokumentumfang und Auswertungstiefe ab. Für eine Bachelorarbeit kann ein kleiner, klar begrenzter Korpus von etwa 5 bis 20 Dokumenten ausreichen, wenn die Analyse gründlich ist. Wichtiger als die Menge ist, dass Auswahlkriterien und Auswertungsmethode nachvollziehbar sind.

Kann ich in einer Masterarbeit nur Sekundärdaten nutzen?

Ja, eine Masterarbeit kann vollständig auf Sekundärdaten beruhen, wenn Forschungsfrage, Datengrundlage und Auswertung anspruchsvoll genug sind. Erwartet wird meist eine genauere methodische Begründung als in einer kleineren Haus- oder Seminararbeit. Besonders wichtig sind Qualität der Daten, transparente Auswahl und klare Grenzen der Aussagekraft.

Darf ich Webseiten als Dokumente analysieren?

Ja, Webseiten können als Dokumente analysiert werden, wenn sie zur Forschungsfrage passen und stabil dokumentiert werden. Du solltest Abrufdatum, Betreiber:in, Seitentyp und Auswahlkriterien angeben. Bei dynamischen Inhalten sind Screenshots, Archivlinks oder klare Dokumentationsregeln sinnvoll.

Ist Sekundärforschung weniger wert als eigene Datenerhebung?

Nein, Sekundärforschung ist nicht automatisch weniger wert. Sie kann methodisch sehr stark sein, wenn vorhandene Daten gezielt, transparent und kritisch ausgewertet werden. Schwach wird sie nur, wenn Material zufällig gesammelt oder ohne Auswertungslogik beschrieben wird.