Vai al contenuto
Scrittura accademicaGeneraleLaurea triennale / Laurea magistrale

Analisi dati secondari tesi: usare dataset e documenti già esistenti

Guida pratica per studenti universitari italiani su analisi dati secondari, analisi documentale e uso rigoroso di fonti già esistenti nella tesi.

Team di scrittura accademica Texio22 min di lettura
Nodi di dataset e documenti convergono in un cerchio centrale — analisi dati secondari tesi
Fonti già esistenti che convergono in una traccia analitica centrale.

L’analisi dei dati secondari nella tesi usa dataset, documenti, report, archivi o statistiche già disponibili come evidenze, purché siano selezionati con criteri chiari e analizzati con un metodo esplicito. Per funzionare, il progetto deve collegare domanda di ricerca, tipo di fonte, strategia di analisi, limiti e trasparenza delle decisioni.

Analisi dati secondari tesi: usare dataset e documenti già esistenti

Hai trovato un dataset pubblico, alcuni report istituzionali e una serie di documenti utili, ma non sai se bastano davvero per costruire una tesi: il dubbio è se stai facendo ricerca o solo “mettendo insieme fonti”. L’analisi dati secondari tesi diventa confusa proprio qui, quando il materiale esiste già ma manca un metodo per trasformarlo in evidenze. Molti studenti di laurea triennale e magistrale pensano che raccogliere dati nuovi sia sempre più “scientifico”, poi scoprono che un buon dataset ufficiale o un corpus documentale ben delimitato può rispondere meglio alla domanda di ricerca. Il punto non è usare fonti già pronte per fare prima, ma spiegare perché sono adatte, come le selezioni, come le analizzi e quali limiti comportano.

L’analisi dei dati secondari nella tesi consiste nell’usare dataset, documenti, report, archivi o statistiche già disponibili come base empirica o teorica della ricerca. Funziona solo se la domanda di ricerca guida la scelta delle fonti e se il metodo di analisi è dichiarato in modo trasparente. La qualità della tesi dipende meno dal fatto che i dati siano “nuovi” e più dalla coerenza tra obiettivo, fonti, procedura e limiti.

In questa guida

Che cosa significa fare analisi dati secondari tesi?

Fare analisi dati secondari tesi significa costruire una risposta di ricerca usando dati raccolti da altri o documenti già esistenti. Non vuol dire copiare risultati altrui: vuol dire formulare una nuova domanda, selezionare fonti pertinenti e applicare una procedura di analisi adatta. La differenza sta nel passaggio da “uso materiale disponibile” a “produco un’interpretazione controllabile”.

Definizioni di base da non confondere

Dati secondari: dati già raccolti per un altro scopo, come statistiche ISTAT, database Eurostat, bilanci aziendali, cartelle aggregate, open data comunali, survey pubbliche o archivi amministrativi accessibili.

Fonti secondarie: materiali che interpretano, commentano o rielaborano informazioni, come articoli scientifici, libri, report di ricerca, policy paper o revisioni della letteratura.

Documenti come dati: testi, regolamenti, linee guida, sentenze, piani strategici, comunicati, protocolli, curricula scolastici o report annuali trattati non solo come citazioni, ma come oggetti da analizzare.

Una tesi può combinare questi livelli. Per esempio, una studentessa di economia può usare dati secondari sui tassi di occupazione giovanile e affiancarli a documenti di policy regionali. Uno studente di psicologia può analizzare dataset pubblici su benessere e uso dei social media, confrontando variabili già presenti. Una studentessa di giurisprudenza può svolgere un’analisi documentale di sentenze e atti normativi, se definisce criteri di selezione e categorie interpretative.

Quando il dato esiste già, la ricerca resta tua

Il fatto che il dato non sia stato raccolto da te non rende la tesi meno autonoma. La tua parte originale può stare nella domanda, nel campione di documenti scelto, nel modo in cui confronti fonti diverse, nel periodo considerato, nelle variabili osservate o nella griglia di codifica.

La domanda utile non è “posso usare dati già disponibili?”, ma “questi dati permettono di rispondere alla mia domanda meglio di una raccolta nuova?”. Se la risposta è sì, la ricerca con fonti secondarie può essere solida, soprattutto quando tempo, accesso al campo o vincoli etici rendono poco realistico raccogliere dati primari.

Per evitare confusione fin dall’inizio, collega subito tema, domanda e metodo. Se il tema è ancora troppo ampio, può aiutarti il percorso descritto in Imbuto concettuale per restringere un argomento di tesi, perché l’analisi secondaria funziona solo quando il perimetro è abbastanza preciso.

Quando conviene usare dati secondari nella tesi invece di raccogliere dati nuovi?

Conviene usare dati secondari nella tesi quando fonti già disponibili rispondono in modo credibile alla domanda di ricerca, con qualità e copertura superiori a quelle che potresti ottenere da solo. È una scelta adatta anche quando l’accesso ai partecipanti è difficile, i tempi sono stretti o l’argomento richiede serie storiche, documenti ufficiali o archivi. Non è una scorciatoia: richiede criteri più espliciti, proprio perché non controlli la raccolta originaria.

Casi in cui i dati secondari sono più adatti

Alcune domande sono quasi impossibili da affrontare bene con una piccola raccolta autonoma. Se vuoi studiare l’andamento della povertà educativa in Italia negli ultimi dieci anni, un questionario inviato a trenta persone non basta. Un dataset istituzionale o una serie di report ministeriali può offrire una base più coerente.

In scienze della salute, una tesi magistrale in infermieristica sull’aderenza terapeutica negli anziani dimessi in assistenza domiciliare potrebbe non avere accesso diretto ai pazienti. Una revisione di documenti clinico-organizzativi pubblici, linee guida regionali e report sanitari aggregati può essere più praticabile e meno problematica sul piano etico.

In management, una tesi sulla rendicontazione ESG delle aziende quotate può analizzare bilanci di sostenibilità già pubblicati. Qui i documenti non sono semplici “materiali da citare”: diventano il corpus su cui osservare ricorrenze, omissioni, indicatori e differenze tra imprese.

Quando invece serve prudenza

Usare dati secondari nella tesi diventa rischioso se la domanda richiede percezioni, esperienze o motivazioni che le fonti esistenti non registrano. Per esempio, se vuoi capire “come gli studenti vivono l’ansia da esame durante il primo anno”, un dataset generale sul rendimento universitario potrebbe non contenere variabili emotive o narrative sufficienti.

C’è anche un problema di scala. Un dataset nazionale può essere autorevole, ma non adatto se la tua domanda riguarda un piccolo contesto locale. Allo stesso modo, documenti prodotti da un ente possono raccontare l’immagine ufficiale di un fenomeno, non necessariamente le pratiche reali.

Versione deboleVersione più solida
“Userò report sull’università per parlare del disagio degli studenti.”“Analizzerò i report annuali di tre atenei italiani pubblicati tra 2020 e 2024 per confrontare come viene definito il disagio psicologico studentesco.”
“Prendo dati ISTAT sui giovani.”“Uso le tavole ISTAT 2018–2023 su occupazione 18–29 anni per osservare differenze territoriali Nord/Sud.”
“Analizzo documenti aziendali sulla sostenibilità.”“Codifico i bilanci di sostenibilità 2022–2024 di cinque aziende energetiche secondo tre categorie: emissioni, governance, obiettivi misurabili.”
“Uso articoli trovati online.”“Seleziono articoli peer-reviewed da banche dati accademiche con criteri di inclusione dichiarati e li tratto come base per una revisione tematica.”

Come si imposta una ricerca con fonti secondarie senza perdere rigore?

Una ricerca con fonti secondarie resta rigorosa quando dichiari perché quelle fonti sono adatte, come le hai trovate, quali criteri hai usato per includerle o escluderle e come le hai analizzate. La trasparenza sostituisce il controllo diretto che avresti nella raccolta di dati primari. Chi legge deve poter capire il percorso che ti porta dalle fonti alle conclusioni.

Dal tema alla domanda analizzabile

La domanda di ricerca deve essere compatibile con ciò che i dati o i documenti possono mostrare. Una domanda come “Perché i giovani non si fidano delle istituzioni?” è troppo ampia se hai solo report statistici. Una versione più gestibile potrebbe essere: “Come varia la fiducia nelle istituzioni tra i giovani italiani 18–29 anni nei dati dell’European Social Survey tra due rilevazioni?”

Se lavori su documenti, evita domande che promettono di misurare effetti reali senza dati adeguati. “Le politiche scolastiche riducono la dispersione?” richiede dati sugli esiti. “Come i piani regionali 2020–2024 definiscono la dispersione scolastica e quali strumenti propongono?” è invece adatta all’analisi documentale.

Per trasformare un tema in domanda, puoi partire dal modello di Dal tema ampio alla domanda di ricerca: oggetto, contesto, popolazione, periodo e tipo di evidenza devono comparire in modo chiaro.

Una procedura pratica in sei passaggi

  1. Definisci la domanda di ricerca in una frase.
  2. Elenca quali tipi di fonte potrebbero rispondere: dataset, report, documenti normativi, archivi, articoli.
  3. Verifica accessibilità, copertura temporale, affidabilità e formato dei materiali.
  4. Stabilisci criteri di inclusione ed esclusione prima di raccogliere tutto.
  5. Scegli la tecnica di analisi: statistica descrittiva, confronto tra variabili, analisi tematica, content analysis, analisi comparativa.
  6. Scrivi una nota sui limiti: dati mancanti, bias di produzione, contesto originario, impossibilità di inferire causalità.

Criteri di selezione visibili

Scrivere “ho scelto i documenti più rilevanti” non basta. Devi spiegare cosa significa “rilevante” nel tuo progetto. Può voler dire pubblicato da un ente ufficiale, riferito a un certo periodo, disponibile integralmente, legato a una popolazione specifica o citato nella letteratura.

Per le fonti accademiche, consulta strategie simili a quelle di Mappa di fonti accademiche verificate. Anche se lavori su dataset o documenti istituzionali, la logica è la stessa: una fonte non è affidabile perché “sembra seria”, ma perché puoi verificarne autore, scopo, data, metodo e contesto.

Come funziona l’analisi documentale metodologia in una tesi?

L’analisi documentale metodologia consiste nel trattare documenti selezionati come dati da esaminare con criteri espliciti. Puoi osservare temi, categorie, linguaggio, assenze, cambiamenti nel tempo o differenze tra enti. Il metodo richiede un corpus delimitato, una griglia di analisi e una spiegazione del modo in cui passi dal testo alle interpretazioni.

Che cosa può diventare corpus documentale

Un corpus documentale è l’insieme dei documenti che analizzi. Può includere linee guida sanitarie, regolamenti universitari, piani strategici, report annuali, sentenze, programmi elettorali, documenti scolastici, bilanci sociali o comunicati ufficiali.

In educazione, per esempio, una tesi può analizzare i piani triennali dell’offerta formativa di dieci istituti per capire come viene descritta l’inclusione degli studenti con bisogni educativi speciali. In diritto, una tesi può confrontare sentenze su un tema specifico, purché il criterio di scelta sia dichiarato: corte, periodo, materia, parole chiave, esiti.

L’analisi documentale non coincide con “riassumere documenti”. Il riassunto dice che cosa contiene un testo. L’analisi mostra come quel contenuto risponde a categorie definite, quali differenze emergono e quali inferenze sono legittime.

Griglia di codifica e categorie

Una griglia di codifica è una tabella o schema che stabilisce che cosa osservare in ogni documento. Le categorie possono nascere dalla letteratura, dalla domanda di ricerca o da una prima lettura esplorativa.

Esempio realistico per una tesi in management:

DocumentoCategoria osservataEsempio di evidenza cercataInterpretazione possibile
Bilancio di sostenibilità azienda AObiettivi misurabiliPresenza di target con anno e indicatoreMaggiore formalizzazione dell’impegno ESG
Bilancio di sostenibilità azienda BLinguaggio reputazionaleAffermazioni generiche senza indicatoriComunicazione orientata all’immagine
Report 2023 settore energiaRischi dichiaratiRiferimenti a transizione, costi, normativaPressione regolativa sul settore

La griglia va descritta nel capitolo metodologico e poi applicata in modo coerente. Se cambi categorie durante l’analisi, puoi farlo, ma devi dirlo: per esempio, “dopo una prima lettura è stata aggiunta la categoria ‘accessibilità dei servizi’ perché ricorrente nei documenti”.

Come si possono analizzare dati già esistenti in modo trasparente?

Per analizzare dati già esistenti in modo trasparente devi indicare provenienza, struttura, variabili o categorie, operazioni svolte e limiti dell’interpretazione. Ogni trasformazione del dato va resa visibile: selezione dei casi, esclusioni, aggregazioni, ricodifiche, confronti. La trasparenza permette al relatore e al lettore di valutare se le conclusioni sono proporzionate alle evidenze.

Dati numerici: variabili, periodo e unità di analisi

Quando lavori con dataset quantitativi, chiarisci subito l’unità di analisi, cioè ciò che ogni riga o caso rappresenta: individuo, scuola, regione, azienda, anno, comune. Poi definisci le variabili usate e il periodo osservato.

In psicologia sociale, una tesi potrebbe usare un dataset pubblico su benessere soggettivo e uso dei social. La domanda non dovrebbe promettere una diagnosi clinica se il dataset contiene solo autovalutazioni generali. Una formulazione più prudente sarebbe: “Quale associazione emerge tra tempo dichiarato sui social media e soddisfazione di vita nel campione considerato?”

Il verbo conta. “Dimostrare che X causa Y” è spesso troppo forte con dati secondari osservazionali. “Esaminare l’associazione”, “descrivere le differenze”, “confrontare gruppi” o “osservare tendenze” sono formule più coerenti quando non controlli disegno e raccolta dei dati.

Documenti: categorie, frequenze e interpretazione

Nei documenti puoi contare occorrenze, confrontare categorie o interpretare temi. La scelta dipende dalla domanda. Se chiedi “quanto spesso appare il tema dell’equità nei piani strategici?”, userai forse una content analysis con conteggi. Se chiedi “come viene costruita l’idea di equità?”, userai un’analisi qualitativa più interpretativa.

Una buona sezione risultati non deve riportare ogni documento uno per uno. Deve organizzare le evidenze per categorie. Se hai studiato dieci documenti sanitari sulle dimissioni protette, potresti presentare risultati su continuità assistenziale, ruolo del caregiver, comunicazione ospedale-territorio e monitoraggio post-dimissione.

Ecco un confronto tra una formulazione debole e una più solida:

Versione debole dello studenteRiscrittura più forte
“Analizzerò dati già esistenti sulla sanità per capire se il sistema funziona.”“Analizzerò i report regionali 2021–2024 sulle dimissioni ospedaliere protette per confrontare indicatori di continuità assistenziale tra tre regioni.”
“Guarderò documenti scolastici per parlare di inclusione.”“Codificherò i PTOF 2022–2025 di otto istituti secondari per osservare come vengono definite misure, destinatari e responsabilità dell’inclusione.”

Quali errori fanno più spesso gli studenti quando usano dati secondari nella tesi?

Gli errori più frequenti riguardano domande troppo ambiziose, fonti scelte dopo aver già deciso la tesi, confusione tra riassunto e analisi, e conclusioni più forti dei dati. Usare dati secondari nella tesi richiede disciplina: non puoi compensare una fonte debole con molte pagine di commento. Serve un collegamento verificabile tra domanda, materiale e metodo.

Errori tipici e correzioni

  1. Promettere causalità con dati descrittivi
    Esempio studente: “Dimostrerò che l’uso dei social causa ansia negli studenti universitari usando statistiche online.”
    Correzione: se i dati non derivano da un disegno sperimentale o longitudinale adatto, riformula in termini di associazione: “Esaminerò l’associazione tra uso dichiarato dei social e indicatori di benessere psicologico in un dataset esistente.”

  2. Usare documenti come decorazione, non come dati
    Esempio studente: “Citerò alcune linee guida infermieristiche per spiegare le dimissioni protette.”
    Correzione: definisci un corpus e una griglia: “Analizzerò cinque linee guida regionali sulle dimissioni protette, codificando ruoli professionali, continuità assistenziale e follow-up.”

  3. Scegliere fonti perché sono facili da trovare
    Esempio studente: “Userò i primi report che escono su Google sulla sostenibilità aziendale.”
    Correzione: stabilisci criteri prima della selezione: tipo di azienda, anno, settore, documento ufficiale, disponibilità integrale, comparabilità degli indicatori.

  4. Mescolare livelli diversi senza distinzione
    Esempio studente: “Confronterò articoli scientifici, post di blog, report ministeriali e commenti social per studiare la didattica digitale.”
    Correzione: separa le funzioni: articoli scientifici per quadro teorico, report istituzionali come fonti documentali, eventuali contenuti social solo se fanno parte di un corpus giustificato.

  5. Nascondere i limiti per far sembrare la tesi più forte
    Esempio studente: “I dati mostrano la situazione reale degli studenti italiani.”
    Correzione: specifica copertura e limiti: “I dati descrivono il campione e le variabili disponibili nella rilevazione; non includono studenti non raggiunti dall’indagine né dimensioni qualitative dell’esperienza.”

Perché questi errori pesano nel voto

Il relatore non valuta solo la quantità di materiale raccolto. Valuta se sai trasformare un insieme di fonti in un disegno di ricerca coerente. Una tesi con meno documenti ma criteri chiari spesso risulta più convincente di una tesi con trenta file scaricati e nessuna procedura.

Anche la scrittura deve riflettere il metodo. Se nel capitolo di metodologia dici di fare analisi tematica, nei risultati non puoi limitarti a riassunti cronologici. Se dichiari una comparazione tra regioni, devi mantenere la stessa struttura per ogni regione, altrimenti il confronto si perde.

Come si scrive il capitolo di metodologia per dati secondari e documenti?

Il capitolo di metodologia deve spiegare che tipo di dati secondari o documenti usi, perché sono adatti, come li hai selezionati e con quale procedura li analizzi. Deve anche chiarire limiti, questioni etiche e grado di generalizzabilità. Il lettore deve poter ricostruire il tuo percorso anche senza vedere tutti i file originali.

Struttura consigliata del capitolo

Una struttura efficace può seguire questo ordine:

  1. Disegno della ricerca: quantitativo, qualitativo, comparativo, documentale, revisione, studio descrittivo.
  2. Fonti dei dati: nome del dataset, ente produttore, documenti inclusi, banche dati consultate, periodo.
  3. Criteri di selezione: inclusione, esclusione, parole chiave, contesto, lingua, arco temporale.
  4. Procedura di analisi: variabili, categorie, griglia di codifica, software eventuale, passaggi analitici.
  5. Qualità e affidabilità: attendibilità delle fonti, coerenza dei criteri, eventuale triangolazione.
  6. Limiti ed etica: dati mancanti, bias, privacy, contesto originario, inferenze non possibili.

Questa sequenza si integra bene con il ragionamento metodologico presentato in Flusso del capitolo di metodologia, soprattutto se devi far vedere al relatore che la scelta delle fonti non è casuale.

Frasi modello da adattare

Puoi usare formule chiare, senza gonfiare il linguaggio:

  • “La ricerca utilizza dati secondari provenienti da…”
  • “Il corpus documentale è composto da…”
  • “Sono stati inclusi documenti pubblicati tra…”
  • “Sono stati esclusi materiali privi di data, autore istituzionale o accesso integrale.”
  • “L’analisi si concentra su tre categorie…”
  • “I risultati non permettono di stabilire causalità, ma consentono di descrivere…”

Evita frasi assolute come “questi dati rappresentano tutta la realtà” o “i documenti dimostrano l’efficacia della politica”. Se i dati non misurano un esito, non puoi trasformarli in prova di efficacia. Puoi però discutere coerenza, priorità dichiarate, cambiamenti nel tempo o differenze tra contesti.

Come si valutano limiti, etica e qualità delle fonti secondarie?

Limiti, etica e qualità si valutano chiedendo chi ha prodotto i dati, per quale scopo, con quale metodo, con quale copertura e con quali esclusioni. Anche se non raccogli dati primari, resti responsabile dell’uso che ne fai. Una tesi corretta non nasconde le debolezze delle fonti: le descrive e calibra le conclusioni.

Qualità della fonte e scopo originario

Ogni fonte nasce in un contesto. Un report aziendale può essere utile, ma ha anche uno scopo reputazionale. Un dataset amministrativo può essere ampio, ma raccoglie solo variabili previste da procedure burocratiche. Una sentenza contiene argomentazioni giuridiche, non interviste alle parti.

Per valutare una fonte, chiediti:

  • chi l’ha prodotta;
  • quando è stata prodotta;
  • perché è stata prodotta;
  • come sono stati raccolti i dati;
  • quali casi o voci mancano;
  • se il formato consente confronto;
  • se esistono definizioni operative delle variabili.

Il Filtro visivo per distinguere fonti accademiche attendibili è utile anche oltre gli articoli scientifici: autorevolezza, tracciabilità e pertinenza restano criteri centrali.

Etica anche senza interviste

Molti studenti pensano che l’etica riguardi solo interviste e questionari. Non è così. Se usi dataset con dati personali, anche anonimizzati, devi rispettare condizioni d’uso, privacy e limiti di accesso. Se analizzi documenti sensibili, devi evitare identificazioni inutili e citazioni che possano danneggiare persone o gruppi.

Nei lavori di laurea triennale e magistrale, spesso si usano fonti pubbliche e aggregate proprio per ridurre rischi etici. Questo non elimina la necessità di citarle correttamente, dichiarare licenze o condizioni d’uso e non manipolare il significato dei dati.

Anche il linguaggio dei limiti conta. Scrivere “il campione è piccolo” non basta se stai usando documenti. Meglio: “Il corpus include solo documenti pubblicati dagli enti selezionati e non permette di osservare pratiche informali o percezioni degli utenti.”

Quali esempi concreti aiutano a progettare l’analisi dati secondari tesi?

Esempi concreti aiutano perché mostrano come collegare domanda, fonte e metodo senza restare su formule astratte. Ogni disciplina usa dati secondari e documenti in modo diverso: variabili in psicologia, indicatori in sanità, testi normativi nel diritto, bilanci in management, documenti scolastici in educazione. Il modello resta lo stesso: domanda controllabile, fonti coerenti, analisi dichiarata.

Psicologia e scienze sociali

Tema iniziale: social media e benessere degli studenti universitari.
Domanda migliorata: “Quale relazione emerge tra tempo dichiarato sui social media e soddisfazione di vita in un dataset europeo su giovani adulti?”
Fonte possibile: dataset survey pubblico con variabili su età, uso dei media, benessere soggettivo.
Metodo: analisi descrittiva e confronto tra gruppi, senza affermare causalità.

Qui la tesi non dice “i social causano malessere”. Esamina se, nei dati disponibili, alcuni gruppi presentano differenze. La discussione può poi collegare risultati e letteratura, ma senza superare ciò che il dataset misura.

Scienze infermieristiche e sanitarie

Tema iniziale: continuità assistenziale dopo dimissione ospedaliera.
Domanda migliorata: “Come le linee guida regionali descrivono il ruolo dell’infermiere nella continuità assistenziale post-dimissione degli anziani?”
Fonte possibile: linee guida regionali, protocolli pubblici, report sanitari aggregati.
Metodo: analisi documentale con categorie come ruolo infermieristico, caregiver, follow-up, comunicazione territorio-ospedale.

Questo progetto è adatto quando l’accesso a pazienti o cartelle cliniche non è possibile. Non misura l’efficacia clinica, ma analizza come il sistema formalizza responsabilità e procedure.

Educazione, management e diritto

In educazione, una tesi può analizzare documenti scolastici per capire come viene definita l’inclusione. Il corpus potrebbe includere PTOF e piani per l’inclusione di scuole secondarie in una provincia. Il metodo può combinare categorie derivate dalla normativa e categorie emerse dalla lettura.

In management, una tesi può confrontare bilanci di sostenibilità di aziende dello stesso settore. Le categorie potrebbero essere obiettivi misurabili, indicatori ambientali, governance e rischi dichiarati. La ricerca non verifica se l’azienda sia davvero sostenibile in assoluto, ma valuta come rendiconta e struttura le proprie dichiarazioni.

In diritto, una tesi può analizzare sentenze su un istituto specifico in un periodo definito. Il metodo può essere comparativo: criterio interpretativo, esito, riferimenti normativi, orientamento giurisprudenziale. Anche qui serve delimitazione, non una raccolta indistinta di casi.

Come controlli se il progetto è pronto prima di scrivere?

Il progetto è pronto quando sai dire in poche righe quale domanda poni, quali fonti userai, perché sono adatte, come le analizzerai e quali limiti accetti. Se una di queste parti resta vaga, la scrittura tenderà a diventare descrittiva. Prima di passare ai capitoli, verifica che il disegno sia abbastanza stretto da essere gestibile.

Segnali di prontezza metodologica

Un buon test è spiegare il progetto a voce in meno di un minuto. Se dici “parlo di giovani e lavoro usando dati online”, sei ancora troppo largo. Se dici “analizzo dati ISTAT 2019–2023 sull’occupazione 18–29 anni per confrontare differenze territoriali, usando indicatori di tasso di occupazione e disoccupazione”, il progetto inizia ad avere forma.

La scaletta deve riflettere questa forma. Un capitolo teorico, uno metodologico e uno di analisi non bastano se dentro non distingui fonti, categorie e risultati. Per organizzare le sezioni, può esserti utile lo Schema gerarchico dei capitoli di un elaborato accademico.

Prima di andare avanti: checklist per analisi dati secondari e documentale

  • La domanda di ricerca è compatibile con dati o documenti già disponibili.
  • Ho distinto dati secondari, fonti secondarie e documenti trattati come dati.
  • Ho indicato autore, ente, data e scopo originario delle fonti.
  • Ho definito criteri di inclusione ed esclusione.
  • Ho chiarito l’unità di analisi: individuo, ente, documento, anno, regione o altro.
  • Ho scelto una tecnica coerente: analisi statistica, documentale, tematica, comparativa o content analysis.
  • Ho preparato variabili, categorie o griglia di codifica.
  • Ho evitato conclusioni causali se i dati non le permettono.
  • Ho dichiarato limiti di copertura, qualità e interpretazione.
  • Ho previsto come citare dataset, report e documenti nel testo e in bibliografia.
  • Ho collegato metodo, risultati attesi e struttura dei capitoli.

(Metadati del sistema di pubblicazione — non rimuovere questa sezione)

Domande frequenti

Posso fare una tesi solo con dati secondari?

Sì, puoi fare una tesi solo con dati secondari se la domanda di ricerca è adatta e le fonti sono affidabili. Devi però spiegare perché quei dati bastano, come li selezioni e quali limiti hanno. Non basta dire che sono “pubblici” o “ufficiali”.

Qual è la differenza tra dati secondari e analisi documentale?

I dati secondari sono spesso dataset o statistiche già raccolte, mentre l’analisi documentale tratta testi e documenti come materiale da analizzare. In pratica, un dataset ISTAT richiede attenzione a variabili e unità di analisi; un corpus di linee guida richiede categorie, codifica e interpretazione. Le due strategie possono anche essere combinate.

Quanti documenti servono per un’analisi documentale in una tesi triennale o magistrale?

Non esiste un numero fisso: servono abbastanza documenti per rispondere alla domanda senza rendere il lavoro ingestibile. Per una triennale può bastare un corpus più ristretto e ben motivato; per una magistrale ci si aspetta spesso maggiore profondità analitica. Conta più la coerenza del criterio di selezione che la quantità.

Usare dati secondari nella tesi è considerato meno originale?

No, non è meno originale se produci una domanda, una selezione e un’analisi tue. L’originalità può stare nel confronto tra periodi, nella scelta del corpus, nella griglia di codifica o nell’interpretazione dei risultati. Diventa debole solo quando ti limiti a riassumere materiali già pubblicati.

Come cito un dataset o un report usato come fonte principale?

Cita dataset e report come fonti vere e proprie, seguendo lo stile richiesto dal corso o dal relatore. Inserisci ente autore, anno, titolo, versione se disponibile, link o DOI, e data di accesso quando necessario. Nel testo, chiarisci anche quale parte del dataset o del report hai usato.