Přejít k obsahu
Kvantitativní výzkumBakalářské studium / Magisterské studium

Jak vybrat statistický test podle výzkumné otázky

Praktický návod pro studenty, jak vybrat statistický test podle výzkumné otázky, typu proměnných, počtu skupin a předpokladů analýzy.

Akademický tým Texio19 min čtení
Rozvětvený diagram s uzly a grafem — jak vybrat statistický test
Schéma znázorňuje, že statistický test se volí podle typu otázky, proměnných a dat.

Statistický test vybírejte podle toho, co přesně vaše výzkumná otázka porovnává nebo vysvětluje: rozdíl mezi skupinami, vztah mezi proměnnými, změnu v čase, nebo predikci výsledku. Nejdřív určete závislou a nezávislou proměnnou, typ dat, počet skupin, nezávislost měření a základní předpoklady; teprve potom má smysl rozhodovat mezi t-testem, ANOVA, korelací, regresí nebo neparametrickou alternativou.

Jak vybrat statistický test podle výzkumné otázky

Máte hotový dotazník, tabulku v Excelu nebo export z Forms, ale ve chvíli, kdy máte napsat „data budou analyzována pomocí…“, začne panika. V poznámkách máte t-test, chí-kvadrát, ANOVA, korelaci, regresi a možná ještě Mann-Whitneyho test, ale není jasné, co z toho patří k vaší otázce. Právě tady se láme hodně bakalářských a diplomových prací: studenti nehledají odpověď na otázku, jak vybrat statistický test, ale snaží se zpětně napasovat známý test na data, která mají po ruce. Výsledek pak vypadá odborně, ale metodicky nesedí. Správná volba nezačíná softwarem ani názvem testu. Začíná přesnou výzkumnou otázkou, proměnnými a tím, zda chcete porovnat skupiny, ověřit vztah, vysvětlit vliv, nebo odhadnout pravděpodobnost nějakého výsledku.

Statistický test vybírejte podle toho, co přesně vaše výzkumná otázka porovnává nebo vysvětluje: rozdíl mezi skupinami, vztah mezi proměnnými, změnu v čase, nebo predikci výsledku. Nejdřív určete závislou a nezávislou proměnnou, typ dat, počet skupin, nezávislost měření a základní předpoklady; teprve potom má smysl rozhodovat mezi t-testem, ANOVA, korelací, regresí nebo neparametrickou alternativou.

In this guide

Jak vybrat statistický test podle výzkumné otázky?

Statistický test vyberete tak, že nejdřív přeložíte výzkumnou otázku do vztahu mezi proměnnými. Pokud otázka porovnává průměry dvou skupin, často budete uvažovat o t-testu; pokud porovnává více skupin, o ANOVA; pokud zkoumá vztah mezi dvěma číselnými proměnnými, o korelaci nebo regresi. Název testu má přijít až po určení otázky, proměnných, typu dat a designu měření.

Test není náhrada za výzkumnou otázku

Častý studentský postup vypadá takto: „Mám dotazník s pěti otázkami, asi použiju korelaci.“ Jenže korelace není univerzální způsob, jak „něco spočítat“. Korelace odpovídá na specifický typ otázky: zda dvě číselné nebo pořadové proměnné rostou či klesají společně.

Lepší začátek je věta: „Chci zjistit, zda se liší míra studijní motivace mezi studenty prezenčního a kombinovaného studia.“ Tady už vidíte skupiny, výsledek i směr analýzy. Máte jednu kategoriální nezávislou proměnnou se dvěma skupinami a jednu číselnou nebo škálovou závislou proměnnou. Výběr statistického testu se tím výrazně zúží.

Pokud ještě nemáte jasně pojmenované proměnné, vraťte se k převodu pojmů na měřitelná data. Pomůže vám postup převod pojmu na měřitelnou proměnnou, protože bez něj zůstane výběr testu jen odhadem.

Čtyři otázky před názvem testu

Než začnete hledat, který statistický test použít, odpovězte si na čtyři praktické otázky:

  1. Co je závislá proměnná? Tedy výsledek, který měříte nebo vysvětlujete.
  2. Co je nezávislá proměnná? Tedy skupina, faktor, prediktor nebo podmínka, která může s výsledkem souviset.
  3. Jaký typ dat má závislá proměnná? Číselná, ordinální, kategoriální nebo binární.
  4. Kolik skupin nebo měření porovnáváte? Dvě skupiny, více skupin, stejné osoby před a po, nebo spojitý vztah.

Závislá proměnná je měřený výsledek, například skóre stresu, známka, délka hospitalizace nebo počet absencí. Nezávislá proměnná je vysvětlující faktor, například typ výuky, pohlaví respondenta, pracovní režim nebo míra podpory manažera.

Slabá a silnější formulace otázky

Výzkumná otázka nemusí znít složitě, ale musí být statisticky použitelná. Rozdíl je vidět na konkrétním přepisu:

Slabá studentská verzeSilnější přeformulování
„Ovlivňuje sociální média psychiku studentů?“„Liší se průměrné skóre úzkosti mezi studenty, kteří používají sociální sítě méně než 1 hodinu denně, 1–3 hodiny denně a více než 3 hodiny denně?“
„Má spánek vztah k výkonu?“„Souvisí počet hodin spánku před zkouškou s bodovým výsledkem testu u studentů 1. ročníku?“
„Jsou sestry spokojené v práci?“„Liší se pracovní spokojenost sester mezi směnným a jednosměnným provozem?“
„Pomáhá školení zaměstnancům?“„Změní se průměrné skóre znalostního testu zaměstnanců před školením a po školení?“

V silnější verzi je patrné, zda půjde o porovnání skupin, vztah mezi proměnnými nebo změnu v čase. Tím se z obecné metodologické nejistoty stává řešitelný analytický úkol.

Který statistický test použít, když porovnávám skupiny?

Když porovnáváte skupiny, rozhoduje hlavně počet skupin, typ závislé proměnné a to, zda jsou měření nezávislá nebo párová. Pro dvě nezávislé skupiny a číselný výsledek se často používá nezávislý t-test; pro více skupin ANOVA; pro stejnou skupinu před a po párový t-test. Pokud data nesplňují předpoklady parametrických testů, zvažují se neparametrické alternativy.

Dvě skupiny: typický prostor pro t-test

T-test se hodí tehdy, když porovnáváte průměr číselné proměnné mezi dvěma skupinami. Například v psychologii můžete zkoumat, zda se průměrné skóre akademického stresu liší mezi studenty, kteří pracují při studiu, a těmi, kteří nepracují. Nezávislá proměnná má dvě kategorie, závislá proměnná je skóre stresu.

V oblasti zdravotnictví může jít o otázku, zda se průměrná doba návratu k běžné aktivitě liší mezi pacienty se standardní edukací a pacienty s rozšířenou edukační intervencí. Pokud jsou pacienti v každé skupině různí lidé, jde o nezávislé skupiny.

Párový t-test patří do jiné situace. Použijete ho, když měříte stejnou osobu dvakrát: před intervencí a po ní. Typický příklad ve vzdělávání je porovnání skóre znalostního testu před kurzem a po kurzu u stejné skupiny studentů.

Více než dvě skupiny: prostor pro ANOVA

Pokud máte tři nebo více skupin a číselnou závislou proměnnou, často se objevuje ANOVA. Například v managementu můžete porovnat průměrnou pracovní spokojenost zaměstnanců ve třech typech pracovního režimu: plně prezenční, hybridní a plně vzdálený.

ANOVA netvrdí automaticky, které skupiny se liší. Základní test říká, zda existuje statisticky významný rozdíl alespoň mezi některými skupinami. Pokud vyjde významně, následují post-hoc testy nebo plánovaná porovnání podle toho, co jste předem stanovili v metodice.

Studentské vyhledávání „t-test ANOVA regrese rozdíl“ často vzniká z toho, že všechny tři názvy vypadají jako obecné statistické možnosti. Rozdíl je ale zásadní: t-test a ANOVA porovnávají skupiny, zatímco regrese modeluje vztah mezi výsledkem a jedním nebo více prediktory.

Kategoriální výsledky: chí-kvadrát a příbuzné testy

Ne každá závislá proměnná je průměr. Pokud je výsledkem kategorie, například „ano/ne“, „splnil/nesplnil“, „preferuje online/prezenční/hybridní výuku“, vstupujete do oblasti testů četností.

Chí-kvadrát test nezávislosti se používá, když zkoumáte vztah mezi dvěma kategoriálními proměnnými. Například: „Souvisí forma studia s preferencí online výuky?“ Forma studia může mít kategorie prezenční a kombinovaná, preference výuky může mít několik kategorií. Test pracuje s četnostmi v kontingenční tabulce, ne s průměry.

Pokud jsou četnosti v některých buňkách malé, může být vhodnější Fisherův exaktní test. To se objevuje hlavně u menších studentských vzorků, kde některá kombinace kategorií obsahuje jen několik respondentů.

Kdy použít korelaci, regresi nebo model vztahu mezi proměnnými?

Korelaci použijte, když chcete popsat sílu a směr vztahu mezi dvěma proměnnými. Regresi použijte, když chcete odhadnout nebo vysvětlit hodnotu závislé proměnné pomocí jednoho nebo více prediktorů. Pokud se ptáte „souvisí spolu?“, často začínáte korelací; pokud se ptáte „do jaké míry proměnná X předpovídá Y při kontrole dalších faktorů?“, uvažujete o regresi.

Korelace odpovídá na otázku souvislosti

Korelace se hodí pro otázky typu: „Souvisí počet hodin samostudia s výsledkem testu?“ nebo „Souvisí míra vnímané sociální opory s mírou stresu?“ Výsledkem je koeficient, který ukazuje směr a sílu vztahu. Kladná korelace znamená, že vyšší hodnoty jedné proměnné mají tendenci souviset s vyššími hodnotami druhé. Záporná korelace znamená opačný směr.

Pozor na kauzalitu. Korelace sama o sobě neprokazuje, že jedna proměnná způsobuje druhou. Pokud zjistíte vztah mezi časem stráveným učením a známkou, ještě tím neprokazujete, že samotný čas učení způsobil lepší známku. Ve hře mohou být schopnosti, předchozí znalosti, motivace nebo obtížnost předmětu.

U ordinálních dat nebo škál, které nelze rozumně považovat za intervalové, se často volí Spearmanova korelace. U přibližně spojitých a normálně rozložených dat se často používá Pearsonova korelace.

Regrese pracuje s predikcí a kontrolou dalších proměnných

Regrese je vhodná, když máte jednu závislou proměnnou a chcete posoudit vliv jednoho nebo více prediktorů. Například v sociálních vědách můžete zkoumat, zda studijní angažovanost predikuje akademický výkon po zohlednění počtu odpracovaných hodin týdně.

Lineární regrese se používá pro číselnou závislou proměnnou. Logistická regrese se používá, když je závislá proměnná binární, například „dokončil kurz / nedokončil kurz“ nebo „doporučil službu / nedoporučil službu“. Tady už neporovnáváte průměry, ale modelujete pravděpodobnost výsledku.

Regrese vyžaduje jasný model. Nestačí vložit do softwaru všechny proměnné z dotazníku. Musíte odůvodnit, proč konkrétní prediktory patří do analýzy, ideálně podle teorie, literární rešerše nebo předchozích zjištění. K tomu se hodí práce se zdroji, například tematické shluky zdrojů a mezera v literární rešerši.

Vztah mezi hypotézou a testem

Hypotéza má být napsaná tak, aby z ní bylo vidět, jaký test dává smysl. Věta „Existuje vztah mezi spokojeností a loajalitou zákazníků“ míří spíše ke korelaci nebo regresi. Věta „Zákazníci, kteří využili zákaznickou podporu, mají vyšší průměrnou spokojenost než zákazníci, kteří ji nevyužili“ míří k porovnání dvou skupin.

Pokud máte problém rozlišit cíl, výzkumnou otázku a hypotézu, pomůže vám text vztah mezi cílem práce a hypotézami. U statistických testů totiž nejde jen o matematiku. Test musí být napojený na to, co tvrdíte v hypotéze.

Jak funguje rozhodovací strom statistické testy v bakalářské nebo diplomové práci?

Rozhodovací strom pro statistické testy funguje jako série metodických otázek, ne jako seznam názvů testů. Nejprve určíte, zda analyzujete rozdíl, vztah, četnosti nebo změnu; potom typ proměnných, počet skupin a nezávislost měření. Teprve na konci větve se objeví konkrétní test nebo několik možných alternativ.

Praktický rozhodovací postup

Místo dlouhé tabulky testů si položte otázky v tomto pořadí:

  1. Ptám se na rozdíl, vztah, predikci, nebo četnosti? Rozdíl vede k t-testu, ANOVA nebo neparametrickým alternativám; vztah ke korelaci; predikce k regresi; četnosti k chí-kvadrát testu.
  2. Jaká je závislá proměnná? Číselná, ordinální, binární nebo kategoriální.
  3. Kolik skupin nebo prediktorů mám? Dvě skupiny, více skupin, jeden prediktor, více prediktorů.
  4. Jsou měření nezávislá, nebo párová? Jiný test patří k různým lidem ve skupinách, jiný ke stejným lidem měřeným dvakrát.
  5. Splňují data základní předpoklady? Pokud ne, zvažte transformaci, neparametrický test nebo jiný model.

Tento postup není mechanická zkratka. Je to kontrola logiky mezi otázkou a daty. Pokud se na některém kroku zaseknete, problém bývá často v tom, že výzkumná otázka není dostatečně konkrétní.

Minirozcestník pro běžné studentské situace

Následující tabulka zjednodušuje výběr statistického testu pro typické situace. Neřeší všechny okrajové případy, ale pomůže odhalit, kam vaše úloha pravděpodobně patří.

Situace ve výzkumné otázcePříklad studentské otázkyPravděpodobný směr analýzy
Dvě nezávislé skupiny a číselné skóre„Liší se průměrné skóre stresu mezi pracujícími a nepracujícími studenty?“Nezávislý t-test nebo Mann-Whitneyho test
Tři skupiny a číselné skóre„Liší se spokojenost zaměstnanců podle typu pracovního režimu?“ANOVA nebo Kruskal-Wallisův test
Stejné osoby před a po intervenci„Změnilo se skóre znalostí po školení?“Párový t-test nebo Wilcoxonův test
Dvě číselné proměnné„Souvisí počet hodin spánku s výsledkem testu?“Pearsonova nebo Spearmanova korelace
Dvě kategoriální proměnné„Souvisí forma studia s preferencí online výuky?“Chí-kvadrát test nebo Fisherův exaktní test

Tabulka nenahrazuje metodické odůvodnění. Pokud ale nevíte, který statistický test použít, podobné rozdělení vám rychle ukáže, zda vůbec přemýšlíte správným směrem.

Kdy rozhodovací strom nestačí

Rozhodovací strom statistické testy zjednodušuje. Ve studentské práci je to užitečné, ale některé situace jsou složitější: víc měření v čase, hierarchická data, velmi malé vzorky, mnoho prediktorů, nevyvážené skupiny nebo kombinace kategoriálních a číselných výstupů.

U bakalářské nebo diplomové práce často není cílem použít co nejsložitější model. Cílem je zvolit test, který odpovídá otázce, je proveditelný na vašich datech a umíte ho srozumitelně popsat. Pokud je zadání metodicky příliš široké, vraťte se k plánování práce. Užitečný může být postup převod zadání práce na plán psaní, protože statistická část nemůže zachraňovat nejasně postavený výzkum.

Jak si poradit s předpoklady testů, typem dat a velikostí vzorku?

Předpoklady testů kontrolujte před finální interpretací výsledků, protože test může být formálně špatně zvolený i tehdy, když software vrátí p-hodnotu. Sledujte hlavně typ proměnných, rozložení dat, nezávislost pozorování, extrémní hodnoty a přibližnou velikost skupin. Pokud předpoklady nesedí, neznamená to konec analýzy; často jen potřebujete jiný test nebo opatrnější interpretaci.

Typ dat rozhoduje víc než název dotazníku

Studenti často píšou: „Použiji t-test, protože mám dotazník.“ Dotazník ale není typ dat. V dotazníku můžete mít kategoriální otázky, Likertovy škály, součtová skóre, otevřené odpovědi i číselné údaje. Každá položka může vyžadovat jiný způsob analýzy.

Kategoriální proměnná rozděluje odpovědi do skupin, například pohlaví, forma studia nebo typ zaměstnání. Ordinální proměnná má pořadí, ale vzdálenosti mezi kategoriemi nemusí být stejné, například odpovědi „zcela nesouhlasím“ až „zcela souhlasím“. Intervalová nebo poměrová proměnná je číselná a umožňuje smysluplně porovnávat rozdíly, například věk, počet bodů nebo délka praxe.

U součtových škál se v praxi často zachází se skórem jako s přibližně číselnou proměnnou, pokud má škála dost položek a rozumné vlastnosti. Je ale dobré to v metodice vysvětlit, ne jen předpokládat.

Normalita, rozptyly a extrémní hodnoty

Parametrické testy, jako t-test nebo ANOVA, pracují s určitými předpoklady. Nejčastěji se řeší přibližná normalita rozložení závislé proměnné v jednotlivých skupinách a podobnost rozptylů. U menších vzorků mohou extrémní hodnoty výrazně změnit průměr a výsledek testu.

Neznamená to, že každá odchylka od normality automaticky zakazuje t-test. U větších vzorků bývají některé testy poměrně odolné. Ve studentské práci však musíte ukázat, že jste předpoklady zkontrolovali a zvolili rozumný postup. Můžete zmínit histogram, boxplot, Shapiro-Wilkův test, Leveneův test nebo kontrolu odlehlých hodnot, podle toho, co vaše fakulta očekává.

Pokud předpoklady výrazně nesedí, přicházejí v úvahu neparametrické alternativy: Mann-Whitneyho test místo nezávislého t-testu, Wilcoxonův test místo párového t-testu nebo Kruskal-Wallisův test místo jednofaktorové ANOVA.

Velikost vzorku a síla interpretace

Malý vzorek nemusí znemožnit analýzu, ale omezuje interpretaci. Pokud máte 18 respondentů rozdělených do tří skupin, můžete technicky spočítat test, ale výsledek bude nejistý a citlivý na jednotlivé hodnoty. U velmi malých skupin se navíc hůř ověřují předpoklady.

V bakalářské nebo diplomové práci je vhodné přiznat limity vzorku. V metodice a diskusi vysvětlete, že výsledky mají spíše orientační charakter, pokud je rozsah nízký nebo výběr nebyl reprezentativní. K vymezení podobných omezení se hodí článek vymezený rozsah a limity výzkumu.

Statistická významnost není totéž co praktická významnost. Uveďte také velikost efektu, pokud je to pro váš test běžné. Například rozdíl může být statisticky významný, ale tak malý, že má v praxi omezený dopad.

Jak vypadá výběr statistického testu v různých oborech?

Výběr testu se mezi obory liší hlavně typem proměnných, výzkumným designem a jazykem interpretace. Psychologie často pracuje se škálami a korelacemi, zdravotnické obory s intervencemi, skupinami a klinicky čitelnými výsledky, vzdělávání nebo management s porovnáním programů, režimů či organizačních podmínek. Logika ale zůstává stejná: otázka, proměnné, data, test.

Sociální vědy a psychologie

Představte si bakalářskou práci z psychologie na téma akademický stres a prokrastinace. Výzkumná otázka zní: „Souvisí míra prokrastinace s mírou akademického stresu u studentů prvního ročníku?“ Obě proměnné jsou měřené škálovým skórem. Pokud data přibližně splňují podmínky, může dávat smysl Pearsonova korelace; pokud jsou výrazně šikmá nebo ordinální, Spearmanova korelace.

Jiná otázka by zněla: „Liší se průměrná míra akademického stresu mezi studenty, kteří při studiu pracují, a studenty, kteří nepracují?“ Tady už nejde o vztah dvou číselných proměnných, ale o rozdíl mezi dvěma skupinami. Pravděpodobný směr je t-test nebo jeho neparametrická alternativa.

Jeden obor, stejné téma, ale jiná otázka — a tím i jiný test. To je důvod, proč nestačí říct „budu dělat dotazníkové šetření“.

Zdravotnictví a ošetřovatelství

V ošetřovatelství může diplomová práce zkoumat edukaci pacientů po propuštění do domácí péče. Otázka může znít: „Změní se skóre znalostí o medikaci u pacientů před edukační intervencí a po ní?“ Stejní pacienti jsou měřeni dvakrát, takže se nabízí párový t-test nebo Wilcoxonův test podle vlastností dat.

Jiná zdravotnická otázka může porovnávat dvě nezávislé skupiny: „Liší se míra adherence k léčbě mezi pacienty, kteří dostali standardní edukaci, a pacienty, kteří dostali strukturovaný edukační plán?“ Pokud je adherence vyjádřena číselným skórem, uvažujete o t-testu. Pokud je vyjádřena kategorií „adherentní/neadherentní“, směr se přesouvá ke chí-kvadrát testu nebo logistické regresi.

Ve zdravotnických oborech je také důležité interpretovat výsledek věcně. Samotná p-hodnota neřekne, zda je rozdíl užitečný pro praxi, péči nebo edukaci pacienta.

Vzdělávání, management a právo

Ve vzdělávání může student zkoumat, zda se liší výsledky testu mezi třemi výukovými metodami: frontální výuka, problémově orientovaná výuka a online modul. Má tři nezávislé skupiny a číselný výsledek. Typický směr je ANOVA, případně Kruskal-Wallisův test.

V managementu může otázka znít: „Predikuje míra podpory nadřízeného pracovní spokojenost zaměstnanců po zohlednění délky praxe?“ Tady nejde jen o rozdíl mezi skupinami. Máte číselný výsledek a více prediktorů, takže je přirozenější lineární regrese.

V právně zaměřené empirické práci můžete zkoumat, zda typ právního povědomí souvisí s ochotou využít mediaci. Pokud jsou obě proměnné kategoriální, například úroveň povědomí ve třech kategoriích a ochota ano/ne, půjde spíše o kontingenční tabulku a chí-kvadrát test. U studentských prací v právu bývá obzvlášť důležité vysvětlit, proč je kvantitativní část vhodná doplňkem právní argumentace.

Jaké chyby studenti často dělají při výběru statistického testu?

Studenti nejčastěji chybují tím, že vybírají test podle názvu, který znají, místo podle výzkumné otázky a typu dat. Další častý problém je záměna rozdílu a vztahu, ignorování párového měření nebo použití průměrů tam, kde data tvoří kategorie. Dobrá oprava obvykle nezačíná výpočtem, ale přeformulováním otázky a proměnných.

Chyby, které mění celý výsledek

  1. Záměna vztahu za rozdíl
    Studentský příklad: „Chci zjistit, zda existuje rozdíl mezi počtem hodin spánku a výsledkem testu.“
    Oprava: Hodiny spánku i výsledek testu jsou číselné proměnné, takže nejde o rozdíl mezi skupinami. Přesnější formulace zní: „Souvisí počet hodin spánku s výsledkem testu?“ a směr analýzy bude korelace nebo regrese.

  2. Použití t-testu pro tři skupiny
    Studentský příklad: „Porovnám spokojenost studentů v 1., 2. a 3. ročníku pomocí t-testu.“
    Oprava: Tři skupiny nepatří do jednoho běžného t-testu. Vhodnější je ANOVA nebo neparametrická alternativa, případně předem plánovaná porovnání, pokud mají metodické zdůvodnění.

  3. Ignorování párového designu
    Studentský příklad: „Porovnám výsledky testu před kurzem a po kurzu nezávislým t-testem.“
    Oprava: Pokud jde o stejné osoby, měření nejsou nezávislá. Patří sem párový t-test nebo Wilcoxonův test.

  4. Průměrování kategorií bez smyslu
    Studentský příklad: „Spočítám průměr z odpovědí: učitel, zdravotník, manažer, student.“
    Oprava: Profese je kategoriální proměnná, ne číselné skóre. Pracujte s četnostmi, procenty a podle otázky s kontingenční tabulkou.

  5. Výběr testu až po prohlížení výsledků
    Studentský příklad: „Zkusím víc testů a použiju ten, který vyjde významně.“
    Oprava: Analytický plán má být stanoven před hlavním vyhodnocením. Jinak zvyšujete riziko náhodně významného výsledku a metodicky oslabujete práci.

Jak chybu poznat ve vlastní práci

Podezřelé je, když nedokážete jednou větou říct, co test ověřuje. Například: „Tento t-test porovnává průměrné skóre vyhoření mezi sestrami ve směnném a jednosměnném provozu.“ Taková věta je konkrétní. Naopak „tento test ověřuje hypotézu“ je příliš obecné.

Zkuste si napsat větu ve tvaru: „Testuji, zda se [závislá proměnná] liší podle [skupina/faktor]“ nebo „Testuji, zda [proměnná X] souvisí s [proměnná Y].“ Pokud věta nejde doplnit, pravděpodobně ještě nemáte připravenou analýzu.

Jak připravit metodickou kapitolu, aby byl test obhajitelný?

Metodická kapitola má ukázat, že statistický test odpovídá výzkumné otázce, proměnným a datům. Nestačí napsat, že data budou zpracována v Excelu, SPSS, Jamovi nebo R; musíte vysvětlit, co přesně budete testovat, proč je zvolený test vhodný a jak budete kontrolovat předpoklady. Obhajitelná metodika propojuje cíl práce, hypotézy, měření a analytický postup.

Co napsat do metodiky

U každé hypotézy nebo výzkumné otázky uveďte, jaké proměnné do testu vstupují. Napište, zda je závislá proměnná číselná, ordinální nebo kategoriální. Potom vysvětlete, zda porovnáváte dvě skupiny, více skupin, párové měření, vztah proměnných nebo predikci.

Vhodná formulace může znít: „Pro ověření rozdílu v průměrném skóre pracovní spokojenosti mezi zaměstnanci v prezenčním, hybridním a vzdáleném režimu bude použita jednofaktorová ANOVA. V případě nesplnění předpokladů bude zvažována neparametrická alternativa Kruskal-Wallisův test.“ Tato věta je lepší než neurčité „data budou analyzována statistickými metodami“.

Metodická kapitola by také měla obsahovat popis práce s chybějícími hodnotami, kontrolu odlehlých hodnot a hladinu významnosti, pokud ji používáte. V běžných studentských pracích se často objevuje hladina 0,05, ale nepoužívejte ji mechanicky bez vysvětlení kontextu.

Jak propojit test s osnovou práce

Statistická analýza není izolovaná položka na konci práce. Musí navazovat na teoretickou část, výzkumný problém a hypotézy. Pokud teorie řeší vztah mezi podporou nadřízeného a spokojeností, metodika by neměla náhle analyzovat jen rozdíly podle věku, protože to bylo snadné spočítat.

Při plánování kapitol si pohlídejte, aby teoretická část vysvětlila pojmy, metodická část popsala měření a analytická část odpověděla na otázky ve stejném pořadí. K tomu se hodí hierarchická osnova kapitol akademické práce, protože dobře postavená osnova snižuje riziko, že statistika bude působit jako dodatečně přilepená kapitola.

Než přejdete dál: kontrolní seznam pro výběr statistického testu

  • Výzkumná otázka jasně říká, zda zkoumám rozdíl, vztah, predikci, četnosti nebo změnu v čase.
  • Umím pojmenovat závislou proměnnou a nezávislou proměnnou nebo prediktor.
  • Vím, zda je závislá proměnná číselná, ordinální, binární nebo kategoriální.
  • Vím, kolik skupin porovnávám a zda jsou nezávislé, nebo párové.
  • Nepoužívám t-test tam, kde mám tři nebo více skupin.
  • Nepoužívám korelaci tam, kde ve skutečnosti porovnávám skupiny.
  • Zkontroloval/a jsem základní předpoklady testu nebo mám připravenou alternativu.
  • Mám napsané, jak naložím s chybějícími a odlehlými hodnotami.
  • Umím jednou větou vysvětlit, co vybraný test ověřuje.
  • Test je přímo napojený na hypotézu, výzkumnou otázku a metodickou kapitolu.

Doporučené interní odkazy

(Metadata pro sestavovací systém — tuto část neodstraňujte)

Často kladené otázky

Jak dlouho trvá vybrat správný statistický test?

U dobře připravené výzkumné otázky může základní výběr trvat několik minut. Pokud ale nejsou jasné proměnné, typ dat nebo počet skupin, může se rozhodování protáhnout na několik hodin přepracování metodiky. Nejvíc času obvykle nezabere název testu, ale oprava nejasné otázky.

Jaký je rozdíl mezi t-testem, ANOVA a regresí?

T-test porovnává průměr číselné proměnné mezi dvěma skupinami nebo dvěma párovými měřeními. ANOVA porovnává průměry u tří nebo více skupin. Regrese neporovnává jen skupiny, ale modeluje vztah mezi závislou proměnnou a jedním nebo více prediktory.

Který statistický test použít v bakalářské práci s dotazníkem?

Záleží na tom, jaké otázky v dotazníku máte a co chcete ověřit. Pro rozdíl mezi dvěma skupinami může jít o t-test, pro více skupin o ANOVA, pro vztah dvou škál o korelaci a pro dvě kategoriální proměnné o chí-kvadrát test. Samotné slovo „dotazník“ k výběru testu nestačí.

Musím v diplomové práci vždy kontrolovat normalitu dat?

Pokud používáte parametrické testy, měli byste přiměřeně zkontrolovat předpoklady včetně rozložení dat. Nemusí to znamenat dlouhou technickou pasáž, ale metodika má ukázat, že jste test nezvolili naslepo. U malých vzorků a výrazně šikmých dat může být vhodnější neparametrická alternativa.

Co dělat, když mi vedoucí doporučí jiný test než rozhodovací strom?

Nejdřív si vyjasněte, jak vedoucí chápe výzkumnou otázku, proměnné a data. Někdy doporučený test vychází z informace, kterou jste do vlastního rozhodování nezahrnuli, například párového měření nebo kategoriálního výsledku. Pokud si nejste jistí, připravte krátké srovnání: otázka, proměnné, váš navržený test, doporučený test a důvod rozdílu.