Para escolher o teste estatístico adequado, comece pela pergunta de pesquisa, identifique a variável dependente, veja se os grupos são independentes ou pareados e confirme quantas variáveis entram na análise. Depois, escolha entre comparação de grupos, associação/correlação ou previsão por regressão, verificando pressupostos como nível de medida, distribuição, independência e tamanho amostral.
Como escolher teste estatístico para sua pergunta de pesquisa
Você abriu o software de análise, viu dezenas de opções no menu e travou porque nenhuma delas parece falar a mesma língua da sua pergunta de pesquisa. O problema não é falta de esforço: muitos estudantes tentam aprender como escolher teste estatístico decorando nomes como teste t, ANOVA, qui-quadrado e regressão, mas a escolha depende primeiro do desenho do estudo. Se a sua pergunta compara médias, avalia associação entre variáveis, prevê um resultado ou testa diferença antes e depois de uma intervenção, o caminho muda. A dificuldade aumenta quando o orientador pede "justificar o teste", mas o questionário ainda não está bem alinhado às hipóteses.
Para escolher o teste estatístico adequado, comece pela pergunta de pesquisa, identifique a variável dependente, veja se os grupos são independentes ou pareados e confirme quantas variáveis entram na análise. Depois, escolha entre comparação de grupos, associação/correlação ou previsão por regressão, verificando pressupostos como nível de medida, distribuição, independência e tamanho amostral.
Neste guia
- Como escolher teste estatístico sem decorar uma lista de nomes?
- Qual teste estatístico usar para comparar grupos?
- Quando usar teste t, ANOVA ou regressão?
- Como a escala da variável muda a escolha de teste estatístico?
- Como montar uma árvore de decisão para testes estatísticos?
- Quais erros os estudantes cometem ao escolher teste estatístico?
- Como verificar pressupostos antes de rodar o teste?
- Como relatar a escolha do teste estatístico no trabalho?
Como escolher teste estatístico sem decorar uma lista de nomes?
A melhor forma de escolher teste estatístico é transformar a pergunta de pesquisa em uma estrutura analítica: resultado, explicação, grupos, medidas e objetivo da comparação. Em vez de perguntar "qual teste eu uso?", pergunte "que tipo de evidência minha pergunta exige?". O nome do teste vem depois dessa tradução.
Comece pela pergunta, não pelo software
Muitos estudantes abrem o SPSS, Jamovi, R, Excel ou JASP e tentam decidir pelo menu. Isso inverte a ordem. O software mostra ferramentas; a pergunta de pesquisa define qual ferramenta faz sentido.
Se a pergunta é "há diferença no nível de ansiedade entre estudantes que trabalham e estudantes que não trabalham?", você tem uma comparação entre dois grupos independentes. Se a pergunta é "a quantidade de horas de estudo prevê a nota final?", você tem uma relação preditiva entre variáveis numéricas. Se a pergunta é "a proporção de adesão ao tratamento difere entre homens e mulheres?", você trabalha com categorias e proporções.
Antes da análise, vale conferir se a pergunta está operacionalizada. O artigo Funil visual para formular uma pergunta de pesquisa ajuda a passar de um tema amplo para uma pergunta que realmente pode ser respondida com dados.
Traduza a pergunta em componentes estatísticos
Quase toda escolha de teste estatístico passa por quatro perguntas menores:
- Qual é a variável dependente ou resultado?
- Essa variável é numérica contínua, ordinal ou categórica?
- Quantos grupos, condições ou variáveis explicativas existem?
- As observações são independentes ou pareadas?
Variável dependente é o resultado que você tenta explicar, comparar ou prever. Variável independente é a condição, grupo ou fator usado para explicar diferenças no resultado. Em um estudo de psicologia sobre sono e estresse, por exemplo, "nível de estresse" pode ser a variável dependente, enquanto "horas de sono" pode ser a variável independente.
Se esses papéis ainda estão confusos, consulte Relação entre variáveis independentes e dependentes antes de escolher o teste. Um teste correto aplicado a variáveis mal definidas continua gerando uma análise frágil.
Exemplo de tradução da pergunta
Veja como uma pergunta vaga muda quando é reescrita para análise estatística:
| Versão fraca do estudante | Reescrita mais forte para análise |
|---|---|
| "A motivação melhora o desempenho dos alunos?" | "Há associação entre a pontuação em uma escala de motivação acadêmica e a média final de estudantes de graduação?" |
| "O treinamento funciona?" | "A média de conhecimento sobre segurança do paciente aumenta após uma oficina de 2 horas com os mesmos participantes?" |
| "Empresas maiores inovam mais?" | "O número de empregados prevê o investimento anual em inovação em pequenas e médias empresas?" |
| "Homens e mulheres compram diferente?" | "A proporção de clientes que escolhem assinatura mensal difere entre clientes homens e mulheres em uma amostra de e-commerce?" |
A versão forte não é apenas mais bonita. Ela indica tipo de variável, unidade de análise, comparação e, muitas vezes, o teste provável.
Qual teste estatístico usar para comparar grupos?
Para comparar grupos, observe três pontos: quantos grupos existem, se os participantes são os mesmos ou diferentes e se o resultado é numérico ou categórico. Dois grupos independentes com resultado numérico costumam levar ao teste t independente; três ou mais grupos podem levar à ANOVA. Para proporções e categorias, o qui-quadrado costuma ser mais adequado.
Dois grupos independentes
Use uma comparação de dois grupos independentes quando cada participante pertence a apenas um grupo. Em ciências sociais, um exemplo seria comparar a média de engajamento político entre estudantes que participam de movimento estudantil e estudantes que não participam. Em enfermagem, você poderia comparar o escore médio de conhecimento sobre medicação entre pacientes que receberam orientação impressa e pacientes que receberam orientação verbal.
Se o resultado é numérico e atende aos pressupostos básicos, o teste t para amostras independentes pode ser usado. Se a distribuição é muito assimétrica ou a escala é ordinal com poucos pontos, uma alternativa não paramétrica, como Mann-Whitney, pode ser considerada, dependendo das normas da disciplina e do desenho do estudo.
Dois momentos no mesmo grupo
Quando você mede as mesmas pessoas antes e depois de uma intervenção, as observações são pareadas. Isso muda a análise, porque cada participante serve como sua própria referência. Um exemplo em saúde seria medir a adesão percebida ao tratamento antes e depois de uma orientação de enfermagem na alta hospitalar.
Para resultado numérico, o teste t pareado costuma ser usado quando os pressupostos são atendidos. Se os dados não sustentam essa escolha, o teste de Wilcoxon para postos sinalizados pode ser uma opção. A pergunta não é "qual teste parece mais conhecido?", mas "meus dados comparam pessoas diferentes ou a mesma pessoa em dois momentos?".
Três ou mais grupos
Quando há três ou mais grupos independentes e um resultado numérico, a ANOVA de um fator costuma entrar na lista de possibilidades. Em educação, por exemplo, uma pesquisa pode comparar a média de desempenho em leitura entre estudantes expostos a três métodos de ensino. Se a pergunta compara médias entre três condições, rodar vários testes t aumenta o risco de erro.
Depois de uma ANOVA com resultado estatisticamente relevante, você pode precisar de comparações pós-teste para identificar quais grupos diferem. O teste global diz que existe diferença em algum ponto; as comparações posteriores ajudam a localizar essa diferença.
Quando usar teste t, ANOVA ou regressão?
Use teste t quando a pergunta compara a média de dois grupos ou dois momentos. Use ANOVA quando a pergunta compara médias entre três ou mais grupos. Use regressão quando a pergunta busca prever ou explicar uma variável a partir de uma ou mais variáveis independentes.
Teste t: diferença entre duas médias
O teste t é adequado quando o resultado é numérico e você quer comparar duas médias. A pergunta típica tem formato simples: "a média de X difere entre A e B?" ou "a média de X mudou do pré-teste para o pós-teste?".
Exemplo em psicologia: uma estudante de graduação quer saber se estudantes que praticam atividade física regularmente têm média menor de estresse percebido do que estudantes sedentários. A variável dependente é o escore de estresse. A variável independente é o grupo de atividade física. Como são dois grupos independentes, o teste t independente pode ser considerado.
ANOVA: diferença entre três ou mais médias
A ANOVA amplia a lógica de comparação de médias para três ou mais grupos. Ela evita que o estudante faça muitas comparações isoladas sem controlar o problema de múltiplos testes. Uma pergunta típica seria: "há diferença na média de satisfação entre estudantes de três turnos diferentes?".
Exemplo em educação: uma pesquisa compara notas de matemática entre estudantes que usaram aula expositiva, aprendizagem baseada em problemas e videoaulas. A variável dependente é a nota. A variável independente é o método de ensino, com três níveis. A ANOVA de um fator é uma candidata natural, desde que os pressupostos sejam avaliados.
Regressão: previsão, explicação e ajuste
A regressão entra quando a pergunta não se limita a comparar grupos, mas procura estimar como uma ou mais variáveis se relacionam com um resultado. Em administração, uma pesquisa de mestrado pode investigar se satisfação com atendimento, tempo de entrega e preço percebido predizem a intenção de recompra em uma loja online.
Se o resultado é numérico, a regressão linear pode ser adequada. Se o resultado é binário, como "comprou/não comprou" ou "aderiu/não aderiu", a regressão logística pode ser mais coerente. A escolha depende do formato do resultado, não apenas do fato de haver uma variável "causando" outra.
Comparação rápida entre escolhas comuns
| Situação concreta | Teste mais provável | Exemplo de pergunta |
|---|---|---|
| Duas médias, grupos diferentes | Teste t independente | "A média de ansiedade difere entre estudantes que trabalham e estudantes que não trabalham?" |
| Duas médias, mesmos participantes | Teste t pareado | "A média de conhecimento aumenta após uma oficina de biossegurança?" |
| Três ou mais médias | ANOVA | "A média de desempenho difere entre três métodos de ensino?" |
| Associação entre duas variáveis numéricas | Correlação ou regressão linear simples | "Horas de estudo se associam à nota final?" |
| Resultado sim/não previsto por variáveis explicativas | Regressão logística | "Idade e renda predizem adesão a um plano de saúde?" |
A tabela não substitui a justificativa metodológica, mas reduz a chance de escolher por familiaridade. Para alinhar teste, hipótese e desenho de pesquisa, o artigo Relação entre objetivos e hipóteses de pesquisa pode ajudar a conferir se a análise responde ao que foi prometido.
Como a escala da variável muda a escolha de teste estatístico?
A escala da variável muda o teste porque define que operações estatísticas fazem sentido. Médias funcionam melhor para variáveis numéricas; proporções funcionam para categorias; rankings e escalas ordinais exigem mais cuidado. Antes de perguntar "qual teste estatístico usar", classifique o resultado principal.
Variáveis categóricas
Variável categórica é uma variável formada por grupos ou rótulos, como sexo, curso, turno, presença/ausência de doença ou tipo de contrato. Quando o resultado é categórico, a análise costuma trabalhar com frequências e proporções, não com médias.
Exemplo em enfermagem: um estudo quer saber se a adesão ao uso correto de medicamentos após a alta difere entre pacientes que receberam visita domiciliar e pacientes que receberam apenas orientação no hospital. Se "adesão" foi codificada como "sim" ou "não", a pergunta envolve proporções. O qui-quadrado pode ser considerado, desde que as frequências esperadas sejam adequadas; em tabelas pequenas, o teste exato de Fisher pode aparecer.
Variáveis ordinais
Variável ordinal tem categorias com ordem, mas a distância entre elas não é necessariamente igual. Escalas do tipo "discordo totalmente" até "concordo totalmente" são exemplos comuns. Muitos trabalhos tratam escalas Likert somadas como escores numéricos, mas itens isolados exigem cuidado.
Se um questionário tem vários itens e gera uma pontuação total, a análise pode tratar o escore como numérico em algumas áreas, desde que isso seja justificado. Se você ainda está construindo os itens, veja Itens, escala e dados de um questionário de pesquisa, porque o desenho do instrumento já limita as análises possíveis.
Variáveis numéricas
Variável numérica expressa quantidade ou medida, como idade, renda, escore, tempo, nota, pressão arterial ou número de atendimentos. Esse tipo de variável permite médias, desvios-padrão, correlação e regressão, desde que o desenho do estudo e os pressupostos sustentem a análise.
Em ciências sociais, renda pode ser numérica, mas costuma ter distribuição assimétrica. Em saúde, tempo de internação pode ter muitos valores extremos. Em educação, nota pode ter teto, como quando muitos estudantes alcançam pontuação máxima. Esses detalhes não impedem a análise, mas podem mudar o teste, a transformação ou a forma de apresentar os resultados.
Como montar uma árvore de decisão para testes estatísticos?
Uma árvore de decisão para testes estatísticos começa pela variável dependente e segue por perguntas simples: ela é numérica ou categórica, há comparação ou associação, quantos grupos existem e as medidas são independentes ou pareadas. Esse fluxo não escolhe por você automaticamente, mas reduz opções incompatíveis. Ele também ajuda a justificar a escolha no capítulo de metodologia.
Um fluxo prático de decisão
Use este processo antes de abrir o software:
- Escreva a pergunta de pesquisa em uma frase com variável dependente e variável independente.
- Marque a variável dependente como numérica, ordinal ou categórica.
- Identifique se a pergunta compara grupos, mede associação ou prevê um resultado.
- Conte o número de grupos, condições ou preditores.
- Verifique se as observações são independentes, pareadas ou repetidas.
- Liste 2 ou 3 testes candidatos.
- Elimine testes incompatíveis com a escala da variável ou o desenho do estudo.
- Verifique pressupostos antes de apresentar o teste como escolha final.
Esse roteiro parece simples, mas ele força uma disciplina que muitos trabalhos pulam: ligar pergunta, variáveis, hipótese e análise. Se você está escrevendo o capítulo metodológico, o artigo Fluxo visual do capítulo de metodologia ajuda a colocar essa decisão no lugar certo do texto.
Exemplo de árvore em linguagem simples
Imagine uma pesquisa em administração sobre intenção de recompra em um aplicativo de delivery. A variável dependente pode ser uma nota de 0 a 10 para intenção de recompra. Se a pergunta é "a satisfação com o atendimento prevê a intenção de recompra?", você tem duas variáveis numéricas e pode considerar correlação ou regressão linear simples.
Agora mude o resultado: "o cliente voltou a comprar nos últimos 30 dias, sim ou não?". A variável dependente deixa de ser numérica e vira binária. A regressão linear perde sentido como primeira escolha; a regressão logística passa a ser mais adequada. A pergunta de pesquisa quase não mudou em termos de tema, mas a forma de medir o resultado mudou tudo.
Quando a árvore não resolve sozinha
Uma árvore de decisão para testes estatísticos é útil, mas não substitui orientação metodológica quando há desenhos mais complexos. Medidas repetidas com vários momentos, amostras agrupadas por turma, dados longitudinais e múltiplos preditores podem exigir modelos mais específicos. Em trabalhos de graduação e mestrado, porém, muitos projetos ficam em estruturas mais diretas: comparação de grupos, associação entre variáveis e regressão simples ou múltipla.
Também há decisões que dependem da área. Algumas disciplinas aceitam tratar escores compostos como contínuos; outras preferem métodos não paramétricos quando os dados vêm de escalas ordinais. Por isso, a escolha deve conversar com o orientador, com o plano metodológico e com a forma como estudos semelhantes analisam dados.
Quais erros os estudantes cometem ao escolher teste estatístico?
Os erros mais comuns aparecem quando o estudante escolhe o teste pelo nome mais conhecido, ignora o desenho do estudo ou muda a análise depois de ver os resultados. Também é frequente confundir variável dependente com independente e tratar categorias como se fossem números contínuos. Esses erros podem tornar uma conclusão incompatível com os próprios dados.
Erros que aparecem em trabalhos reais
-
Escolher o teste antes de definir a variável dependente
Exemplo do estudante: "Vou usar ANOVA para ver se redes sociais influenciam a saúde mental."
Correção: defina primeiro como "saúde mental" será medida: escore de ansiedade, diagnóstico, frequência de sintomas ou autopercepção ordinal. Cada formato aponta para testes diferentes. -
Comparar três grupos com vários testes t sem justificativa
Exemplo do estudante: "Comparei manhã vs. tarde, manhã vs. noite e tarde vs. noite com teste t."
Correção: quando há três grupos e um resultado numérico, comece considerando ANOVA e, se necessário, use comparações posteriores adequadas. -
Usar correlação para uma variável categórica disfarçada de número
Exemplo do estudante: "Codifiquei curso como 1, 2, 3 e correlacionei com nota."
Correção: números usados como códigos não viram medida numérica real. Se "1 = administração", "2 = enfermagem" e "3 = psicologia", a variável é categórica. -
Ignorar pareamento em medidas antes/depois
Exemplo do estudante: "Usei teste t independente para comparar a média antes e depois da intervenção."
Correção: se as mesmas pessoas foram medidas duas vezes, as observações são pareadas; considere teste t pareado ou alternativa equivalente. -
Trocar de teste porque o primeiro não deu p < 0,05
Exemplo do estudante: "A ANOVA não deu diferença, então rodei Mann-Whitney entre os grupos até achar algo."
Correção: o teste deve ser escolhido pelo desenho e pelos pressupostos, não pelo resultado desejado. Se houver mudança de análise, ela precisa ser justificada.
Versão fraca e versão mais forte da justificativa
Fraca: "Foi usado o teste t porque é o teste mais comum para comparar os dados da pesquisa."
Mais forte: "Foi usado o teste t para amostras independentes porque a pergunta compara a média do escore de estresse entre dois grupos distintos de estudantes, classificados conforme vínculo de trabalho. A variável dependente é numérica e os grupos não compartilham participantes."
A segunda versão mostra que a escolha de teste estatístico nasceu da pergunta e do desenho, não de preferência pessoal.
Como verificar pressupostos antes de rodar o teste?
Verificar pressupostos significa conferir se os dados atendem às condições mínimas para o teste escolhido. Os principais pontos são nível de medida, independência das observações, distribuição dos dados, homogeneidade de variâncias e presença de valores extremos. Quando um pressuposto não se sustenta, você pode ajustar a análise, escolher outro teste ou relatar a limitação.
Independência das observações
Independência significa que uma observação não depende diretamente de outra. Se cada participante responde uma vez e pertence a apenas um grupo, a independência tende a ser mais plausível. Se estudantes estão agrupados por turma, pacientes por unidade de saúde ou respostas por casal, a independência pode ser menor.
Em projetos de graduação, essa questão costuma ser ignorada porque parece técnica demais. Porém, ela afeta a interpretação. Comparar 200 estudantes de 4 turmas como se fossem 200 observações totalmente separadas pode mascarar diferenças entre turmas, professoras, professores ou contextos.
Distribuição e valores extremos
Alguns testes assumem que os resíduos ou a variável analisada têm distribuição aproximadamente normal, principalmente em amostras menores. Isso não significa que todo dado precisa formar uma curva perfeita. Significa que assimetria extrema, muitos valores iguais no limite da escala ou outliers podem afetar médias e testes paramétricos.
Outlier é um valor muito distante do padrão do conjunto de dados. Ele pode ser erro de digitação, caso real extremo ou sinal de que a variável deveria ser analisada de outra forma. Não exclua outliers apenas porque "atrapalham" o resultado; registre o critério de decisão.
Homogeneidade de variâncias
Homogeneidade de variâncias significa que os grupos comparados têm dispersão parecida. Em uma comparação de notas entre dois métodos de ensino, por exemplo, um grupo pode ter notas muito concentradas e outro muito espalhadas. Isso pode afetar o teste t ou a ANOVA.
Quando a variância é muito diferente entre grupos, existem versões ajustadas de alguns testes, como o teste t de Welch. Em vez de esconder o problema, relate a verificação e explique a escolha. A banca tende a avaliar melhor uma decisão transparente do que uma análise que finge que os dados são perfeitos.
Como relatar a escolha do teste estatístico no trabalho?
Relate a escolha do teste estatístico ligando pergunta, variável dependente, tipo de grupo e pressupostos. Não basta escrever "os dados foram analisados no software X"; explique por que aquele teste responde à hipótese. Um parágrafo curto e claro costuma ser suficiente em trabalhos de graduação e mestrado.
O que escrever na metodologia
O parágrafo metodológico deve responder a quatro perguntas: o que foi comparado ou testado, qual teste foi usado, por que ele foi escolhido e qual critério de interpretação foi adotado. Evite transformar o texto em manual de estatística. A banca quer saber se a decisão foi coerente com o estudo.
Exemplo em saúde: "Para comparar a média do escore de adesão medicamentosa entre pacientes que receberam orientação domiciliar e pacientes que receberam orientação hospitalar, foi utilizado teste t para amostras independentes, pois a variável dependente era numérica e os grupos eram distintos. Foram avaliados pressupostos de distribuição e homogeneidade de variâncias antes da análise."
O que escrever nos resultados
Nos resultados, separe descrição e inferência. Primeiro apresente médias, desvios-padrão, frequências ou proporções. Depois informe o teste, o valor da estatística, o valor de p e, quando exigido, medida de tamanho de efeito ou intervalo de confiança.
Não escreva apenas "deu diferença" ou "não deu diferença". Diga onde a diferença aparece, em qual direção e com qual magnitude aproximada. Em uma pesquisa educacional, por exemplo, "o grupo que usou aprendizagem baseada em problemas apresentou média maior de desempenho do que o grupo de aula expositiva" é mais informativo do que "a ANOVA foi significativa".
Lista de checagem antes de avançar: escolha de teste estatístico
- A pergunta de pesquisa está escrita em termos mensuráveis.
- A variável dependente foi identificada claramente.
- A variável independente, grupo ou preditor foi definido.
- O nível de medida da variável dependente foi classificado.
- O número de grupos, condições ou momentos foi contado.
- O desenho foi classificado como independente, pareado ou repetido.
- Há uma justificativa para escolher teste t, ANOVA, qui-quadrado, correlação ou regressão.
- Os pressupostos relevantes foram verificados ou discutidos.
- A escolha não foi alterada apenas para obter p < 0,05.
- O texto metodológico explica por que o teste responde à pergunta.
- Tabelas e resultados usam a mesma linguagem das hipóteses.
- Limitações estatísticas foram reconhecidas quando necessário.
Links internos recomendados
(Metadados do sistema de publicação — não remova esta seção)
Perguntas frequentes
Qual é a diferença entre teste t, ANOVA e regressão?
O teste t compara duas médias, a ANOVA compara três ou mais médias e a regressão estima a relação entre uma variável dependente e uma ou mais variáveis independentes. A escolha depende da pergunta e do formato das variáveis. Se você está comparando grupos, pense em teste t ou ANOVA; se está prevendo um resultado, pense em regressão.
Como saber quantos testes estatísticos usar em um TCC de graduação?
Use apenas os testes necessários para responder às perguntas ou hipóteses do TCC. Muitos trabalhos de graduação usam um conjunto pequeno: estatísticas descritivas e 1 ou 2 testes inferenciais. O excesso de testes sem plano claro costuma enfraquecer a análise.
Posso usar teste t no mestrado com amostra pequena?
Pode ser possível, mas depende do desenho, da distribuição dos dados e da independência das observações. Em amostras pequenas, a verificação de pressupostos ganha mais peso e alternativas não paramétricas podem ser consideradas. A decisão deve aparecer justificada na metodologia.
O que fazer se meus dados não forem normais?
Primeiro verifique se a não normalidade afeta o teste que você pretende usar e se há valores extremos ou erros de registro. Depois, considere transformações, versões ajustadas do teste ou alternativas não paramétricas. Não mude de teste apenas para buscar um resultado mais favorável.
Qual teste estatístico usar para questionário com escala Likert?
Depende de como a escala foi construída e analisada. Um item Likert isolado é ordinal; uma pontuação somada de vários itens pode ser tratada como escore em algumas áreas, desde que haja justificativa. Antes de escolher o teste, defina se o resultado será item individual, categoria agrupada ou escore total.



