O teste de hipótese é realizado para definir se a resposta para uma questão clínica apresenta evidência científica a partir de um estudo. Por exemplo, em um experimento no qual 50 indivíduos receberam um placebo e outros 50 receberam uma medicação para cefaleia. Após 2 horas, 40 pessoas no grupo medicação melhoraram a dor, enquanto 30 pessoas no grupo placebo melhoraram.
Como sabemos se essa diferença significa que a droga funciona e não é simplesmente resultado do acaso? A forma mais comum de se abordar esse problema é utilizar um teste de hipótese.
Navegue pelo conteúdo
Definição do teste de hipótese
Pode ser definida como a inferência de alguma relação entre duas ou mais variáveis, sendo desenvolvida a partir de uma questão clínica. Por sua vez, o objetivo do teste de hipótese é fazer uma inferência sobre a população de interesse com base em uma amostra aleatória retirada dessa população.
Definir a hipótese é o pontapé inicial para se desenhar um estudo, definir a estratégia de amostragem, intervenção (se aplicável), comparação, variáveis de resultado, testes estatísticos e, finalmente, o significado clínico. Dois conceitos sobre hipótese são importantes para entender a MBE como um todo:
- Hipótese nula (H0): não há diferença ou relação entre os grupos estudados.
- Hipótese alternativa: existe relação entre as duas variáveis, com significância estatística.
No exemplo que demos, a equipe de investigação deve primeiro formular uma hipótese de pesquisa. Isso pode ser expresso como um resultado único, por exemplo, o uso da medicação leva a uma melhora da cefaleia. A hipótese nula é que não há diferença entre o placebo e a medicação.
Teste de hipótese : Tipos de erros
A partir da definição da hipótese nula e alternativa, é possível definir os erros possíveis de um estudo.
Erro alfa ou tipo I
Rejeitar a hipótese nula em um estudo, quando essa é a verdadeira no mundo real. Este é o tipo de erro mais grave, pois inferimos uma relação que não é verdadeira.
Este erro é habitualmente cobrado em provas, por exemplo, uma nova medicação é testada para HIV, se demonstrando eficaz, mas estudos maiores e mais bem desenhados posteriores demonstram que seu uso não apresenta diferença com placebo (hipótese nula) ou no mundo real/habitual não demonstra diferença.
A partir do Erro Alfa é possível determinar o nível de confiança do estudo. Ele é definido a partir do valor de erro alfa permitido no estudo. Um valor convencional para a maioria dos estudos é de 5 %.
Nível de confiança: 1 – erro Alfa
Se erro tipo alfa permitido até 5%, um nível de confiança de 95%.
Erro Beta ou tipo II
Aceitar a hipótese nula, quando na verdade esta é falsa no mundo habitual, considerando que há diferença entre os grupos estudados, quando na verdade não há.
Como é um erro menos grave que o tipo I, seu valor aceitável varia de 10 a 20%. Seu valor é utilizado para calcular o poder de confiança ou poder do estudo:
Poder de confiança = 1 – erro Beta
Se erro Beta de 15%, poder de confiança do estudo é de 85%.
Quando se realiza um teste estatístico é desejável que tanto o valor de α como de β sejam os menores possíveis. Porém, dentro de um estudo não é possível que se diminua simultaneamente a probabilidade dos dois tipos de erros. Se baixar o valor de α, aumentará o valor de β, e vice-versa.
#Ponto importante: A partir de cálculos estatísticos, os limites permitidos pelos autores de erro do tipo I ou II determinam o tamanho amostral necessário para o estudo. Dessa forma, a situação ideal é aumentar o tamanho amostral, se quiser ter minimização dos dois tipos de erros ao mesmo tempo.
Teste de hipótese : Valor-p
É a probabilidade de se encontrar um valor estatístico maior ou igual ao encontrado no estudo, caso a relação não seja real (H0 verdadeira). Tradicionalmente, o valor de corte para rejeitar a hipótese nula é de 0,05, o que significa que, quando não há nenhuma diferença, um valor tão extremo para a estatística de teste é esperado em menos de 5% das vezes.
Por exemplo, em um estudo em que houve risco relativo (RR) > 20% de tabagistas desenvolverem CA de pulmão em relação aos não tabagistas. O valor-p seria a probabilidade de não haver diferença de risco quando um valor tão extremo (como um RR >20) para a estatística de teste for encontrado.
Em um estudo, para haver diferença significativa, o valor-p encontrado deve ser menor que o nível de erro do tipo I aceitável no início do estudo. Isso porque, como vimos, o erro do tipo I que define o nível de confiança do estudo.
#Ponto importante: É inadequado interpretar um valor-p de, digamos, 0,06, como uma tendência de diferença. Um valor-p de 0,06 significa que existe uma probabilidade de 6% de se obter esse resultado por acaso quando o tratamento não tem nenhum efeito real. Como definimos o nível de significância de 5%, a hipótese nula não deve ser rejeitada.
Veja também:
- Resumo de medidas de associação: risco relativo, razão de prevalência e mais!
- Resumo de testes diagnósticos
- Resumo de indicadores de mortalidade o que são e como funcionam
- Resumo dos marcos legais do SUS: constituição, Lei 8.080, Lei 8.184 e mais!
- ResuMED de financiamento em saúde: medicina preventiva e mais
- ResuMED de vigilância em saúde: epidemiológica, sanitária e mais
- ResuMED de medicina de família e comunidade
- Residência Médica em Medicina Preventiva e Social: rotina, remuneração, estudos e mais
Referências bibliográficas:
- Ferreira JC, Patino CM. What does the p value really mean?. J bras pneumol [Internet]. 2015Sep;41(J. bras. pneumol., 2015 41(5)):485–. Available from: https://doi.org/10.1590/S1806-37132015000000215
- Farrugia P, Petrisor BA, Farrokhyar F, Bhandari M. Practical tips for surgical research: Research questions, hypotheses and objectives. Can J Surg. 2010 Aug;53(4):278-81. PMID: 20646403; PMCID: PMC2912019.https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2912019/#b3-0530278
- Luís MJL, Manuel GHG. Interpretação crítica dos resultados estatísticos: para lá da significância estatística. Revista de Enfermagem Referência – III – n.° 3 – 2011. UNIFESP.
- Crédito da imagem em destaque:Pexels