Resumo de teste de hipótese: definição, tipos de erros, valor-p e mais!

Resumo de teste de hipótese: definição, tipos de erros, valor-p e mais!

O teste de hipótese é realizado para definir se a resposta para uma questão clínica apresenta evidência científica a partir de um estudo. Por exemplo, em um experimento no qual 50 indivíduos receberam um placebo e outros 50 receberam uma medicação para cefaleia. Após 2 horas, 40 pessoas no grupo medicação melhoraram a dor, enquanto 30 pessoas no grupo placebo melhoraram. 

Como sabemos se essa diferença significa que a droga funciona e não é simplesmente resultado do acaso? A forma mais comum de se abordar esse problema é utilizar um teste de hipótese. 

Inscreva-se em nossa newsletter!

Receba notícias sobre residência médica, revalidação de diplomas e concursos médicos, além de materiais de estudo gratuitos e informações relevantes do mundo da Medicina.

Definição do teste de hipótese

Pode ser definida como a inferência de alguma relação entre duas ou mais variáveis, sendo desenvolvida a partir de uma questão clínica. Por sua vez, o objetivo do teste de hipótese é fazer uma inferência sobre a população de interesse com base em uma amostra aleatória retirada dessa população. 

Definir a hipótese é o pontapé inicial para se desenhar um estudo, definir a estratégia de amostragem, intervenção (se aplicável), comparação, variáveis ​​de resultado, testes estatísticos e, finalmente, o significado clínico. Dois conceitos sobre hipótese são importantes para entender a MBE como um todo:

  • Hipótese nula (H0): não há diferença ou relação entre os grupos estudados.  
  • Hipótese alternativa: existe relação entre as duas variáveis, com significância estatística.    

No exemplo que demos, a equipe de investigação deve primeiro formular uma hipótese de pesquisa. Isso pode ser expresso como um resultado único, por exemplo, o uso da medicação leva a uma melhora da cefaleia. A hipótese nula é que não há diferença entre o placebo e a medicação. 

Teste de hipótese : Tipos de erros 

A partir da definição da hipótese nula e alternativa, é possível definir os erros possíveis de um estudo. 

Erro alfa ou tipo I

Rejeitar a hipótese nula em um estudo, quando essa é a verdadeira no mundo real. Este é o tipo de erro mais grave, pois inferimos uma relação que não é verdadeira. 

Este erro é habitualmente cobrado em provas, por exemplo, uma nova medicação é testada para HIV, se demonstrando eficaz, mas estudos maiores e mais bem desenhados posteriores demonstram que seu uso não apresenta diferença com placebo (hipótese nula) ou no mundo real/habitual não demonstra diferença. 

A partir do Erro Alfa é possível determinar o nível de confiança do estudo. Ele é definido a partir do valor de erro alfa permitido no estudo. Um valor convencional para a maioria dos estudos é de 5 %.  

Nível de confiança: 1 – erro Alfa

Se erro tipo alfa permitido até 5%, um nível de confiança de 95%. 

Erro Beta ou tipo II

Aceitar a hipótese nula, quando na verdade esta é falsa no mundo habitual, considerando que há diferença entre os grupos estudados, quando na verdade não há.  

Como é um erro menos grave que o tipo I, seu valor aceitável varia de 10 a 20%. Seu valor é utilizado para calcular o poder de confiança ou poder do estudo:

Poder de confiança = 1 – erro Beta

Se erro Beta de 15%, poder de confiança do estudo é de 85%. 

Quando se realiza um teste estatístico é desejável que tanto o valor de α como de β sejam os menores possíveis. Porém, dentro de um estudo não é possível que se diminua simultaneamente a probabilidade dos dois tipos de erros. Se baixar o valor de α, aumentará o valor de β, e vice-versa.

#Ponto importante: A partir de cálculos estatísticos, os limites permitidos pelos autores de erro do tipo I ou II determinam o tamanho amostral necessário para o estudo. Dessa forma, a situação ideal é aumentar o tamanho amostral, se quiser ter minimização dos dois tipos de erros ao mesmo tempo. 

Teste de hipótese : Valor-p 

É a probabilidade de se encontrar um valor estatístico maior ou igual ao encontrado no estudo, caso a relação não seja real (H0 verdadeira). Tradicionalmente, o valor de corte para rejeitar a hipótese nula é de 0,05, o que significa que, quando não há nenhuma diferença, um valor tão extremo para a estatística de teste é esperado em menos de 5% das vezes. 

Por exemplo, em um estudo em que houve risco relativo (RR) > 20% de tabagistas desenvolverem CA de pulmão em relação aos não tabagistas. O valor-p seria a probabilidade de não haver diferença de risco quando um valor tão extremo (como um RR >20) para a estatística de teste for encontrado. 

Em um estudo, para haver diferença significativa, o valor-p encontrado deve ser menor que o nível de erro do tipo I aceitável no início do estudo. Isso porque, como vimos, o erro do tipo I que define o nível de confiança do estudo. 

#Ponto importante: É inadequado interpretar um valor-p de, digamos, 0,06, como uma tendência de diferença. Um valor-p de 0,06 significa que existe uma probabilidade de 6% de se obter esse resultado por acaso quando o tratamento não tem nenhum efeito real. Como definimos o nível de significância de 5%, a hipótese nula não deve ser rejeitada.

Curso Extensivo Residência Médica

Veja também:

Referências bibliográficas:

  • Ferreira JC, Patino CM. What does the p value really mean?. J bras pneumol [Internet]. 2015Sep;41(J. bras. pneumol., 2015 41(5)):485–. Available from: https://doi.org/10.1590/S1806-37132015000000215
  • Farrugia P, Petrisor BA, Farrokhyar F, Bhandari M. Practical tips for surgical research: Research questions, hypotheses and objectives. Can J Surg. 2010 Aug;53(4):278-81. PMID: 20646403; PMCID: PMC2912019.https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2912019/#b3-0530278
  • Luís MJL, Manuel GHG. Interpretação crítica dos resultados estatísticos: para lá da significância estatística. Revista de Enfermagem Referência – III – n.° 3 – 2011. UNIFESP
  • Crédito da imagem em destaque:Pexels
Você pode gostar também