A definição parece simples, mas gera muita confusão.
Os p-valores surgiram nos testes de significância de Fisher.
A questão acerca do abuso e das interpretações equivocadas é tão relevante que fizeram uma edição especial da American Statistician só sobre o tema:
tandfonline.com/toc/utas20/73/…
doi.org/10.1080/000313…
Mas essa preocupação não é nova. O próprio Fisher sempre tomou muito cuidado com as definições e interpretações.
psycnet.apa.org/record/1995-12…
dx.doi.org/10.1080/016214…
dx.doi.org/10.1198/000313…
Assim, vemos que o tema é extremamente relevante.
Dito isso, vamos aos p-valores.
P₀(|T| > C) = α ou P₀(T > C) = α ou P₀(T < C) = α,
onde T é a estat. do teste
p-valor = P₀(|T| >|t₀|) ou P₀(T > t₀) ou P₀(T<t₀) , resp.
E o que ele nos diz?
Observe que no p-valor estamos assumindo H₀!!
ERRO COMUM: Acreditar que o p-valor é a probabilidade de H₀ ser verdadeiro.
P-valor não é isso, pois, assim como mencionado anteriormente, ele assume H₀ verdadeiro. Então, a afirmação acima só seria verdade se H₀ fosse sempre verdadeiro!
Mais detalhes em: en.wikipedia.org/wiki/Multiple_…
Não é possível calcular P(H₀ ), mas utilizando inferência Bayesiana (que possui alguma subjetividade) dá para estimar.
No artigo acima, é possível ver alguns exemplos.
Voltando para o p-valor. O efeito prático disso é que vários pesquisadores agem como se para provar uma teoria fosse suficiente realizar um teste e obter p-valor < 0.05.
Parece piada, mas é algo que é, de fato, feito.
Recomendo a leitura do artigo para ver a linha argumentativa: stat.columbia.edu/~gelman/resear…
Abaixo descrevo brevemente o fenômeno.
link.springer.com/article/10.100…
O coração do problema sendo que Fisher achava que não deveria existir hip. alternativa. Havendo outras divergências.
jstor.org/stable/3541653
jstor.org/stable/2291263
projecteuclid.org/euclid.ss/1056…
amazon.com/Fisher-Neyman-…
jstor.org/stable/4616108
amazon.com/Lady-Tasting-T…
projecteuclid.org/euclid.bj/1544…
sciencedirect.com/science/articl…
link.springer.com/article/10.100…