Quando o valor-p é considerado bom ou ruim?

Perguntado por: candrade4 . Última atualização: 25 de abril de 2023
4.9 / 5 12 votos

Na maioria das análises, um alfa de 0.05 é usado como ponto de corte para significância. Se o valor-p for menor que 0.05, devemos rejeitar a hipótese nula de que não há diferença entre as médias e concluir que existe uma diferença significativa.

Conclusão. O p-valor é uma probabilidade com valor entre 0 e 1, ou entre 0 e 100% . O p-valor é a probabilidade de que a estatística do teste tenha um valor extremo em relação ao valor observado quando a hipótese nula é verdadeira.

Quando o valor de p é muito pequeno (aqueles que têm 4, 5 ou mais casas decimais até que apareça o valor real), convencionou-se apresentá-lo como p<0,001, que é o menor valor apresentável usando três casas decimais.

Um valor de p 0,05 significa que a probabilidade de o achado ser resultado do acaso é de apenas 5%. Significa que, se reproduzirmos o algorítimo ou se administrarmos o medicamento x, a probabilidade de se obter o mesmo resultado do estudo é de 95%.

Na estatística clássica, o valor-p (também chamado de nível descritivo ou probabilidade de significância), é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra, sob a hipótese nula.

O nível de significância é o corte para julgar um resultado como estatisticamente significativo. Se o valor de significância for menor que o nível de significância, o resultado será julgado como estatisticamente significativo. O nível de significância também é conhecido como o nível alfa.

Se aquela probabilidade for menor que o nosso nível de significância, neste caso, se a probabilidade for menor que 0,05, ou seja, menor que 5%, então, nós rejeitamos a hipótese nula e dizemos que temos evidência para a hipótese alternativa.

Essa notação seria lida de forma bem parecida a apresentada anteriormente, o valor de p é a probabilidade de uma métrica de um teste estatístico qualquer (e.g., D) ser maior que o valor observado (e.g., d) assumindo que a hipótese nula (H0) é verdadeira.

CONCLUSÃO: No nível de 5% de significância, há evidências que a audiência do programa de 2ª feira não foi de 60% e sim inferior a esse número ( < 60%).

Se em um teste A/B uma versão foi vencedora e a significância foi de 95%, por exemplo, isso significa que há 95% de chance de que você realmente tem uma versão vencedora. No entanto, ainda há 5% de chance de que esse resultado tenha sido uma pura obra do acaso e não refletir a realidade.

De forma pragmática, o valor de P representa a probabilidade da hipótese nula ser verdadeira, ou seja, que a diferença encontrada, entre o resultado de duas ou mais amostras, seja devido ao acaso, e não devido a fatores que estão sendo estudados.

Se a diferença não é devida ao acaso, dizemos que é uma diferença estatisticamente significativa. São inúmeras as situações em que precisamos ter certeza de que as diferenças que observamos não são explicadas por acaso. É a base do método científico.

Um resultado de teste diz-se estatisticamente significativo se tiver sido previsto como improvável de ocorrer por erro de amostragem isoladamente, de acordo com uma probabilidade limiar: o nível de significância. A significância estatística não implica importância ou significado prático.

E utilizando essas informações e o tamanho da amostra, nós podemos calcular uma estatística "t". E observe que ela é dada aqui no exercício. Com isso, nós podemos calcular um valor "p". E ele nada mais é do que a probabilidade de se obter um valor extremo a essa média aqui.

Como o p-valor calculado é 0,015 e menor que 0,02, temos p-valor ruim; Estudo 2: nível de confiança 95%, logo, nível de significância 0,05. Como o p-valor calculado é 0,7 e maior que 0,05, temos p-valor bom; Estudo 3: nível de confiança 95%, logo, nível de significância 0,05.

Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula CHISQ. TEST (em português, TESTE. QUIQUA), informando como parâmetros os valores observados, e depois os valores esperados. Já para calcular a estatística de teste quiquadrado, usa-se a fórmula CHIST.

A hipótese nula é, muitas vezes, uma alegação inicial baseado em análises anteriores ou conhecimentos especializados. A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula.

O teste F global determina se este relacionamento é estatisticamente significativo. Se o valor-p para o teste F global for menor que seu nível de significância, é possível concluir que o valor de R-quadrado é significativamente diferente de zero.

Raios Alfa, Beta e Gama.

O P-value (ou p-value ou valor da probabilidade) é a probabilidade de obter um valor da estatística de teste que seja pelo menos tão extremo quanto o representado pelos dados, admitindo que a hipótese nula é verdadeira. A hipótese nula é rejeitada se o P-value for muito pequeno, digamos 0.05 ou inferior.

Se o valor-p for menor que 0.05, devemos rejeitar a hipótese nula de que não há diferença entre as médias e concluir que existe uma diferença significativa. Se o valor-p for maior que 0.05, não é possível concluir que existe uma diferença significativa. Isso está bem claro, não é mesmo? Abaixo de 0.05, significativo.