O que significa um p-valor alto?

Perguntado por: icarvalho . Última atualização: 2 de maio de 2023
4.5 / 5 14 votos

O valor-p indica a probabilidade de se observar uma diferença tão grande ou maior do que a que foi observada sob a hipótese nula. Mas se o novo tratamento tiver um efeito de tamanho menor, um estudo com uma pequena amostra pode não ter poder suficiente para detectá-lo.

Logo, a regra de ouro é: Se o valor de p for maior do que o valor de alfa, deve-se aceitar a hipótese nula. Por outro lado, se o valor de p for menor do que o valor de alfa, deve-se rejeitar a hipótese nula. Vamos a um exemplo!

De forma pragmática, o valor de P representa a probabilidade da hipótese nula ser verdadeira, ou seja, que a diferença encontrada, entre o resultado de duas ou mais amostras, seja devido ao acaso, e não devido a fatores que estão sendo estudados.

Na estatística clássica, o valor-p (também chamado de nível descritivo ou probabilidade de significância), é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra, sob a hipótese nula.

Um valor-p baixo (< 0,05) indica que você pode rejeitar a hipótese nula. Em outras palavras, uma variável que tenha um valor-p baixo provavelmente será significativa ao seu modelo, porque as alterações no valor dela estão relacionadas à alterações na variável resposta.

Um valor de p 0,05 significa que a probabilidade de o achado ser resultado do acaso é de apenas 5%.

Assim, Se em nosso estudo obtermos uma significância menor do que 0,05 ("p>0,005") , então estamos assumindo que há uma probabilidade de apenas 5% de que a diferença encontrada no estudo não seja verdadeira, apesar de, estatisticamente, ter sido assim demonstrada.

Se o valor é muito pequeno (menor que 0,01), ele declara que o efeito foi percebido. Se for muito grande (maior que 0,20), ele declara que, se há algum efeito, nenhum experimento do tamanho do que foi executado, será capaz de detectá-lo.

Se o nível de significância for menor, a probabilidade do valor estatístico ser mais extremo que o valor crítico também será menor. Então, um resultado significante ao nível de 1% é mais significante que um resultado significante ao nível de 5%.

Se em um teste A/B uma versão foi vencedora e a significância foi de 95%, por exemplo, isso significa que há 95% de chance de que você realmente tem uma versão vencedora. No entanto, ainda há 5% de chance de que esse resultado tenha sido uma pura obra do acaso e não refletir a realidade.

Se a diferença não é devida ao acaso, dizemos que é uma diferença estatisticamente significativa. São inúmeras as situações em que precisamos ter certeza de que as diferenças que observamos não são explicadas por acaso. É a base do método científico.

Um resultado de teste diz-se estatisticamente significativo se tiver sido previsto como improvável de ocorrer por erro de amostragem isoladamente, de acordo com uma probabilidade limiar: o nível de significância. A significância estatística não implica importância ou significado prático.

Um nível de significância de 0,05 indica um risco de 5% de concluir que os dados não seguem a distribuição normal quando eles realmente a seguem. Se o valor de p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula e concluir que os seus dados não seguem a distribuição normal.

Raios Alfa, Beta e Gama.

A análise de regressão é útil para uma organização, pois permite determinar o grau em que as variáveis independentes influenciam as variáveis dependentes. Além disso, permite explicar um fenômeno e prever coisas sobre o futuro, assim como também pode obter informações comerciais valiosas e acionáveis.

Problemas de Regressão
as de regressão existem quando precisamos prever um valor numérico específico. Este valor pode ser o preço de um produto, o peso ou altura de uma pessoa, a metragem de uma casa, e assim por diante. Nestas situações, o modelo poderá apresentar como resposta qualquer valor.

A análise de regressão é uma técnica de análise que calcula o relacionamento estimado entre uma variável dependente e uma ou mais variáveis explanatórias. Com a análise de regressão, você pode modelar o relacionamento entre as variáveis escolhidas, como também, prever valores com base no modelo.

Sendo assim, os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada a uma distribuição normal.

A hipótese nula é, muitas vezes, uma alegação inicial baseado em análises anteriores ou conhecimentos especializados. A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula.