Quando a distribuição não é normal?

Perguntado por: dgil2 . Última atualização: 2 de maio de 2023
4.9 / 5 16 votos

Existem casos em que a não normalidade é evidente, por exemplo: a) quando há restrições sobre os valores das obser- vações; b) quando a distribuição tem caudas pesadas ou deformações em relação à distribuição normal; e c) quando uma variável aleatória é definida pela razão entre outras duas.

Para uma distribuição perfeitamente normal, a média, mediana e moda terão o mesmo valor, visualmente representados pelo pico da curva. Também é frequentemente chamada de curva de sino porque o gráfico de sua densidade de probabilidade se parece com um sino.

A área total sob uma curva de distribuição normal padrão é de 100% (ou seja, "1" como um decimal). Por exemplo, a metade esquerda da curva é 50% ou 0,5. Portanto, a probabilidade de uma variável aleatória aparecer na metade esquerda da curva é 0,5.

A distribuição normal é caracterizada por uma função de probabilidade, cujo gráfico descreve uma curva em forma de sino, como mostra a Figura 1. Em 1733 Abraham De Moivre desenvolveu a equação matemática da curva normal. Isto possibilitou estabelecer a base para toda a teoria da Estatística indutiva.

Se o tamanho da amostra for de pelo menos 15, a normalidade não é um problema e o teste é preciso mesmo com dados não normais. Isso porque os testes foram modificados no software para ajustar esses desvios de normalidade. O teste t de uma amostra para menos de 20 dados, também será bastante robusto.

Sendo assim, os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada a uma distribuição normal.

Se média = 0 e desv_padrão = 1, DIST. NORMAL fornece uma distribuição normal padrão, DIST. S. NORM.

Os testes de normalidade estatísticos como Kolmogorov-Smirnov (K-S) , Shapiro-Wilk e Anderson-Darling comparam os valores de média e desvio padrão da amostra testada com o de uma distribuição normal. A hipótese nula é que a amostra é normal, então se o teste é significativo p<0.05 a amostra é não normal.

O teste de Kolmogorov-Smirnov de uma amostra pode ser utilizado para testar se uma variável (por exemplo, income) é normalmente distribuída. Média, desvio padrão, mínimo, máximo, número de casos não omissos, quartis, teste de Lilliefors e simulação de Monte Carlo.

Assim sendo, esse método de cálculo serve para diversas situações, como para o estudo da ocorrência de fenômenos físicos e financeiros. De tal modo, áreas da engenharia, da indústria química e até mesmo da medicina, como mostramos no exemplo anterior, podem utilizar da distribuição normal para a realização de cálculos.

AnáliseA distribuição de Gauss originalmente serve para mostrar como se distribuem os erros em uma medida experimental. Mas, pode também mostrar como se distribuem os dados em várias situações originadas de eventos mutuamente independentes.

A normalidade pode ser avaliada até certo ponto obtendo valores de assimetria e curtose. No entanto, outras técnicas também estão disponíveis no SPSS usando a opção Explorar do menu Estatísticas Descritivas. Este procedimento é detalhado a seguir. Estatísticas Descritivas e, em seguida, Explorar.

Existem técnicas específicas para cada caso de assimetria, que servem para transforma a distribuição em normal. Assimetria positiva, pode ser tratada com as seguintes técnicas: raiz quadrada, raiz cúbica e log. Assimetria negativa, pode ser tratada com as seguintes técnicas: quadrado, raiz cúbica e log.

O que é uma amostra representativa? Uma amostra representativa é um subconjunto de dados, normalmente de um grupo maior com características semelhantes. Usar uma amostra representativa ajuda a analisar populações maiores, pois os dados gerados contêm versões menores e mais fáceis de manusear do que os do grupo maior.

De fato, mudanças no valor do desvio-padrão tendem a provocar deformações na configuração gráfica da curva normal.