Como saber se a distribuição dos dados é uma normal?

Como saber se a distribuição dos dados é uma normal?

No artigo de hoje, mais um texto extraído do nosso próximo livro, escrito pelo Prof. Ademir Petenate.

Checando se os dados seguem uma distribuição Normal

Em muitas situações, quando coletamos uma amostra e medimos uma característica nos elementos da amostra, queremos verificar se a suposição de que as medidas obtidas tem distribuição Normal é plausível.

Embora existam procedimentos estatísticos formais para testar essa  suposição, é muito comum hoje em dia verificar se é razoável supor distribuição Normal através de procedimentos gráficos .Embora esses procedimentos contemplem uma certa dose de subjetividade no julgamento, é possível detectar desvios com respeito à distribuição Normal que possam comprometer a análise.

Um desses procedimentos é o gráfico probabilístico normal . Os dados da amostra são ordenados e plotados contra os escores normais num gráfico chamado de  gráfico probabilístico normal.  Os escores normais são calculados de tal forma que se os dados seguem uma distribuição Normal, então o gráfico resultante será aproximadamente uma reta.

Mesmo que a amostra tenha sido obtida a partir de uma distribuição Normal, os dados graficados contra os escores normais não se alinharão exatamente de acordo com uma reta devido às flutuações amostrais. O que se procura observar nesse gráfico são desvios anormais em relação a uma reta, o que indicaria que a suposição de que a distribuição Normal se aplica aos dados não é razoável.

Exemplo 

Dados duas amostras: 

a) de 30 valores  de uma distribuição

b) de 30 valores  de uma distribuição Lognormal.

Os gráficos abaixo apresentam o histograma, o Box-plot e o gráfico probabilístico normal para cada uma das amostras. Observe o comportamento do gráfico probabilístico quando a amostra segue a distribuição Normal (praticamente uma reta) e quando a amostra não segue a distribuição normal. A forte assimetria de Y pode ser notada no histograma e no Box-plot.

O uso do gráfico normal para verificar a suposição de normalidade é bastante facilitado pelos recursos dos softwares disponíveis.

A análise do gráfico probabilístico normal exige certa experiência acumulada. Essa experiência pode ser acelerada através da simulação de diversas distribuições diferentes utilizando o computador, e da verificação do comportamento dos respectivos gráficos normais.

[retweet]
[facebook]

0 respostas

Deixe uma resposta

Want to join the discussion?
Feel free to contribute!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *