estatistica-descritiva

Estatística descritiva

A estatística descritiva é um ramo da estatística no qual um conjunto de dados pode ser condensado e descrito, ou seja, sintetiza dados de forma direta, se preocupando menos com variações e intervalos de confiança dos dados.

Usada para resumir, descrever e compreender os dados de uma distribuição usando medidas de tendência central, de dispersão, percentis, quartis e decis, e medidas de distribuição.

Quando usar:

Em momentos em que estamos diante de muitos dados, é necessário tornar essas informações manejáveis para então relacioná-los. 

A estatística descritiva é o instrumento que torna possível reduzir essas informações, no entanto ao utiliza-lo também ocorre uma defazagem de informações.

Este enviesamento introduzido pela redução da informação a um único número pode ser minimizado pela utilização de várias medidas que nos permitam cruzar informação e contrapor outras leituras dos nossos dados resumidos.

Esta é uma das razões pelas quais os dados estatísticos que se apresentam em relatórios de investigação terem frequentemente duas ou mais medidas descritivas associadas.

Por exemplo, o valor da Média (medida de tendência central) é frequentemente apresentado em associação com o valor do Desvio Padrão (medida de dispersão).

As medidas da Estatística Descritiva são também a base para a Estatística Inferencial (aquela que relaciona os dados da nossa distribuição).

A Estatística Descritiva descreve a nossa amostra e a Estatística Inferencial permite-nos fazer extrapolações dos resultados obtidos na nossa amostra para a população.

Permite-nos tirar conclusões, fazer estimativas, previsões e generalizações sobre todo um conjunto de dados estudando apenas parte dele.

Tratamento estatístico: 

O primeiro passo para o tratamento estatístico de dados é a sua organização numa base de dados.

A base de dados é uma tabela de dupla entrada em que habitualmente as colunas são usadas para colocar os dados referentes às variáveis e as linhas para identificar os sujeitos.

Na célula formada pela intercepção das linhas com as colunas coloca-se o valor da variável correspondente ao sujeito.  

A partir da informação organizada na nossa base de dados, podemos construir uma tabela de distribuição de frequências que mais não é do que a identificação do número de vezes em que cada tipo de resposta ocorre.

Medidas de Tendência Central

Quando queremos resumir os dados de uma distribuição utilizando apenas um número recorremos a medidas de tendência central (Média, Moda e Mediana).  

A utilização destas três medidas varia consoante o tipo de informação que pretendemos resumir ou descrever:

Percentis

Alguns percentis têm uma designação específica. Estas medidas permitem-nos situar os valores de cada observação em relação à distribuição total dos dados.

Uma vez que dividem o conjunto de observações em partes iguais tendo por referência o número de elementos que compõem a nossa amostra.

Elas são particularmente úteis quando queremos destacar um valor que marque um percentual de interesse. Também podem ser usadas para nos dar informação sobre o valor relativo de um dado valor numa distribuição.

Por exemplo, na análise das médias de estudantes com o mesmo curso feito em instituições diferentes, a mesma média situada em percentis diferentes, tem um valor relativo diferente.

Medidas de dispersão

O Desvio padrão é o valor que quantifica a dispersão das respostas numa distribuição normal, ou seja, a média das diferenças entre o valor de cada resposta e a média da distribuição (Nota: como a média da soma dos desvios é sempre igual a zero, elevam-se esses desvios ao quadrado e só depois é que se calcula a média desses desvios elevados ao quadrado, que se designa por Variância. Calculando a raiz quadrada da variância obtém-se o valor do desvio padrão).

O calculo da média dos desvios quadrados é feito dividindo a soma dos quadrados pelo valor de n-1  e não por n (a razão para este procedimento prende-se com o conceito de graus de liberdade).

Medidas de distribuição

O conceito de distribuição é fundamental na estatística. Toda a estatística paramétrica assenta no pressuposto de que os factores e variáveis da população se distribuem de acordo com a distribuição normal.

Quando número de sujeitos ou de casos for suficientemente grande, a distribuição amostral da média se aproxima cada vez mais de uma distribuição normal.

A distribuição normal das variáveis em estudo é um pressuposto para a utilização de testes estatísticos paramétricos.

Quando os resultados não se distribuem de acordo com a curva normal, teremos de usar testes estatísticos não-paramétricos.

As medidas de dispersão permitem-nos avaliar se os nossos dados estão distribuídos de acordo com o padrão descrito acima, ou seja, verificar se temos uma distribuição normal, ou se há desvios nessa distribuição.

Para medir a distribuição usamos medidas de achatamento (Kurtose) ou de simetria e obliquidade da curva de distribuição (Skewness).

Gostou de nosso conteúdo? Deixe seu comentário e compartilhe nas suas redes sociais.

 

Rating: 4.5/5. From 4 votes.
Please wait...
0 respostas

Deixe uma resposta

Quer participar da conversa?
Deixe sua opinião! :)

Deixe uma resposta