A estatística descritiva é um ramo da estatística no qual um conjunto de dados pode ser condensado e descrito, ou seja, sintetiza dados de forma direta, se preocupando menos com variações e intervalos de confiança dos dados.
Usada para resumir, descrever e compreender os dados de uma distribuição usando medidas de tendência central, de dispersão, percentis, quartis e decis, e medidas de distribuição.
Quando usar a estatística descritiva
Em momentos em que estamos diante de muitos dados, é necessário tornar essas informações manejáveis para então relacioná-los.
A estatística descritiva é o instrumento que torna possível reduzir essas informações, no entanto ao utiliza-lo também ocorre uma defasagem de informações.
Este viés introduzido pela redução da informação a um único número pode ser minimizado pela utilização de várias medidas que nos permitam cruzar informação e contrapor outras leituras dos nossos dados resumidos.
Esta é uma das razões pelas quais os dados estatísticos que se apresentam em relatórios de investigação terem frequentemente duas ou mais medidas descritivas associadas.
Por exemplo, o valor da Média (medida de tendência central) é frequentemente apresentado em associação com o valor do Desvio Padrão (medida de dispersão).
As medidas da Estatística Descritiva são também a base para a Estatística Inferencial (aquela que relaciona os dados da nossa distribuição).
A Estatística Descritiva descreve a nossa amostra e a Estatística Inferencial permite-nos fazer extrapolações dos resultados obtidos na nossa amostra para a população.
Permite-nos tirar conclusões, fazer estimativas, previsões e generalizações sobre todo um conjunto de dados estudando apenas parte dele.
Tratamento estatístico
O primeiro passo para o tratamento estatístico de dados é a sua organização numa base de dados.
A base de dados é uma tabela de dupla entrada em que habitualmente as colunas são usadas para colocar os dados referentes às variáveis e as linhas para identificar os sujeitos.
Na célula formada pela intercepção das linhas com as colunas coloca-se o valor da variável correspondente ao sujeito.
A partir da informação organizada na nossa base de dados, podemos construir uma tabela de distribuição de frequências que nada mais é do que a identificação do número de vezes em que cada tipo de resposta ocorre.
Medidas de Tendência Central
Quando queremos resumir os dados de uma distribuição utilizando apenas um número recorremos a medidas de tendência central (Média, Moda e Mediana).
A utilização destas três medidas varia conforme o tipo de informação que pretendemos resumir ou descrever.
Estatística descritiva: Percentis
Alguns percentis têm uma designação específica. Estas medidas permitem-nos situar os valores de cada observação em relação à distribuição total dos dados.
Uma vez que dividem o conjunto de observações em partes iguais tendo por referência o número de elementos que compõem a nossa amostra.
Elas são particularmente úteis quando queremos destacar um valor que marque um percentual de interesse. Também podem ser usadas para nos dar informação sobre o valor relativo de um dado valor numa distribuição.
Por exemplo, na análise das médias de estudantes com o mesmo curso feito em instituições diferentes, a mesma média situada em percentis diferentes, tem um valor relativo diferente.
Medidas de dispersão
O Desvio padrão é o valor que quantifica a dispersão das respostas numa distribuição normal, ou seja, a média das diferenças entre o valor de cada resposta e a média da distribuição (Nota: como a média da soma dos desvios é sempre igual a zero, elevam-se esses desvios ao quadrado e só depois é que se calcula a média desses desvios elevados ao quadrado, que se designa por Variância. Calculando a raiz quadrada da variância obtém-se o valor do desvio padrão).
O calculo da média dos desvios quadrados é feito dividindo a soma dos quadrados pelo valor de n-1 e não por n (a razão para este procedimento prende-se com o conceito de graus de liberdade).
Medidas de distribuição
O conceito de distribuição é fundamental na estatística. Toda a estatística paramétrica assenta no pressuposto de que os fatores e variáveis da população se distribuem de acordo com a distribuição normal.
Quando número de sujeitos ou de casos for suficientemente grande, a distribuição amostral da média se aproxima cada vez mais de uma distribuição normal.
A distribuição normal das variáveis em estudo é um pressuposto para a utilização de testes estatísticos paramétricos.
Quando os resultados não se distribuem de acordo com a curva normal, teremos de usar testes estatísticos não-paramétricos.
As medidas de dispersão permitem-nos avaliar se os nossos dados estão distribuídos de acordo com o padrão descrito acima, ou seja, verificar se temos uma distribuição normal, ou se há desvios nessa distribuição.
Para medir a distribuição usamos medidas de achatamento (Kurtose) ou de simetria e obliquidade da curva de distribuição (Skewness).
Gostou de nosso conteúdo? Deixe seu comentário e compartilhe nas suas redes sociais!