Pular para o conteúdo
Você está aqui: Início / Blog / Aprenda a fazer um histograma

Aprenda a fazer um histograma

Você sabe o que é histograma? À primeira vista, eles parecem muito semelhantes aos gráficos de barras. Ambos empregam barras verticais para representar dados. A altura de uma barra corresponde à frequência relativa da quantidade de dados na classe.

Quanto maior a barra, maior a frequência dos dados. Quanto menor a barra, menor a frequência dos dados. Mas as aparências podem enganar. É aqui que as semelhanças terminam entre os dois tipos de gráficos.

Quer entender melhor? No artigo a seguir, vamos apresentar as vantagens de utilizar o método na sua empresa para mostrar os diferentes tipos de histograma. Depois, entraremos no processo de aprendizado do método, elencando os indicadores e informando o passo a passo do processo.

Ao final, vamos mostrar um exemplo na prática e explicar os dados estatísticos envolvidos. Acompanhe!

O que é histograma?

O que é histograma?

Um histograma nada mais é do que uma representação gráfica de uma distribuição de frequência. Essa ferramenta tem retângulos justapostos, sendo que a base do retângulo é formada pelos intervalos de classe e a altura é proporcional à frequência do intervalo.

De aparência semelhante a um gráfico de barras (ou colunas), os histogramas ilustram a frequência de ocorrência de algum evento ou propriedade mensurável. Eles são usados ​​para exibir estatísticas em negócios, economia e outras disciplinas e fornecem uma ferramenta útil para analisar dados e tendências.

Para que serve essa ferramenta?

Para que serve essa ferramenta?

Agora que você já sabe o que é histograma, vejamos para que serve a ferramenta. Eles são empregados com mais frequência para mapear uma distribuição de valores ou resultados de um conjunto de observações. Nesse aspecto, eles estão relacionados à noção de uma curva em forma de sino — ou uma curva distorcida — para descrever uma série de dados.

Por exemplo, um pesquisador pode usar um histograma para resumir os dados coletados de uma pesquisa sobre a renda familiar de seus clientes. O eixo horizontal poderia representar renda e o eixo vertical poderia representar o número de respondentes.

Uma abordagem típica seria determinar intervalos significativos de valores – ou escala – para o eixo horizontal, que nesse caso é a renda. Assim, o pesquisador pode optar por dividir a renda em unidades de R$10.000, criando uma primeira categoria de R$10.000 ou menos, uma segunda categoria que varia de R$ 10.000 a R$ 20.000, e assim por diante.

Utilizar uma escala de intervalos iguais significa que cada coluna no histograma terá largura uniforme. A altura das colunas seria então determinada pelo número de respondentes que se enquadrava em cada categoria de rendimento.

Podem ser usados ​​números reais da pesquisa, proporções ou porcentagens do todo para representar a frequência e, portanto, a altura, para cada categoria de renda no histograma. Depois que os dados são preparados, o diagrama finalizado pode ser renderizado facilmente a partir de uma planilha ou programa gráfico em um computador pessoal.

Às vezes, quando não há a certeza do que fazer com um grande conjunto de medições mostrado em uma tabela, um histograma pode ser usado para organizar e exibir os dados em um formato mais amigável e compreensível. Torna mais fácil ver onde a maioria dos valores se enquadra em uma escala de medição e quanta diferença existe.

Além de fornecer uma representação visual da distribuição dos dados, o histograma é também um mecanismo fundamental para o controle de qualidade. Dessa forma, ele pode ser utilizado para melhorar um determinado projeto devido à visão completa do conjunto de dados.

Veja a seguir para quais outros fins um histograma pode servir.

Para comparar os resultados do processo com os limites de especificação

  • quando você adiciona os limites de especificação do ao seu histograma, pode saber rapidamente se o procedimento atual foi capaz de produzir produtos “bons”;
  • os limites de especificação podem ter a aparência de peso, comprimento, densidade, quantidade de materiais a serem entregues ou o que for crucial para o produto de um determinado processo.

Para comunicar informações graficamente

  • com o histograma, os membros da equipe podem ver com facilidade os valores que ocorrem na maioria das vezes (ou seja, a frequência dos valores). Se você usar um histograma para resumir grandes conjuntos de dados ou relacionar medidas a limites de especificação, usará uma ferramenta poderosa para a comunicação de informações.

Para auxiliar na tomada de decisões

  • no uso ou na criação do histograma, todos os dados têm significados que podem ajudá-lo a identificar problemas com clareza e tomar decisões eficientes;
  • mas lembre-se sempre de que, se os dados que você tem em mãos não estiverem atualizados ou se você não souber como os dados foram coletados, será uma perda de tempo tentar mapeá-los. A realização de medições não pode ser usada para tomar decisões ou estimativas quando elas foram feitas por um processo que é diferente do atual ou foram coletadas sob condições desconhecidas.

Tipos de histograma

Você já sabe o que é histograma e para que serve. Agora, antes de detalhar a aplicação da ferramenta, é preciso conhecer os tipos existentes para entender onde cada um se encaixa. Vamos lá?

1. Simétrico

Esse tipo de histograma representa os processos padronizados. O valor médio é encontrado no meio da faixa, onde a frequência é mais alta e vai diminuindo ao se aproximar dos extremos. É o tipo mais encontrado, geralmente.

2. Assimétrico

O histograma assimétrico é fácil de identificar por apresentar somente um pico. Ele serve para apresentar um processo com um limite de especificação, ou seja, quando não são colocados valores acima de determinado limite.

3. Despenhadeiro

O nome diz respeito ao formato íngreme do gráfico, como se fosse despencar a qualquer hora. Esse histograma pode ser utilizado quando for preciso eliminar os dados.

4. Dois picos

Se o tipo assimétrico se caracteriza por ter uma frequência em destaque, o tipo “dois picos” apresenta duas. O gráfico representa uma situação em que dados diferentes serão inseridos, portanto, a análise deve ser feita de modo separado.

5. Achatados

Esse histograma também é identificado como “platô”. Nele, as frequências aparecem de forma mais nivelada, com alturas semelhantes. Ele é utilizado quando há distribuições com médias distintas.

6. Ilha isolada

Esse tipo apresenta uma separação entre os dois processos, isolando-os um do outro. Isso ocorre quando aconteceu uma falha.

Em geral, é mais adequado construir um histograma da frequência relativa. Uma das razões é que a influência do tamanho da amostra é minimizada. A área total do histograma (soma das áreas de cada retângulo, considerando a base como sendo igual a 1) é 1 (ou 100%). Dessa forma, é possível comparar duas distribuições.

O histograma é uma ferramenta extremamente útil para conhecer os dados. Ele nos mostra informações importantes, como centro e dispersão de conjunto de dados. Confira a seguir os passos para interpretar adequadamente esse importante mecanismo.

Como analisar um histograma?

Antes de começar a análise, é preciso saber qual é o tipo de informação que será extraída. Dependendo do tipo de variável que coletamos, vamos utilizar uma ferramenta diferente. Por isso, é importante conhecer os indicadores e os dados que eles podem representar:

  • classificação: os resultados são classificações. Eles vão indicar se o resultado foi compatível com o padrão de qualidade determinado anteriormente ou não. Por exemplo, uma peça defeituosa ou não defeituosa, entrega atrasada ou não atrasada, cliente satisfeito ou não satisfeito;
  • contagem: dessa vez, os resultados serão representados por números inteiros. Por exemplo, a quantidade de riscos em uma peça, de acidentes no mês, dentre outros;
  • contínuos: os indicadores vão ser mostrados por valores dentro de um determinado intervalo. Por exemplo, peso, comprimento ou gasto mensal.

Enquanto a informação a ser colhida de um histograma pode variar amplamente com a natureza dos dados e a perspectiva do observador, algumas generalizações podem ser feitas. Os pontos óbvios de interesse em um histograma são seus altos e baixos. Estes mostram quão amplamente e quão uniformemente a variável medida no eixo horizontal é dispersa.

Na chamada distribuição normal, há um pico amplo na categoria média e os lados esquerdo e direito do histograma são simétricos. Isso não precisa ser o caso, no entanto. Pode haver vários picos e eles podem estar inclinados para cada extremidade da escala.

Como elaborar um histograma?

Já que você está familiarizado com os tipos de histograma e como os seus indicadores podem ser interpretados, que tal aprender a montar o seu próprio? Antes de qualquer coisa, porém, tenha cuidado com a coleta de dados.

Certifique-se de que eles estão corretos, porque isso pode comprometer os resultados do processo. Também é bom estar atento à simetria da forma, ao tamanho da dispersão (que precisa ser pequena) e à centralização, a qual, para melhor análise, deve estar na média.

Tudo pronto? Confira os passos a seguir:

  1. antes de tudo, você precisa determinar a amostra que vai utilizar. Para que você possa representar o total do que você vai analisar, a amostra tem que ser aleatória. Para um melhor resultado, apresente de 50 a 100 dados;
  2. observe qual é o maior e menor valor dos dados escolhidos. A partir disso, você pode calcular a amplitude (R), que é o resultado da diferença entre ambos;
  3. nessa etapa, você precisa decidir a quantidade de classes (K) que vão ser utilizadas. Isso vai determinar as faixas de variação no gráfico, o que significa que o número definido não pode ser nem tão grande e nem tão pequeno, e sim apenas proporcional ao que será calculado;
  4. depois de definir o valor da amplitude e do número de classes, você precisa calcular o intervalo entre elas (H). O cálculo é muito simples, basta dividir a amplitude pela quantidade de classes, ou seja, H = R/K;
  5. agora, vamos calcular os extremos das classes. Para isso, verifique o menor valor dos dados da amostra para definir o limite inferior (LI). Para definir o limite superior da primeira classe, só é preciso somar o intervalo de classe (H) ao limite inferior, ou seja, LS = LI+H. Para calcular os das demais classes, é só usar essa fórmula como base;
  6. é hora de montar o histograma. Contabilize os números de cada classe e encaixe-os na tabela;
  7. desenhe uma linha horizontal;
  8. coloque marcas uniformemente espaçadas ao longo desta linha que correspondam às classes;
  9. etiquete as marcas para que a escala fique nítida e dê um nome ao eixo horizontal;
  10. desenhe uma linha vertical à esquerda da classe mais baixa;
  11. escolha uma escala para o eixo vertical que acomodará a classe com a frequência mais alta;
  12. etiquete as marcas para que a escala fique nítida e dê um nome ao eixo vertical;
  13. construa barras para cada classe. A altura de cada barra deve corresponder à frequência da classe na base da barra.

Vamos ver um exemplo de aplicação do histograma?

Agora que você já aprendeu o que é histograma e como montar um, vamos ver um exemplo prático? Para isso, vamos analisar o conceito de distribuição na tabela a seguir. Para isso, considere o conjunto de dados que contém o peso líquido de leite evaporado em gramas de uma amostra retirada da produção.

Distribuição dos dados por meio do histograma

Examinando o arquivo, nós encontramos 60 registros, sendo que os pesos variam de 265.1 a 281.8 gramas. A maioria dos pesos, entretanto, está entre 270 e 276 gramas. Uma melhor descrição dos pesos, do ponto de vista estatístico, é feita por meio da distribuição deles.

A figura abaixo representa essa distribuição. Por meio do gráfico, podemos observar o comportamento dos pesos e examinar características como: simetria da distribuição, região onde há maior concentração de valores, o centro da distribuição (média, mediana etc.) e a dispersão dos valores em torno de um valor central. Podemos observar também que aproximadamente 10% das latas têm peso líquido acima de 277.3.

A distribuição — como veremos em detalhes mais à frente — fornece uma grande quantidade de informações sobre o conjunto de dados que estamos analisando. A figura a seguir apresenta a distribuição dos valores de peso líquido das informações apresentadas acima.

Análise do histograma

Quando examinamos a distribuição, não estamos interessados nos valores individuais, mas sim no conjunto das respostas, que pode ser caracterizado por poucos números que quantificam características importantes.

Quer um exemplo? Então, imagine que estamos produzindo um determinado tipo de peça fundida para uma indústria automobilística e que a característica de qualidade de interesse é uma dimensão da peça. Essa dimensão, portanto, deve atender a certas especificações.

Quando avaliamos o processo, não estamos interessados no valor da característica para cada peça produzida. Queremos saber qual é o valor médio dessa dimensão, se o processo produtivo apresenta muita ou pouca variabilidade, qual é a porcentagem de peças produzidas que não atende às especificações, dentre outros aspectos dessa natureza.

É difícil obter tais informações observando todos os valores da produção, ou mesmo todos os valores medidos em uma amostra. É necessário que se utilize algum recurso para sintetizar os dados e retirar as informações que são relevantes.

Quando estudamos um processo discreto, podemos medir cada item produzido. Em processos contínuos, a necessidade de caracterizar o processo a partir de uma amostra é mais evidente.

Medidas de centralidade

A medida de posição central é um valor que representa a distribuição em torno da qual as outras medidas se distribuem. Das suas ramificações, podemos citar duas medidas mais utilizadas: a média aritmética e a mediana.

Média Aritmética

A média aritmética de um conjunto de “n” valores — como o próprio nome indica — é obtida por meio da soma de todas as medidas e divisão dessa soma por “n”. Como ela é a soma dividida pelo total de resultados, essa medida representa bem os dados totais da distribuição.

Mediana

A mediana é uma medida que representa o centro da distribuição. Considere que a mediana das medidas y_1,y_2,…,y_n é um valor “A”. Então, pelo menos metade dos valores são menores ou iguais a A e, pelo menos, a outra metade dos números apresentados são maiores ou iguais a “A”.

Resumindo, 50% das medidas ficam abaixo da mediana e 50% acima. Vamos visualizar com um exemplo? Imagine que uma moça deu à luz a 5 filhos. Os pesos dos bebês foram: 9.2, 6.4, 10.5, 8.1 e 7.8. Como vamos saber a mediana dos pesos? Os valores na ordem direta são: 6.4, 7.8, 8.1, 9.2 e 10.5. Logo, a mediana é 8.1.

Que tal um exemplo um pouco mais complicado? Os dados a seguir são tempos de vida de 8 lâmpadas em termos de quantidade de dias: 500, 550, 550, 550, 600, 700, 750, 2000. Se você prestar atenção, dois valores atendem ao requisito de ser mediana: o quarto (550) e o quinto (600) valor na lista ordenada. Desse modo, a mediana vai ser a média desses valores: (550+600) / 2 = 575. A média aritmética é 775.

Entender esses conceitos é importante não somente para indústrias, mas para o nosso cotidiano também. Por exemplo, quando vemos uma reportagem sinalizando a renda média de um país, podemos ter uma visão errônea da real situação.

O valor da renda média pode ser alto e a situação social ser marcada por uma desigualdade extrema. Se poucas pessoas ganham muito e a maioria dos habitantes ganha pouco, a média pode passar a impressão de ser mais favorável do que ela realmente é.

Medidas de variabilidade

Como já foi dito, a variabilidade está presente em praticamente todos os fenômenos estudados. Dois indivíduos submetidos às mesmas condições respondem de forma diferente. É importante entender essa variabilidade e, principalmente, saber quantificá-la.

Somente o cálculo da média, ou outra medida de posição, não é suficiente para caracterizar o conjunto de dados. Dois conjuntos de medidas podem ter a mesma média, mas apresentarem diferenças a respeito da distribuição das medidas ao redor. Quer uma explanação mais prática? Considere os dois conjuntos de dados seguintes:

  • A: (2, 3, 4);
  • B: (1, 3, 5).

Ambos têm a média igual a 3, mas o conjunto B é mais disperso em torno da média. Consegue perceber agora? Podemos também calcular a dispersão de um conjunto de medidas. Confira a seguir:

Amplitude

A forma mais simples de se quantificar a dispersão é calculando a amplitude. Ela nada mais é do que a diferença entre o maior e o menor valor do conjunto, como já explicamos. No exemplo acima, a amplitude do conjunto A é 4 – 2 = 2 e do conjunto B é 5 –1 = 4.

Desvio Padrão

O uso da amplitude apresenta algumas desvantagens e a mais importante é que o seu cálculo envolva apenas os valores extremos do conjunto. É por isso que uma forma amplamente utilizada para medir variabilidade é o desvio padrão.

Como a média é uma medida de centralidade, e queremos quantificar a dispersão dos dados em torno dela, vamos usar os desvios de cada valor ao redor, ou seja, a diferença entre cada ponto e a média.

Quais são os benefícios trazidos pelo histograma?

Que vantagens a aplicação do método poderia trazer para a sua empresa? Para começar, fazer uma análise comparativa entre muitos dados vai se tornar uma tarefa mais fácil e detalhada. Assim, vai ser possível identificar os problemas que um determinado projeto pode acarretar, o que agiliza as soluções para evitá-los.

Com o histograma, você vai poder perceber as frequências em que determinados eventos acontecem e a tendência deles dentro de um processo. Além de tudo isso, esse mecanismo é fácil de manusear, tanto manualmente quanto em programas como Excel.

Outra vantagem é que, ao utilizar o método, vai ser possível comparar os resultados obtidos com as especificações requeridas pelos clientes. Ou seja, é proporcionada uma melhor visualização se o processo está dentro do que foi combinado.

Por último, mas definitivamente não menos importante, um histograma pode ser útil para determinar quando você está desperdiçando muito esforço ou recursos em uma tarefa específica. Às vezes, uma parte do seu processo não exige tanta atenção quanto você pensa, e um histograma representando a alocação de recursos atual pode revelar isso imediatamente.

Apenas certifique-se de ter uma visão geral adequada de como seus recursos estão sendo alocados e utilizados para construir os conjuntos de dados para o seu histograma, caso contrário, você pode não ver a imagem completa.

Ao fazer isso corretamente, você pode garantir que seus recursos estejam sendo aplicados lugar certo, diminuir o investimento nas áreas que não demandem tanto e redirecioná-lo para a parte do processo que está atualmente com falta de recursos. Eventualmente, você alcançará um ponto de equilíbrio onde as coisas funcionarão de forma otimizada.

É importante ressaltar, no entanto, que o método funciona melhor em sistemas estáveis. É mais fácil detectar padrões e prever eventos quando o processo apresenta constância. Se tudo mudar de período em período, a instabilidade vai dificultar a apresentação de uma análise de grande utilidade.

Até aqui, vimos o que é histograma, para que serve a ferramenta e quais os tipos existentes, como montá-lo, como analisá-lo e os benefícios de utilizá-lo na empresa onde trabalha.

Como você pôde perceber, o histograma pode ser utilizado para os mais variados exemplos dentro de uma indústria. Além do exemplo do leite evaporado, podemos aplicar esse método para identificar padrões dentro de uma produção ou, simplesmente, para a confecção de uniformes novos de um grupo de funcionários.

As possibilidades são muitas. Todos esses exemplos podem servir ao propósito de metodologias como Seis-Sigma, que visa às melhorias na qualidade de um processo.

Apesar de ser uma excelente ferramenta para o controle de qualidade, o histograma não deve ser a única para o aprimoramento da sua empresa. Existem outros métodos que podem ajudar a complementar a sua eficácia e, assim, alcançar resultados ainda mais promissores. Até porque é preciso ter bastante experiência para não fazer um histograma com informações errôneas, o que depende da quantidade de barras utilizadas para construí-lo.

Antes de iniciar todo o processo do histograma, é preciso fazer um planejamento de negócios detalhado e saber segui-lo com atenção em todas as etapas. Confira como construir um planejamento estratégico!

Se quiser ficar sempre por dentro de nossos artigos e cursos, não deixe de assinar nossa newsletter!

post

1 comentário em “Aprenda a fazer um histograma”

  1. Pingback: Análise de dados: sua importância para os negócios

Deixe um comentário

Inscreva-se em nossa newsletter

E receba por email novos conteúdos assim que forem publicados!

Desenvolvido por: