Aprenda a fazer um histograma

Um histograma nada mais é do que uma representação gráfica de uma distribuição de frequência. Essa ferramenta tem retângulos justapostos, sendo que a base do retângulo é formada pelos intervalos de classe e a altura é proporcional à frequência do intervalo.

Além de fornecer uma representação visual da distribuição dos dados, o histograma é um mecanismo fundamental para o controle de qualidade. Dessa forma, ele pode ser utilizado para melhorar um determinado projeto devido à visão completa do conjunto de dados.

No artigo a seguir, vamos apresentar as vantagens de utilizar o método na sua empresa para mostrar os diferentes tipos de histograma. Depois, entraremos no processo de aprendizado do método, elencando os indicadores e informando o passo a passo do processo. Ao final, vamos mostrar um exemplo na prática e explicar os dados estatísticos envolvidos. Acompanhe!

eBook: Como fazer análise de dados

A análise de dados tem sido uma habilidade cada vez mais requisitada no mercado de trabalho. A quantidade de dados disponíveis é enorme, mas poucas pessoas conseguem transformá-los em insights para decisões de negócios.





Capa eBook: Como fazer análise de dados

Os benefícios trazidos pelo histograma

Que vantagens a aplicação do método poderia trazer para a sua empresa? Para começar, fazer uma análise comparativa entre muitos dados vai se tornar uma tarefa mais fácil e detalhada. Assim, vai ser possível identificar os problemas que um determinado projeto pode acarretar, o que agiliza as soluções para evitá-los.

Com o histograma, você vai poder perceber as frequências em que determinados eventos acontecem e a tendência deles dentro de um processo. Além de tudo isso, esse mecanismo é fácil de manusear, tanto manualmente quanto em programas como Excel.

Outra vantagem é que, ao utilizar o método, vai ser possível comparar os resultados obtidos com as especificações requeridas pelos clientes. Ou seja, é proporcionada uma melhor visualização se o processo está dentro do que foi combinado.

É importante ressaltar, no entanto, que o método funciona melhor em sistemas estáveis. É mais fácil detectar padrões e prever eventos quando o processo apresenta constância. Se tudo mudar de período em período, a instabilidade vai dificultar a apresentação de uma análise de grande utilidade.

Tipos de histograma

Antes de detalhar a aplicação do histograma, é preciso conhecer os tipos existentes para entender onde cada um se encaixa. Vamos lá?

1. Simétrico

Esse tipo de histograma representa os processos padronizados. O valor médio é encontrado no meio da faixa, onde a frequência é mais alta e vai diminuindo ao se aproximar dos extremos. É o tipo mais encontrado, geralmente.

2. Assimétrico

O histograma assimétrico é fácil de identificar por apresentar somente um pico. Ele serve para apresentar um processo com um limite de especificação, ou seja, quando não são colocados valores acima de determinado limite.

3. Despenhadeiro

O nome diz respeito ao formato íngreme do gráfico, como se fosse despencar a qualquer hora. Esse histograma pode ser utilizado quando for preciso eliminar os dados.

4. Dois picos

Se o tipo assimétrico se caracteriza por ter uma frequência em destaque, o tipo “dois picos” apresenta duas. O gráfico representa uma situação em que dados diferentes serão inseridos, portanto, a análise deve ser feita de modo separado.

5. Achatados

Esse histograma também é identificado como “platô”. Nele, as frequências aparecem de forma mais nivelada, com alturas semelhantes. Ele é utilizado quando há distribuições com médias distintas.

6. Ilha isolada

Esse tipo apresenta uma separação entre os dois processos, isolando-os um do outro. Isso ocorre quando aconteceu uma falha.

Em geral, é mais adequado construir um histograma da frequência relativa. Uma das razões é que a influência do tamanho da amostra é minimizada. A área total do histograma (soma das áreas de cada retângulo, considerando a base como sendo igual a 1) é 1 (ou 100%). Dessa forma, é possível comparar duas distribuições.

O histograma é uma ferramenta extremamente útil para conhecer os dados. Ele nos mostra informações importantes, como centro e dispersão de conjunto de dados. Confira a seguir os passos para interpretar adequadamente esse importante mecanismo:

Como analisar um histograma

Antes de começar a análise, é preciso saber qual é o tipo de informação que será extraída. Dependendo do tipo de variável que coletamos, vamos utilizar uma ferramenta diferente. Por isso, é importante conhecer os indicadores e os dados que eles podem representar:

  • classificação: os resultados são classificações. Eles vão indicar se o resultado foi compatível com o padrão de qualidade determinado anteriormente ou não. Por exemplo, uma peça defeituosa ou não defeituosa, entrega atrasada ou não atrasada, cliente satisfeito ou não satisfeito;
  • contagem: dessa vez, os resultados serão representados por números inteiros. Por exemplo, a quantidade de riscos em uma peça, de acidentes no mês, dentre outros;
  • contínuos: os indicadores vão ser mostrados por valores dentro de um determinado intervalo. Por exemplo, peso, comprimento ou gasto mensal.

Como elaborar um histograma

Já que você está familiarizado com os tipos de histograma e como os seus indicadores podem ser interpretados, que tal aprender a montar o seu próprio? Antes de qualquer coisa, porém, tenha cuidado com a coleta de dados. Certifique-se de que eles estão corretos, porque isso pode comprometer os resultados do processo. Também é bom estar atento à simetria da forma, ao tamanho da dispersão (que precisa ser pequena) e à centralização, a qual, para melhor análise, deve estar na média.  Tudo pronto? Confira os passos a seguir:

  1. Antes de tudo, você precisa determinar a amostra que vai utilizar. Para que você possa representar o total do que você vai analisar, a amostra tem que ser aleatória. Para um melhor resultado, apresente de 50 a 100 dados;
  2. Observe qual é o maior e menor valor dos dados escolhidos. A partir disso, você pode calcular a amplitude (R), que é o resultado da diferença entre ambos;
  3. Nessa etapa, você precisa decidir a quantidade de classes (K) que vão ser utilizadas. Isso vai determinar as faixas de variação no gráfico, o que significa que o número definido não pode ser nem tão grande e nem tão pequeno, e sim apenas proporcional ao que será calculado;
  4. Depois de definir o valor da amplitude e do número de classes, você precisa calcular o intervalo entre elas (H). O cálculo é muito simples, basta dividir a amplitude pela quantidade de classes, ou seja, H = R/K;
  5. Agora, vamos calcular os extremos das classes. Para isso, verifique o menor valor dos dados da amostra para definir o limite inferior (LI). Para definir o limite superior da primeira classe, só é preciso somar o intervalo de classe (H) ao limite inferior, ou seja, LS = LI+H. Para calcular os das demais classes, é só usar essa fórmula como base;
  6. É hora de montar o histograma. Contabilize os números de cada classe e encaixe-os na tabela.

Um exemplo de aplicação do histograma

Agora que você já aprendeu como montar um histograma, vamos ver um exemplo prático?  Para isso, vamos analisar o conceito de distribuição na tabela a seguir. Para isso, considere o conjunto de dados que contém o peso líquido de leite evaporado em gramas de uma amostra retirada da produção.

Lata Peso Lata Peso Lata Peso Lata Peso
1 275.40 16 275.20 31 273.90 46 271.80
2 275.30 17 279.10 32 266.80 47 266.40
3 271.40 18 276.30 33 271.40 48 271.50
4 270.30 19 271.80 34 270.50 49 276.50
5 275.70 20 278.50 35 276.10 50 272.20
6 277.30 21 271.70 36 270.30 51 271.50
7 268.00 22 281.80 37 272.50 52 271.70
8 273.30 23 272.60 38 274.10 53 274.80
9 277.10 24 268.80 39 271.20 54 274.60
10 276.00 25 272.40 40 275.20 55 272.60
11 275.70 26 275.20 41 271.30 56 272.50
12 275.90 27 276.70 42 278.80 57 269.90
13 271.60 28 276.00 43 273.80 58 274.50
14 276.30 29 272.60 44 277.80 59 267.80
15 266.50 30 273.40 45 274.70 60 265.10

Distribuição dos dados por meio do histograma

Examinando o arquivo, nós encontramos 60 registros, sendo que os pesos variam de 265.1 a 281.8 gramas. A maioria dos pesos, entretanto, está entre 270 e 276 gramas. Uma melhor descrição dos pesos, do ponto de vista estatístico, é feita por meio da distribuição deles.

A figura abaixo representa essa distribuição. Por meio do gráfico, podemos observar o comportamento dos pesos e examinar características como: simetria da distribuição, região onde há maior concentração de valores, o centro da distribuição (média, mediana etc.) e a dispersão dos valores em torno de um valor central. Podemos observar também que aproximadamente 10% das latas têm peso líquido acima de 277.3.

A distribuição — como veremos em detalhes mais à frente — fornece uma grande quantidade de informações sobre o conjunto de dados que estamos analisando. A figura a seguir apresenta a distribuição dos valores de peso líquido das informações apresentadas acima.

histograma 60 embalagens leite

Análise do histograma

Quando examinamos a distribuição, não estamos interessados nos valores individuais, mas sim no conjunto das respostas, que pode ser caracterizado por poucos números que quantificam características importantes.

Quer um exemplo? Então, imagine que estamos produzindo um determinado tipo de peça fundida para uma indústria automobilística e que a característica de qualidade de interesse é uma dimensão da peça. Essa dimensão, portanto, deve atender a certas especificações.

Quando avaliamos o processo, não estamos interessados no valor da característica para cada peça produzida. Queremos saber qual é o valor médio dessa dimensão, se o processo produtivo apresenta muita ou pouca variabilidade, qual é a porcentagem de peças produzidas que não atende às especificações, dentre outros aspectos dessa natureza.

É difícil obter tais informações observando todos os valores da produção, ou mesmo todos os valores medidos em uma amostra. É necessário que se utilize algum recurso para sintetizar os dados e retirar as informações que são relevantes.

Quando estudamos um processo discreto, podemos medir cada item produzido. Em processos contínuos, a necessidade de caracterizar o processo a partir de uma amostra é mais evidente.

Medidas de centralidade

A medida de posição central é um valor que representa a distribuição em torno da qual as outras medidas se distribuem. Das suas ramificações, podemos citar duas medidas mais utilizadas: a média aritmética e a mediana.

Média Aritmética

A média aritmética de um conjunto de “n” valores — como o próprio nome indica — é obtida por meio da soma de todas as medidas e divisão dessa soma por “n”. Como ela é a soma dividida pelo total de resultados, essa medida representa bem os dados totais da distribuição.

Mediana

A mediana é uma medida que representa o centro da distribuição. Considere que a mediana das medidas y_1,y_2,…,y_n é um valor “A”. Então, pelo menos metade dos valores são menores ou iguais a A e pelo menos a outra metade dos números apresentados são maiores ou iguais a “A”.

Resumindo, 50% das medidas ficam abaixo da mediana e 50% acima. Vamos visualizar com um exemplo? Imagine que uma moça deu à luz a 5 filhos. Os pesos dos bebês foram: 9.2, 6.4, 10.5, 8.1 e 7.8. Como vamos saber a mediana dos pesos? Os valores na ordem direta são: 6.4, 7.8, 8.1, 9.2 e 10.5. Logo, a mediana é 8.1.

Que tal um exemplo um pouco mais complicado? Os dados a seguir são tempos de vida de 8 lâmpadas em termos de quantidade de dias: 500, 550, 550, 550, 600, 700, 750, 2000.  Se você prestar atenção, dois valores atendem ao requisito de ser mediana: o quarto (550) e o quinto (600) valor na lista ordenada. Desse modo, a mediana vai ser a média desses valores: (550+600) / 2 = 575. A média aritmética é 775.

Entender esses conceitos é importante não somente para indústrias, mas para o nosso cotidiano também. Por exemplo, quando vemos uma reportagem sinalizando a renda média de um país, podemos ter uma visão errônea da real situação.

O valor da renda média pode ser alto e a situação social ser marcada por uma desigualdade extrema. Se poucas pessoas ganham muito e a maioria dos habitantes ganha pouco, a média pode passar a impressão de ser mais favorável do que ela realmente é.

Medidas de variabilidade

Como dissemos anteriormente, a variabilidade está presente em praticamente todos os fenômenos estudados. Dois indivíduos submetidos às mesmas condições respondem de forma diferente. É importante entender essa variabilidade e, principalmente, saber quantificá-la.

Somente o cálculo da média, ou outra medida de posição, não é suficiente para caracterizar o conjunto de dados. Dois conjuntos de medidas podem ter a mesma média, mas apresentarem diferenças a respeito da distribuição das medidas ao redor. Quer uma explanação mais prática? Considere os dois conjuntos de dados seguintes:

  • A: (2, 3, 4);
  • B: (1, 3, 5).

Ambos têm a média igual a 3, mas o conjunto B é mais disperso em torno da média. Consegue perceber agora? Podemos também calcular a dispersão de um conjunto de medidas. Confira a seguir:

Amplitude

A forma mais simples de se quantificar a dispersão é calculando a amplitude. Ela nada mais é do que a diferença entre o maior e o menor valor do conjunto, como já explicamos anteriormente. No exemplo acima, a amplitude do conjunto A é 4 – 2 = 2 e do conjunto B é 5 –1 = 4.

Desvio Padrão

O uso da amplitude apresenta algumas desvantagens e a mais importante é que o seu cálculo envolva apenas os valores extremos do conjunto. É por isso que uma forma amplamente utilizada para medir variabilidade é o desvio padrão.

Como a média é uma medida de centralidade, e queremos quantificar a dispersão dos dados em torno dela, vamos usar os desvios de cada valor ao redor, ou seja, a diferença entre cada ponto e a média.

Como você pôde perceber, o histograma pode ser utilizado para os mais variados exemplos dentro de uma indústria. Além do exemplo do leite evaporado, podemos aplicar esse método para identificar padrões dentro de uma produção ou, simplesmente, para a confecção de uniformes novos de um grupo de funcionários. As possibilidades são muitas. Todos esses exemplos podem servir ao propósito de metodologias como Seis-Sigma, que visa às melhorias na qualidade de um processo.

Apesar de ser uma excelente ferramenta para o controle de qualidade, o histograma não deve ser a única para o aprimoramento da sua empresa. Existem outros métodos que podem ajudar a complementar a sua eficácia e, assim, alcançar resultados ainda mais promissores. Até porque é preciso ter bastante experiência para não fazer um histograma com informações errôneas, o que depende da quantidade de barras utilizadas para construí-lo.

Antes de iniciar todo o processo do histograma, é preciso fazer um planejamento de negócios detalhado e saber segui-lo com atenção em todas as etapas. Confira como construir um planejamento estratégico!

Se você quer saber mais sobre as ferramentas de controle de qualidade, pode encontrar o histograma e outras em nosso livro exclusivo: 7 ferramentas da qualidade. Boa leitura!



1 responder

Trackbacks & Pingbacks

  1. […] uma variedade de aplicações usadas para analisar dados, transformando-os em um modelo visual — gráficos e tabelas — que permitem análises sofisticadas da realidade e das tendências do […]

Deixe uma resposta

Quer participar da conversa?
Deixe sua opinião! :)

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *