Como interpretar uma regressão linear?

O post de hoje tem por objetivo ajuda-lo a entender uma das ferramentas mais utilizadas em estatística (e claro, em Seis Sigma, nos projetos de Black Belt) para se realizar previsões e verificar a existência de correlação entre variáveis. No post de hoje nós vamos explicar a como se fazer interpretar uma regressão linear.

Hoje há muitas maneiras para se construir uma regressão linear, mas aqui nós vamos explicar sua construção no Excel. A primeira coisa para construir este gráfico realizar a coleta dos dados em que se deseja buscar a existência de correlação.

No nosso exemplo, vamos analisar se o número de buscas orgânicas no Google tem correlação com o número de usuários recorrentes em um site. Nossa predição é de à medida que as buscas orgânicas aumentam, aumentará também o número de visitantes recorrentes no nosso site. A teoria por trás da predição versa que se as pessoas começam a procurar um site ou as palavras chave deste site no Google, é por que elas se interessam pelo assunto tratado no site achado. Se o site for bom, estas pessoas tornar-se-ão usuários recorrentes, ou seja, depois de visitar o site pela primeira vez, continuarão a visita-lo para terem acesso ao conteúdo de seu interesse.

Coletado os dados, fomos até o Excel e fizemos um gráfico de tendência, que está na figura 1.

Figura 1: Gráfico de dispersão feito no Excel.

Na figura 1 está o gráfico de dispersão que construímos para analisar se nossa teoria sobre a correlação entre o tráfego de pesquisa e as visitas recorrentes se comprova. Como analisar o gráfico?

Pela figura 1 é possível verificar que há correlação entre o tráfego de pesquisa e as visitas recorrentes, mas será que é uma correlação forte? Para isto, precisamos analisar o (R²). Neste caso o valor de R² é de 0.4677. E o que significa isto? Que 46,77% da variação de Y é explicada pela regressão. Será que isto é bom? A resposta é depende, já que algumas variáveis nos negócios não são simples de explicar, principalmente aquelas que se relacionam a comportamento. Para estes casos em particular, ter 20% da variação explicada pelo modelo é algo extraordinário.

Para o nosso caso, a análise mostrou que não há uma correlação muito forte e não é possível explicar a variação do número de visitantes recorrentes por meio do número de pesquisas no Google. É necessário investigar mais.

Para você que já é um Green Belt, convidamos para conhecer nosso curso de Black Belt.

Pensando em facilitar as suas análises, preparamos um infográfico com os 5 passos para elaborar uma regressão matadora! Acesso clicando no link abaixo.

infografico

Se você se interessou pelo assunto, também pode baixar nosso super guia sobre análise de dados clicando no link abaixo. É Gratuito!

 

 

No votes yet.
Please wait...
0 respostas

Deixe uma resposta

Quer participar da conversa?
Deixe sua opinião! :)

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *