Correlação linear
Por Igor Cruz
(igor.cruz@ccc.ufcg.eu.br)
A correlação linear é uma importante ferramenta para entender como, em um determinado problema, se comporta uma informação específica quando ocorrem variações em um conjunto de dados relacionados a esta informação. Isso nos ajuda a compreender melhor o universo ao qual o problema esta inserido.

A Correlação ou também conhecida como coeficiente de correlação, em probabilidade e estatística, refere-se a força de um relacionamento linear entre duas variáveis aleatórias (variável quantitativa cujo valor depende de fatores aleatórios).

Podemos utilizar, de acordo com a situação, vários coeficientes, porém o mais utilizado é o “Coeficiente de Correlação de Pearson” (figura 1), obtido a partir da divisão das covariâncias (é o que determina a relação de como duas variáveis variam conjuntamente) de duas variáveis pelo produto de seus desvios padrão (medida que determina o quanto de dispersão existe em relação à média ).

Figura 1

A partir da correlação linear podemos gerar o diagrama de dispersão, que é um gráfico no plano cartesiano usado para representar simultaneamente os valores de duas variáveis quantitativas e sua respectiva correlação linear. Dependendo da forma como essa dispersão é apresentada, podemos classifica-la de 4 formas(explicado durante a resolução da questão do POSCOMP mais adiante).

A análise de Correlação é uma ferramenta importante para diferentes áreas do conhecimento. Saber o quanto duas variáveis são relacionadas linearmente pode ajudar bastante no desenvolvimento de um software por exemplo. Vejamos um exemplo prático: Imagine que sua equipe está desenvolvendo um programa para realizar o cálculo do preço de venda de um imóvel qualquer. Para isso é extremamente necessário saber os fatores que influenciam nesse valor (por exemplo, tamanho do imóvel, quando foi construído, distância dele até o centro da cidade, dentre outros) e o quanto esses fatores aumentam ou diminuem o valor final esperado de tal imóvel. Para isso usamos a correlação linear, que nos fornecerá o quanto essas características contribuem para o aumento ou diminuição do valor do produto.

Vamos então revisar a questão do POSCOMP de 2012, relacionada ao tema abordado:

Resolvendo a questão:

  • I – B: Correlação positiva entre X e Y ocorre quando X e Y movem-se na mesma direção, porém não nescessariamente na mesma proporção;
  • II – A: Correlação positiva perfeita entre X e Y existe quando X e Y movem-se na mesma direção e praticamente na mesma proporção;
  • III – E: Correlação negativa perfeita entre X e Y refere-se a X e Y movendo-se em direções opostas e praticamente na mesma proporção;
  • IV – D: Forte correlação negativa entre X e Y ocorre quando X e Y movem-se em direções opostas, não nescessariamente na mesma proporção, mas , no gráfico, a diferença básica dela para a correlação negativa entre X e Y é a proximidade (menor dispersão) dos pontos;
  • V- C: Nenhuma correlação entre X e Y, basicamente existe quando os pontos estão dispostos no plano carteziano sem nenhuma relação de crescimento positivo ou negativo;

Logo a resposta para a questão é a letra “d”.

Referências:

Jornal PETNews - Edição: Rafael Rêgo - Revisão: Lívia Sampaio
Grupo PET Computação UFCG, 2013. All rights reserved.