8.1 Relações entre variáveis
Em diversas investigações deseja-se avaliar a relação entre duas medidas quantitativas. Por exemplo, estão as alturas de filhos relacionadas com as alturas dos seus pais? Processos praianos condicionam a inclinação da zona pós-praia abaixo da linha da maré baixa? Ou seja, o ângulo de inclinação do fundo oceânico situado logo após a linha da maré baixa a estirâncio está relacionado com o diâmetro médio (em

- para verificar se os valores sestão associados. (Os valores de uma medida tendem a crescer (ou decrescer) à medida que a outra cresce?)
- para predizer o valor de uma variável a partir de um valor conhecido da outra.
- para descrever a relação entre variáveis. (Dado um aumento específico numa variável, qual o crescimento médio esperado para a segunda variável?)
A associação linear entre duas variáveis é avaliada usando correlação. Para predizer o valor de uma variável contínua a partir de uma outra variável e para descrever a relação entre duas variáveis utiliza-se regressão (veja o próximo capítulo).
O primeiro estágio em qualquer um dos casos é produzir um gráfico de pontos dos dados para obter alguma idéia da forma e grau de associação entre duas variáveis.
![\includegraphics[width=3.5in]{pics/angulo.ps}](http://leg.ufpr.br/~paulojus/CE003/ce003/img257.png)
8.2 Definições
Seja





Para obter uma medida do grau de associação da relação linear entre duas variáveis, usamos o coeficiente de correlação, definido como:

onde

Para os dados do exemplo acima, temos







Assim como para médias e desvios padrão, existe uma letra Grega especial que utlizamos para o coeficiante de correlação populacional:





Abaixo estão exemplos de dados com seus coeficientes de correlação correspondentes.
![\includegraphics[width=4.9in]{pics/cors.ps}](http://leg.ufpr.br/~paulojus/CE003/ce003/img272.png)
8.3 Interpretação do coeficiente de correlação
O valor de




Usamos o termo correlação positiva quando






Quanto maior o valor de




A seguinte quadro fornece um guia de como podemos descrever uma correlação em palavras dado o valor numérico. É claro que as interpretações dependem de cada contexto em particular.



8.4 Linearidade e normalidade
Somente relações lineares são detectadas pelo coeficiente de correlação que acabamos de descrever (também chamado coeficiente de correlação de Pearson). Nos dados abaixo, mesmo existindo uma clara relação (não-linear) entre

![\includegraphics[width=3.2in]{pics/quad.ps}](http://leg.ufpr.br/~paulojus/CE003/ce003/img283.png)


![\includegraphics[width=5.3in]{pics/expenditure.ps}](http://leg.ufpr.br/~paulojus/CE003/ce003/img284.png)
8.5 Coeficiente de determinação,
O quadrado do coeficiente de correlação de Pearson é chamado de coeficiente de determinação ou simplesmente R



8.6 Associação não é causalidade
Suponha que encontremos uma associação ou correlação entre duas variáveis A e B. Podem existir diversas explicações do porque elas variam conjuntamente, incluindo:- Mudanças em A causam mudanças em B.
- Mudanças em B causam mudanças em A.
- Mudanças em outras variáveis causam mudanças tanto em A quanto em B.
- A relação observada é somente uma coincidência.
É extremamente difícil estabelecer relações causais a partir de dados observacionais. Precisamos realizar experimentos para obter mais evidências de um relação causal.
8.7 Exercícios 7
- Um estudo geoquímico orientador realizado, utilizando amostras compostas de sedimentos de corrente com granulometria de 100-150
e profundidade de
, provenientes de riachos correndo sobre granulitos, revelou os seguintes resultados em
:
- Faça o gráfico destes dados com Ni no eixo
.
- Calcule o coeficiente de correlation
pata estes dados e cheque se o valor obtido parece consistente com seu gráfico.
- Qual proporção da variabilidade na concentração de Cr pode ser explicada pela concentração de Ni?
- Faça o gráfico destes dados com Ni no eixo
- Prosseguindo o estudo da influência de processos praianos no condicionamento do ângulo de inclinação do fundo oceânico situado logo após a linha da maré baixa a estirâncio mediu-se a profundidade da lâmina d'água (em pés). Os dados coletados foram:
- Faça o gráfico desses dados com profundidade da lâmina d'água no eixo
.
- Calcule o coeficiente de correlação,
e interprete o resultado obtido.
- Qual proporção da variabilidade em ângulo de inclinação pode ser explicada por profundidade da lâmina d'água?
- Faça o gráfico desses dados com profundidade da lâmina d'água no eixo
Nenhum comentário:
Postar um comentário