DELINEAMENTOS
CORRELACIONAIS
Stephanie Santana Pinto
O que a pesquisa correlacional investiga?
Investiga o grau do relacionamento entre duas
variáveis ou mais.
Correlação linear simples
Avaliar se existe ASSOCIAÇÃO entre
duas características quantitativas é objetivo
de muitos estudos em ciências da saúde!
Por exemplo...
* Quando se pode demonstrar que duas variáveis
quantitativas variam juntas, diz-se que as mesmas estão
correlacionadas.
Correlação linear simples
Existe correlação entre o tempo
dedicado ao estudo e o desempenho dos
alunos em determinada disciplina?
N = 8 alunos
A
x (horas)
8
y (nota)
10
B
C
D
E
7
6
3
3
8
4
8
6
F
6
9
G
H
5
2
7
4
Correlação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
12
10
Nota (y)
8
6
4
2
0
0
2
4
6
Horas de estudo (x)
8
10
Correlação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
12
10
Nota (y)
8
6
4
2
0
0
2
4
6
Horas de estudo (x)
8
10
Correlação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
12
10
Nota (y)
8
6
4
2
0
0
2
4
6
Horas de estudo (x)
8
10
Correlação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
12
10
Nota (y)
8
6
4
2
Associação não é perfeita!
0
0
2
4
6
Horas de estudo (x)
8
10
Correlação linear simples
Coeficiente de correlação produto-momento (r)
Outra forma de se avaliar a correlação é usar um
COEFICIENTE, que tem a vantagem de ser um número
puro, o qual é independente da unidade de medida das
variáveis.
* Medida da intensidade de associação entre 2 variáveis
quantitativas!
Fórmula de cálculo proposta por Karl Pearson em 1896 →
coeficiente de correlação de Pearson!
Correlação linear simples
Variação no coeficiente de correlação
O coeficiente de correlação pode variar entre -1 e +1!
 Quando não existe correlação entre x e y → pontos se
distribuem em nuvens circulares!
 Associações de grau intermediário apresentam nuvens
inclinadas elípticas → mais estreitas maior a correlação!
 Nuvem elíptica paralela a um dos eixos do gráfico, a
correlação é nula!
 Pontos formam nuvem cujo eixo principal é uma curva →
r não mede corretamente a associação entre as variáveis!
Correlação linear simples
Teste de hipóteses sobre a correlação
Raciocínio do teste
Quando se calcula o coeficiente r em uma amostra
Estimando associação
existente na população!
verdadeira
entre
x
e
y
 Exemplo da correlação entre horas de estudo e nota
da prova, foi obtido um r = 0,58.
Entretanto...
Não existe a certeza de que na população de alunos haja,
efetivamente, correlação entre horas de estudo e nota na prova,
pois foi estudada apenas uma parte da população!
Correlação linear simples
Para realizar um teste de hipóteses sobre a
existência de correlação, usa-se um raciocínio análogo
ao dos testes de hipóteses sobre médias.
Além disso...
Avaliar significância do coeficiente de correlação
Testa-se a H0!
Utilizando para tanto a distribuição t.
Correlação linear simples
Etapas do teste de hipóteses da correlação
(1) Elaboração das hipóteses
H 0: ρ = 0
HA: ρ ≠ 0
(2) Escolha do nível de significância
α = 0,05
(3) Determinação do valor crítico do teste:
tα;gl = t0,05;6 = 2,447 (gl = n – 2, n é o número de pares de valores x,y)
(4) Determinação do valor calculado de t:
r
tcalc =
tcal = 1,74 para r = 0,58
√1 – r2
n-2
(5) Como tcal = 1,74 < t0,05;6 = 2,45, não se rejeita H0
Correlação linear simples
(6) Conclusão:
Não existe evidência de correlação entre tempo dedicado ao
estudo e o desempenho obtido na prova. O valor de r foi
casual.
Suponha que existam razões para se acreditar que
essa conclusão não espelha a realidade. Como interpretar o
resultado obtido?
* Teste estatístico não apóia a existência de correlação
populacional, isso pode ser explicado:
- Não existe correlação entre x e y e o valor de r foi um
resultado casual;
- Existe correlação entre x e y, entretanto não foi possível
mostrar esta associação pelo pequeno tamanho da amostra.
Correlação linear simples
Avaliação qualitativa de r quanto à intensidade
r
A correlação é dita
0
Nula
0 – 0,3
Fraca
0,3 ├ 0,6
Regular
0,6 ├ 0,9
Forte
0,9 ├ 1
Muito Forte
1
Plena ou perfeita
Correlação linear simples
Coeficiente de determinação
É o quadrado do coeficiente de correlação e informa
que fração da variabilidade de uma característica é
explicada estatisticamente pela outra variável.
r2 = 0,64
Durante caminhada na água,
64% da variação que se
observa na amostra em relação
a FC explica-se porque a
mesma amostra varia também
em relação ao VO2!
Correlação linear simples
Requisitos ao estudo da correlação (Pearson)
 Tanto a variável x quanto a y têm distribuição normal;
 O grau de variação em torno dos diferentes valores de
x e y é o mesmo (homocedasticidade);
Coeficiente de correlação mede uma ASSOCIAÇÃO e não um
relação de causa e efeito!
Correlação linear simples
Coeficiente de correlação de Spearman
* Variáveis medidas em escala ordinal;
* Variáveis quantitativas não satisfazem as exigências para o
teste de correlação de Pearson (distribuição normal).
SSE x VO2
20
18
SSE
16
14
12
r = 0,432
10
p = 0,012
8
r2 = 0,1455
6
0,6
0,8
1
1,2
VO2 (l.min-1)
1,4
1,6
1,8
Reprodução de uma medida (dias diferentes) e
Repetição de uma medida (mesmo dia)
RMS RF dry land (mV)
RMS rectus femoris in water and on dry land
300
250
200
150
ICC = 0.924
p = 0.001
100
50
0
0
50
100
150
RMS RF water (mV)
200
250
300
Reprodução de uma medida (dias diferentes) e
Repetição de uma medida (mesmo dia)
Log10 HFL dry land
Force production of hip flexors in water and on dry land
1,8
1,7
1,6
1,5
1,4
1,3
1,2
1,1
1
0,9
ICC = 0.920
p < 0.001
1
1,1
1,2
1,3
1,4
Log10 HFL water
1,5
1,6
1,7
1,8
Regressão linear simples
Aplica-se àquelas situações em que há razões
para supor uma relação de causa-efeito entre duas
variáveis quantitativas e se deseja expressar
matematicamente essa relação.
Chama-se...
 y depende de x (coloquial)
 y é função de x (matemática)
 Existe regressão de y sobre x (estatística)
Regressão linear simples
Em um estudo de regressão...
Valores da variável independente (x) geralmente são escolhidos;
Para cada valor escolhido observa-se o valor de y correspondente!
Por exemplo...
Estudar a forma pela qual a PA depende da idade.
Estudar indivíduos com x = 30, 35, 40, 45, etc., anos de idade e
então medir suas PA. Para que resultados sejam fidedignos,
indivíduos deverão ser sorteados de uma subpopulação com
idades correspondentes.
Regressão linear simples
Avaliar possível dependência de y em relação a x;
Expressar matematicamente esta relação (equação).
Análise de regressão simples
Descrevem fenômenos em que há uma variável independente!
Regressão linear simples
A reta de regressão linear
A equação da reta pode ser dada por:
y = A + Bx
onde
y = variável dependente;
A = coeficiente linear (valor de y quando x = 0)
B = coeficiente angular (inclinação da reta)
x = variável independente
Regressão linear simples
Obtenção da reta de regressão
Mais comum é estudar a regressão entre x e y
utilizando uma amostra da população. Os valores a e b
(estimativas dos valores A e B) são obtidos pelo método dos
mínimos quadrados.
Garante que reta obtida é aquela que se tem as menores
distâncias entre os valores observados (x) e a própria reta!
Regressão linear simples
Teste de significância da regressão
Raciocínio do teste
Quando não existe dependência de y em relação a x, o
coeficiente de regressão populacional, B, é igual a zero.
No entanto, valores de b obtidos em amostras
aleatórias da população devem variar, ao acaso, ao redor do
zero.
Regressão linear simples
Etapas do teste de hipóteses da regressão
(1) Elaboração das hipóteses
H 0: B = 0
HA: B ≠ 0
(2) Escolha do nível de significância
α = 0,05
(3) tcal > t0,05, rejeita-se H0
(4) Admite-se que existe regressão de y sobre x (α = 0,05)
Regressão linear simples
Utilidades da reta de regressão
A reta de regressão permite:
Representar a dependência de uma variável quantitativa em
relação à outra por meio de uma equação simples;
Prever valores para variável dependente y de acordo com
valores determinados (inclusive não-observados) da
variável independente x.
Regressão linear simples
Requisitos ao uso da regressão linear
A
variável
y
deve
ter
distribuição
normal
ou
aproximadamente normal;
 O grau de variação em torno dos diferentes valores de
x e y é o mesmo (homocedasticidade);
 Pontos do gráfico devem apresentar uma tendência
linear;
 Valores de y foram obtidos ao acaso da população e
são independentes um dos outros;
 Variável x medida sem erro. Pressupor que os erros
ao se medir x são desprezíveis.
Regressão linear simples
Exemplo prático
Pode-se concluir que a RPE
depende da FC da seguinte forma:
Para cada valor de FC (x)
r2 = 0,99
Estima-se um índice de esforço
percebido (y)!
Regressão linear múltipla
Consiste em...
Uso de mais do que uma variável independente usualmente
aumenta a precisão da predição!
Regressão linear múltipla
Coeficiente de correlação múltipla (r)
Indica a relação entre o fenômeno estudado e a soma de
diferentes pesos das variáveis independentes (explicativas)!
Coeficiente de determinação (R2)
Quantidade de variância do fenômeno que é explicada ou
considerada pelas variáveis independentes (explicativas)
combinadas!
Regressão linear múltipla
Deseja-se encontrar a melhor combinação de
variáveis que darão a predição mais precisa do fenômeno!
Quanto cada variável independente contribui para a
variação total explicada!
Existem vários procedimentos de seleção utilizados para
esse propósito.
Regressão linear múltipla
Regressão múltipla de seleção progressiva (stepwise)
Uma nova variável independente (explicativa) é adicionada a
cada passo.
Primeira variável selecionada é aquela que tem a maior
correlação com o fenômeno.
Cada passo subseqüente uma variável é
adicionada àquela, com uma ou mais já escolhidas,
resultando em uma melhor predição!
Regressão linear múltipla
É importante ressaltar que para adicionar variáveis
independentes no modelo, as mesmas não devem apresentar
relações entre elas, pois podem prejudicar na predição!
Regressão múltipla de seleção progressiva
Variáveis são introduzidas conforme a sua importância e
processo pára quando não existe mais uma contribuição
significativa para predição!
Regressão linear múltipla
Regressão múltipla de seleção regressiva (enter)
Variáveis independentes são eliminadas por sua falta de
importância para explicar o fenômeno estudado!
Isto é...
Inicia-se testando o modelo de predição com todas
variáveis independentes e de acordo com os seus respectivos
graus de significância, excluem-se aquelas variáveis que não
contribuem para predição e conseqüentemente explicação do
fenômeno.
Regressão linear múltipla
Método do R quadrado máximo
Melhor de todos os modelos possíveis de uma
única variável é selecionado, assim como o melhor
modelo de duas variáveis, o melhor modelo de três
variáveis e assim por diante.
Modelo avaliado de acordo com o valor de R2!
Regressão linear múltipla
Procedimento de regressão gradativa
Variação da técnica progressiva, exceto pelo fato de que
cada vez que uma nova variável independente é introduzida no
modelo é reavaliado se as variáveis que já estão no mesmo
continuam contribuindo significativamente para explicação do
fenômeno.
Maioria dos casos...
Regressão linear múltipla
Equações de predição de regressão múltipla
A equação de predição da regressão múltipla é
basicamente aquela do modelo de regressão de duas
variáveis, y = A + Bx. Única diferença é que existe mais do
que uma variável x:
y = A + B1x1 +B2x2 + ... + Bixi
Regressão linear múltipla
Regressão linear múltipla
Regressão linear múltipla
[email protected]
Contínuo
Intervalado
Média
DP
Média
DP
Sig.
VO2 (l . min-1)
0,63
± 0,16
0,92
± 0,18
0,002*
VO2 (ml . kg-1 . min-1)
10,70
± 2,70
15,50
± 2,80
0,002*
GE (kcal . min-1)
3,20
± 0,80
4,60
± 0,90
0,002*
GE (kcal)
102,40
± 25,20
148,40
±28,40
0,002*
FC (bpm)
118,00
± 14,80
132,80
±15,70
0,01*
Download

DELINEAMENTOS CORRELACIONAIS