Métodos Quantitativos
Aplicados
Aula 5
http://www.iseg.utl.pt/~vescaria/mqa/
Tópicos apresentação
• Análise de dados bivariada: cruzamentos e medidas de
associação – variáveis nominais e ordinais e variáveis
quantitativas
• Análise de dados bivariada: testes de igualdades de
média ou tendência central para duas amostras
independentes e emparelhadas
Análise bivariada
 análise bivariada
 Objectivo: análise de relação entre duas variáveis
 Tipo de análise 1: medir a relação entre as variáveis
 Duas variáveis qualitativas: cruzamentos, teste de independência
e medidas de associação
 Duas variáveis quantitativas: análise da correlação
Análise bivariada: variáveis
nominais/ordinais
Cruzamentos e medidas de associação
• Analisar em que medida duas variáveis surgem relacionadas
Variável 2
Variável 1
Categoria 1
Categoria 2
Categoria 1
a
b
Categoria 2
c
d
Análise bivariada: variáveis
nominais/ordinais
Cruzamentos e medidas de associação para variáveis nominais e
ordinais
• A leitura da tabela
• A contagem de casos
• As percentagens em linha e em coluna
• Os casos esperados e os resíduos na forma ajustada –
permitem ver se temos ou não independência entre as
variáveis
Análise bivariada: testes independência
Testar a independência
• Teste do Qui- quadrado (com duas categorias)
• Correcções – para casos em que se violam as hipóteses do
teste do Qui-Quadrado
Análise bivariada: medidas associação
Se se rejeitar a independência é possível medir a associação
entre as variáveis
• Baseadas no Qui- quadrado
• Baseadas na redução do erro de previsão
Análise bivariada: medidas associação
Medidas de associação (baseadas no Qui- quadrado)
• O Phi
Phi 
2
n
• O C de Pearson – coeficiente de contingência
• O V de Cramer
V
C
2
2
2  n
n(q  1)
(q – menor número de linhas ou colunas)
• Variam entre 0 – pouca associação - e valores próximos de 1
elevada associação.
Análise bivariada: medidas associação
Medidas de associação (baseadas na redução do erro de
previsão)
• A ideia – em que medida conhecer a categoria de uma variável
ajuda a prever o valor da outra variável
• Medidas simétricas – existe associação mas não se identifica
causa e efeito
• Medidas assimétricas – identifica-se a causa e o efeito
• O valor das estatísticas – dá a redução percentual do erro de
previsão
Análise bivariada variáveis quantitativas:
análise correlação
Variáveis Quantitativas: A análise de correlação
• O coeficiente de correlação de Pearson
• O coeficiente de correlação de Spearman – coeficiente de
correlação de ordem – aplicável a variáveis ordinais
• O coeficiente de correlação parcial - analisa a correlação
entre duas variáveis controlando o efeito de outras
• O comando correlate
Análise bivariada: avaliar comportamento
variável quantitativa em grupos população
 análise bivariada
 Objectivo: análise de relação entre duas variáveis
 Tipo de análise 2: avaliar comportamento de uma variável quantitativa
em grupos de população
 Comparar média de variável quantitativa em duas amostras:
testes t, Mann-Whitney, Sinal, Wilcoxon
 Comparar média de variável quantitativa em mais de duas
amostras: análise ANOVA, Kruskal-Wallis
Análise bivariada: teste igualdade médias
Testes de igualdade das médias
• testar se uma determinada variável quantitativa apresenta
médias iguais em diferentes grupos da população - os testes t
• Três tipos de testes t
• Para duas amostras independentes
• Para duas amostras emparelhadas
• Para uma amostra
• NOTA: sempre que a amostra tem uma dimensão inferior a 30
é necessário verificar que os grupos apresentam uma
distribuição normal
Análise bivariada: teste igualdade médias
Teste t de igualdade das médias - duas amostras
independentes
• Comparar a média de uma variável num grupo com a média
dessa variável noutro grupo.
ex: comparação dos rendimentos de homens e mulheres
H0 : xHomens  xMulheres
Ha : xHomens  xMulheres
Análise bivariada: teste igualdade médias
Teste t de igualdade das médias para duas amostras independentes
(cont.)
• Necessário testar se variância variável igual nos grupos ou
não – o teste de Levene
• teste de Levene - testa a igualdade das variâncias
H0 : 
2
Homens

2
Mulheres
Ha : 
2
Homens

2
Mulheres
Análise bivariada: teste igualdade médias
Teste t de igualdade das médias para duas amostras independentes
(cont.)
• Se rejeitarmos igualdade das variâncias utiliza-se o teste onde
essa igualdade não é assumida
• Exemplo no caso da igualdade de salários entre homens e
mulheres
Independent Samples Test
Levene's Test for Equal ity
of Variances
t-test for Equality of Means
95% Confi dence Interval
of t he Difference
Current Salary Equal vari ances assumed
Equal vari ances not assumed
F
119,669
Sig.
,000
t
10,945
11,688
df
Sig. (2-tailed) Mean Difference
472
,000
$15,409.862
344,262
,000
$15,409.862
Std. Error
Difference
Lower
Upper
$1,407.906 $12,643.322 $18,176.401
$1,318.400 $12,816.728 $18,002.996
Análise bivariada: teste igualdade médias
Teste t de igualdade das médias - duas amostras
emparelhadas
• o mesmo grupo de sujeitos é analisado em dois momentos ou
dois grupos diferentes são analisados mas existe uma
característica em comum pela qual os dois grupos podem ser
comparados
• apresenta vantagens quando existe correlação entre os
valores observados nas duas amostras
• compara-se com o valor 0 a média das diferenças entre os
pares de observações – não existe modificação significativa
nos valores desses pares.
ex: os valores antes e depois de um tratamento
H0 : xdiferença  0
Ha : xdiferença  0
Análise bivariada: teste igualdade médias
Teste t de igualdade das médias para duas amostras emparelhadas
(cont)
Análise bivariada: teste igualdade médias
Teste t - uma amostra
• Compara os valores observados com um valor pré-definido
H0 : x  100
Ha : x  100
• A distribuição da estatística de teste é diferente conforme o
número de observações é superior ou inferior a 30
• Exemplo:
One-Sampl e Tes t
Test Value = 20000
Cu rrent Salary
t
18,385
df
473
Sig . (2-tailed )
,000
Mean
Differen ce
$14,419.57
95% Co nfid ence Interval
of the Difference
Lo wer
$12,878.40
Up per
$15,960.73
Análise bivariada: testes não paramétricos
igualdade tendência central
Testes não paramétricos:
• Testes não paramétricos ou de distribuição livre – são menos
exigentes quanto às hipóteses, permitindo fazer os testes
quando são violadas as hipóteses dos testes t
• Podem por vezes aplicar-se a dados de nível ordinal com pelo
menos duas categorias
• Exemplos:
• Teste de Mann-Whitney para duas amostras independentes
• Testes de Sinal e de Wilcoxon para amostras emparelhadas
Análise bivariada: testes não paramétricos
igualdade tendência central
Teste de Mann-Whitney
•
Compara o centro posicional das duas amostras - não as
médias
•
preferível ao teste t quando há violação da normalidade ou
quando as variáveis são ordinais com duas ou três
categorias
H0: As duas populações são iguais em tendência central
Ha: As duas populações não são iguais em tendência central
Análise bivariada: testes não paramétricos
igualdade tendência central
Teste de Mann-Whitney (cont.)
•
A estatística de teste é diferente conforme existam ou não
empates (observações com o mesmo valor)
•
Para se poder aplicar o teste tem que se verificar a igualdade
da forma das duas distribuições:
•
•
•
•
Caixas de bigodes
Teste igualdade variâncias
Simetria
Regras de rejeição idênticas
Análise bivariada: testes não paramétricos
igualdade tendência central
Teste do Sinal e de Wilcoxon - Testes para amostras
emparelhadas
Teste de sinal:
• não utiliza os valores das observações mas apenas o sinal
• Aplica-se a variáveis pelo menos ordinal
• Vantagem quando uma das variáveis tende a ser superior à
outra
• Cada par classificado como +: xi<yi (aumento); - : xi>yi ou 0:
xi=yi
•
Hipótese: H0:P(x>Y)=P(X<Y)=0,5
•
Estatística diferente se nº empates <= 20 ou >20
Análise bivariada: testes não paramétricos
igualdade tendência central
Teste de Wilcoxon
•
Variáveis ordinais com pelo menos duas categorias, ou de
nível superior
•
Mais eficiente que teste de sinal pois não usa só sinal mas
também ordem das diferenças
Hipótese: H0:E(X)=E(Y)
•
Exige simetria da distribuição da diferenças
Bibliografia
Maroco, Cap 2, 5, 6, 7
Pestana e Gageiro, Cap 2, 4, 5, 6 e 7
Download

Aula 5