Métodos Quantitativos Aplicados Aula 5 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação • Análise de dados bivariada: cruzamentos e medidas de associação – variáveis nominais e ordinais e variáveis quantitativas • Análise de dados bivariada: testes de igualdades de média ou tendência central para duas amostras independentes e emparelhadas Análise bivariada análise bivariada Objectivo: análise de relação entre duas variáveis Tipo de análise 1: medir a relação entre as variáveis Duas variáveis qualitativas: cruzamentos, teste de independência e medidas de associação Duas variáveis quantitativas: análise da correlação Análise bivariada: variáveis nominais/ordinais Cruzamentos e medidas de associação • Analisar em que medida duas variáveis surgem relacionadas Variável 2 Variável 1 Categoria 1 Categoria 2 Categoria 1 a b Categoria 2 c d Análise bivariada: variáveis nominais/ordinais Cruzamentos e medidas de associação para variáveis nominais e ordinais • A leitura da tabela • A contagem de casos • As percentagens em linha e em coluna • Os casos esperados e os resíduos na forma ajustada – permitem ver se temos ou não independência entre as variáveis Análise bivariada: testes independência Testar a independência • Teste do Qui- quadrado (com duas categorias) • Correcções – para casos em que se violam as hipóteses do teste do Qui-Quadrado Análise bivariada: medidas associação Se se rejeitar a independência é possível medir a associação entre as variáveis • Baseadas no Qui- quadrado • Baseadas na redução do erro de previsão Análise bivariada: medidas associação Medidas de associação (baseadas no Qui- quadrado) • O Phi Phi 2 n • O C de Pearson – coeficiente de contingência • O V de Cramer V C 2 2 2 n n(q 1) (q – menor número de linhas ou colunas) • Variam entre 0 – pouca associação - e valores próximos de 1 elevada associação. Análise bivariada: medidas associação Medidas de associação (baseadas na redução do erro de previsão) • A ideia – em que medida conhecer a categoria de uma variável ajuda a prever o valor da outra variável • Medidas simétricas – existe associação mas não se identifica causa e efeito • Medidas assimétricas – identifica-se a causa e o efeito • O valor das estatísticas – dá a redução percentual do erro de previsão Análise bivariada variáveis quantitativas: análise correlação Variáveis Quantitativas: A análise de correlação • O coeficiente de correlação de Pearson • O coeficiente de correlação de Spearman – coeficiente de correlação de ordem – aplicável a variáveis ordinais • O coeficiente de correlação parcial - analisa a correlação entre duas variáveis controlando o efeito de outras • O comando correlate Análise bivariada: avaliar comportamento variável quantitativa em grupos população análise bivariada Objectivo: análise de relação entre duas variáveis Tipo de análise 2: avaliar comportamento de uma variável quantitativa em grupos de população Comparar média de variável quantitativa em duas amostras: testes t, Mann-Whitney, Sinal, Wilcoxon Comparar média de variável quantitativa em mais de duas amostras: análise ANOVA, Kruskal-Wallis Análise bivariada: teste igualdade médias Testes de igualdade das médias • testar se uma determinada variável quantitativa apresenta médias iguais em diferentes grupos da população - os testes t • Três tipos de testes t • Para duas amostras independentes • Para duas amostras emparelhadas • Para uma amostra • NOTA: sempre que a amostra tem uma dimensão inferior a 30 é necessário verificar que os grupos apresentam uma distribuição normal Análise bivariada: teste igualdade médias Teste t de igualdade das médias - duas amostras independentes • Comparar a média de uma variável num grupo com a média dessa variável noutro grupo. ex: comparação dos rendimentos de homens e mulheres H0 : xHomens xMulheres Ha : xHomens xMulheres Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras independentes (cont.) • Necessário testar se variância variável igual nos grupos ou não – o teste de Levene • teste de Levene - testa a igualdade das variâncias H0 : 2 Homens 2 Mulheres Ha : 2 Homens 2 Mulheres Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras independentes (cont.) • Se rejeitarmos igualdade das variâncias utiliza-se o teste onde essa igualdade não é assumida • Exemplo no caso da igualdade de salários entre homens e mulheres Independent Samples Test Levene's Test for Equal ity of Variances t-test for Equality of Means 95% Confi dence Interval of t he Difference Current Salary Equal vari ances assumed Equal vari ances not assumed F 119,669 Sig. ,000 t 10,945 11,688 df Sig. (2-tailed) Mean Difference 472 ,000 $15,409.862 344,262 ,000 $15,409.862 Std. Error Difference Lower Upper $1,407.906 $12,643.322 $18,176.401 $1,318.400 $12,816.728 $18,002.996 Análise bivariada: teste igualdade médias Teste t de igualdade das médias - duas amostras emparelhadas • o mesmo grupo de sujeitos é analisado em dois momentos ou dois grupos diferentes são analisados mas existe uma característica em comum pela qual os dois grupos podem ser comparados • apresenta vantagens quando existe correlação entre os valores observados nas duas amostras • compara-se com o valor 0 a média das diferenças entre os pares de observações – não existe modificação significativa nos valores desses pares. ex: os valores antes e depois de um tratamento H0 : xdiferença 0 Ha : xdiferença 0 Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras emparelhadas (cont) Análise bivariada: teste igualdade médias Teste t - uma amostra • Compara os valores observados com um valor pré-definido H0 : x 100 Ha : x 100 • A distribuição da estatística de teste é diferente conforme o número de observações é superior ou inferior a 30 • Exemplo: One-Sampl e Tes t Test Value = 20000 Cu rrent Salary t 18,385 df 473 Sig . (2-tailed ) ,000 Mean Differen ce $14,419.57 95% Co nfid ence Interval of the Difference Lo wer $12,878.40 Up per $15,960.73 Análise bivariada: testes não paramétricos igualdade tendência central Testes não paramétricos: • Testes não paramétricos ou de distribuição livre – são menos exigentes quanto às hipóteses, permitindo fazer os testes quando são violadas as hipóteses dos testes t • Podem por vezes aplicar-se a dados de nível ordinal com pelo menos duas categorias • Exemplos: • Teste de Mann-Whitney para duas amostras independentes • Testes de Sinal e de Wilcoxon para amostras emparelhadas Análise bivariada: testes não paramétricos igualdade tendência central Teste de Mann-Whitney • Compara o centro posicional das duas amostras - não as médias • preferível ao teste t quando há violação da normalidade ou quando as variáveis são ordinais com duas ou três categorias H0: As duas populações são iguais em tendência central Ha: As duas populações não são iguais em tendência central Análise bivariada: testes não paramétricos igualdade tendência central Teste de Mann-Whitney (cont.) • A estatística de teste é diferente conforme existam ou não empates (observações com o mesmo valor) • Para se poder aplicar o teste tem que se verificar a igualdade da forma das duas distribuições: • • • • Caixas de bigodes Teste igualdade variâncias Simetria Regras de rejeição idênticas Análise bivariada: testes não paramétricos igualdade tendência central Teste do Sinal e de Wilcoxon - Testes para amostras emparelhadas Teste de sinal: • não utiliza os valores das observações mas apenas o sinal • Aplica-se a variáveis pelo menos ordinal • Vantagem quando uma das variáveis tende a ser superior à outra • Cada par classificado como +: xi<yi (aumento); - : xi>yi ou 0: xi=yi • Hipótese: H0:P(x>Y)=P(X<Y)=0,5 • Estatística diferente se nº empates <= 20 ou >20 Análise bivariada: testes não paramétricos igualdade tendência central Teste de Wilcoxon • Variáveis ordinais com pelo menos duas categorias, ou de nível superior • Mais eficiente que teste de sinal pois não usa só sinal mas também ordem das diferenças Hipótese: H0:E(X)=E(Y) • Exige simetria da distribuição da diferenças Bibliografia Maroco, Cap 2, 5, 6, 7 Pestana e Gageiro, Cap 2, 4, 5, 6 e 7