Investigação Sociológica Analisar modelos com Equações Estruturais Rui Brites [email protected] 1 Modelação de Equações Estruturais (MEE) (SEM structural equations modeling) com SPSS/AMOS® O essencial Exemplo de aplicação 2 Os modelos de equações estruturais (MEE) podem ser vistos, segundo Klem*, como uma extensão da regressão múltipla, se for considerado que na aplicação da regressão o investigador está interessado em prever uma única variável dependente, enquanto nos MEE há mais do que uma variável dependente. • Regressão: X influencia Y; • MEE: X influencia Y e Y influencia Z. Uma das características básicas da MEE é o de permitir testar uma teoria de ordem causal entre um conjunto de variáveis pois: • Permite observar de que forma as variáveis independentes explicam a variável dependente, bem como a sua importância relativa, podendo incorporar variáveis latentes na análise;** • Permite calcular simultaneamente todas as relações entre os factores associados a um determinado fenómeno. *Klem, L. “Path analysis”, em Grimm, L. G. e P. R. Yarnold, Reading and understanding multivariate statistics”. Washington, DC, American Psychological Association, 1995. ** Uma variável latente é um construto teórico e não observado que, por conseguinte, não pode ser medido directamente, mas pode ser representado ou medido por duas ou mais variáveis observadas. 3 A MEE é aconselhável quando: • Existem construtos latentes; • Quando as variáveis observadas contêm erros de mensuração e a relação desejada é entre as variáveis observáveis; • Quando existe interdependência entre as variáveis observadas. A sua principal utilidade é a de possibilitar a resolução de problemas de pesquisa relacionados com relações causais entre construtos latentes que são medidos través de variáveis observadas. 4 A MEE revela-se muito útil quando se pretende testar modelos complexos, com múltiplas variáveis simultâneas e traços latentes, sendo apresentada por vários autores como uma mistura de análise factorial com a regressão múltipla.* O processo inicia-se com a formulação do modelo teórico que estabelece as relações causais entre um conjunto de variáveis. Este deve estar devidamente fundamentado na teoria, entendendo-se o respectivo diagrama como o resumo das hipóteses que se pretendem validar. A MEE começa pelo enunciar dos aspectos teóricos do estudo. Por conseguinte, a elaboração teórica de modelos hipotéticos é fundamental no contexto da MEE, pois as relações entre as variáveis, a estabelecer pelo investigador devem basear-se em pressupostos teóricos consistentes ou em evidências empíricas anteriores. * Cfr. Ullman, J. B. (2007), “Structural Equation Modeling”, em Tabachnick, B. G. & L. S. Fidell (Orgs.), Using multivariate statistics, (5ª ed.). Boston, Pearson Education. 5 Uma característica comum na MEE como forma de especificação, é a representação gráfica dos modelos estruturais. Essa representação possui uma simbologia convencionada de nomenclatura das relações estruturais entre variáveis representadas num diagrama: • As variáveis observadas são representadas por rectângulos ou quadrados; • As variáveis latentes são representadas por círculos ou elipses; • O caminho ou a relação de causa entre duas variáveis é representado por uma seta com uma ponta; • Uma relação bidireccional entre duas variáveis é representada por duas setas em sentidos opostos; • A correlação ou covariância entre duas variáveis é representada por uma seta com duas pontas 6 No nosso exemplo vamos utilizar o AMOS®, que é um programa opcional do SPSS® que se distingue de outros softwares de Modelação de Equações Estruturais pelo seu interface bastante amigável, que inclui as “ferramentas” necessárias ao desenho do modelo. Os dados provêm do European Social Survey*, round 1 (2002) e referem-se unicamente a Portugal Nota: sobre o European Social Survey, ver o ESS no CIES: http://ess.cies.iscte.pt/ 7 * A base de dados original está disponível em http://www.europeansocialsurvey.org/ Modelo de medida (Análise Factorial Confirmatória) 8 Os modelos de medida especificam a forma como as variáveis observadas dependem das variáveis latentes. Veja-se o seguinte exemplo, que comporta quatro medidas distintas:* * Arbuckle, J. L. (1995-2007). Amos 16.0 User’s Guide, USA, Amos Development Corporation. Disponível 9em: http://www.amosdevelopment.com/download/Amos%2016.0%20User's%20Guide.pdf No nosso exemplo pretendemos confirmar se os 3 indicadores de Confiança Social (a8, a9 e a10) e os 4 de Confiança nas Instituições Públicas nacionais (b7, b8, b9 e b10) são explicados pelas variáveis latentes Confiança Social e Confiança Institucional, respectivamente, bem como saber a correlação entre elas. O modelo teórico é o seguinte: Confiança interpessoal Confiança na honestidade dos outros Confiança Social Confiança no altruísmo dos outros Confiança no Parlamento Confiança nos Políticos Confiança no Sistema Jurídico Confiança na Polícia Confiança Institucional 10 Especificação do Modelo Confiança interpessoal e1 e2 Confiança na honestidade dos outros e3 Confiança no altruísmo dos outros Confiança no Parlamento e4 Confiança nos Políticos e5 e6 Confiança no Sistema Jurídico e7 Confiança na Polícia Variáveis observadas Erros de medida Confiança Social Variáveis latentes (intuídas teoricamente) Correlação entre as variáveis latentes Confiança Institucional Direcção (as variáveis latentes explicam as observadas) 11 Resultados da Análise Coeficientes de regressão estandardizados (Beta)* Confiança interpessoal e1 e2 Confiança na honestidade dos outros ,88 ,85 Confiança Social ,82 e3 Coeficiente de correlação Confiança no altruísmo dos outros ,34 Confiança no Parlamento e4 ,88 ,82 Confiança nos Políticos e5 ,88 e6 Confiança no Sistema Jurídico e7 Confiança Institucional ,86 Confiança na Polícia 12 * Designados por pesos factoriais na Análise Factorial Confirmatória Resultados da Análise Formato publicação Confiança interpessoal Confiança na honestidade dos outros ,88 ,85 Confiança Social ,82 Confiança no altruísmo dos outros ,34 Confiança no Parlamento ,88 ,82 Confiança nos Políticos ,88 Confiança no Sistema Jurídico Confiança Institucional ,86 Confiança na Polícia 13 Análise de Caminhos (Path Analysis) 14 De acordo com Bryman e Duncan*: “A path analysis é uma extensão dos procedimentos referentes à regressão múltipla. De facto, este tipo de análise implica o uso da regressão múltipla em relação a modelos causais explicitamente formulados”. “Não se pode estabelecer a causalidade através dela; também não pode ser usada para substituir o investigador na formulação das relações causais mais prováveis entre um grupo de variáveis”. “Com base nesta análise o que se pode fazer é analisar o padrão de relações entre três ou mais variáveis, mas nunca se pode confirmar ou rejeitar a hipotética relação causal”. “o objectivo da path analysis é o de fornecer estimativas quantitativas das relações causais entre grupos de variáveis. As relações são direccionadas e são vistas como formando vias (paths) distintas. […] O diagrama torna explícitas as relações de causa e efeito que são consideradas prováveis entre as variáveis”. 15 * Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências Sociais, Oeiras, Celta. Path Diagrama do exemplo apresentado no slide 9, com a especificação das relações: 16 Resultados do exemplo apresentado no slide 9 O valor .66 indica que knowledge, value e satisfaction explicam 66% da variação de performance. 17 Modelo teórico do nosso exemplo: Satisfação com o estado da Economia Confiança nos Políticos Satisfação com a forma como Satisfação com a o Governo está a actuar vida em geral Confiança na Polícia Grau de felicidade que sente Satisfação com o funcionamento Confiança no Parlamento da Democracia 18 Especificação do Modelo: 0; e1 1 Satisfação com o estado da Economia 0; e2 1 Confiança nos Políticos Satisfação com a forma como o Governo está a actuar Satisfação com a vida em geral Confiança na Polícia Grau de felicidade que sente Confiança no Parlamento 1 e4 1 0; e5 Satisfação com o funcionamento da Democracia 1 0; e3 0; 19 Resultados da Análise Coeficientes de correlação e1 Coeficientes de regressão estandardizados (Beta)* Satisfação com Coeficientes de regressão** ,25 o estado da Economia ,83 ,23 -,50 e2 -,14 ,49 Confiança nos Políticos Satisfação com a forma como o Governo está a actuar ,37 Satisfação com a vida em geral e4 ,55 ,26 ,55 ,60 ,17 ,30 Confiança na Polícia ,23 ,16 ,38 ,25 Confiança no Parlamento * Efeito de x em y Grau de felicidade que sente e5 Satisfação com o funcionamento da Democracia e3 20 ** % de variação de y explicada pelas variáveis especificadas no modelo Resultados da Análise Formato publicação ,25 Satisfação com o estado da Economia ,83 ,23 -,50 -,14 ,49 Confiança nos Políticos Satisfação com a forma como o Governo está a actuar ,37 Satisfação com a vida em geral ,55 ,55 ,60 ,17 ,26 ,30 Confiança na Polícia ,23 ,16 ,38 ,25 Confiança no Parlamento Grau de felicidade que sente Satisfação com o funcionamento da Democracia 21 Exemplo de aplicação A satisfação dos estudantes universitários portugueses (resultados mais importantes) 22 Diagrama da Análise de Equações Estruturais dos indicadores de satisfação (Coeficientes Beta e correlação linear) Melhores cap.comunicação Laboratórios Edifícios e envolvente ,88 Rec.bibliotecários ,78 Salas de aula ,89 Interacção com docentes Qual.aconselham. Disciplinas opção ,57 Conhecimento Aspectos Académicos ,84 Melhores cap.liderança ,79 ,53 ,55 Satisfação ,78 ,67 Turmas ,62 ,74 ,82 Qual.conteúdos ,80 ,63 ,58 Relacionam.interpessoal ,88 Satisfação ,89 Aspectos de Desenvolvimento Pessoal ,88 Satisfação Apoio Académico ,80 Melhores cap.trabalho Mais conhecimentos Expect.intelectuais Expect.pessoais ,74 Qual.ensino ,83 ,43 Avaliação ,24 -,02 ,27 ,34 Relevância ,30 ,78 ,11 ,40 Curso Instituição ,09 ,24 Empregabilidade ,27 ,28 Prestígio social Satisfação com o Curso, a Instituição, a Empregabilidade e o Prestígio social do curso Legenda: Variáveis observadas Variáveis latentes 23 Diagrama da Análise de Equações Estruturais dos indicadores de satisfação (cont.) (Coeficientes Beta) Os resultados permitem concluir o seguinte: a) relevância dos indicadores associados a cada uma das variáveis latentes, uma vez que, com excepção dos indicadores “interacção com os docentes” (β=0,58), “oferta de disciplinas de opção” (β=0,62), os restantes são muito bem explicados pelas respectivas variáveis latentes, apresentando βs>0,7; b) correlação linear moderada entre a “Satisfação com os aspectos académicos” e a “Satisfação com o apoio académico” (r=0,55) e entre esta e a “Satisfação com os aspectos de Desenvolvimento pessoal” (r=0,53), e forte entre esta e a “Satisfação com os aspectos académicos” (r=0,78); c) capacidade explicativa das variáveis latentes no que se refere à satisfação com o Curso, com a Empregabilidade, o Prestígio social do curso e a Instituição, sintetizada no quadro acima, verificando-se que a “Satisfação com os aspectos académicos” é a que mais explica as quatro dimensões de satisfação observadas. 24 Verifica-se, também, que “Satisfação com o apoio académico” não tem impacto na satisfação com o Curso e no Prestígio social Output Informação sobre a qualidade do ajuste do modelo (resultados mais importantes) 25 Para além dos resultados estandardizados (coeficientes de regressão e de correlação), deve também ser disponibilizada informação sobre o ajuste dos dados. Os índices de ajuste dão informação sobre a qualidade do ajuste do modelo hipotético com os dados amostrais. 26 Modelo de medida (AFC) χ2 dá uma ideia ampla sobre o ajuste do modelo. A hipótese nula é a de que o modelo se ajusta perfeitamente à população, pelo que interessa não rejeitar. 27 CMIN/DF Complementa a informação sobre o χ2. É a razão entre χ2/graus de liberdade. Considera-se um bom ajuste quando a razão entre χ2/graus de liberdade não excede 5. Os modelos especificados são, normalmente, rejeitados pelos testes de excelência (ajuste perfeito), devido à sua complexidade e ao número de restrições. Neste caso rejeita-se a hipótese nula, considerando-se, por conseguinte, que o ajuste não é perfeito: 28 Para contornar as limitações do teste do χ2, devem interpretarse os índices de aderência (Goodness-of-fit) para avaliar o modelo. NFI (Normed Fit Índex): compara o modelo hipotético com o modelo de independência. Varia entre 0 e 1, considerando-se um bom ajuste valores >0,90. Tendência para subestimar o ajuste em amostras pequenas. CFI (Comparative Fit Índex): interpretação idêntica ao NFI, já que se trata de uma correcção ao mesmo para o tamanho da amostra. Revela um bom ajuste (CFI e NFI >09) 29 RMSEA (Root Mean Square Error of Aproximation): reconhecido como um dos critérios mais informativos sobre MEE em estruturas de co-variâncias. O RMSEA tem em conta o erro de aproximação na população, cuja medida de discrepância é expressa em graus de liberdade. É sensível ao número de parâmetros estimados no modelo. Valores menores que 0,05 indicam bom ajuste, e valores maiores que 0,08 representam erros razoáveis na aproximação com a população. Valores entre 0,08 e 0,10 indicam um ajuste medíocre, e maiores que 0,10, um ajuste pobre. RMSEA de 0,06 pode ser um indicativo de bom ajuste entre o modelo hipotético e os dados observados. Ajuste medíocre (>0,08) 30 CN (Critical N); também chamado índice de Hoelter 0,05 e 0,01 (níveis de significância), adequação do tamanho da amostra ao modelo postulado com 95% de confiança e 99% de confiança, respectivamente. Este critério verifica a adequação do tamanho da amostra, e não o ajustado modelo. A proposta deste índice é uma estimativa do tamanho da amostra que seja suficientemente adequado ao ajuste o modelo para o teste χ2. Um valor que exceda 200 é indicativo que o modelo representa adequadamente os dados amostrais. O modelo representa adequadamente os dados amostrais (>200): 31 Path Analysis Qualidade global do ajuste: 32 Índices de ajuste (aderência) 33 Breve tutorial 34 Execução do AMOS: 35 Especificação do Modelo 36 Especificação do modelo: 37 38 39 Bibliografia recomendada Arbuckle, J. L. (1995-2007). Amos 16.0 User’s Guide, USA, Amos Development Corporation. Disponível em: http://www.amosdevelopment.com/download/Amos%2016.0 %20User's%20Guide.pdf, consultado em 26/02/2010. Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências Sociais, Oeiras, 3ª edição portuguesa: 288-295. Maroco, J. (2007), Análise Estatística com utilização do SPSS, Lisboa, Sílabo, 3ª edição: 648-667. Ullman, J. B. (2007). “Structural Equation Modeling”, em Tabachnick, B. G. & L. S. Fidell (Orgs.), Using multivariate statistics, (5ª ed.). Boston, Pearson Education. 40 É tudo. Muito obrigado pela vossa atenção! 41