Modelos de Equações Estruturais Lúcia P. Barroso [email protected] Modelos de Equações Estruturais É uma evolução da modelagem de multiequações (Econometria) e dos princípios de mensuração (Psicologia e Sociologia); Modelos de Equações Estruturais Problemas Básicos: 1) O que a medida observada realmente está medindo? Modelo de Mensuração 2) Como inferir relações causais complexas entre as variáveis que não são observáveis diretamente? Modelo Estrutural Modelos de Equações Estruturais Equações simultâneas = B + + y = y + x = X+ Modelagem 1 x1 1 1 2 x2 g11 x3 x4 1 g21 b21 1 2 4 1 y2 2 y3 3 y4 4 1 l21(x) f21 3 y1 1 b12 g12 l41(x) l21(y) 1 2 l41(y) 2 1 = b12 2 + g111 + g12 2 + 1 2 = b211 + g 211 + 2 Variáveis y: Variáveis x: y1 = 1 + 1 x1 = 1 + 1 y 2 = l 21( y ) 1 + 2 y3 = 2 + 3 x 2 = l 21( x ) 1 + 2 x3 = 2 + 3 y 4 = l 42 ( y ) 2 + 4 x 4 = l42 ( x ) 2 + 4 O diagrama de caminho Círculos: erros Elipses: variáveis latentes Retângulos: variáveis observadas Setas com um sentido: indicam que variável exerce influência sobre outra (causa) Setas com ambos os sentidos: indicam correlação Duas setas, uma em cada sentido: indicam relações recíprocas – uma variável é causa e é causada pela outra Notação Indicadores: variáveis mensuráveis X: indicador de variáveis latentes exógenas Y: indicador de variáveis latentes endógenas Variáveis latentes ξ: variável latente exógena : variável latente endógena Notação Erros : erro associado a X : erro associado a Y : erro associado a ξ Notação Coeficientes x: entre X e ξ y: entre Y e B: entre ’s : entre e ξ : vetor de parâmetros Notação Matrizes de covariâncias : matriz de covariância estruturada S: matriz de covariância amostral : covariâncias entre ξ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s Matriz de covariância imposta pelo modelo - () YY YX ( ) = XY XX YY = Y [(I B) 1 ('+ )[(I B) 1 ]' ]'Y + XX = X ' X + YX = Y ( I B) 1 ' X Estimação dos parâmetros Σ = Σ () : vetor de parâmetros do modelo Estamos interessados em encontrar valores para os parâmetros que minimizem alguma função de S e (ˆ) Função de discrepância Se a função é contínua e é um escalar maior do que zero, sendo igual a zero somente se os argumentos forem iguais, então teremos estimadores consistentes para os parâmetros Estimação dos parâmetros Máxima verossimilhança (normal multivariada) FML = log | ( ) | +tr[S ( )1 ] log | S | ( p + q) (N-1)FML avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade (t = número de parâmetros livres) Estimação dos parâmetros Mínimos quadrados FULS = 1/ 2{tr[(S ( ))2 ]} Estimação dos parâmetros Mínimos quadrados generalizados FGLS = 1/ 2tr{[S( )]W 1}2 W-1 é estimador consistente de -1 (usal S-1) (N-1)FGLS avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade Estimação dos parâmetros Mínimos quadrados ponderados generalizados FWLS = (s )T W 1 (s ) wgh,ij = mghij sgh sij mghij 1 N = ( zag z g )(zah zh )(zai zi )(zaj z j ) N a =1 Não depende de distribuição, mas de momento de quarta ordem e requer amostras muito grandes Estimação dos parâmetros Mínimos quadrados ponderados diagonalmente k FDWLS = g =1 k 1 2 ( s ) gh gh w h =1 gh wgh é estimativa da variância assintótica de sgh Variáveis seguem distribuição normal Método de Máxima Verossimilhança ou Método de Mínimos Quadrados Generalizados e não-normais Método de Máxima Verossimilhança ou Método de Mínimos Quadrados Generalizados ou Método de Mínimos Quadrados Ponderados Generalizados Variáveis categóricas Método de Mínimos Quadrados Ponderados Generalizados Variáveis contínuas Como avaliar o ajuste do modelo? • Avaliar o sinal dos coeficientes • Avaliar a magnitude dos efeitos • Avaliar se os efeitos são estatisticamente significantes Validação do modelo: Hipótese de interesse: Σ = Σ() Como Σ é desconhecida, usa-se S Como avaliar o ajuste do modelo? Hipótese de interesse: Σ = Σ() Teste qui-quadrado ( N 1)FML (2p+q)( p+q+1) / 2t Resíduos Bom ajuste: resíduos próximos de zero, resíduos padronizados menores do que 0,05. Medidas de Ajuste Raiz do Quadrado Médio Residual (RMR) 2 RMR = 2 sij ˆ ij k k + 1 i =1 j =1 k i 1 2 sij é o ij-ésimo elemento da matriz de covariância amostral S ; ̂ij é o ij-ésimo elemento da matriz de covariância ̂ ; ̂ k é a matriz de covariância avaliada no ponto ̂ ; é o número total de variáveis observadas. Medidas de Ajuste Raiz do Quadrado Médio Residual (RMR) 2 RMR = 2 sij ˆ ij k k + 1 i =1 j =1 k i 1 2 Bom ajuste: RMR 0. Pode ser afetada por variáveis de escalas diferentes. Alternativa: cij = rij rˆij 2 cij 2 rˆij = ˆ ij (ˆ iiˆ jj ) 1 2 Medidas de Ajuste Teste Qui-quadrado 2 = N 1F N é o tamanho amostral; F é a função de ajuste utilizada ML, GLS ou ULS. Bom ajuste: valor-p grande. Cautela: Curtose próxima da normal, matriz de covariâncias analisada, amostra grande, estrutura imposta possível no problema analisado. Medidas de Ajuste Ajuste de modelos para comparação: •Modelo de independência (baseline) – ruim •Seu modelo •Modelo saturado (sempre se ajusta) Discrepância Mínima da Amostra (CMIN) CMIN = N F Bom ajuste: CMIN pequeno. Medidas de Ajuste Índice de Ajuste Normalizado (NFI) Fb Fm 2b 2 m NFI = = Fb 2b Fb é o valor da função do modelo “baseline”; Fm é o valor da função de ajuste do “seu modelo”. 0 NFI 1 Bom ajuste: NFI 1. NFI pode aumentar com a adição de parâmetros e com tamanho da amostra. Considerando que média Fm glm/(N-1) Medidas de Ajuste Índice de Ajuste Corrigido (IFI) Fb Fm 2b 2 m IFI = = 2 Fb glm N 1 b glm glm é o número de graus de liberdade da distribuição qui-quadrado do “seu modelo” Não varia entre 0 e 1. Bom ajuste: IFI 1. Medidas de Ajuste Índice de Ajuste Relativo (RFI) 1 Fb = glb Fm glm 2b glb 2m glm = Fb glb 2b glb Bom ajuste: RFI 1. Índice de Tucker-Lewis (TLI) Fb 2 = Fb glb Fm glm 2b glb 2m glm = glb 1 N 1 2b glb 1 Bom ajuste: RFI 1. Medidas de Ajuste Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI) Método de Máxima Verossimilhança: GFIML tr ˆ 1S I = 1 2 1 ˆ tr S Bom ajuste: GFI 1 2 e AGFI 1. AGFIML k k + 1 1 GFIML = 1 2 gl Medidas de Ajuste Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI) Método de Mínimos Quadrados Não-Ponderados: tr S ˆ 2 GFI ULS = 1 tr S 2 e k k + 1 1 GFI ULS AGFI ULS = 1 2 gl Método de Mínimos Quadrados Generalizados: GFI GLS tr I ˆ S 1 2 = 1 k e AGFIGLS kk + 1 1 GFIGLS = 1 2gl Medidas de Ajuste Índice de Qualidade do Ajuste de Parsimônia (PGFI) 2 glm PGFI = GFI k k + 1 Índice de Ajuste Normalizado de Parsimônia (PNFI) glm PNFI = NFI glb Medidas de Ajuste Índice de Ajuste Comparativo (CFI) CFI = 1 max Ĉ gl ,0 max Ĉm glm ,0 b b Ĉm é a discrepância mínima da amostra do “seu modelo”; Ĉb é a discrepância mínima da amostra do modelo “baseline”. Bom ajuste: CFI 1. Medidas de Ajuste Raiz do Erro Quadrático Médio de Aproximação (RMSEA) F̂0 RMSEA = gl Ĉ gl . em que F̂0 = max , 0 N Limites de Confiança de 90%: LO90 = L N gl HI90 = e com L e U obtidos através das equações: 2NC Ĉ | , gl = 0,95 e U N gl 2NC Ĉ | , gl = 0,05 Medidas de Ajuste Qui-quadrado Relativo 2 gl Qui-quadrado Padronizado 2P 2 gl = 2gl Medidas de Ajuste Critério da Informação de Akaike (AIC) AIC = Ĉ + 2t Ĉ é a discrepância mínima da amostra do modelo prosposto; t é o número de parâmetros livres. Critério da Informação de Bayes (BIC) BIC = Ĉ + t ln(Nk ) k é o número de variáveis observadas. Medidas de Ajuste Critério de Browne-Cudeck (BCC) k k + 3 b BCC = Ĉ + 2t N k 2 k k + 3 em que b = N 1 . Critério da Informação de Akaike Consistente (CAIC) CAIC = Ĉ + tlnN + 1 Medida de Ajuste Indicação de Bom Ajuste Qui-quadrado ( 2 ) P-valor do teste > nível de significânica CMIN CMIN < graus de liberdade NFI IFI RFI TLI Valores próximos de 1 GFI AGFI PGFI PNFI Comparação de modelos CFI CFI > 0,90 RMSEA RMSEA < 0,05 Qui-Quadrado Relativo Valor menor que 2 (ou 3) Qui-Quadrado Padronizado (2P ) Não há consenso AIC BIC BCC CAIC Comparação de modelos (menor) Índices de Modificação MI : estatística do teste score – quantidade mínima esperada para decréscimo do qui-quadrado se o correspondente parâmetro fixado fosse considerado como livre. EPC : estimated parameter changes Estratégia: excluir parâmetros não significantes e incluir parâmetros a serem estimados no modelo, 1 a 1, pelo maior valor do MI. Softwares LISREL EQS AMOS CALIS MPLUS R lavaan Exemplo 1 Stress em atletas de basquete n = 123 Escala de 0 a 6 0: não provoca stress Quanto maior, mais stress Estado psicológico X1: Necessidade de sempre jogar bem X2: Perder X3: Auto cobrança exagerada X4: Pensamentos negativos sobre sua carreira Jogo X5: Perder jogo praticamente ganho X6: Repetir os mesmos erros X7: Cometer erros que provocam a derrota da equipe X8: Adversário desleal X9: Arbitragem prejudica você Pessoas X10: Falta de humildade de um companheiro de equipe X11: Pessoas com pensamento negativo X12: Companheiro desleal X13: Diferenças de tratamento na equipe X14: Falta de confiança por parte do técnico Exemplo 2 Estudo: Um questionário foi aplicado a 36 agricultores familiares de Salto, ao norte de Uruguai. Objetivo: Avaliar a “estrutura financeiro-tecnológica” (EFT) e a “estrutura social e familiar” (ESF) dos agricultores. Variáveis Observadas: “tipo de fertilização” 0 – manual 1 – mecânica “veículo” 0 – não possui EFT 1 – possui 1 – mochila na mão “tipo de dedetização” 2 – mochila com motor 3 – pulverizador no trator “número de parentes” “pai” 0 – pai não trabalhou na horticultura 1 – pai trabalhou “trabalhadores permanentes” ESF Tipo de Fertilização 1 Veículo 2 l1 EFT 1 Equações de Mensuração l3 Tipo de Dedetização 3 Tipo de Fertilização = Veículo = EFT + l4 ESF l5 Número de Parentes Pai 4 5 1 Trabalhadores Permanentes 6 l1 EFT + 1 2 Tipo de Dedetização = l 3 EFT + 3 Número de Parentes = l 4 ESF + 4 Pai = l 5 ESF + 5 Trabalhadores Permanentes = ESF + 6 Indicadores Formativos - definição Direção Causal: o indicador formativo é definido por causar o construto e não ser causado por ele. Podemos dizer que esse comportamento é contrário ao usual. Formativos Reflexivos Exemplos de indicadores Reflexivo: “Número de vezes que uma criança tenta montar um quebra-cabeça até desistir” - efeito da variável latente “persistência”. Formativo: “Número de participações em um comitê executivo” – causa a variável latente “experiência”. Motivações para o estudo dos Indicadores Formativos Desconhecimento do assunto: muitos usuários de modelos estruturais simplesmente desconhecem a existência e a forma de uso dos indicadores formativos. Literatura escassa: são muito raros os trabalhos que têm como tema os indicadores formativos. Uso incorreto: muitas vezes o indicador reflexivo não é apropriado, mas é usado. Componentes da relação causal Definição: se tivermos duas variáveis, X e Y, isoladas de qualquer influência externa, e se a cada mudança em X, Y também sofre uma mudança, então dizemos que X causa Y Isolamento: X e Y estão isolados de influências externas. Associação: se X causa Y, deve haver associação entre X e Y. Direção: X causa Y e não o contrário. Qual a direção da causa? É comum, ao construirmos o diagrama de caminho, termos dúvida quanto à direção da causa Exemplo: percepção da propaganda intenção de compra outros fatores intenção de compra percepção da propaganda Métodos usuais de especificação da direção causal Precedência temporal: a variável que acontece primeiro no tempo é a causadora e a outra é a causa. Experimentos mentais: imagina-se o que faz mais sentido, qual a direção da causa que é mais sensata. Experimentos práticos: tenta-se isolar as variáveis o máximo possível e fazer uma delas sofrer uma variação para verificar se a outra também varia. Implicações da direção causal: Consistência interna Indicador reflexivo: os indicadores devem ser correlacionados entre si pois são causados pela mesma fonte. Isso é chamado consistência interna dos indicadores. Indicador formativo: os indicadores não precisam ter qualquer relação entre si. Multicolinearidade Indicador reflexivo: a multicolinearidade entre os indicadores é desejável pois além de fornecer indícios de que os indicadores são de fato causados por um mesmo construto, ela não causa problema algum. Indicador formativo: a multicolinearidade pode existir ou não. Muita sobreposição entre os indicadores pode causar os mesmos problemas que temos em regressão. Confiabilidade Indicador reflexivo: existem métodos para se calcular a confiabilidade tratando os indicadores como um grupo, como no caso do Alfa de Cronbach. Indicador formativo: os indicadores não formam um grupo, não existe um métodos amplamente aceito para se calcular a confiabilidade. Não tem sentido agrupar para verificar a consistência. Representação amostral do constructo Indicador reflexivo: teoricamente a ausência de um ou mais indicadores não é muito problemática, já que eles são correlacionados e os que estão no modelo trazem grande parte da informação dos que ficaram de fora. Indicador formativo: a ausência de um indicador invalida o construto, visto que os indicadores formativos são variáveis exógenas, com causas desconhecidas na maioria das vezes, e por isso são teoricamente insubstituíveis. Identificação Principal fator que leva ao receio do uso dos indicadores formativos. Um modelo é identificado se o sistema de equações = () tem apenas uma solução. Var(Y1) = 1 + 2 -> não é Identificado. Var(Y1) = 1 + 2 com a restrição 1 = 2 -> é identificado A identificação de um modelo estrutural típico é difícil de ser provada. Mas há algumas regras úteis para se verificar a identificação do modelo. Às vezes são necessários métodos numéricos para verificar a identificação. Regra da escala Toda variável latente precisa ter uma escala, o que é feito fixando-se o seu coeficiente ou sua variância. Y = + bX + -> O coeficiente de é 1. Regra t O número de parâmetros a serem estimados (t) deve ser menor ou igual o número de elementos diferentes na matriz de covariâncias -> p(p+1)/2, onde p = nº variáveis observadas . 3 Coeficientes + 4 variâcias = 7 parâmetros 4 variáveis observadas = 10 elementos diferentes na matriz . Regra dos dois caminhos emitidos Toda variável latente que tem indicadores formativos tem que emitir pelo menos dois caminhos e ambos devem levar a conjuntos de indicadores diferentes. Neste modelo 2 emite dois caminhos, portanto ele obedece a regra dos dois caminhos emitidos. Regra MIMIC Modelos do tipo MIMIC são modelos em que todas as variáveis latentes têm indicadores formativos e reflexivos ao mesmo tempo. 1 – Cada variável latente deve afetar pelo menos dois indicadores reflexivos. 2 – Cada variável latente deve ter pelo menos um indicador formativo. 3 – A matriz de variâncias e covariâncias dos erros devem ser diagonais (erros não correlacionados). 4 - O modelo que relaciona os indicadores formativos às variáveis latentes e as variáveis latentes entre si tem uma estrutura identificada. Modelos não identificados Modelo original não identificado Modelo em sua Forma Parcialmente Reduzida (FPR) Identificado Modelos não identificados Modelo Original Não Identificado Latente sem Erro Forma Parcialmente Reduzida Simulações - objetivos 1) 2) 3) 4) Estudar as consequências da especificação incorreta do indicador formativo como indicador reflexivo (o inverso é menos frequente). Consequências de interesse: Alterações nos valores dos coeficientes do modelo; Alterações nos valores de outros parâmetros estimados do modelo; Alterações no ajuste do modelo e na estatística qui-quadrado; Indícios de que o modelo com indicadores reflexivos está incorreto. Método Foi utilizado o software SAS (PROC CALIS). Os modelos estudados foram restritos aos do tipo MIMIC. 1000 amostras (n=1000) que satisfazem um modelo formativo foram geradas e usadas para a estimação de um modelo reflexivo, como se o modelo correto para os dados estivesse especificado incorretamente. As amostras foram previamente testadas ajustando-se a elas o modelo correto e confirmando o bom ajuste. Finalmente as amostras foram ajustadas considerando-se o modelo incorreto e os valores médios dos parâmetros para as 1000 amostras foram considerados para a análise dos resultados. MIMIC: 3 formativos e 3 reflexivos. Modelo para a geração dos dados Modelo para o ajuste Ajuste do modelo correto Estimativas: distribuição empírica simétrica, centrada no valor do parâmetro. O histograma da distribuição acumulada empírica mostrouse próximo da U(0,1) como esperado. Embora os indicadores formativos tenham sido gerados sem correlação, na estimação do modelo foi incluída uma possível correlação (próxima de zero e não significante). Distribuição da estatística qui-quadrado 140 120 Freqüências 100 80 60 40 20 0 1 3 5 7 9 11 13 15 17 19 Estatística Qui-Quadrado 21 23 Ajuste do modelo correto Parâmetro lambda21 lambda31 gama11 gama12 gama13 phi11 phi12 phi22 phi13 phi23 phi33 theta11 theta22 theta33 psi11 N 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 Média 0,800 1,301 0,500 1,000 1,499 0,998 0,001 1,000 0,000 0,001 0,999 0,996 0,999 0,998 0,995 D.P. 0,020 0,027 0,038 0,039 0,041 0,044 0,031 0,044 0,031 0,032 0,044 0,061 0,054 0,078 0,064 Significado Var X1 Cov(X1,X2) Var X2 Cov(X1,X3) Cov(X2,X3) Var X3 Var 1 Var 2 Var 3 Var 1 Aprox. 5% dos modelos foram rejeitados com nível de significância de 5%. A estatística qui-quadrado teve distribuição qui – quadrado aproximada e sua média foi em torno de 7. Ajuste do modelo incorreto O coeficiente do indicador incorretamente especificado e a variância do erro da variável latente tiveram estimativas bem diferentes do valor correto. Pa r â m e t r o gam a11 La m b d a 2 1 La m b d a 3 1 gam a12 gam a13 p h i1 1 p h i2 2 p h i2 3 p h i3 3 t het a11 t het a22 t het a33 p si1 1 N 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 M é d ia 0,095 0,801 1,302 0,996 1,494 0,961 0,999 -0,001 1,000 0,996 0,995 0,979 1,272 Esp e r a d o De sv . Pa d r ã o Sig n if ica d o 0,500 0,015 0,800 0,020 1,300 0,027 1,000 0,042 1,500 0,045 Var 4 0,042 1,000 Var X2 0,045 0,000 Co v (X2 ,X3 ) 0,031 1,000 Var X3 0,046 1,000 Var 1 0,063 1,000 Var 2 0,055 1,000 Var 3 0,083 1,000 Var 1 0,080 Ajuste do modelo incorreto O ajuste do modelo incorreto foi sempre muito ruim. Valor médio do 2 = 144,9. Mínimo valor do 2 = 83,7. Desvio padrão do 2 = 22,7. Todos os valores-p foram menores do que 0,00001 (rejeitando para todas as amostras). Invertendo a relação de causa entre X2 e 1 e entre X3 e 1 Média gama Média psi11 X2 (gama12 =1) 0,207 2,083 X3 (gama13 = 1,5) 0,326 3,373 Re-especificação do modelo incorreto O índice de modificação aponta para a existência de uma correlação muito grande entre o erro de X1 (4) e o erro do constructo. Maiores índices de modificação para covariâncias de X1, X2 e X3 com 4. Maiores resíduos também. A inclusão dessa correlação no modelo por si só corrige o problema do mau ajuste. O modelo reespecificado passa a ter um bom ajuste mas não é o modelo correto sob o qual os dados foram gerados. Conclusão das simulações A especificação incorreta faz o ajuste ser muito ruim. A maior parte dos parâmetros são estimados corretamente. O erro do constructo tem sua variância incorretamente estimada. A re-especificação do modelo leva a um modelo de bom ajuste, mas incorreto. Simulação: MIMIC com indicadores formativos correlacionados Modelo correto: média do 2 = 6,08 Simulação: a, b, c ~ N(0,1) X1 = a X2 = 1,5 X1 + b X3 = 0,5 X2 + c Mudança nas estimativas de g11, g12 e g13 (a variância 11 foi pouco afetada) Ajuste do modelo incorreto Parâmetro N Média D.P. lambda21 1000 0,800 0,800 0,010 lambda31 1000 1,301 1,300 0,013 gama11 1000 0,195 0,500 0,005 gama12 1000 1,263 1,000 0,030 gama13 1000 1,457 1,500 0,038 phi11 1000 0,386 phi22 1000 3,245 3,250 0,140 Var Var X2 phi23 1000 1,624 1,600 0,089 Cov(X2,X3) phi33 1000 1,812 1,800 0,082 Var X3 theta11 1000 1,007 1,000 0,060 theta22 1000 0,999 1,000 0,052 Var 1 Var 2 theta33 1000 1,016 1,000 0,076 psi11 1000 1,051 1,000 0,064 0,018 Significado Var 3 Var 1 Outras simulações do modelo MIMIC 3 indicadores formativos e 5 indicadores reflexivos. 5 indicadores formativos e 3 indicadores reflexivos. Com 2 constructos, sendo um sem indicadores formativos e causado pelo outro. Mesmas conclusões Conclusões A relação de causa nem sempre é estudada como deveria ao se postular um modelo estrutural; A Análise Fatorial com seus indicadores reflexivos parece ser um padrão também adotado nos modelos estruturais; Os modelos estruturais são muitas vezes utilizados com a direção causal incorretamente especificada; A literatura especializada ainda é muito pobre na abordagem dos indicadores formativos; Conclusões Vimos que há possibilidade de indicadores formativos estarem sendo incorretamente especificados, e na busca do bom ajuste, o modelo todo estar sendo re-especificado de forma incorreta. Modelos de Equações Estruturais Lúcia P. Barroso [email protected]