Investigação
Sociológica
Analisar modelos com Equações Estruturais
Rui Brites
[email protected]
1
Modelação de Equações Estruturais (MEE)
(SEM structural equations modeling)
com SPSS/AMOS®
O essencial
Exemplo de aplicação
2
Os modelos de equações estruturais (MEE) podem ser vistos,
segundo Klem*, como uma extensão da regressão múltipla, se for
considerado que na aplicação da regressão o investigador está
interessado em prever uma única variável dependente, enquanto
nos MEE há mais do que uma variável dependente.
• Regressão: X influencia Y;
• MEE: X influencia Y e Y influencia Z.
Uma das características básicas da MEE é o de permitir testar uma
teoria de ordem causal entre um conjunto de variáveis pois:
• Permite observar de que forma as variáveis independentes
explicam a variável dependente, bem como a sua importância
relativa, podendo incorporar variáveis latentes na análise;**
• Permite calcular simultaneamente todas as relações entre os
factores associados a um determinado fenómeno.
*Klem, L. “Path analysis”, em Grimm, L. G. e P. R. Yarnold, Reading and understanding multivariate
statistics”. Washington, DC, American Psychological Association, 1995.
** Uma variável latente é um construto teórico e não observado que, por conseguinte, não pode ser
medido directamente, mas pode ser representado ou medido por duas ou mais variáveis observadas.
3
A MEE é aconselhável quando:
• Existem construtos latentes;
• Quando as variáveis observadas contêm erros de
mensuração e a relação desejada é entre as variáveis
observáveis;
• Quando existe interdependência entre as variáveis
observadas. A sua principal utilidade é a de possibilitar
a resolução de problemas de pesquisa relacionados
com relações causais entre construtos latentes que
são medidos través de variáveis observadas.
4
A MEE revela-se muito útil quando se pretende testar modelos
complexos, com múltiplas variáveis simultâneas e traços latentes,
sendo apresentada por vários autores como uma mistura de análise
factorial com a regressão múltipla.*
O processo inicia-se com a formulação do modelo teórico que
estabelece as relações causais entre um conjunto de variáveis. Este
deve estar devidamente fundamentado na teoria, entendendo-se
o respectivo diagrama como o resumo das hipóteses que se
pretendem validar.
A MEE começa pelo enunciar dos aspectos teóricos do estudo. Por
conseguinte, a elaboração teórica de modelos hipotéticos é
fundamental no contexto da MEE, pois as relações entre as variáveis,
a estabelecer pelo investigador devem basear-se em pressupostos
teóricos consistentes ou em evidências empíricas anteriores.
* Cfr. Ullman, J. B. (2007), “Structural Equation Modeling”, em Tabachnick, B. G. & L. S. Fidell
(Orgs.), Using multivariate statistics, (5ª ed.). Boston, Pearson Education.
5
Uma característica comum na MEE como forma de
especificação, é a representação gráfica dos modelos
estruturais. Essa representação possui uma simbologia
convencionada de nomenclatura das relações estruturais entre
variáveis representadas num diagrama:
• As variáveis observadas são representadas por
rectângulos ou quadrados;
• As variáveis latentes são representadas por círculos ou
elipses;
• O caminho ou a relação de causa entre duas variáveis é
representado por uma seta com uma ponta;
• Uma relação bidireccional entre duas variáveis é
representada por duas setas em sentidos opostos;
• A correlação ou covariância entre duas variáveis é
representada por uma seta com duas pontas
6
No nosso exemplo vamos utilizar o AMOS®, que é
um programa opcional do SPSS® que se distingue
de outros softwares de Modelação de Equações
Estruturais pelo seu interface bastante amigável,
que
inclui
as
“ferramentas”
necessárias
ao
desenho do modelo.
Os dados provêm do European Social Survey*,
round 1 (2002) e referem-se unicamente a Portugal
Nota: sobre o European Social Survey, ver o ESS no CIES: http://ess.cies.iscte.pt/
7
* A base de dados original está disponível em http://www.europeansocialsurvey.org/
Modelo de
medida
(Análise Factorial Confirmatória)
8
Os modelos de medida especificam a forma como as variáveis
observadas dependem das variáveis latentes. Veja-se o seguinte
exemplo, que comporta quatro medidas distintas:*
* Arbuckle, J. L. (1995-2007). Amos 16.0 User’s Guide, USA, Amos Development Corporation. Disponível 9em:
http://www.amosdevelopment.com/download/Amos%2016.0%20User's%20Guide.pdf
No nosso exemplo pretendemos confirmar se os 3 indicadores
de Confiança Social (a8, a9 e a10) e os 4 de Confiança nas
Instituições Públicas nacionais (b7, b8, b9 e b10) são
explicados pelas variáveis latentes Confiança Social e
Confiança Institucional, respectivamente, bem como saber a
correlação entre elas. O modelo teórico é o seguinte:
Confiança interpessoal
Confiança na honestidade dos outros
Confiança
Social
Confiança no altruísmo dos outros
Confiança no Parlamento
Confiança nos Políticos
Confiança no Sistema Jurídico
Confiança na Polícia
Confiança
Institucional
10
Especificação do Modelo
Confiança interpessoal
e1
e2
Confiança na honestidade dos outros
e3
Confiança no altruísmo dos outros
Confiança no Parlamento
e4
Confiança nos Políticos
e5
e6
Confiança no Sistema Jurídico
e7
Confiança na Polícia
Variáveis observadas
Erros de medida
Confiança
Social
Variáveis latentes
(intuídas teoricamente)
Correlação entre as
variáveis latentes
Confiança
Institucional
Direcção (as variáveis latentes
explicam as observadas)
11
Resultados da Análise
Coeficientes de regressão estandardizados (Beta)*
Confiança interpessoal
e1
e2
Confiança na honestidade dos outros
,88
,85
Confiança
Social
,82
e3
Coeficiente de correlação
Confiança no altruísmo dos outros
,34
Confiança no Parlamento
e4
,88
,82
Confiança nos Políticos
e5
,88
e6
Confiança no Sistema Jurídico
e7
Confiança
Institucional
,86
Confiança na Polícia
12
* Designados por pesos factoriais na Análise Factorial Confirmatória
Resultados da Análise
Formato publicação
Confiança interpessoal
Confiança na honestidade dos outros
,88
,85
Confiança
Social
,82
Confiança no altruísmo dos outros
,34
Confiança no Parlamento
,88
,82
Confiança nos Políticos
,88
Confiança no Sistema Jurídico
Confiança
Institucional
,86
Confiança na Polícia
13
Análise de
Caminhos
(Path Analysis)
14
De acordo com Bryman e Duncan*:
“A path analysis é uma extensão dos procedimentos referentes à
regressão múltipla. De facto, este tipo de análise implica o uso da
regressão múltipla em relação a modelos causais explicitamente
formulados”.
“Não se pode estabelecer a causalidade através dela; também não
pode ser usada para substituir o investigador na formulação das
relações causais mais prováveis entre um grupo de variáveis”.
“Com base nesta análise o que se pode fazer é analisar o padrão de
relações entre três ou mais variáveis, mas nunca se pode confirmar
ou rejeitar a hipotética relação causal”.
“o objectivo da path analysis é o de fornecer estimativas quantitativas das
relações causais entre grupos de variáveis. As relações são
direccionadas e são vistas como formando vias (paths) distintas. […] O
diagrama torna explícitas as relações de causa e efeito que são
consideradas prováveis entre as variáveis”.
15
* Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências Sociais, Oeiras, Celta.
Path Diagrama do exemplo apresentado no slide 9, com a
especificação das relações:
16
Resultados do exemplo apresentado no slide 9
O valor .66 indica que knowledge, value e satisfaction
explicam 66% da variação de performance.
17
Modelo teórico do nosso exemplo:
Satisfação com
o estado da Economia
Confiança nos Políticos
Satisfação com a forma como
Satisfação com a
o Governo está a actuar
vida em geral
Confiança na Polícia
Grau de felicidade
que sente
Satisfação com o funcionamento
Confiança no Parlamento
da Democracia
18
Especificação do Modelo:
0;
e1
1
Satisfação com
o estado da Economia
0;
e2
1
Confiança nos Políticos
Satisfação com a forma como
o Governo está a actuar
Satisfação com a
vida em geral
Confiança na Polícia
Grau de felicidade
que sente
Confiança no Parlamento
1
e4
1
0;
e5
Satisfação com o funcionamento
da Democracia
1
0;
e3
0;
19
Resultados da Análise
Coeficientes de correlação
e1
Coeficientes de regressão estandardizados (Beta)*
Satisfação com
Coeficientes de regressão**
,25
o estado da Economia
,83
,23
-,50
e2
-,14
,49
Confiança nos Políticos
Satisfação com a forma como
o Governo está a actuar
,37
Satisfação com a
vida em geral
e4
,55
,26
,55
,60
,17
,30
Confiança na Polícia
,23
,16
,38
,25
Confiança no Parlamento
* Efeito de x em y
Grau de felicidade
que sente
e5
Satisfação com o funcionamento
da Democracia
e3
20
** % de variação de y explicada pelas variáveis especificadas no modelo
Resultados da Análise
Formato publicação
,25
Satisfação com
o estado da Economia
,83
,23
-,50
-,14
,49
Confiança nos Políticos
Satisfação com a forma como
o Governo está a actuar
,37
Satisfação com a
vida em geral
,55
,55
,60
,17
,26
,30
Confiança na Polícia
,23
,16
,38
,25
Confiança no Parlamento
Grau de felicidade
que sente
Satisfação com o funcionamento
da Democracia
21
Exemplo de aplicação
A satisfação dos estudantes
universitários portugueses
(resultados mais importantes)
22
Diagrama da Análise de Equações Estruturais dos
indicadores de satisfação
(Coeficientes Beta e correlação linear)
Melhores cap.comunicação
Laboratórios
Edifícios e envolvente
,88
Rec.bibliotecários
,78
Salas de aula
,89
Interacção com docentes
Qual.aconselham.
Disciplinas opção
,57
Conhecimento
Aspectos
Académicos
,84
Melhores cap.liderança
,79
,53
,55
Satisfação
,78
,67
Turmas
,62
,74
,82
Qual.conteúdos
,80
,63
,58
Relacionam.interpessoal
,88
Satisfação
,89
Aspectos de
Desenvolvimento
Pessoal
,88
Satisfação
Apoio
Académico
,80
Melhores cap.trabalho
Mais conhecimentos
Expect.intelectuais
Expect.pessoais
,74
Qual.ensino
,83
,43
Avaliação
,24
-,02
,27
,34
Relevância
,30
,78
,11
,40
Curso
Instituição
,09
,24
Empregabilidade
,27
,28
Prestígio social
Satisfação com o Curso, a Instituição, a
Empregabilidade e o Prestígio social do curso
Legenda:
Variáveis observadas
Variáveis latentes
23
Diagrama da Análise de Equações Estruturais dos
indicadores de satisfação (cont.)
(Coeficientes Beta)
Os resultados permitem concluir o seguinte:
a) relevância dos indicadores associados a cada uma das variáveis latentes, uma vez que, com
excepção dos indicadores “interacção com os docentes” (β=0,58), “oferta de disciplinas de opção”
(β=0,62), os restantes são muito bem explicados pelas respectivas variáveis latentes, apresentando
βs>0,7;
b) correlação linear moderada entre a “Satisfação com os aspectos académicos” e a “Satisfação com
o apoio académico” (r=0,55) e entre esta e a “Satisfação com os aspectos de Desenvolvimento
pessoal” (r=0,53), e forte entre esta e a “Satisfação com os aspectos académicos” (r=0,78);
c) capacidade explicativa das variáveis latentes no que se refere à satisfação com o Curso, com a
Empregabilidade, o Prestígio social do curso e a Instituição, sintetizada no quadro acima,
verificando-se que a “Satisfação com os aspectos académicos” é a que mais explica as quatro
dimensões de satisfação observadas.
24
Verifica-se, também, que “Satisfação com o apoio académico” não tem impacto na satisfação
com o Curso e no Prestígio social
Output
Informação sobre a qualidade do
ajuste do modelo
(resultados mais importantes)
25
Para além dos resultados estandardizados (coeficientes
de
regressão
e
de
correlação),
deve
também
ser
disponibilizada informação sobre o ajuste dos dados. Os
índices de ajuste dão informação sobre a qualidade do
ajuste do modelo hipotético com os dados amostrais.
26
Modelo de medida (AFC)
χ2 dá uma ideia ampla sobre o ajuste do modelo. A hipótese
nula é a de que o modelo se ajusta perfeitamente à população,
pelo que interessa não rejeitar.
27
CMIN/DF Complementa a informação sobre o χ2. É a razão
entre χ2/graus de liberdade.
Considera-se um bom ajuste quando a razão entre χ2/graus de
liberdade não excede 5. Os modelos especificados são,
normalmente, rejeitados pelos testes de excelência (ajuste
perfeito), devido à sua complexidade e ao número de
restrições. Neste caso rejeita-se a hipótese nula,
considerando-se, por conseguinte, que o ajuste não é perfeito:
28
Para contornar as limitações do teste do χ2, devem interpretarse os índices de aderência (Goodness-of-fit) para avaliar o
modelo.
NFI (Normed Fit Índex): compara o modelo hipotético com o
modelo de independência. Varia entre 0 e 1, considerando-se
um bom ajuste valores >0,90. Tendência para subestimar o
ajuste em amostras pequenas.
CFI (Comparative Fit Índex): interpretação idêntica ao NFI, já
que se trata de uma correcção ao mesmo para o tamanho da
amostra.
Revela um bom ajuste (CFI e NFI >09)
29
RMSEA (Root Mean Square Error of Aproximation): reconhecido
como um dos critérios mais informativos sobre MEE em
estruturas de co-variâncias. O RMSEA tem em conta o erro de
aproximação na população, cuja medida de discrepância é
expressa em graus de liberdade. É sensível ao número de
parâmetros estimados no modelo. Valores menores que 0,05
indicam bom ajuste, e valores maiores que 0,08 representam
erros razoáveis na aproximação com a população. Valores entre
0,08 e 0,10 indicam um ajuste medíocre, e maiores que 0,10,
um ajuste pobre. RMSEA de 0,06 pode ser um indicativo de bom
ajuste entre o modelo hipotético e os dados observados.
Ajuste medíocre (>0,08)
30
CN (Critical N); também chamado índice de Hoelter 0,05 e 0,01
(níveis de significância), adequação do tamanho da amostra ao
modelo postulado com 95% de confiança e 99% de confiança,
respectivamente. Este critério verifica a adequação do tamanho
da amostra, e não o ajustado modelo. A proposta deste índice é
uma estimativa do tamanho da amostra que seja
suficientemente adequado ao ajuste o modelo para o teste χ2.
Um valor que exceda 200 é indicativo que o modelo representa
adequadamente os dados amostrais.
O modelo representa adequadamente os dados amostrais
(>200):
31
Path Analysis
Qualidade global do ajuste:
32
Índices de ajuste (aderência)
33
Breve
tutorial
34
Execução do AMOS:
35
Especificação do Modelo
36
Especificação do modelo:
37
38
39
Bibliografia recomendada
Arbuckle, J. L. (1995-2007). Amos 16.0 User’s Guide, USA,
Amos Development Corporation. Disponível em:
http://www.amosdevelopment.com/download/Amos%2016.0
%20User's%20Guide.pdf, consultado em 26/02/2010.
Bryman, A. e D. Cramer (2003), Análise de Dados em
Ciências Sociais, Oeiras, 3ª edição portuguesa: 288-295.
Maroco, J. (2007), Análise Estatística com utilização do SPSS,
Lisboa, Sílabo, 3ª edição: 648-667.
Ullman, J. B. (2007). “Structural Equation Modeling”, em
Tabachnick, B. G. & L. S. Fidell (Orgs.), Using multivariate
statistics, (5ª ed.). Boston, Pearson Education.
40
É tudo.
Muito obrigado pela
vossa atenção!
41
Download

Variáveis latentes