modelos de equações estruturais lúcia p. barroso lbarroso@imep.br
Post on 06-Feb-2016
82 Views
Preview:
DESCRIPTION
TRANSCRIPT
Modelos de Equações Estruturais
Lúcia P. Barrosolbarroso@ime.usp.br
Modelos de Equações Estruturais
É uma evolução da modelagem de multiequações (Econometria) e dos princípios de mensuração (Psicologia e Sociologia);
Modelos de Equações Estruturais
Problemas Básicos:
1) O que a medida observada realmente está medindo?
2) Como inferir relações causais complexas entre as variáveis que
não são observáveis diretamente?
Modelo de Mensuração
Modelo Estrutural
Modelos de Equações Estruturais
= B + + y = y + x = X+
Equações simultâneas
Modelagem
12121112121
21211212 111 y
21)(
212 yy323 y
42)(
424 yy
Variáveis y: Variáveis x:111 x
21)(
212 xx
323 x
42)(
424 xx
x1
y3
y2
x4
x3
x2
y1
y4
1
2
1
2
1
21(x)
1
41(x)
1
21(y)
141
(y)
21
11
21
12
21 12
1
2
3
4
1
2
3
4
1
2
O diagrama de caminho
Círculos: errosElipses: variáveis latentesRetângulos: variáveis observadasSetas com um sentido: indicam que variável exerce influência sobre outra (causa)Setas com ambos os sentidos: indicam correlaçãoDuas setas, uma em cada sentido: indicam relações recíprocas – uma variável é causa e é causada pela outra
Notação
Indicadores: variáveis mensuráveis X: indicador de variáveis latentes exógenas Y: indicador de variáveis latentes endógenas
Variáveis latentes ξ: variável latente exógena : variável latente endógena
Notação
Erros : erro associado a X : erro associado a Y : erro associado a ξ
Notação
Coeficientes
x: entre X e ξ y: entre Y e B: entre ’s : entre e ξ : vetor de parâmetros
Notação
Matrizes de covariâncias
: matriz de covariância estruturada S: matriz de covariância amostral : covariâncias entre ξ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s
Matriz de covariância imposta pelo modelo - ()
XYYX
XXXX
YYYY
XXXY
YXYY
BI
BIBI
')(
'']]'))[('()[(
)(
1
11
Estimação dos parâmetros
Σ = Σ (): vetor de parâmetros do modeloEstamos interessados em encontrar valores para os parâmetros que minimizem alguma função de S e
Função de discrepância
Se a função é contínua e é um escalar maior do que zero, sendo igual a zero somente se os argumentos forem iguais, então teremos estimadores consistentes para os parâmetros
)ˆ(
Estimação dos parâmetros
Máxima verossimilhança(normal multivariada)
)(||log])([|)(|log 1 qpSStrFML
(N-1)FML avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade (t = número de parâmetros livres)
Estimação dos parâmetros
Mínimos quadrados
]}))([({2/1 2 StrFULS
Estimação dos parâmetros
Mínimos quadrados generalizados
21})]({[2/1 WStrFGLS
W-1 é estimador consistente de -1 (usal S-1)
(N-1)FGLS avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade
Estimação dos parâmetrosMínimos quadrados ponderados generalizados
Não depende de distribuição, mas de momento de quarta ordem e requer amostras muito grandes
)()( 1 sWsF TWLS
ijghghijijgh ssmw ,
N
ajajiaihahgagghij zzzzzzzz
Nm
1
))()()((1
Estimação dos parâmetros
Mínimos quadrados ponderados diagonalmente
2
11
)(1 ghgh
k
h gh
k
gDWLS s
wF
wgh é estimativa da variância assintótica de sgh
Variáveis seguem distribuição normal
Método de Máxima Verossimilhança
ou
Método de Mínimos Quadrados Generalizados
Variáveis contínuas e não-normais
Método de Máxima Verossimilhança ou Método de Mínimos Quadrados GeneralizadosouMétodo de Mínimos Quadrados Ponderados Generalizados
Variáveis categóricasMétodo de Mínimos Quadrados Ponderados Generalizados
Como avaliar o ajuste do modelo?
• Avaliar o sinal dos coeficientes• Avaliar a magnitude dos efeitos• Avaliar se os efeitos são estatisticamente
significantes
Validação do modelo:Hipótese de interesse: Σ = Σ()Como Σ é desconhecida, usa-se S
Como avaliar o ajuste do modelo?
Hipótese de interesse: Σ = Σ()
Teste qui-quadrado
22/)1)(()1( tqpqpMLFN
Resíduos
Bom ajuste: resíduos próximos de zero, resíduos padronizados menores do que 0,05.
Medidas de Ajuste
Raiz do Quadrado Médio Residual (RMR)
2
1
1 1
2 1ˆ2
k
i
i
jijij kksRMR
ijs é o ij-ésimo elemento da matriz de covariância amostral ; Sij é o ij-ésimo elemento da matriz de covariância ;
é a matriz de covariância avaliada no ponto ; k é o número total de variáveis observadas.
Medidas de Ajuste
Raiz do Quadrado Médio Residual (RMR)
2
1
1 1
2 1ˆ2
k
i
i
jijij kksRMR
Bom ajuste: RMR 0.Pode ser afetada por variáveis de escalas diferentes. Alternativa:
ijijij rrc ˆ21)ˆˆ(
ˆˆ
jjii
ijijr
22 ijc
Medidas de AjusteTeste Qui-quadrado
F1N2
N é o tamanho amostral;
F é a função de ajuste utilizada ML, GLS ou ULS.
Bom ajuste: valor-p grande.
Cautela:
Curtose próxima da normal, matriz de covariâncias analisada,
amostra grande, estrutura imposta possível no problema analisado.
Medidas de Ajuste
Ajuste de modelos para comparação:
• Modelo de independência (baseline) – ruim
• Seu modelo
• Modelo saturado (sempre se ajusta)
Discrepância Mínima da Amostra (CMIN)
FNCMIN
Bom ajuste: CMIN pequeno.
Medidas de AjusteÍndice de Ajuste Normalizado (NFI)
b
mb
b
mb
FFFNFI 2
22
Fb é o valor da função do modelo “baseline”;
Fm é o valor da função de ajuste do “seu modelo”.
0 NFI 1 Bom ajuste: NFI 1.
NFI pode aumentar com a adição de parâmetros e com tamanho
da amostra.
Considerando que média Fm glm/(N-1)
Medidas de AjusteÍndice de Ajuste Corrigido (IFI)
mb
mb
mb
mb
glNglFFFIFI
2
22
1
glm é o número de graus de liberdade da distribuição qui-quadrado do
“seu modelo”
Não varia entre 0 e 1.
Bom ajuste: IFI 1.
Medidas de AjusteÍndice de Ajuste Relativo (RFI)
bb
2mm
2bb
2
bb
mmbb1 gl
glglglF
glFglF
Bom ajuste: RFI 1.
Índice de Tucker-Lewis (TLI)
1gl
glgl1N1glF
glFglF
bb2
mm2
bb2
bb
mmbb2
Bom ajuste: RFI 1.
Medidas de Ajuste
Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI)
21
21
ˆ
ˆ1
Str
IStrGFIML
MLML GFI
glkkAGFI
1
211
e
Método de Máxima Verossimilhança:
Bom ajuste: GFI 1 AGFI 1.
Medidas de Ajuste
Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI)
2
2ˆ1
StrStrGFI ULS
ULSULS GFIgl
kkAGFI
1
211e
Método de Mínimos Quadrados Não-Ponderados:
Método de Mínimos Quadrados Generalizados:
kSˆItr1GFI
21
GLS
GLSGLS GFI1gl2
1kk1AGFI
e
Medidas de Ajuste
Índice de Qualidade do Ajuste de Parsimônia (PGFI)
1
2kkglGFIPGFI m
Índice de Ajuste Normalizado de Parsimônia (PNFI)
b
m
glglNFIPNFI
Medidas de Ajuste
Índice de Ajuste Comparativo (CFI)
0,glCmax
0,glCmax1CFIbb
mm
mC é a discrepância mínima da amostra do “seu modelo”;
bC é a discrepância mínima da amostra do modelo “baseline”.
Bom ajuste: CFI 1.
Medidas de AjusteRaiz do Erro Quadrático Médio de Aproximação (RMSEA)
glFRMSEA 0
em que .
0,
NglCmaxF0
Limites de Confiança de 90%:
glN90LO L
glN90HI Ue
95,0gl,|CNC2 05,0gl,|CNC
2 e
com e obtidos através das equações:L U
Medidas de Ajuste
Qui-quadrado Relativo
gl
2
Qui-quadrado Padronizado
gl2gl2
P2
Medidas de AjusteCritério da Informação de Akaike (AIC)
t2CAIC
C é a discrepância mínima da amostra do modelo prosposto;t é o número de parâmetros livres.
Critério da Informação de Bayes (BIC))Nkln(tCBIC
k é o número de variáveis observadas.
Medidas de AjusteCritério de Browne-Cudeck (BCC)
3kk2kN
3kkbt2CBCC
em que .1Nb
Critério da Informação de Akaike Consistente (CAIC)
1NlntCCAIC
Medida de Ajuste Indicação de Bom Ajuste
Qui-quadrado ( 2 ) P-valor do teste > nível de significânica
CMIN CMIN < graus de liberdade
NFI
Valores próximos de 1
IFI
RFI
TLI
GFI
AGFI
PGFIComparação de modelos
PNFI
CFI CFI > 0,90
RMSEA RMSEA < 0,05
Qui-Quadrado Relativo Valor menor que 2 (ou 3)
Qui-Quadrado Padronizado (2P ) Não há consenso
AIC
Comparação de modelos (menor)BIC
BCC
CAIC
Índices de Modificação MI : estatística do teste score – quantidade mínima
esperada para decréscimo do qui-quadrado se o correspondente parâmetro fixado fosse considerado como livre.
EPC : estimated parameter changes
Estratégia: excluir parâmetros não significantes e incluir parâmetros a serem estimados no modelo, 1 a 1, pelo maior valor do MI.
Softwares
LISREL EQS AMOS CALIS MPLUS R lavaan
Exemplo 1
Stress em atletas de basquete n = 123
Escala de 0 a 60: não provoca stressQuanto maior, mais stress
Estado psicológico
X1: Necessidade de sempre jogar bemX2: PerderX3: Auto cobrança exageradaX4: Pensamentos negativos sobre sua carreira
Jogo
X5: Perder jogo praticamente ganhoX6: Repetir os mesmos errosX7: Cometer erros que provocam a derrota da
equipeX8: Adversário deslealX9: Arbitragem prejudica você
Pessoas
X10: Falta de humildade de um companheiro de equipe
X11: Pessoas com pensamento negativoX12: Companheiro deslealX13: Diferenças de tratamento na equipeX14: Falta de confiança por parte do técnico
Exemplo 2
Estudo:Um questionário foi aplicado a 36 agricultores familiares de Salto,
ao norte de Uruguai.
Objetivo:Avaliar a “estrutura financeiro-tecnológica” (EFT) e a “estrutura
social e familiar” (ESF) dos agricultores.
Variáveis Observadas:
EFT
“tipo de fertilização”0 – manual
1 – mecânica
“tipo de dedetização”
1 – mochila na mão
2 – mochila com motor
3 – pulverizador no trator
“veículo”
0 – não possui
1 – possui
“número de parentes”
“trabalhadores permanentes”
“pai” 0 – pai não trabalhou na horticultura
1 – pai trabalhou ESF
Tipo de Fertilização = EFT + 1 1
Veículo = EFT + 2
Tipo de Dedetização = EFT + 3 3
Número de Parentes = ESF + 4 4
Pai = ESF + 5 5
Trabalhadores Permanentes = ESF +
6
Equações de Mensuração
EFT
ESF
Tipo de Fertilização
Veículo
Tipo de Dedetização
Número de Parentes
Pai
Trabalhadores Permanentes
1
1
1
3
4
5
1
2
3
4
5
6
EFT
ESF
Tipo de Fertilização
Veículo
Tipo de Dedetização
Número de Parentes
Pai
Trabalhadores Permanentes
1
1
1
3
4
5
1
2
3
4
5
6
Indicadores Formativos - definição Direção Causal: o indicador formativo é definido por causar o
construto e não ser causado por ele. Podemos dizer que esse comportamento é contrário ao usual.
Formativos Reflexivos
Exemplos de indicadores
Reflexivo: “Número de vezes que uma criança tenta montar um quebra-cabeça até desistir” - efeito da variável latente “persistência”.
Formativo: “Número de participações em um comitê executivo” – causa a variável latente “experiência”.
Motivações para o estudo dos Indicadores Formativos Desconhecimento do assunto: muitos usuários de
modelos estruturais simplesmente desconhecem a existência e a forma de uso dos indicadores formativos.
Literatura escassa: são muito raros os trabalhos que têm como tema os indicadores formativos.
Uso incorreto: muitas vezes o indicador reflexivo não é apropriado, mas é usado.
Componentes da relação causal Definição: se tivermos duas variáveis, X e Y, isoladas de qualquer
influência externa, e se a cada mudança em X, Y também sofre uma
mudança, então dizemos que X causa Y
Isolamento: X e Y estão isolados de influências externas.
Associação: se X causa Y, deve haver associação entre X e Y.
Direção: X causa Y e não o contrário.
Qual a direção da causa?
É comum, ao construirmos o diagrama de caminho,
termos dúvida quanto à direção da causa
Exemplo:
percepção da propaganda intenção de compra
outros fatores intenção de compra
percepção da propaganda
Métodos usuais de especificação da direção
causal Precedência temporal: a variável que acontece
primeiro no tempo é a causadora e a outra é a causa.
Experimentos mentais: imagina-se o que faz mais sentido, qual a direção da causa que é mais sensata.
Experimentos práticos: tenta-se isolar as variáveis o máximo possível e fazer uma delas sofrer uma variação para verificar se a outra também varia.
Implicações da direção causal:
Consistência interna Indicador reflexivo: os indicadores devem ser
correlacionados entre si pois são causados pela mesma fonte. Isso é chamado consistência interna dos indicadores.
Indicador formativo: os indicadores não precisam ter qualquer relação entre si.
Multicolinearidade
Indicador reflexivo: a multicolinearidade entre os indicadores é desejável pois além de fornecer indícios de que os indicadores são de fato causados por um mesmo construto, ela não causa problema algum.
Indicador formativo: a multicolinearidade pode existir ou não. Muita sobreposição entre os indicadores pode causar os mesmos problemas que temos em regressão.
Confiabilidade
Indicador reflexivo: existem métodos para se calcular a confiabilidade tratando os indicadores como um grupo, como no caso do Alfa de Cronbach.
Indicador formativo: os indicadores não formam um grupo, não existe um métodos amplamente aceito para se calcular a confiabilidade. Não tem sentido agrupar para verificar a consistência.
Representação amostral do constructo
Indicador reflexivo: teoricamente a ausência de um ou mais indicadores não é muito problemática, já que eles são correlacionados e os que estão no modelo trazem grande parte da informação dos que ficaram de fora.
Indicador formativo: a ausência de um indicador invalida o construto, visto que os indicadores formativos são variáveis exógenas, com causas desconhecidas na maioria das vezes, e por isso são teoricamente insubstituíveis.
Identificação
Principal fator que leva ao receio do uso dos indicadores formativos.
Um modelo é identificado se o sistema de equações = () tem
apenas uma solução.
Var(Y1) = 1 + 2 -> não é Identificado.
Var(Y1) = 1 + 2 com a restrição 1 = 2 -> é identificado
A identificação de um modelo estrutural típico é difícil de ser provada. Mas
há algumas regras úteis para se verificar a identificação do modelo. Às
vezes são necessários métodos numéricos para verificar a identificação.
Regra da escala Toda variável latente precisa ter uma escala, o que é feito
fixando-se o seu coeficiente ou sua variância. Y = + X + -> O coeficiente de é 1.
Regra t O número de parâmetros a serem estimados (t) deve ser menor ou
igual o número de elementos diferentes na matriz de covariâncias -> p(p+1)/2, onde p = nº variáveis observadas .
3 Coeficientes + 4 variâcias = 7 parâmetros4 variáveis observadas = 10 elementos diferentes na matriz .
Regra dos dois caminhos emitidos Toda variável latente que tem indicadores formativos tem que emitir pelo menos dois caminhos e ambos devem levar a conjuntos de indicadores diferentes.
Neste modelo 2 emite dois caminhos, portanto ele obedece a regra dos dois caminhos emitidos.
Regra MIMIC Modelos do tipo MIMIC são modelos em que todas as
variáveis latentes têm indicadores formativos e reflexivos ao mesmo tempo.
1 – Cada variável latente deve afetar pelo menos dois indicadores reflexivos.2 – Cada variável latente deve ter pelo menos um indicador formativo.3 – A matriz de variâncias e covariâncias dos erros devem ser diagonais (erros não
correlacionados).4 - O modelo que relaciona os indicadores formativos às variáveis latentes e as
variáveis latentes entre si tem uma estrutura identificada.
Modelos não identificadosModelo original não identificado
Modelo em sua Forma Parcialmente Reduzida (FPR)Identificado
Modelos não identificados
Modelo Original Não Identificado
Forma Parcialmente ReduzidaLatente sem Erro
Simulações - objetivos
Estudar as consequências da especificação incorreta do indicador formativo como indicador reflexivo (o inverso é menos frequente).
Consequências de interesse:
1) Alterações nos valores dos coeficientes do modelo;2) Alterações nos valores de outros parâmetros estimados do
modelo;3) Alterações no ajuste do modelo e na estatística qui-quadrado;4) Indícios de que o modelo com indicadores reflexivos está
incorreto.
Método Foi utilizado o software SAS (PROC CALIS).
Os modelos estudados foram restritos aos do tipo MIMIC.
1000 amostras (n=1000) que satisfazem um modelo formativo foram geradas e usadas para a estimação de um modelo reflexivo, como se o modelo correto para os dados estivesse especificado incorretamente.
As amostras foram previamente testadas ajustando-se a elas o modelo correto e confirmando o bom ajuste.
Finalmente as amostras foram ajustadas considerando-se o modelo incorreto e os valores médios dos parâmetros para as 1000 amostras foram considerados para a análise dos resultados.
MIMIC: 3 formativos e 3 reflexivos.Modelo para a geração dos dados
Modelo para o ajuste
Ajuste do modelo correto
Estimativas: distribuição empírica simétrica, centrada no valor do parâmetro.
O histograma da distribuição acumulada empírica mostrou-se próximo da U(0,1) como esperado.
Embora os indicadores formativos tenham sido gerados sem correlação, na estimação do modelo foi incluída uma possível correlação (próxima de zero e não significante).
Distribuição da estatísticaqui-quadrado
Estatística Qui-Quadrado
2321191715131197531
Freq
üênc
ias
140
120
100
80
60
40
20
0
Ajuste do modelo correto
Aprox. 5% dos modelos foram rejeitados com nível de significância de 5%.
A estatística qui-quadrado teve distribuição qui –quadrado aproximada e sua média foi em torno de 7.
Par âmet r o N Médi a D. P. Si gni fi cadol ambda21 1000 0, 800 0, 020l ambda31 1000 1, 301 0, 027gama11 1000 0, 500 0, 038gama12 1000 1, 000 0, 039gama13 1000 1, 499 0, 041phi 11 1000 0, 998 0, 044 Var X1phi 12 1000 0, 001 0, 031 Cov( X1, X2)phi 22 1000 1, 000 0, 044 Var X2phi 13 1000 0, 000 0, 031 Cov( X1, X3)phi 23 1000 0, 001 0, 032 Cov( X2, X3)phi 33 1000 0, 999 0, 044 Var X3t het a11 1000 0, 996 0, 061 Var 1t het a22 1000 0, 999 0, 054 Var 2t het a33 1000 0, 998 0, 078 Var 3psi 11 1000 0, 995 0, 064 Var 1
Ajuste do modelo incorretoO coeficiente do indicador incorretamente especificado e a variância do erro da variável latente tiveram estimativas bem diferentes do valorcorreto.
Parâmetro N Média EsperadoDesv. PadrãoSignificadogama11 1000 0,095 0,500 0,015Lambda21 1000 0,801 0,800 0,020Lambda31 1000 1,302 1,300 0,027gama12 1000 0,996 1,000 0,042gama13 1000 1,494 1,500 0,045phi11 1000 0,961 - 0,042 Var 4phi22 1000 0,999 1,000 0,045 Var X2phi23 1000 -0,001 0,000 0,031 Cov (X2,X3)phi33 1000 1,000 1,000 0,046 Var X3theta11 1000 0,996 1,000 0,063 Var 1theta22 1000 0,995 1,000 0,055 Var 2theta33 1000 0,979 1,000 0,083 Var 3psi11 1000 1,272 1,000 0,080 Var 1
Ajuste do modelo incorreto
O ajuste do modelo incorreto foi sempre muito ruim.
Valor médio do 2 = 144,9.
Mínimo valor do 2 = 83,7.
Desvio padrão do 2 = 22,7.
Todos os valores-p foram menores do que 0,00001 (rejeitando para todas as amostras).
Invertendo a relação de causa entre X2 e 1 e entre X3 e 1
Médiagama
Médiapsi11
X2 (gama12 =1) 0,207 2,083
X3 (gama13 = 1,5) 0,326 3,373
Re-especificação do modelo incorreto O índice de modificação aponta para a existência de uma
correlação muito grande entre o erro de X1 (4) e o erro do constructo.
Maiores índices de modificação para covariâncias de X1, X2 e X3 com 4. Maiores resíduos também.
A inclusão dessa correlação no modelo por si só corrige o problema do mau ajuste.
O modelo reespecificado passa a ter um bom ajuste mas não é o modelo correto sob o qual os dados foram gerados.
Conclusão das simulações A especificação incorreta faz o ajuste ser muito
ruim.
A maior parte dos parâmetros são estimados corretamente.
O erro do constructo tem sua variância incorretamente estimada.
A re-especificação do modelo leva a um modelo de bom ajuste, mas incorreto.
Simulação: MIMIC com indicadores formativos correlacionadosModelo correto: média do 2 = 6,08
Simulação: a, b, c ~ N(0,1)X1 = a
X2 = 1,5 X1 + bX3 = 0,5 X2 + c
Mudança nas estimativas de 11, 12 e 13(a variância 11 foi pouco afetada)
Ajuste do modelo incorreto
Par âmet r o N Médi a D. P. Si gni fi cadol ambda21 1000 0, 800 0, 800 0, 010l ambda31 1000 1, 301 1, 300 0, 013gama11 1000 0, 195 0, 500 0, 005gama12 1000 1, 263 1, 000 0, 030gama13 1000 1, 457 1, 500 0, 038phi 11 1000 0, 386 0, 018 Var
phi 22 1000 3, 245 3, 250 0, 140 Var X2phi 23 1000 1, 624 1, 600 0, 089 Cov( X2, X3)phi 33 1000 1, 812 1, 800 0, 082 Var X3t het a11 1000 1, 007 1, 000 0, 060 Var 1t het a22 1000 0, 999 1, 000 0, 052 Var 2t het a33 1000 1, 016 1, 000 0, 076 Var 3psi 11 1000 1, 051 1, 000 0, 064 Var 1
Outras simulações do modelo MIMIC 3 indicadores formativos e 5 indicadores reflexivos.
5 indicadores formativos e 3 indicadores reflexivos.
Com 2 constructos, sendo um sem indicadores formativos e causado pelo outro.
Mesmas conclusões
Conclusões
A relação de causa nem sempre é estudada como deveria ao se postular um modelo estrutural;
A Análise Fatorial com seus indicadores reflexivos parece ser um padrão também adotado nos modelos estruturais;
Os modelos estruturais são muitas vezes utilizados com a direção causal incorretamente especificada;
A literatura especializada ainda é muito pobre na abordagem dos indicadores formativos;
Conclusões
Vimos que há possibilidade de indicadores formativos estarem sendo incorretamente especificados, e na busca do bom ajuste, o modelo todo estar sendo re-especificado de forma incorreta.
Modelos de Equações Estruturais
Lúcia P. Barroso
lbarroso@ime.usp.br
top related