modelos de equações estruturais lúcia p. barroso lbarroso@imep.br

Modelos de Equações Estruturais

Lúcia P. Barrosolbarroso@ime.usp.br

É uma evolução da modelagem de multiequações (Econometria) e dos princípios de mensuração (Psicologia e Sociologia);

Problemas Básicos:

1) O que a medida observada realmente está medindo?

2) Como inferir relações causais complexas entre as variáveis que

não são observáveis diretamente?

Modelo de Mensuração

Modelo Estrutural

= B + + y = y + x = X+

Equações simultâneas

Modelagem

12121112121

21211212 111 y

212 yy323 y

424 yy

Variáveis y: Variáveis x:111 x

212 xx

424 xx

O diagrama de caminho

Círculos: errosElipses: variáveis latentesRetângulos: variáveis observadasSetas com um sentido: indicam que variável exerce influência sobre outra (causa)Setas com ambos os sentidos: indicam correlaçãoDuas setas, uma em cada sentido: indicam relações recíprocas – uma variável é causa e é causada pela outra

Notação

Indicadores: variáveis mensuráveis X: indicador de variáveis latentes exógenas Y: indicador de variáveis latentes endógenas

Variáveis latentes ξ: variável latente exógena : variável latente endógena

Notação

Erros : erro associado a X : erro associado a Y : erro associado a ξ

Notação

Coeficientes

x: entre X e ξ y: entre Y e B: entre ’s : entre e ξ : vetor de parâmetros

Notação

Matrizes de covariâncias

: matriz de covariância estruturada S: matriz de covariância amostral : covariâncias entre ξ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s : covariâncias entre os erros ’s

Matriz de covariância imposta pelo modelo - ()

'']]'))[('()[(

Estimação dos parâmetros

Σ = Σ (): vetor de parâmetros do modeloEstamos interessados em encontrar valores para os parâmetros que minimizem alguma função de S e

Função de discrepância

Se a função é contínua e é um escalar maior do que zero, sendo igual a zero somente se os argumentos forem iguais, então teremos estimadores consistentes para os parâmetros

Máxima verossimilhança(normal multivariada)

)(||log])([|)(|log 1 qpSStrFML

(N-1)FML avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade (t = número de parâmetros livres)

Mínimos quadrados

]}))([({2/1 2 StrFULS

Mínimos quadrados generalizados

21})]({[2/1 WStrFGLS

W-1 é estimador consistente de -1 (usal S-1)

(N-1)FGLS avaliada nas estimativas obtidas tem distribuição assintótica qui-quadrado com ½(p+q)(p+q+1) – t graus de liberdade

Estimação dos parâmetrosMínimos quadrados ponderados generalizados

Não depende de distribuição, mas de momento de quarta ordem e requer amostras muito grandes

)()( 1 sWsF TWLS

ijghghijijgh ssmw ,

ajajiaihahgagghij zzzzzzzz

))()()((1

Mínimos quadrados ponderados diagonalmente

)(1 ghgh

gDWLS s

wgh é estimativa da variância assintótica de sgh

Variáveis seguem distribuição normal

Método de Máxima Verossimilhança

Método de Mínimos Quadrados Generalizados

Variáveis contínuas e não-normais

Método de Máxima Verossimilhança ou Método de Mínimos Quadrados GeneralizadosouMétodo de Mínimos Quadrados Ponderados Generalizados

Variáveis categóricasMétodo de Mínimos Quadrados Ponderados Generalizados

Como avaliar o ajuste do modelo?

• Avaliar o sinal dos coeficientes• Avaliar a magnitude dos efeitos• Avaliar se os efeitos são estatisticamente

significantes

Validação do modelo:Hipótese de interesse: Σ = Σ()Como Σ é desconhecida, usa-se S

Como avaliar o ajuste do modelo?

Hipótese de interesse: Σ = Σ()

Teste qui-quadrado

22/)1)(()1( tqpqpMLFN

Resíduos

Bom ajuste: resíduos próximos de zero, resíduos padronizados menores do que 0,05.

Medidas de Ajuste

Raiz do Quadrado Médio Residual (RMR)

2 1ˆ2

jijij kksRMR

ijs é o ij-ésimo elemento da matriz de covariância amostral ; Sij é o ij-ésimo elemento da matriz de covariância ;

é a matriz de covariância avaliada no ponto ; k é o número total de variáveis observadas.

Medidas de Ajuste

Raiz do Quadrado Médio Residual (RMR)

2 1ˆ2

jijij kksRMR

Bom ajuste: RMR 0.Pode ser afetada por variáveis de escalas diferentes. Alternativa:

ijijij rrc ˆ21)ˆˆ(

22 ijc

Medidas de AjusteTeste Qui-quadrado

N é o tamanho amostral;

F é a função de ajuste utilizada ML, GLS ou ULS.

Bom ajuste: valor-p grande.

Cautela:

Curtose próxima da normal, matriz de covariâncias analisada,

amostra grande, estrutura imposta possível no problema analisado.

Medidas de Ajuste

Ajuste de modelos para comparação:

• Modelo de independência (baseline) – ruim

• Seu modelo

• Modelo saturado (sempre se ajusta)

Discrepância Mínima da Amostra (CMIN)

FNCMIN

Bom ajuste: CMIN pequeno.

Medidas de AjusteÍndice de Ajuste Normalizado (NFI)

FFFNFI 2

Fb é o valor da função do modelo “baseline”;

Fm é o valor da função de ajuste do “seu modelo”.

0 NFI 1 Bom ajuste: NFI 1.

NFI pode aumentar com a adição de parâmetros e com tamanho

da amostra.

Considerando que média Fm glm/(N-1)

Medidas de AjusteÍndice de Ajuste Corrigido (IFI)

glNglFFFIFI

glm é o número de graus de liberdade da distribuição qui-quadrado do

“seu modelo”

Não varia entre 0 e 1.

Bom ajuste: IFI 1.

Medidas de AjusteÍndice de Ajuste Relativo (RFI)

mmbb1 gl

glglglF

glFglF

Bom ajuste: RFI 1.

Índice de Tucker-Lewis (TLI)

glgl1N1glF

glFglF

Bom ajuste: RFI 1.

Medidas de Ajuste

Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI)

IStrGFIML

MLML GFI

glkkAGFI

Método de Máxima Verossimilhança:

Bom ajuste: GFI 1 AGFI 1.

Medidas de Ajuste

Índice de Qualidade do Ajuste (GFI) e Índice de Qualidade do Ajuste Corrigido (AGFI)

StrStrGFI ULS

ULSULS GFIgl

kkAGFI

Método de Mínimos Quadrados Não-Ponderados:

Método de Mínimos Quadrados Generalizados:

kSˆItr1GFI

GLSGLS GFI1gl2

1kk1AGFI

Medidas de Ajuste

Índice de Qualidade do Ajuste de Parsimônia (PGFI)

2kkglGFIPGFI m

Índice de Ajuste Normalizado de Parsimônia (PNFI)

glglNFIPNFI

Medidas de Ajuste

Índice de Ajuste Comparativo (CFI)

0,glCmax

0,glCmax1CFIbb

mC é a discrepância mínima da amostra do “seu modelo”;

bC é a discrepância mínima da amostra do modelo “baseline”.

Bom ajuste: CFI 1.

Medidas de AjusteRaiz do Erro Quadrático Médio de Aproximação (RMSEA)

glFRMSEA 0

em que .

NglCmaxF0

Limites de Confiança de 90%:

glN90LO L

glN90HI Ue

95,0gl,|CNC2 05,0gl,|CNC

com e obtidos através das equações:L U

Medidas de Ajuste

Qui-quadrado Relativo

Qui-quadrado Padronizado

gl2gl2

Medidas de AjusteCritério da Informação de Akaike (AIC)

t2CAIC

C é a discrepância mínima da amostra do modelo prosposto;t é o número de parâmetros livres.

Critério da Informação de Bayes (BIC))Nkln(tCBIC

k é o número de variáveis observadas.

Medidas de AjusteCritério de Browne-Cudeck (BCC)

3kk2kN

3kkbt2CBCC

em que .1Nb

Critério da Informação de Akaike Consistente (CAIC)

1NlntCCAIC

Medida de Ajuste Indicação de Bom Ajuste

Qui-quadrado ( 2 ) P-valor do teste > nível de significânica

CMIN CMIN < graus de liberdade

Valores próximos de 1

PGFIComparação de modelos

CFI CFI > 0,90

RMSEA RMSEA < 0,05

Qui-Quadrado Relativo Valor menor que 2 (ou 3)

Qui-Quadrado Padronizado (2P ) Não há consenso

Comparação de modelos (menor)BIC

Índices de Modificação MI : estatística do teste score – quantidade mínima

esperada para decréscimo do qui-quadrado se o correspondente parâmetro fixado fosse considerado como livre.

EPC : estimated parameter changes

Estratégia: excluir parâmetros não significantes e incluir parâmetros a serem estimados no modelo, 1 a 1, pelo maior valor do MI.

Softwares

LISREL EQS AMOS CALIS MPLUS R lavaan

Exemplo 1

Stress em atletas de basquete n = 123

Escala de 0 a 60: não provoca stressQuanto maior, mais stress

Estado psicológico

X1: Necessidade de sempre jogar bemX2: PerderX3: Auto cobrança exageradaX4: Pensamentos negativos sobre sua carreira

X5: Perder jogo praticamente ganhoX6: Repetir os mesmos errosX7: Cometer erros que provocam a derrota da

equipeX8: Adversário deslealX9: Arbitragem prejudica você

Pessoas

X10: Falta de humildade de um companheiro de equipe

X11: Pessoas com pensamento negativoX12: Companheiro deslealX13: Diferenças de tratamento na equipeX14: Falta de confiança por parte do técnico

Exemplo 2

Estudo:Um questionário foi aplicado a 36 agricultores familiares de Salto,

ao norte de Uruguai.

Objetivo:Avaliar a “estrutura financeiro-tecnológica” (EFT) e a “estrutura

social e familiar” (ESF) dos agricultores.

Variáveis Observadas:

“tipo de fertilização”0 – manual

1 – mecânica

“tipo de dedetização”

1 – mochila na mão

2 – mochila com motor

3 – pulverizador no trator

“veículo”

0 – não possui

1 – possui

“número de parentes”

“trabalhadores permanentes”

“pai” 0 – pai não trabalhou na horticultura

1 – pai trabalhou ESF

Tipo de Fertilização = EFT + 1 1

Veículo = EFT + 2

Tipo de Dedetização = EFT + 3 3

Número de Parentes = ESF + 4 4

Pai = ESF + 5 5

Trabalhadores Permanentes = ESF +

Equações de Mensuração

Tipo de Fertilização

Veículo

Tipo de Dedetização

Número de Parentes

Trabalhadores Permanentes

Tipo de Fertilização

Veículo

Tipo de Dedetização

Número de Parentes

Trabalhadores Permanentes

Indicadores Formativos - definição Direção Causal: o indicador formativo é definido por causar o

construto e não ser causado por ele. Podemos dizer que esse comportamento é contrário ao usual.

Formativos Reflexivos

Exemplos de indicadores

Reflexivo: “Número de vezes que uma criança tenta montar um quebra-cabeça até desistir” - efeito da variável latente “persistência”.

Formativo: “Número de participações em um comitê executivo” – causa a variável latente “experiência”.

Motivações para o estudo dos Indicadores Formativos Desconhecimento do assunto: muitos usuários de

modelos estruturais simplesmente desconhecem a existência e a forma de uso dos indicadores formativos.

Literatura escassa: são muito raros os trabalhos que têm como tema os indicadores formativos.

Uso incorreto: muitas vezes o indicador reflexivo não é apropriado, mas é usado.

Componentes da relação causal Definição: se tivermos duas variáveis, X e Y, isoladas de qualquer

influência externa, e se a cada mudança em X, Y também sofre uma

mudança, então dizemos que X causa Y

Isolamento: X e Y estão isolados de influências externas.

Associação: se X causa Y, deve haver associação entre X e Y.

Direção: X causa Y e não o contrário.

Qual a direção da causa?

É comum, ao construirmos o diagrama de caminho,

termos dúvida quanto à direção da causa

Exemplo:

percepção da propaganda intenção de compra

outros fatores intenção de compra

percepção da propaganda

Métodos usuais de especificação da direção

causal Precedência temporal: a variável que acontece

primeiro no tempo é a causadora e a outra é a causa.

Experimentos mentais: imagina-se o que faz mais sentido, qual a direção da causa que é mais sensata.

Experimentos práticos: tenta-se isolar as variáveis o máximo possível e fazer uma delas sofrer uma variação para verificar se a outra também varia.

Implicações da direção causal:

Consistência interna Indicador reflexivo: os indicadores devem ser

correlacionados entre si pois são causados pela mesma fonte. Isso é chamado consistência interna dos indicadores.

Indicador formativo: os indicadores não precisam ter qualquer relação entre si.

Multicolinearidade

Indicador reflexivo: a multicolinearidade entre os indicadores é desejável pois além de fornecer indícios de que os indicadores são de fato causados por um mesmo construto, ela não causa problema algum.

Indicador formativo: a multicolinearidade pode existir ou não. Muita sobreposição entre os indicadores pode causar os mesmos problemas que temos em regressão.

Confiabilidade

Indicador reflexivo: existem métodos para se calcular a confiabilidade tratando os indicadores como um grupo, como no caso do Alfa de Cronbach.

Indicador formativo: os indicadores não formam um grupo, não existe um métodos amplamente aceito para se calcular a confiabilidade. Não tem sentido agrupar para verificar a consistência.

Representação amostral do constructo

Indicador reflexivo: teoricamente a ausência de um ou mais indicadores não é muito problemática, já que eles são correlacionados e os que estão no modelo trazem grande parte da informação dos que ficaram de fora.

Indicador formativo: a ausência de um indicador invalida o construto, visto que os indicadores formativos são variáveis exógenas, com causas desconhecidas na maioria das vezes, e por isso são teoricamente insubstituíveis.

Identificação

Principal fator que leva ao receio do uso dos indicadores formativos.

Um modelo é identificado se o sistema de equações = () tem

apenas uma solução.

Var(Y1) = 1 + 2 -> não é Identificado.

Var(Y1) = 1 + 2 com a restrição 1 = 2 -> é identificado

A identificação de um modelo estrutural típico é difícil de ser provada. Mas

há algumas regras úteis para se verificar a identificação do modelo. Às

vezes são necessários métodos numéricos para verificar a identificação.

Regra da escala Toda variável latente precisa ter uma escala, o que é feito

fixando-se o seu coeficiente ou sua variância. Y = + X + -> O coeficiente de é 1.

Regra t O número de parâmetros a serem estimados (t) deve ser menor ou

igual o número de elementos diferentes na matriz de covariâncias -> p(p+1)/2, onde p = nº variáveis observadas .

3 Coeficientes + 4 variâcias = 7 parâmetros4 variáveis observadas = 10 elementos diferentes na matriz .

Regra dos dois caminhos emitidos Toda variável latente que tem indicadores formativos tem que emitir pelo menos dois caminhos e ambos devem levar a conjuntos de indicadores diferentes.

Neste modelo 2 emite dois caminhos, portanto ele obedece a regra dos dois caminhos emitidos.

Regra MIMIC Modelos do tipo MIMIC são modelos em que todas as

variáveis latentes têm indicadores formativos e reflexivos ao mesmo tempo.

1 – Cada variável latente deve afetar pelo menos dois indicadores reflexivos.2 – Cada variável latente deve ter pelo menos um indicador formativo.3 – A matriz de variâncias e covariâncias dos erros devem ser diagonais (erros não

correlacionados).4 - O modelo que relaciona os indicadores formativos às variáveis latentes e as

variáveis latentes entre si tem uma estrutura identificada.

Modelos não identificadosModelo original não identificado

Modelo em sua Forma Parcialmente Reduzida (FPR)Identificado

Modelos não identificados

Modelo Original Não Identificado

Forma Parcialmente ReduzidaLatente sem Erro

Simulações - objetivos

Estudar as consequências da especificação incorreta do indicador formativo como indicador reflexivo (o inverso é menos frequente).

Consequências de interesse:

1) Alterações nos valores dos coeficientes do modelo;2) Alterações nos valores de outros parâmetros estimados do

modelo;3) Alterações no ajuste do modelo e na estatística qui-quadrado;4) Indícios de que o modelo com indicadores reflexivos está

incorreto.

Método Foi utilizado o software SAS (PROC CALIS).

Os modelos estudados foram restritos aos do tipo MIMIC.

1000 amostras (n=1000) que satisfazem um modelo formativo foram geradas e usadas para a estimação de um modelo reflexivo, como se o modelo correto para os dados estivesse especificado incorretamente.

As amostras foram previamente testadas ajustando-se a elas o modelo correto e confirmando o bom ajuste.

Finalmente as amostras foram ajustadas considerando-se o modelo incorreto e os valores médios dos parâmetros para as 1000 amostras foram considerados para a análise dos resultados.

MIMIC: 3 formativos e 3 reflexivos.Modelo para a geração dos dados

Modelo para o ajuste

Ajuste do modelo correto

Estimativas: distribuição empírica simétrica, centrada no valor do parâmetro.

O histograma da distribuição acumulada empírica mostrou-se próximo da U(0,1) como esperado.

Embora os indicadores formativos tenham sido gerados sem correlação, na estimação do modelo foi incluída uma possível correlação (próxima de zero e não significante).

Distribuição da estatísticaqui-quadrado

Estatística Qui-Quadrado

2321191715131197531

üênc

Ajuste do modelo correto

Aprox. 5% dos modelos foram rejeitados com nível de significância de 5%.

A estatística qui-quadrado teve distribuição qui –quadrado aproximada e sua média foi em torno de 7.

Par âmet r o N Médi a D. P. Si gni fi cadol ambda21 1000 0, 800 0, 020l ambda31 1000 1, 301 0, 027gama11 1000 0, 500 0, 038gama12 1000 1, 000 0, 039gama13 1000 1, 499 0, 041phi 11 1000 0, 998 0, 044 Var X1phi 12 1000 0, 001 0, 031 Cov( X1, X2)phi 22 1000 1, 000 0, 044 Var X2phi 13 1000 0, 000 0, 031 Cov( X1, X3)phi 23 1000 0, 001 0, 032 Cov( X2, X3)phi 33 1000 0, 999 0, 044 Var X3t het a11 1000 0, 996 0, 061 Var 1t het a22 1000 0, 999 0, 054 Var 2t het a33 1000 0, 998 0, 078 Var 3psi 11 1000 0, 995 0, 064 Var 1

Ajuste do modelo incorretoO coeficiente do indicador incorretamente especificado e a variância do erro da variável latente tiveram estimativas bem diferentes do valorcorreto.

Parâmetro N Média EsperadoDesv. PadrãoSignificadogama11 1000 0,095 0,500 0,015Lambda21 1000 0,801 0,800 0,020Lambda31 1000 1,302 1,300 0,027gama12 1000 0,996 1,000 0,042gama13 1000 1,494 1,500 0,045phi11 1000 0,961 - 0,042 Var 4phi22 1000 0,999 1,000 0,045 Var X2phi23 1000 -0,001 0,000 0,031 Cov (X2,X3)phi33 1000 1,000 1,000 0,046 Var X3theta11 1000 0,996 1,000 0,063 Var 1theta22 1000 0,995 1,000 0,055 Var 2theta33 1000 0,979 1,000 0,083 Var 3psi11 1000 1,272 1,000 0,080 Var 1

Ajuste do modelo incorreto

O ajuste do modelo incorreto foi sempre muito ruim.

Valor médio do 2 = 144,9.

Mínimo valor do 2 = 83,7.

Desvio padrão do 2 = 22,7.

Todos os valores-p foram menores do que 0,00001 (rejeitando para todas as amostras).

Invertendo a relação de causa entre X2 e 1 e entre X3 e 1

Médiagama

Médiapsi11

X2 (gama12 =1) 0,207 2,083

X3 (gama13 = 1,5) 0,326 3,373

Re-especificação do modelo incorreto O índice de modificação aponta para a existência de uma

correlação muito grande entre o erro de X1 (4) e o erro do constructo.

Maiores índices de modificação para covariâncias de X1, X2 e X3 com 4. Maiores resíduos também.

A inclusão dessa correlação no modelo por si só corrige o problema do mau ajuste.

O modelo reespecificado passa a ter um bom ajuste mas não é o modelo correto sob o qual os dados foram gerados.

Conclusão das simulações A especificação incorreta faz o ajuste ser muito

A maior parte dos parâmetros são estimados corretamente.

O erro do constructo tem sua variância incorretamente estimada.

A re-especificação do modelo leva a um modelo de bom ajuste, mas incorreto.

Simulação: MIMIC com indicadores formativos correlacionadosModelo correto: média do 2 = 6,08

Simulação: a, b, c ~ N(0,1)X1 = a

X2 = 1,5 X1 + bX3 = 0,5 X2 + c

Mudança nas estimativas de 11, 12 e 13(a variância 11 foi pouco afetada)

Ajuste do modelo incorreto

Par âmet r o N Médi a D. P. Si gni fi cadol ambda21 1000 0, 800 0, 800 0, 010l ambda31 1000 1, 301 1, 300 0, 013gama11 1000 0, 195 0, 500 0, 005gama12 1000 1, 263 1, 000 0, 030gama13 1000 1, 457 1, 500 0, 038phi 11 1000 0, 386 0, 018 Var

phi 22 1000 3, 245 3, 250 0, 140 Var X2phi 23 1000 1, 624 1, 600 0, 089 Cov( X2, X3)phi 33 1000 1, 812 1, 800 0, 082 Var X3t het a11 1000 1, 007 1, 000 0, 060 Var 1t het a22 1000 0, 999 1, 000 0, 052 Var 2t het a33 1000 1, 016 1, 000 0, 076 Var 3psi 11 1000 1, 051 1, 000 0, 064 Var 1

Outras simulações do modelo MIMIC 3 indicadores formativos e 5 indicadores reflexivos.

5 indicadores formativos e 3 indicadores reflexivos.

Com 2 constructos, sendo um sem indicadores formativos e causado pelo outro.

Mesmas conclusões

Conclusões

A relação de causa nem sempre é estudada como deveria ao se postular um modelo estrutural;

A Análise Fatorial com seus indicadores reflexivos parece ser um padrão também adotado nos modelos estruturais;

Os modelos estruturais são muitas vezes utilizados com a direção causal incorretamente especificada;

A literatura especializada ainda é muito pobre na abordagem dos indicadores formativos;

Conclusões

Vimos que há possibilidade de indicadores formativos estarem sendo incorretamente especificados, e na busca do bom ajuste, o modelo todo estar sendo re-especificado de forma incorreta.

Lúcia P. Barroso

lbarroso@ime.usp.br

modelos de equações estruturais lúcia p. barroso lbarroso@imep.br

Documents

relação entre satisfação de clientes e rendibilidade de...

uso de equações estruturais para validar um modelo ...a...

modelagem com equações estruturais: princípios básicos...

modelagem de equações estruturais: exemplo comentado da...

modelagem de equações estruturais: apresentação de uma...

modelos de equações estruturais métodos...

desempenho no enade de bolsistas prouni: modelagem de...

mediation transitional motivation: exploratory … ·...

anÁlise de flexibilidade em economia da informaÇÃo:...

análise de equações estruturais

modelagem de equações estruturais aplicada à reação a...

modelos de equac˘oes estruturais~ versus teoria da...

antecedentes da satisfação no setor público: um estudo de...

barroso luís roberto barroso - interpretação e...

inezita barroso

barroso, luis roberto barroso. curso de direito...

modelação de equações estruturais para avaliar e...

doutorado - iag.puc-rio.br · escalagem multidimensional...

almirante barroso

modelagem de intenÇÃo empreendedora de estudantes ... ·...