de ni˘c~oes · de ni˘c~oes vetor de m edias matriz de covari^ancias matriz de correla˘c~oes...
TRANSCRIPT
Definicoes
Definicoes
Patrıcia de Siqueira Ramos
UNIFAL-MG, campus Varginha
20 de Setembro de 2018
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Definicoes
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
a) Vetor aleatorio
• X e um vetor com p componentes, em que cada componente e umavariavel aleatoria (v.a.)
• Xi e uma v.a. ∀i = 1, 2, . . . , p
• Cada variavel pode ser analisada separadamente (pelocomportamento da sua distribuicao de probabilidade), mas e melhoranalisar o vetor como um todo (pode ser que haja relacionamentosentre as p variaveis)
X =
X1
X2...Xp
=[X1 X2 . . . Xp
]T.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
a) Vetor aleatorio
Ex.: Empresa de minerio de ferro. Variaveis: X1: teor de ferro, X2: teorde umidade, X3: granulometria.
X =[X1 X2 X3
]Te um vetor aleatorio com p = 3.
Ex.: Pesquisa de mercado, amostra de um novo produto para n pessoasque darao notas de 1 a 7 para cada atributo.X1: nota para a cor da embalagemX2: nota para o saborX3: nota para precoX4: nota para facilidade de compra
X =[X1 X2 X3 X4
]Te um vetor aleatorio com p = 4.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
a) Vetor aleatorio
Ex.: Empresa de minerio de ferro. Variaveis: X1: teor de ferro, X2: teorde umidade, X3: granulometria.
X =[X1 X2 X3
]Te um vetor aleatorio com p = 3.
Ex.: Pesquisa de mercado, amostra de um novo produto para n pessoasque darao notas de 1 a 7 para cada atributo.X1: nota para a cor da embalagemX2: nota para o saborX3: nota para precoX4: nota para facilidade de compra
X =[X1 X2 X3 X4
]Te um vetor aleatorio com p = 4.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
a) Vetor aleatorio
Ex.: Empresa de minerio de ferro. Variaveis: X1: teor de ferro, X2: teorde umidade, X3: granulometria.
X =[X1 X2 X3
]Te um vetor aleatorio com p = 3.
Ex.: Pesquisa de mercado, amostra de um novo produto para n pessoasque darao notas de 1 a 7 para cada atributo.X1: nota para a cor da embalagemX2: nota para o saborX3: nota para precoX4: nota para facilidade de compra
X =[X1 X2 X3 X4
]Te um vetor aleatorio com p = 4.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
a) Vetor aleatorio
Ex.: Empresa de minerio de ferro. Variaveis: X1: teor de ferro, X2: teorde umidade, X3: granulometria.
X =[X1 X2 X3
]Te um vetor aleatorio com p = 3.
Ex.: Pesquisa de mercado, amostra de um novo produto para n pessoasque darao notas de 1 a 7 para cada atributo.X1: nota para a cor da embalagemX2: nota para o saborX3: nota para precoX4: nota para facilidade de compra
X =[X1 X2 X3 X4
]Te um vetor aleatorio com p = 4.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
b) Vetor de medias
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
b) Vetor de medias
• O vetor µ = E (X ) e chamado vetor de medias do vetor X.
µ = E (X) =
E (X1)E (X2)
...E (Xp)
=
µ1
µ2...µp
• µi = E (Xi ) e a esperanca da variavel Xi
• A media µi e uma das medidas mais utilizadas para sintetizar ainformacao de tendencia central da distribuicao de valores da variavelXi
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
c) Matriz de covariancias
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
c) Matriz de covariancias
• A matriz de covariancias do vetor aleatorio X e uma matriz simetricadada por
Σp×p =
σ11 σ12 . . . σ1p
σ21 σ22 . . . σ2p...
.... . .
...σp1 σp2 . . . σpp
,• em que a diagonal e composta pelas variancias e os outros elementos
sao as covariancias entre as variaveis.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Variancia
• A variancia do i-esimo componente de X e
V (Xi ) = E [(Xi − µi )2] = σ2i = σii
• O desvio padrao e σi ou√σii
• O desvio padrao informa a dispersao dos valores da v.a. Xi emrelacao a µi (estao proximos ou distantes de µi )
• Grandes valores de σi indicam maior dispersao de valores em relacaoa media da distribuicao
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
A covariancia entre os valores da i -esima e j-esimavariaveis do vetor aleatorio X e
Cov(Xi ,Xj) = E [(Xi − µi)(Xj − µj)] = σij .
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
• Quando i = j , Cov(Xi ,Xi ) = V (Xi )
• A covariancia mede o grau de relacionamento linear entre duasvariaveis
• Se valores de Xi acima da media µi estiverem associados a valores Xj
acima da media µj , σij tende a ser positiva (e o mesmo para valoresabaixo da media para Xi e Xj)
• Se valores de Xi acima da media µi estiverem associados a valores Xj
abaixo da media µj , ou vice-versa, σij tende a ser negativa
• Covariancia tem informacao sobre o relacionamento linear entre duasvariaveis, mas e difıcil julgar se a relacao e forte ou nao apenas peloseu valor (correlacao e mais util para isso)
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
• Quando i = j , Cov(Xi ,Xi ) = V (Xi )
• A covariancia mede o grau de relacionamento linear entre duasvariaveis
• Se valores de Xi acima da media µi estiverem associados a valores Xj
acima da media µj , σij tende a ser positiva (e o mesmo para valoresabaixo da media para Xi e Xj)
• Se valores de Xi acima da media µi estiverem associados a valores Xj
abaixo da media µj , ou vice-versa, σij tende a ser negativa
• Covariancia tem informacao sobre o relacionamento linear entre duasvariaveis, mas e difıcil julgar se a relacao e forte ou nao apenas peloseu valor (correlacao e mais util para isso)
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
• Quando i = j , Cov(Xi ,Xi ) = V (Xi )
• A covariancia mede o grau de relacionamento linear entre duasvariaveis
• Se valores de Xi acima da media µi estiverem associados a valores Xj
acima da media µj , σij tende a ser positiva (e o mesmo para valoresabaixo da media para Xi e Xj)
• Se valores de Xi acima da media µi estiverem associados a valores Xj
abaixo da media µj , ou vice-versa, σij tende a ser negativa
• Covariancia tem informacao sobre o relacionamento linear entre duasvariaveis, mas e difıcil julgar se a relacao e forte ou nao apenas peloseu valor (correlacao e mais util para isso)
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
• Em formato matricial
Cov(X) = E (X− µ)(X− µ)T =
=
E (X1 − µ1)2 . . . E (X1 − µ1)(Xp − µp)
E (X2 − µ2)(X1 − µ1) . . . E (X2 − µ2)(Xp − µp)...
......
E (Xp − µp)(X1 − µ1) . . . E (Xp − µp)2
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
Forma equivalente da covariancia:
Cov(Xi ,Xj) = E (XiXj)− E (Xi )E (Xj) = E (XiXj)− µiµj .
Matricialmente
Cov(X) = E (XXT )− µµT
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
Forma equivalente da covariancia:
Cov(Xi ,Xj) = E (XiXj)− E (Xi )E (Xj) = E (XiXj)− µiµj .
Matricialmente
Cov(X) = E (XXT )− µµT
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Covariancia
Se Xi e Xj sao independentes, Cov(Xi ,Xj) = 0 (mas o inverso nao everdadeiro):
• Xi e Xj independentes, E (Xi · Xj) = E (Xi )E (Xj)
• Como Cov(Xi ,Xj) = E [(Xi − µi )(Xj − µj)],
Cov(Xi ,Xj) =E (XiXj − Xiµj − Xjµi + µiµj)
= . . .
=E (Xi )E (Xj)− µiµj = 0
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
d) Matriz de correlacoes
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Correlacao
O coeficiente de correlacao entre as i-esima e j-esima variaveis do vetor Xe definido por
ρij =σij√σiiσjj
.
• Medida de covariacao entre as variaveis em uma escala padronizada
• −1 ≤ ρij ≤ 1, i , j = 1, 2, . . . , p. (a covariancia possui domınio ]−∞,+∞ [ )
• Na escala padronizada, um valor muito proximo de 1 ou −1 indicaque as variaveis estao fortemente associadas
• Quando i = j , ρij = ρii = 1
• Se ρij = 0, as variaveis nao possuem associacao linear
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Correlacao
O coeficiente de correlacao entre as i-esima e j-esima variaveis do vetor Xe definido por
ρij =σij√σiiσjj
.
• Medida de covariacao entre as variaveis em uma escala padronizada
• −1 ≤ ρij ≤ 1, i , j = 1, 2, . . . , p. (a covariancia possui domınio ]−∞,+∞ [ )
• Na escala padronizada, um valor muito proximo de 1 ou −1 indicaque as variaveis estao fortemente associadas
• Quando i = j , ρij = ρii = 1
• Se ρij = 0, as variaveis nao possuem associacao linear
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Matriz de correlacoes
A matriz de correlacoes do vetor aleatorio X e uma matriz simetrica dadapor
ρp×p =
1 ρ12 . . . ρ1p
ρ21 1 . . . ρ2p...
.... . .
...ρp1 ρp2 . . . 1
* Exemplo
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Matriz de correlacoes
Matricialmente, se tomarmos V = diag(Σ) = diag(σii ) e definirmosV−1/2 = diag(1/
√σii ), teremos
ρ = V−1/2ΣV−1/2 =
1 ρ12 . . . ρ1p
ρ21 1 . . . ρ2p...
.... . .
...ρp1 ρp2 . . . 1
* Exemplo
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
e) Outras variancias
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
e) Outras variancias
• A matriz de covariancias Σ(p × p) de um vetor aleatorio Xpossui p(p + 1)/2 parametros referentes a
• p variancias e
• p(p − 1)/2 covariancias
• Se p for grande, o numero de parametros pode ser muito grande
• E interessante usar medidas resumo tais como determinante,traco ou o conjunto de autovalores de Σ
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
e) Outras variancias
• A matriz de covariancias Σ(p × p) de um vetor aleatorio Xpossui p(p + 1)/2 parametros referentes a
• p variancias e
• p(p − 1)/2 covariancias
• Se p for grande, o numero de parametros pode ser muito grande
• E interessante usar medidas resumo tais como determinante,traco ou o conjunto de autovalores de Σ
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Variancia total
A variancia total do vetor aleatorio X e definida como
Variancia total = traco(Σ) = tr(Σ) = σ11 + σ22 + · · ·+ σpp.
• Forma de sintetizar a variancia global da distribuicao multivariada porser a soma das variancias de todas as variaveis do vetor X
• Altos valores de variancias totais indicam maior dispersao global dasvariaveis Xi , i = 1, 2, . . . , p.
Obs.: tr(Σ) = tr(Λ) = λ1 + · · ·+ λp (soma dos autovalores).
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Variancia total
A variancia total do vetor aleatorio X e definida como
Variancia total = traco(Σ) = tr(Σ) = σ11 + σ22 + · · ·+ σpp.
• Forma de sintetizar a variancia global da distribuicao multivariada porser a soma das variancias de todas as variaveis do vetor X
• Altos valores de variancias totais indicam maior dispersao global dasvariaveis Xi , i = 1, 2, . . . , p.
Obs.: tr(Σ) = tr(Λ) = λ1 + · · ·+ λp (soma dos autovalores).
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Variancia generalizada
A variancia generalizada do vetor aleatorio X e definida como odeterminante da matriz Σ, ou seja,
Variancia generalizada = |Σ|Desvio padrao generalizado = |Σ|1/2
• Tambem fornece uma nocao da dispersao global da distribuicaomultivariada
• Altos valores de variancias generalizadas tambem indicam maiordispersao global das variaveis
• Mas, ao contrario da variancia total, a variancia generalizada einfluenciada pelas covariancias (ou correlacoes) entre as variancias(ver Ferreira(2008) para explicacao geometrica detalhada)
* Exemplo
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Variancia generalizada
A variancia generalizada do vetor aleatorio X e definida como odeterminante da matriz Σ, ou seja,
Variancia generalizada = |Σ|Desvio padrao generalizado = |Σ|1/2
• Tambem fornece uma nocao da dispersao global da distribuicaomultivariada
• Altos valores de variancias generalizadas tambem indicam maiordispersao global das variaveis
• Mas, ao contrario da variancia total, a variancia generalizada einfluenciada pelas covariancias (ou correlacoes) entre as variancias(ver Ferreira(2008) para explicacao geometrica detalhada)
* ExemploPatrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
f) Combinacoes lineares
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Combinacoes lineares
• Seja X um vetor aleatorio, composto por p variaveis, com vetor demedias µ e matriz de covariancias Σ.
• Seja ap×1 um vetor de escalares (conhecidos), isto e,
a =[a1 a2 . . . ap
]T
• Seja Z a variavel definida por
Z = aTX = a1X1 + a2X2 + . . . apXp.
• Entao, Z e uma v.a. e uma combinacao linear das variaveispertencentes a X.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Combinacoes lineares
• Seja X um vetor aleatorio, composto por p variaveis, com vetor demedias µ e matriz de covariancias Σ.
• Seja ap×1 um vetor de escalares (conhecidos), isto e,
a =[a1 a2 . . . ap
]T• Seja Z a variavel definida por
Z = aTX = a1X1 + a2X2 + . . . apXp.
• Entao, Z e uma v.a. e uma combinacao linear das variaveispertencentes a X.
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes
Definicoes
Vetor de mediasMatriz de covarianciasMatriz de correlacoesOutras variancias
Combinacoes lineares
• A media (esperanca matematica) de Z e dada por
µZ = E (Z ) = a1µ1 + a2µ2 + · · ·+ apµp,
em que µi = E (Xi ).
• A variancia de Z e dada por
σ2Z = aTΣa =
p∑i=1
a2i σ
2i +
∑i 6=j
aiajσij .
Patrıcia de Siqueira Ramos Analise multivariada - Definicoes