sme0822 análise multivariada · programa - 1a parte organização de dados e análise descritiva...

66
SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25

Upload: truongkiet

Post on 28-Nov-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

SME0822Análise Multivariada2o semestre de 2016

Prof. Cibele [email protected]://www.icmc.usp.br/~cibele

Sala 3-113

2. semestre 2016 1 / 25

Principais objetivos do curso

Estudar e desenvolvermétodos estatísticos paradescrever e analisardados multivariados

2. semestre 2016 2 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Programa - 1a parte

Organização de dados e análise descritiva

Vetores aleatórios e álgebra de matrizes

Média e matriz de covariâncias amostrais

Distribuições multivariadas discretas e contínuas.

Inferências sobre um vetor de médias

Análise de variância multivariada

Regressão linear multivariada

2. semestre 2016 3 / 25

Dados multivariados - Exemplo

Fonte: Barroso, L. P. e Artes, R. Análise Multivariada. 2005.Disponível emhttp://www.ime.usp.br/~lbarroso/Livro.pdf.

2. semestre 2016 4 / 25

Programa - 2a parte

Análise de componentes principais

Análise fatorial

Análise de correlação canônica

Análise de agrupamentos

Análise discriminante

2. semestre 2016 5 / 25

Programa - 2a parte

Análise de componentes principais

Análise fatorial

Análise de correlação canônica

Análise de agrupamentos

Análise discriminante

2. semestre 2016 5 / 25

Programa - 2a parte

Análise de componentes principais

Análise fatorial

Análise de correlação canônica

Análise de agrupamentos

Análise discriminante

2. semestre 2016 5 / 25

Programa - 2a parte

Análise de componentes principais

Análise fatorial

Análise de correlação canônica

Análise de agrupamentos

Análise discriminante

2. semestre 2016 5 / 25

Programa - 2a parte

Análise de componentes principais

Análise fatorial

Análise de correlação canônica

Análise de agrupamentos

Análise discriminante

2. semestre 2016 5 / 25

Programa - 2a parte

Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através

de combinações lineares

2 Redução da dimensão dos dados de p variáveis para kcomponentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados

3 Interpretações

2. semestre 2016 6 / 25

Programa - 2a parte

Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através

de combinações lineares2 Redução da dimensão dos dados de p variáveis para k

componentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados

3 Interpretações

2. semestre 2016 6 / 25

Programa - 2a parte

Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através

de combinações lineares2 Redução da dimensão dos dados de p variáveis para k

componentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados

3 Interpretações

2. semestre 2016 6 / 25

Programa - 2a parte

Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que

meçam aspectos comuns dos dados

2 Com várias motivações na psicologia e psicometria, surgiuinicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)

3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes

principais

2. semestre 2016 7 / 25

Programa - 2a parte

Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que

meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu

inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)

3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes

principais

2. semestre 2016 7 / 25

Programa - 2a parte

Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que

meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu

inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)

3 Identificação do número de fatores

4 Interpretações5 Pode ser considerada uma extensão da análise de componentes

principais

2. semestre 2016 7 / 25

Programa - 2a parte

Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que

meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu

inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)

3 Identificação do número de fatores4 Interpretações

5 Pode ser considerada uma extensão da análise de componentesprincipais

2. semestre 2016 7 / 25

Programa - 2a parte

Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que

meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu

inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)

3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes

principais

2. semestre 2016 7 / 25

Programa - 2a parte

Análise de correlação canônica1 Identificar e quantificar associações entre dois conjuntos de dados

2 Resumir as informações de cada conjunto de dados de modo amaximizar a correlação existente entre ambos

2. semestre 2016 8 / 25

Programa - 2a parte

Análise de correlação canônica1 Identificar e quantificar associações entre dois conjuntos de dados2 Resumir as informações de cada conjunto de dados de modo a

maximizar a correlação existente entre ambos

2. semestre 2016 8 / 25

Programa - 2a parte

Análise de agrupamentos1 Análise de conglomerados ou análise de cluster

2 Dividir os elementos da amostra de forma a ter grupos deelementos similares entre si em relação às variáveis observadas

2. semestre 2016 9 / 25

Programa - 2a parte

Análise de agrupamentos1 Análise de conglomerados ou análise de cluster2 Dividir os elementos da amostra de forma a ter grupos de

elementos similares entre si em relação às variáveis observadas

2. semestre 2016 9 / 25

Programa - 2a parte

Análise de agrupamentos - ExemploDeseja-se agrupar 11 idiomas de acordo com a sua similaridade paraa primeira letra dos numerais de 1 a 10.

Fonte: Johnson e Wichern (2007)

2. semestre 2016 10 / 25

Programa - 2a parte

Análise de agrupamentos - Exemplo

2. semestre 2016 11 / 25

Programa - 2a parte

Análise discriminante

1 Diferenciar populações

2 Classificar objetos em populações pré-definidas

2. semestre 2016 12 / 25

Programa - 2a parte

Análise discriminante

1 Diferenciar populações2 Classificar objetos em populações pré-definidas

2. semestre 2016 12 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Algumas áreas de aplicação de Análise Multivariada

Psicologia

Marketing

Biologia

Esportes

Economia

Controle de Qualidade

2. semestre 2016 13 / 25

Bibliografia principal

Johnson, R. A. and Wichern, D. W. (2007)Applied Multivariate Statistical Analysis.5th edition. Prentice-Hall

Mingoti, S. A. (2005). Análise de DadosAtravés de Métodos de Estatística Multi-variada: Uma Abordagem Aplicada. BeloHorizonte: UFMG

2. semestre 2016 14 / 25

Bibliografia complementar

Mardia, K. V., Kent, J. T. and Bibby, J. M. (1979). MultivariateAnalysis. Academic Press.

Hair, J. F., Tatham, R. L., Anderson, R. E. and Black, W. (1998).Multivariate Data Analysis, 5th edition, Prentice Hall.

Morrison, D. F. (1967). Multivariate Statistical Methods.McGraw-Hill.

Greenacre, M. J. (1984). Theory and Applications ofCorrespondence Analysis. London: Academic Press.

2. semestre 2016 15 / 25

Critério de Avaliação

Sejamp1: Provinha 1;P1: Prova 1;p2: Provinha 2;P2: Prova 2.

A média do semestre MS será calculada como

MS =2 (0, 4 p1 + 0, 6 P1) + 3 (0, 4 p2 + 0, 6 P2)

5

Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.

2. semestre 2016 16 / 25

Critério de Avaliação

Sejamp1: Provinha 1;P1: Prova 1;p2: Provinha 2;P2: Prova 2.

A média do semestre MS será calculada como

MS =2 (0, 4 p1 + 0, 6 P1) + 3 (0, 4 p2 + 0, 6 P2)

5

Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.

2. semestre 2016 16 / 25

Critério de Avaliação

Sejamp1: Provinha 1;P1: Prova 1;p2: Provinha 2;P2: Prova 2.

A média do semestre MS será calculada como

MS =2 (0, 4 p1 + 0, 6 P1) + 3 (0, 4 p2 + 0, 6 P2)

5

Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.

2. semestre 2016 16 / 25

Critério de Recuperação (REC)

O aluno poderá fazer a prova REC se, e somente se,

3 <= MS < 5

Nota da REC: NR

Nova média após a REC: MF

MF =

5, se 5 <= NR <= (10−MS); ou(MS + NR)/2 se NR > (10−MS); ouMS se NR < 5

2. semestre 2016 17 / 25

Datas importantes

Datas importantes12/09 - Provinha 126/09 - Prova 124/10 - Provinha 228/11 - Prova 2

Prova Substitutiva: 05/12/16(somente para quem perder uma das provas, com justificativaoficial).

Prova de Recuperação: a combinar.

2. semestre 2016 18 / 25

Horários

Aulas: Segundas-feiras das 19h às 20h40 e terças-feiras das 21hàs 22h40.

Atendimento docente: Mediante agendamento por [email protected]. Mencionar o código da disciplina no assuntoSME0822.

Material de apoio: Tidia Aprendizado eletrônico 4.0http://ae4.tidia-ae.usp.br/.

2. semestre 2016 19 / 25

Apoio computacional

2. semestre 2016 20 / 25

Algumas regras

A USP exige no mínimo 70% de presença nas aulas

A docente poderá fazer a chamada em qualquer instante dohorário da aula, mesmo se os alunos já tiverem assinado a listade presença, e eventuais ausências não serão abonadas

Questionamentos a respeito da matéria poderão ser feitos aqualquer momento

Conversas paralelas sobre outros assuntos não serão toleradas -os outros alunos têm direito a assistir a aula em silêncio

2. semestre 2016 21 / 25

Algumas regras

A USP exige no mínimo 70% de presença nas aulas

A docente poderá fazer a chamada em qualquer instante dohorário da aula, mesmo se os alunos já tiverem assinado a listade presença, e eventuais ausências não serão abonadas

Questionamentos a respeito da matéria poderão ser feitos aqualquer momento

Conversas paralelas sobre outros assuntos não serão toleradas -os outros alunos têm direito a assistir a aula em silêncio

2. semestre 2016 21 / 25

Algumas regras

A USP exige no mínimo 70% de presença nas aulas

A docente poderá fazer a chamada em qualquer instante dohorário da aula, mesmo se os alunos já tiverem assinado a listade presença, e eventuais ausências não serão abonadas

Questionamentos a respeito da matéria poderão ser feitos aqualquer momento

Conversas paralelas sobre outros assuntos não serão toleradas -os outros alunos têm direito a assistir a aula em silêncio

2. semestre 2016 21 / 25

Algumas regras

A USP exige no mínimo 70% de presença nas aulas

A docente poderá fazer a chamada em qualquer instante dohorário da aula, mesmo se os alunos já tiverem assinado a listade presença, e eventuais ausências não serão abonadas

Questionamentos a respeito da matéria poderão ser feitos aqualquer momento

Conversas paralelas sobre outros assuntos não serão toleradas -os outros alunos têm direito a assistir a aula em silêncio

2. semestre 2016 21 / 25

Algumas regras

Os alunos devem desligar seus telefones celulares durante a aula

Não é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticas

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822

Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/

2. semestre 2016 22 / 25

Algumas regras

Os alunos devem desligar seus telefones celulares durante a aula

Não é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticas

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822

Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/

2. semestre 2016 22 / 25

Algumas regras

Os alunos devem desligar seus telefones celulares durante a aula

Não é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticas

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822

Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/

2. semestre 2016 22 / 25

Algumas regras

Os alunos devem desligar seus telefones celulares durante a aula

Não é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticas

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822

Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/

2. semestre 2016 22 / 25

Algumas regras - Sobre provas

Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a prova (para provinhas, uma páginasomente)

Será permitido o uso de calculadora própria

Fraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)

Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar

2. semestre 2016 23 / 25

Algumas regras - Sobre provas

Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a prova (para provinhas, uma páginasomente)

Será permitido o uso de calculadora própria

Fraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)

Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar

2. semestre 2016 23 / 25

Algumas regras - Sobre provas

Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a prova (para provinhas, uma páginasomente)

Será permitido o uso de calculadora própria

Fraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)

Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar

2. semestre 2016 23 / 25

Algumas regras - Sobre provas

Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a prova (para provinhas, uma páginasomente)

Será permitido o uso de calculadora própria

Fraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)

Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar

2. semestre 2016 23 / 25

Importante: E-mail

E-mail é um canal oficial de comunicação da docente com osalunos.

Checar e-mail cadastrado no JupiterWeb regularmente (pelomenos uma vez ao dia).

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822.

É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.

2. semestre 2016 24 / 25

Importante: E-mail

E-mail é um canal oficial de comunicação da docente com osalunos.

Checar e-mail cadastrado no JupiterWeb regularmente (pelomenos uma vez ao dia).

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822.

É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.

2. semestre 2016 24 / 25

Importante: E-mail

E-mail é um canal oficial de comunicação da docente com osalunos.

Checar e-mail cadastrado no JupiterWeb regularmente (pelomenos uma vez ao dia).

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822.

É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.

2. semestre 2016 24 / 25

Importante: E-mail

E-mail é um canal oficial de comunicação da docente com osalunos.

Checar e-mail cadastrado no JupiterWeb regularmente (pelomenos uma vez ao dia).

Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822.

É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.

2. semestre 2016 24 / 25

Orientações de estudo

Manter frequência de estudo do início ao final do semestre. Oideal é estudar o conteúdo de cada aula logo após ter sidoministrada, isso facilita o entendimento das aulas seguintes ediminui a quantidade de conteúdos para os dias anteriores àprova.

Estudar primeiramente o conteúdo dado em aula, buscando apoioem referências bibliográficas, em seguida resolver exemplos eexercícios. Não deixar para a véspera da prova.

Buscar referências bibliográficas logo no início do semestre,dando preferência às referências principais e complementaresadotadas.

2. semestre 2016 25 / 25

Orientações de estudo

Manter frequência de estudo do início ao final do semestre. Oideal é estudar o conteúdo de cada aula logo após ter sidoministrada, isso facilita o entendimento das aulas seguintes ediminui a quantidade de conteúdos para os dias anteriores àprova.

Estudar primeiramente o conteúdo dado em aula, buscando apoioem referências bibliográficas, em seguida resolver exemplos eexercícios. Não deixar para a véspera da prova.

Buscar referências bibliográficas logo no início do semestre,dando preferência às referências principais e complementaresadotadas.

2. semestre 2016 25 / 25

Orientações de estudo

Manter frequência de estudo do início ao final do semestre. Oideal é estudar o conteúdo de cada aula logo após ter sidoministrada, isso facilita o entendimento das aulas seguintes ediminui a quantidade de conteúdos para os dias anteriores àprova.

Estudar primeiramente o conteúdo dado em aula, buscando apoioem referências bibliográficas, em seguida resolver exemplos eexercícios. Não deixar para a véspera da prova.

Buscar referências bibliográficas logo no início do semestre,dando preferência às referências principais e complementaresadotadas.

2. semestre 2016 25 / 25