slides aula comentários.pdf

Upload: joaquim-manoel

Post on 10-Oct-2015

41 views

Category:

Documents


0 download

TRANSCRIPT

  • 5/20/2018 Slides aula coment rios.pdf

    1/133

    1

    Instrues:

    Caros Alunos, estou disponibilizando os slides e

    informaes importantes sobre a nossadisciplina (vejam os slides 8 e 9). No

    necessrio imprimir estes slides, entretanto

    iremos precisar de computadores (lap tops) emtodos os dias do curso. Desta forma, vcs podem

    acompanhar os slides no prprio computador.

    Iremos precisar tambm de alguns programas

    computacionais que eu irei fornecer e ajudarei

    vcs na instalao durante a disciplina.

    Abraos a todos e at o dia 02/07, Edenir.

  • 5/20/2018 Slides aula coment rios.pdf

    2/133

    Edenir Rodrigues Pereira FilhoProfessor Adjunto

    DQ-UFSCar

    Contatos

    e-mail: [email protected] ou [email protected] page: http://www.ufscar.br/dq-gaia

    Disciplina: Tpicos Especiais -

    Quimiometria

    02/07/12 a 04/07/12

    http://lavoisier.dq.ufscar.br/PPG-Q
  • 5/20/2018 Slides aula coment rios.pdf

    3/133

    3

    EXPERINCIA PROFISSIONAL

    2006... Professor Adjunto (DQ CCET - UFSCar)

    37 cursos degraduao

    So Carlos

    6 cursos degraduao

    Araras Sorocaba

    14 cursos degraduao

    31 cursos de mestrado acadmico, 2 demestrado profissional e 23 de doutorado

  • 5/20/2018 Slides aula coment rios.pdf

    4/133

    4

    EXPERINCIA PROFISSIONAL

    (1) Espectroanlise e Preparo de Amostras e(2) Grupo de Anlise Instrumental Aplicada

    Ana Rita de Arajo Nogueira (Embrapa)Edenir Rodrigues Pereira Filho

    Joaquim de Arajo Nbrega

    25 alunos: mestrandos, doutorandos e de iniciao cientfica

    Home Page: http://www.ufscar.br/dq-gaia

  • 5/20/2018 Slides aula coment rios.pdf

    5/133

    5

    Grupo GAIA

  • 5/20/2018 Slides aula coment rios.pdf

    6/133

    6

    Tpicos

    Planejamento Fatorial: Completo e

    fracionrio.

    Proposio de modelos de regresso com

    planejamento fatorial (Composto central,

    Doehlert, Box-Behnken). Exemplos

  • 5/20/2018 Slides aula coment rios.pdf

    7/1337

    Anlise multivariada:

    Anlise exploratria de dados (Anlise de

    Componentes Principais PCA e Anlise

    Hierrquica de Agrupamentos HCA)

    Construo de modelos de calibrao

    (Regresso por mnimos quadrados parciais

    PLS e Regresso por componentes

    principais PCR)

    Construo de modelos de classificao

    Tpicos

  • 5/20/2018 Slides aula coment rios.pdf

    8/1338

    ProgramaoDia Atividade

    02/07

    (segundafeira)

    Parte da manh:Apresentao da disciplina, tpicos que sero abordados, introduode alguns conceitos bsicos, Anlise de Componentes Principais

    (PCA) e Anlise Hierrquica de Agrupamentos (HCA).

    Parte da tarde:Instalao dos programas computacionais nos computadores dos

    alunos e exemplo com o uso do Pirouette.

    03/07

    (tera feira)

    Parte da manh:Reviso das atividades dadas em sala de aula. Instalao do

    programa computacional Octave, uso das rotinas computacionais e

    apresentao de um exemplo.

    Parte da tarde:

    Exerccios utilizando o Octave.04/07

    (quarta

    feira)

    Parte da manh:Diviso da turma em cerca de 6 grupos onde cada um ter um

    conjunto de dados para aplicar as ferramentas vistas em sala de aula.

    Parte da tarde:Apresentao dos resultados de cada grupo, avaliao e balano final

    das atividades.

  • 5/20/2018 Slides aula coment rios.pdf

    9/1339

    Avaliao

    Ser observado o desempenho

    dos alunos durante o tratamento

    dos dados (atividade do dia

    04/07) e apresentao dos

    resultados.

  • 5/20/2018 Slides aula coment rios.pdf

    10/13310

    Quimiometria

    Extrair o mximo deinformao de um conjunto dedados qumicos

    Disciplina que usa mtodosmatemticos e estatsticospara planejar ou selecionar

    procedimentos timos demedidas e experimentos

  • 5/20/2018 Slides aula coment rios.pdf

    11/13311

    Bibliografia1 Martens, H., Naes, T., Multivariate Calibration,Chichester: John Wiley & Sons, 1989.

    2 Sharaf, M., Illman, D. L., Kowalski, B. R., Chemometrics,New York: John Wiley & Sons, 1986.

    3 Otto, M., Chemometrics, Weinheim: Wiley-VCH, 1999.

    4 Massart, D. L., Vandeginste, B. G. M., Deming, S. M., Michotte, Y.,Kaufman, L., Chemometrics: a textbook, Amsterdam: Elsevier, 1988.

    5 Kramer, R., Chemometric techniques for quantitative analysis,New York: Marcel Dekker, Inc., 1998.

    6 Beebe, K. R., Pell, R. J., Seasholtz, M. B., Chemometrics a practicalguide, New York: John Wiley & Sons, 1998.

    7 Breretron, R. G., Applied chemometrics for scientists,Chichester: John Wiley & Sons, 2007.

  • 5/20/2018 Slides aula coment rios.pdf

    12/13312

    Sobre PCA - artigos

    Geladi, P.; Kowalski, B. R..Anal. Chim. Acta, 1986, 185,1. Wold, S.; Esbensen, K.; Geladi, P.. Chemometr. Intell.

    Lab., 1987, 2, 37. DelValls, T. A.; Forja, J. M.; Gonzles-Mazo, E.; Gmez-

    Parra, A.; Blasco, J.. Trends Anal. Chem., 1998, 14,181.

    Wise, B. M.; Gallagher, N. B.. Crit. Rev. Anal. Chem.,1998, 28, 1.

    Sobre lgebra Linear - livros Boldrini, J. L.; Costa, S. I. R.; Figueiredo, V. L.; Wetzler,

    H. G..lgebra Linear. Editora Harbra Ltda: So Paulo,1986.

    Noble, B.; Daniel, J. W..lgebra Linear Aplicada.Editora Prentice-Hall do Brasil Ltda: Rio de Janeiro,1986.

    Bibliografia

  • 5/20/2018 Slides aula coment rios.pdf

    13/13313

    Revistas especializadas

    Journal of Chemometrics WileyInterScience

    Chemometrics and IntelligentLaboratory Systems (Chemolab)

    Elsevier

    Analytical Chemistry AmericanChemical Society (ACS)

    Analytica Chimica Acta Elsevier

    Applied Spectroscopy Society ofApplied Spectroscopy (SAS)

  • 5/20/2018 Slides aula coment rios.pdf

    14/13314

    Sites interessantes

    http://ull.chemistry.uakron.edu/chemometrics/

    http://www.chemometrics.se/

    http://laqqa.iqm.unicamp.br/

    http://www.models.kvl.dk/

  • 5/20/2018 Slides aula coment rios.pdf

    15/13315

    Programas computacionais

    Octave (Livre)

  • 5/20/2018 Slides aula coment rios.pdf

    16/13316

    Definies de quimiometriaQuimiometria uma cincia relacionada com a compreenso demedidas efetuadas em um sistema ou processo qumico com autilizao de mtodos matemticos ou estatsticos (InternationalChemometrics Society)

    Quimiometria todo o processo onde os dados (tabela de

    dados) so transformados em informaes que so utilizadaspara a tomada de decises (K. R. Beebe)

    Quimiometria uma disciplina qumica que utiliza matemtica,estatstica e lgica para: (a) desenhar ou selecionar condies

    timas de experimentao; (b) fornecer o mximo deinformao relevante pela anlise de dados qumicos; e (c)obter conhecimento sobre um sistema qumico (D. L. Massart)

    Subdisciplinas similares: biometria, psicometria, econometria...

  • 5/20/2018 Slides aula coment rios.pdf

    17/13317

    Processo analtico

    Amostragem

    Preparo da amostra

    Medida analtica

    Anlise do dados

    Obteno de informao til

  • 5/20/2018 Slides aula coment rios.pdf

    18/13318

    Estatstica descritiva

    1 Mdia: o valor onde

    se concentram os dados deuma distribuio

    n

    i

    ijj xnx 1

    1

    2 Mediana: o valor queest no meio de umadistribuio

    3 Moda: o valor quemais se repete em umadistribuio

    4 Desvio padro: Estarelacionado com adisperso dos dados deuma distribuio

    1

    )( 21

    N

    xxSD

    i

    N

    i

  • 5/20/2018 Slides aula coment rios.pdf

    19/13319

    Jundia Mirim river

    4715W

    4700W

    4645W

    4630W

    2300 S

    2315 S

    N

    1013

    Itupeva

    8 e 9

    Jundia Rio Jundia

    Cidades

    Pontos de amostragem

    Rio Tiet

    1,26

    e 7Salto

    Classe 2

    Classe 4

    Classe 3

    Interpretao dos dadosexperimentais - estudo de caso

  • 5/20/2018 Slides aula coment rios.pdf

    20/13320

    Mdia SD Mdia SD

    1 1,70 0,11 13,6 0,9

    2 1,36 0,19 8,67 0,94

    3 1,62 0,15 9,06 0,71

    4 1,53 0,07 9,04 1,22

    5 1,49 0,26 10,1 0,56 1,40 0,22 9,06 0,66

    7 0,84 0,11 9,28 1,22

    8 0,84 0,05 6,93 0,44

    9 0,62 0,04 5,99 0,71

    10 0,08 0,01 6,54 0,4811 0,08 0,01 7,17 0,58

    12 0,09 0,01 8,68 0,31

    13 0,09 0,01 7,68 0,43

    Cd (mg/kg) Pb (mg/kg)

    Concentraes biodisponveis de Cd e Pb em sedimentos (n = 3)

    LocalAmostra

    Ribeiro

    Pira

    RioJu

    ndia

  • 5/20/2018 Slides aula coment rios.pdf

    21/133

    0 2 4 6 8 10 12 140,0

    0,5

    1,0

    1,5

    2,0

    [Cd]m

    g/kg

    Amostras

    Rio JundiaRibeiro Pira

  • 5/20/2018 Slides aula coment rios.pdf

    22/133

    Jundia Pira0,0

    0,5

    1,0

    1,5

    2,0

    [Cd]m

    g/kg

    Conjunto de amostras

    Rio JundiaRibeiro Pira

  • 5/20/2018 Slides aula coment rios.pdf

    23/133

    0 2 4 6 8 10 12 140

    5

    10

    15

    [Pb]

    mg/kg

    Amostras

    Rio JundiaRibeiro Pira

  • 5/20/2018 Slides aula coment rios.pdf

    24/133

    Jundia Pira-2

    0

    2

    4

    6

    8

    10

    12

    14

    16

    [Pb]mg/kg

    Conjunto de amostras

    Rio JundiaRibeiro Pira

  • 5/20/2018 Slides aula coment rios.pdf

    25/133

    25

    Jundia Mirim river

    4715W

    4700W

    4645W

    4630W

    2300 S

    2315 S

    N

    Itupeva

    Jundia Rio Jundia

    Cidades

    Pontos de amostragem

    Rio Tiet

    Salto

    Classe 2

    Classe 4

    Classe 3

    Cd1,27

    mg/kgPb

    9,08

    mg/kg

    Pb

    7,52mg/kg

    Cd

    0,09

    mg/kg

  • 5/20/2018 Slides aula coment rios.pdf

    26/133

    26

    lgebra matricial bsicaMatriz (X): Tabela de dados com uma ou mais linhas e

    uma ou mais colunas (letras em negrito maisculas: X)

    Cd Cu Pb Zn

    1 1,93 6,95 11,2 34,5

    2 2,16 6,52 11,6 32,1

    3 2,02 7,23 10,9 34,2

    4 1,37 13,7 1,90 83,5

    5 1,46 3,91 2,68 73,5

    6 1,43 7,66 2,32 77,5

    7 1,01 10,8 4,81 54,98 1,12 13,6 7,29 52,0

    9 1,08 11,6 5,92 52,5

    10 0,100 11,2 31,3 36,0

    11 0,200 10,9 21,4 36,9

    12 2,40 12,8 36,9 41,9

    Metais (mg/kg)Solo

    X

    12:4

    12 linhas e4 colunas

  • 5/20/2018 Slides aula coment rios.pdf

    27/133

    27

    Cd Cu Pb Zn1 1,93 6,95 11,2 34,5

    2 2,16 6,52 11,6 32,1

    3 2,02 7,23 10,9 34,2

    4 1,37 13,7 1,90 83,5

    5 1,46 3,91 2,68 73,5

    6 1,43 7,66 2,32 77,57 1,01 10,8 4,81 54,9

    8 1,12 13,6 7,29 52,0

    9 1,08 11,6 5,92 52,5

    10 0,100 11,2 31,3 36,0

    11 0,200 10,9 21,4 36,9

    12 2,40 12,8 36,9 41,9

    Solo Metais (mg/kg)

    Objetos: Amostras, compostos qumicos

    Linhas da matriz

    Variveis: Caractersticas medidas das amostras

    (espectros, cromatogramas, propriedades fsicas,concentrao de espcies qumicas...)

    Colunas da matriz

    LinhaAmostra

    ColunaVarivel

  • 5/20/2018 Slides aula coment rios.pdf

    28/133

    28

    Matriz Transposta (X

    ): Troca de linhas por colunas

    1 2 3 4 5 6 7 8 9 10 11 12Cd 1,93 2,16 2,02 1,37 1,46 1,43 1,01 1,12 1,08 0,100 0,200 2,40

    Cu 6,95 6,52 7,23 13,7 3,91 7,66 10,8 13,6 11,6 11,2 10,9 12,8Pb 11,2 11,6 10,9 1,90 2,68 2,32 4,81 7,29 5,92 31,3 21,4 36,9Zn 34,5 32,1 34,2 83,5 73,5 77,5 54,9 52,0 52,5 36,0 36,9 41,9

    SolosMetais (mg/kg)

    X

    4:12

    4 linhas e 12 colunas

    V t ( ) M t i t li h l

  • 5/20/2018 Slides aula coment rios.pdf

    29/133

    29

    Vetor (x): Matriz com somente uma linha ou coluna

    1,461,372,022,161,93x

    1,46

    1,37

    2,02

    2,16

    1,93

    x'

    1 2 3 4 5Cd 1,93 2,16 2,02 1,37 1,46

    Metais (mg/kg) Solos

    i li d d d

  • 5/20/2018 Slides aula coment rios.pdf

    30/133

    30

    Visualizao dos dados

    0 1 2 30

    5

    10

    15

    12

    3

    4

    5

    6

    7

    8

    91011

    12

    Cu(mg/kg)

    Cd (mg/kg)0 1 2 3

    0

    5

    10

    15

    20

    25

    30

    35

    40

    1 23

    456

    7

    89

    10

    11

    12

    Pb(mg/kg)

    Cd (mg/kg)

    0 1 2 30

    15

    30

    45

    60

    75

    90

    123

    4

    56

    789

    101112

    Zn(mg/k

    g)

    Cd (mg/kg)0 1 2 30

    5

    10

    15

    12

    3

    4

    5

    6

    7

    8

    91011

    12

    Pb(mg/k

    g)

    Cu (mg/kg)

    i li d d d

  • 5/20/2018 Slides aula coment rios.pdf

    31/133

    31

    1 2 3 4 5 6 7 8 9 10 11 120

    30

    60

    90

    Concentrao(mg/kg)

    Solo

    Cd CuPb Zn

    Visualizao dos dados

    Vi li d d d

  • 5/20/2018 Slides aula coment rios.pdf

    32/133

    32

    0,84 1,02 1,2 1,38 ... 40,44 40,62 40,8 40,92C1R1 0,002 0,003 0,003 0,003 ... 0,000 0,000 0,000 0,001

    C1R2 0,004 0,005 0,006 0,005 ... 0,001 0,001 0,001 0,001C1R3 0,003 0,004 0,004 0,004 ... 0,001 0,001 0,001 0,000C2R1 0,002 0,003 0,002 0,003 ... 0,000 0,000 0,000 0,001C2R2 0,002 0,003 0,002 0,003 ... 0,000 0,000 0,000 0,000C2R3 0,002 0,003 0,003 0,004 ... 0,001 0,000 0,000 0,000

    Variveis - Espectro de XRF (Energia keV) com n = 224Amostras (n = 6)

    Visualizao dos dadosForma de uma matriz

    Forma de um espectro

    0 6 12 18 24 30 36 42

    0,000

    0,030

    0,060

    0,090

    0,120

    0,150

    0,180

    Contage

    ns/segundos

    Energia (keV)

  • 5/20/2018 Slides aula coment rios.pdf

    33/133

    33

    lgebra matricial bsicaAdio de dois vetores de mesmo tamanho:

    nn ba

    baba

    ba

    .

    .

    .

    22

    11

    Adio de dois vetores de mesmo tamanho comutativa e associativa:

    )()( cbacba

    abba

  • 5/20/2018 Slides aula coment rios.pdf

    34/133

    34

    Multiplicao por um escalar:

    nn ka

    ka

    ka

    a

    a

    a

    kak

    .

    .

    .

    .

    .

    .

    2

    1

    2

    1

    Tamanho de um vetor (ou norma de um vetor):

    222

    21 ... naaaa

  • 5/20/2018 Slides aula coment rios.pdf

    35/133

    35

    Produto escalar de dois vetores coluna:

    iiN

    inn

    n

    n

    T babababa

    b

    b

    b

    aaaba1

    2211

    2

    1

    21 ...

    .

    .

    ....

    Matriz: A(dimenso mxn)

    amnamam

    naaa

    naaa

    A

    ...21

    .

    .

    .

    .

    .

    .

    2...2221

    1...1211

    Multiplicao de Matrizes: A (mxp) e B (pxn) produz

  • 5/20/2018 Slides aula coment rios.pdf

    36/133

    36

    Multiplicao de Matrizes: A(mxp) e B (pxn), produzuma matriz C (mxn)

    )32(

    425

    312

    A

    A

    )43(

    5423

    12311132

    B

    B

    )42(

    27252924

    18161514)33()11()22(

    C

    C

  • 5/20/2018 Slides aula coment rios.pdf

    37/133

    37

    Anlise de dados multivariados

    Definio do problema

    Organizao dos dados

    Validao dos dados

    Visualizao dos dados originais

    Transformao/Pr-processamento

    dos dados

    Anlise exploratria dos dados

  • 5/20/2018 Slides aula coment rios.pdf

    38/133

    38

    Anlise de dados multivariados

    Construo de modelos

    Calibrao/ClassificaoValidao dos modelos

    Previses

  • 5/20/2018 Slides aula coment rios.pdf

    39/133

    39

    Definio do problemaQual ou quais informaes devero ser

    extradas do problema (sistema) em questo?

    Tempo

    Definir oproblema a

    serresolvido

    Tcnicas

    experimentais emtodos

    Escolhacorreta daferramenta

    analtica

    Coleta de

    informaes

    Garantia deque as

    informaesdesejadas

    foramcoletadas

  • 5/20/2018 Slides aula coment rios.pdf

    40/133

    40

    Fatores a serem consideradosOrigem do problema:

    Como os dados foram gerados;Que tcnicas analticas foram utilizadas;

    O nvel de exatido relacionado a cada

    varivel;Quando os dados foram coletados

    J foi efetuada uma anlise anterior;

    Existem informaes anteriores que sejampertinentes;

    ...

  • 5/20/2018 Slides aula coment rios.pdf

    41/133

    41

    Colocar osdados emum nicoarquivo

    Organizao dos dados

    Os dados sode um nicoinstrumento?

    H mais deum

    instrumentoou tipo?

    Qual apreciso dos

    mtodos?

    H dadosfaltantes?

    Complete ouexclua linhasou colunascom dadosfaltantes

  • 5/20/2018 Slides aula coment rios.pdf

    42/133

    42

    Quais dados podem ser estudados?

    Variveis:

    Instrumento multicanal: espectros

    Instrumentao de separao:

    cromatogramasDeterminaes mltiplas de instrumentosespecficos: testes fsicos, qumicos ebiolgicos.

    Resposta de anlise sensorial

    ...

  • 5/20/2018 Slides aula coment rios.pdf

    43/133

    43

    Exemplo 1

    1 2 3 4 5 6 7 8 9 10 11Nmero Ordem ID Creat. Fof. Alc. Asp. Ala. Bil. Bil2 Bil3 Glut. Bilia Hip. Cresol

    1 1 GN 1,07 36,51 14,60 18,00 0,68 0,13 0,55 25,30 7,50 2,02 0,422 2 LMF 1,78 32,85 24,50 21,20 0,78 0,24 0,54 28,70 7,33 0,59 0,12

    3 3 RCN 0,95 57,19 15,00 16,40 0,98 0,40 0,58 24,00 6,03 0,05 0,054 4 GAM 1,94 47,91 21,60 10,20 0,53 0,17 0,36 31,90 4,89 1,02 0,315 5 DM 1,56 31,18 11,00 11,70 0,55 0,22 0,33 16,00 1,80 0,54 0,14... ... ... ... ... ... ... ... ... ... ... ... ... ...

    104 53 OPD 1,57 44,39 21,40 31,60 0,52 0,20 0,32 49,20 17,44 0,15 0,00105 55 MS 0,82 34,83 19,40 36,40 0,41 0,16 0,25 31,70 4,17 0,57 0,00106 56 MAS 1,02 38,06 10,90 15,40 0,56 0,21 0,35 36,80 2,08 0,32 0,00107 57 DB 1,24 25,03 9,40 16,90 0,51 0,17 0,34 31,40 7,55 0,07 0,00108 58 HSC 2,27 54,58 17,40 40,10 0,62 0,19 0,43 52,30 14,84 1,60 0,00

    Identificao

    Investigao de alguns parmetros clnicos em

    funileiros (Matriz: 108 x 11)

  • 5/20/2018 Slides aula coment rios.pdf

    44/133

    44

    Exemplo 1

    Classes: caractersticas dos indivduos

    Nmero Ordem ID Idade Funilaria EPI Tempo lcool Cigarro Ac. Bem.1 1 GN 2 1 1 3 1 0 02 2 LMF 1 1 1 2 3 3 03 3 RCN 0 1 1 0 0 0 1

    4 4 GAM 0 1 1 1 4 3 15 5 DM 1 1 0 2 0 2 0... ... ... ... ... ... ... ... ... ...

    104 53 OPD 2 0 - - 2 0 1105 55 MS 3 0 - - 0 0 1106 56 MAS 3 0 - - 0 0 1107 57 DB 0 0 - - 1 0 1108 58 HSC 2 0 - - 0 0 0

    ClassesIdentificao

  • 5/20/2018 Slides aula coment rios.pdf

    45/133

    45

    Exemplo 1 - ClassesIdade: 20 a 30 = 0; 31 a 40 = 1; 41 a 50 = 2; > 51 = 3

    Funilaria: No = 0; Sim = 1EPI: No = 0; Sim = 1

    Tempo: 1 a 100 meses = 0; 101 a 200 = 1; 201 a 300 = 2;

    301 a 400 = 3 e > 400 = 4

    lcool: 0 a 30 g/dia = 0; 31 a 60 = 1; 61 a 90 = 2; 91 a 120

    = 3 e > 120 = 4

    Cigarro: 0 a 5 cigarros/dia = 0; 6 a 10 = 1; 11 a 15 = 2 e >

    15 = 3

    c. Benzico: No = 0; Sim = 1

    l

  • 5/20/2018 Slides aula coment rios.pdf

    46/133

    46

    Exemplo 2Anlise sensorial de amostras de sucos(Matriz: 120 x 4)

    D S A a

    1 4 0 0 0

    2 3 2 0 0

    ... ... ... ... ...

    23 8 3 6 9

    24 9 4 6 10

    25 0 0 0 0

    26 1 0 8 7

    ... ... ... ... ...

    47 8 2 8 7

    48 9 2 10 8

    49 0 0 0 0

    50 0 0 0 0

    ... ... ... ... ...

    71 9 4 8 5

    72 10 7 10 6

    73 0 0 0 074 2 0 0 0

    ... ... ... ... ...

    95 10 2 6 0

    96 10 2 7 6

    97 0 0 0 0

    98 2 0 0 0

    ... ... ... ... ...

    119 8 0 9 6120 9 3 10 7

    Provadores Classe

    Manga

    Tangerina

    Variveis

    Pssego

    Maracuj

    Laranja

    l 3

  • 5/20/2018 Slides aula coment rios.pdf

    47/133

    47

    Exemplo 3

    4 5 6 7 8 9

    0

    2

    4

    6

    Cu (K)

    Ni (K)

    Fe (K)Cr (K)

    Cr (K)

    V (K)

    C

    ontagens/seg

    undo

    Energia (keV)

    Ti (K)

    Anlise tubos atomizadores metlicos (espectros defluorescncia de raios-X XRF): Matriz: 128 x 501

    Vi li d d d

  • 5/20/2018 Slides aula coment rios.pdf

    48/133

    48

    Visualizao dos dados

    350 400 450 500 550

    0,000

    0,300

    0,600

    0,900

    1,200

    Absorbnc

    ia

    Comprimento de onda (nm)

    Corantes alimentcios de amarelo tartrazina e amarelocrepsculo (matriz: 54 x 1001)

    C l t i i

  • 5/20/2018 Slides aula coment rios.pdf

    49/133

    49

    0,000 0,050 0,100 0,150 0,200 0,250 0,300

    0,000

    0,100

    0,200

    0,300

    0,400

    Absorbncia

    em3

    60nm

    Absorbncia em 350 nm

    y = -0,00111 + 1,406x

    r = 0,9991

    Correlao entre as variveis

    C l t i i

  • 5/20/2018 Slides aula coment rios.pdf

    50/133

    50

    0,000 0,200 0,400 0,600 0,800 1,000

    0,000

    0,300

    0,600

    0,900

    1,200y = -0,0698 + 1,068x

    r = 0,9444

    Absorbncia

    em4

    50nm

    Absorbncia em 400 nm

    Correlao entre as variveis

    Vi li d d d

  • 5/20/2018 Slides aula coment rios.pdf

    51/133

    51

    K Mg Ca Zn Fe Mn1 21531 2620 3709 18 78 127

    2 20646 1818 4357 17 345 127

    3 20298 2131 4243 19 280 98

    4 14476 1291 3144 12 197 72

    5 24311 3117 5599 24 161 706 22519 2712 7500 25 1000 70

    7 6630,9 523,3 3125 9 60 72

    8 29585 3856 6931 62 540 118

    9 9317,7 773,7 1034 7 60 53

    10 8431,8 869,9 3069 10 155 11111 14848 3237 7348 23 175 330

    12 9752,9 2776 9717 21 207 82

    13 11193 2250 9692 14 239 101

    14 19966 1872 3832 17 366 149

    15 13053 2281 4767 22 293 1258

    Metais (mg/kg)

    Chs

    Visualizao dos dadosConcentrao de alguns metais em chs (matriz: 15 x 6)

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    52/133

    52

    Correlao entre as variveis

    5000 10000 15000 20000 25000 30000

    500

    1000

    1500

    2000

    2500

    3000

    3500

    4000

    Mg

    K

    5000 10000 15000 20000 25000 30000

    0

    2000

    4000

    6000

    8000

    10000

    Ca

    K

    500 1000 1500 2000 2500 3000 3500 4000

    0

    2000

    4000

    6000

    8000

    10000

    Ca

    Mg

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    53/133

    53

    Correlao entre as variveis

    5000 10000 15000 20000 25000 30000

    0

    200

    400

    600

    800

    1000

    Fe

    K

    5000 10000 15000 20000 25000 30000

    0

    10

    20

    30

    40

    50

    60

    70

    Zn

    K

    500 1000 1500 2000 2500 3000 3500 4000

    0

    10

    20

    30

    40

    50

    60

    70

    Zn

    Mg

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    54/133

    54

    Correlao entre as variveis

    5000 10000 15000 20000 25000 30000

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Mn

    K

    500 1000 1500 2000 2500 3000 3500 4000

    0

    200

    400

    600

    800

    1000

    Fe

    Mg

    0 2000 4000 6000 8000 10000

    0

    10

    20

    30

    40

    50

    60

    70

    Zn

    Ca

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    55/133

    55

    Correlao entre as variveis

    500 1000 1500 2000 2500 3000 3500 4000

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Mn

    Mg

    0 2000 4000 6000 8000 10000

    0

    200

    400

    600

    800

    1000

    Fe

    Ca

    0 2000 4000 6000 8000 10000

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Mn

    Ca

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    56/133

    56

    Correlao entre as variveis

    0 10 20 30 40 50 60 70

    0

    200

    400

    600

    800

    1000

    Fe

    Zn

    0 10 20 30 40 50 60 70

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Mn

    Zn

    0 200 400 600 800 1000

    0

    200

    400

    600

    800

    1000

    1200

    1400

    Mn

    Fe

    Correlao entre as variveis

  • 5/20/2018 Slides aula coment rios.pdf

    57/133

    57

    Mg 0,6995

    Ca 0,1480 0,6925Zn 0,7270 0,7920 0,4209Fe 0,5370 0,4106 0,3855 0,4893Mn -0,1166 0,1211 0,0016 0,0767 0,0006

    K Mg Ca Zn Fe

    Correlao entre as variveis

    5000 10000 15000 20000 25000 300000

    10

    20

    30

    40

    50

    60

    70

    K (mg/kg)

    Zn(mg/kg

    )

    Pr tratamento dos dados

  • 5/20/2018 Slides aula coment rios.pdf

    58/133

    58

    Pr-tratamento dos dadosRemoo de fontes de variao indesejveis: utilizarecursos matemticos

    Transformao

    Aplicado s amostras(linhas da matriz X)

    Pr-processamentoAplicado s variveis(colunas da matriz X)

    Transformao dos dados

    Sinal Analtico = Sinal Verdadeiro + Rudo aleatrio

    Transformao dos dados

  • 5/20/2018 Slides aula coment rios.pdf

    59/133

    59

    Transformao dos dados

    Aplicao de tcnicas matemticas s amostras visando a

    remoo de variaes aleatrias ou sistemticasindesejveis que podem informaes relevantes.

    Variaes aleatrias(rudo experimental)

    Tratadas por meio detcnicas de alisamento

    (smoothing)

    Variaes sistemticasReduzidas ou eliminadaspor meio de correes

    da linha de base

    Tcnicas de alisamento

  • 5/20/2018 Slides aula coment rios.pdf

    60/133

    60

    Tcnicas de alisamentoAumentar a razo sinal-rudo;

    Utilizam uma janela;Todos os pontos da janela so usados para determinara resposta no centro da mesma;

    Esta janela percorre todo o espectro.

    1 Alisamento pela mdia

    Utilizado para diminuir o nmero de variveis (J).

    Seleciona-se uma janela de abertura = n+1, com n par.Calcula-se a mdia das respostas, que ser a primeiravarivel do espectro alisado. O comprimento de ondaser igual ao do centro da janela.

    1 Alisamento pela mdia

  • 5/20/2018 Slides aula coment rios.pdf

    61/133

    61

    p

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    Matriz 1 x 3420

    1 2 3 4 5 6 7 8 9 10 110,000 0,017 0,033 0,050 0,067 0,083 0,100 0,117 0,133 0,150 0,1670,001 -0,001 -0,003 -0,001 0,010 -0,003 0,000 -0,003 0,002 -0,004 -0,001

    Alisamento com uma janela de abertura

    de n + 1 = 11 (onde n = 10)

    1 Alisamento pela mdia

  • 5/20/2018 Slides aula coment rios.pdf

    62/133

    62

    p

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    Original

    Matriz 1 x 3420

    Janela n + 1 = 11

    Matriz 1 x 311

    Janela n + 1 = 31

    Matriz 1 x 110

    Janela n + 1 = 61

    Matriz 1 x 56

    2 Alisamento pela mdia mvel

  • 5/20/2018 Slides aula coment rios.pdf

    63/133

    63

    p

    A janela movimentada de elemento em elemento. Osdados so alisados contm basicamente o mesmo

    nmero de variveis que o original.

    1 2 3 ... 58 59 60 61 62 63Tempo 0,000 0,017 0,033 ... 0,950 0,967 0,984 1,000 1,017 1,034

    Abs 0,001 -0,001 -0,003 ... 0,001 0,000 -0,001 -0,003 0,003 -0,003

    1 a 602 a 61

    3 a 624 a 63

    0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)0 10 20 30 40 50 60

    0,000

    0,040

    0,080

    0,120

    Absorbncia

    Tempo (s)

    Original

    Matriz 1 x 3420

    Alisado

    Matriz 1 x 3420

    Correes da linha de base

  • 5/20/2018 Slides aula coment rios.pdf

    64/133

    64

    Correes da linha de base

    Espectro noinfravermelho

    Primeira derivada

    400 1000 1600 2200 2800 3400 40000,560

    0,600

    0,640

    0,680

    Absorbncia

    Nmero de onda (cm)

    400 1000 1600 2200 2800 3400 4000-0,0008

    -0,0004

    0,0000

    0,0004

    0,0008

    Primeirade

    rivada

    Nmero de onda (cm)

    Pr-processamento C l

  • 5/20/2018 Slides aula coment rios.pdf

    65/133

    65

    Pr processamento

    Linhas

    Colunas

    Dias antes Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.do vencimento (mg/100g)(mg/100g) % % % % %

    M1 papel 21 a 90 dias 298 7,3 6,86 1,07 10,78 0,32 80,96

    M2 papel > 91 dias 258 9,3 6,34 1,06 11,36 0,37 80,86M3 papel 21 a 90 dias 339 10,9 6,42 0,97 11,16 0,31 81,13M4 papel 21 a 90 dias 272 8,7 6,43 0,83 9,72 0,27 82,74M5 papel 21 a 90 dias 307 9,3 6,60 0,73 11,64 0,29 80,73M6 papel > 91 dias 340 6,6 6,65 2,50 11,69 0,47 78,69M7 papel 21 a 90 dias 289 8,4 6,70 2,58 11,95 0,68 78,08M8 papel > 91 dias 488 7,1 6,77 3,08 11,95 0,75 77,45M9 papel 21 a 90 dias 306 7,7 6,77 2,81 11,87 0,64 77,91M10 papel > 91 dias 322 7,0 6,60 3,23 11,71 0,80 77,65M11 papel < 20 dias 285 8,3 6,16 2,50 11,72 0,53 79,78

    M12 papel < 20 dias 325 7,5 6,16 2,58 11,71 0,42 80,27M13 papel > 91 dias 313 9,1 6,78 3,08 12,20 0,43 78,63M14 papel 21 a 90 dias 317 7,6 6,95 2,81 11,81 0,41 79,25M15 papel > 91 dias 398 8,3 6,69 3,23 12,16 0,35 82,16T1 plastico < 20 dias 183 7,6 10,35 1,21 12,94 0,63 74,28T2 Papel < 20 dias 176 7,1 9,92 1,17 12,99 0,61 75,31T3 Papel < 20 dias 206 7,2 10,27 1,29 13,22 0,59 74,64T4 Papel < 20 dias 75 4,4 10,27 1,49 12,58 0,62 75,04T5 Papel < 20 dias 118 6,8 10,32 1,43 13,23 0,62 74,39T6 Papel < 20 dias 207 8,8 10,86 1,21 11,05 0,59 76,29T7 Papel < 20 dias 189 7,6 10,25 1,17 11,69 0,66 76,22T8 Papel 21 a 90 dias 223 8,0 10,25 1,29 12,54 0,43 75,49T9 Papel < 20 dias 180 7,1 10,44 1,18 12,46 0,59 75,33T10 Papel < 20 dias 174 8,7 10,39 1,17 12,34 0,61 75,49T11 Papel < 20 dias 107 6,3 11,38 1,49 12,72 0,55 73,86T12 Papel < 20 dias 97 5,6 10,45 1,48 12,66 0,55 74,85T13 Papel 21 a 90 dias 152 7,4 10,53 1,45 12,57 0,60 74,85T14 Papel 21 a 90 dias 141 7,8 10,09 1,58 11,82 0,64 75,87T15 Papel 21 a 90 dias 140 8,7 10,49 1,15 12,65 0,51 75,20

    Amostras

    Classes VariveisID Emb.

    Visualizao dos dados

  • 5/20/2018 Slides aula coment rios.pdf

    66/133

    66

    Visualizao dos dados

    M2 M4 M6 M8 M10 M12 M14 T1 T3 T5 T7 T9 T11 T13 T15

    0

    250

    500

    Valores

    Amostras

    AFFe

    Prot.Lip.Um.Cin.Carb.

    Questes

  • 5/20/2018 Slides aula coment rios.pdf

    67/133

    67

    Questes

    Como todas as variveis se comportam?

    O que mais influencia determinada amostra?

    O que caracteriza um determinado grupo de amostras?

    ?4 6 8 10 12

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0,8

    0,9

    M1

    M2

    M3M4

    M5

    M6

    M7

    M8

    M9

    M10

    M11

    M12 M13M14

    M15

    T1T2T3

    T4 T5T6

    T7

    T8

    T9 T10

    T11T12

    T13T14

    T15Cinzas

    Fe

    Dados originais

  • 5/20/2018 Slides aula coment rios.pdf

    68/133

    68

    Dados originais

    AF Fe Prot. Lip. Um. Cin. Carb.

    0

    100

    200

    300

    400

    500

    Valoressemp

    r-p

    rocessamento

    Variveis

    Mdia

    Mediana

    Mdia + SD

    Mdia - SD

    95% dos dados

    > valor

    < valor

    95% dos dados

    Dados centrados na mdia

  • 5/20/2018 Slides aula coment rios.pdf

    69/133

    69

    Dados centrados na mdia

    AF Fe Prot. Lip. Um. Cin. Carb.-200

    -100

    0

    100

    200

    300

    Valo

    rescentradosnamdia

    Variveis

    Dados autoescalados

  • 5/20/2018 Slides aula coment rios.pdf

    70/133

    70

    Dados autoescalados

    AF Fe Prot. Lip. Um. Cin. Carb.-4

    -3

    -2

    -1

    0

    1

    2

    3

    Valoresautoe

    scalados

    Variveis

    Tipos de pr-processamento

  • 5/20/2018 Slides aula coment rios.pdf

    71/133

    71

    Tipos de pr processamentoCentrado na mdiaaplicado em

    espectros

    n

    i

    ijj xn

    x1

    1

    jijcmij

    xxx )(

    Mdia da varivel j ( )jx

    Varivel j centrada na mdia ( ))(cmijx

    Dados centrados na mdia

  • 5/20/2018 Slides aula coment rios.pdf

    72/133

    72

    Dados centrados na mdia

    350 400 450 500 550

    0,000

    0,200

    0,400

    0,600

    0,800

    1,000Amarelo Tartrazina

    Abs

    Comprimento de onda (nm)

    350 400 450 500 550-0,600

    -0,300

    0,000

    0,300

    0,600

    Valorescentradosnamdia

    Comprimento de onda (nm)

    Espectros (Vis) de Amarelo Tartrazina (Corante alimentcio)

    Espectros originais Espectros centrado na mdia

    Exemplo centrados na mdia

  • 5/20/2018 Slides aula coment rios.pdf

    73/133

    73

    Exemplo centrados na mdia

    400 401 402 403 404 405

    AmT1 0,139 0,139 0,140 0,141 0,142 0,144AmT2 0,236 0,237 0,238 0,241 0,243 0,245AmT3 0,352 0,354 0,357 0,360 0,364 0,367AmT4 0,481 0,485 0,488 0,493 0,498 0,503AmT5 0,603 0,608 0,613 0,619 0,625 0,630

    Mdia 0,362 0,365 0,367 0,371 0,374 0,378

    400 401 402 403 404 405AmT1 -0,223 -0,225 -0,228 -0,230 -0,232 -0,234

    AmT2 -0,126 -0,127 -0,129 -0,130 -0,131 -0,132AmT3 -0,010 -0,010 -0,011 -0,011 -0,011 -0,011AmT4 0,119 0,120 0,121 0,123 0,124 0,125AmT5 0,241 0,243 0,246 0,248 0,250 0,252Mdia 0,000 0,000 0,000 0,000 0,000 0,000

    Dados originais

    Dados centrados na mdia

    Tipos de pr-processamento

  • 5/20/2018 Slides aula coment rios.pdf

    74/133

    74

    Autoescalamentoaplicado quando se quer

    dar a mesma importncia a todas as variveis(dados de concentrao)

    Tipos de pr processamento

    n

    i

    jijj xxn

    s1

    22 )(1

    1

    Varincia da varivel j ( )2

    js

    Dados autoescalados

  • 5/20/2018 Slides aula coment rios.pdf

    75/133

    75

    Dados autoescalados

    2

    jj ss

    Desvio padro da varivel j ( )

    j

    jij

    asijsxxx )(

    js

    Varivel j autoescalada ( ))(asijx

    Exemplo autoescalados

  • 5/20/2018 Slides aula coment rios.pdf

    76/133

    76

    Exemplo autoescalados

    Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.

    (m

    g/100g) (mg/100g) % % % % %

    Am1 298 7,3 6,86 1,07 10,8 0,32 81,0Am2 258 9,3 6,34 1,06 11,4 0,37 80,9Am3 339 10,9 6,42 0,97 11,2 0,31 81,1Am4 272 8,7 6,43 0,83 9,7 0,27 82,7Am5 307 9,3 6,60 0,73 11,6 0,29 80,7Mdia 294 9,1 6,53 0,93 10,9 0,31 81,3

    Varincia 1001 1,7 0,04 0,02 0,6 0,00 0,7Desvio padro 31,6 1,3 0,21 0,15 0,7 0,04 0,8

    Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.Am1 0,10 -1,38 1,59 0,93 -0,20 0,16 -0,39Am2 -1,17 0,15 -0,93 0,86 0,57 1,56 -0,51

    Am3 1,40 1,41 -0,52 0,26 0,31 -0,02 -0,19Am4 -0,72 -0,31 -0,48 -0,69 -1,63 -1,09 1,76Am5 0,39 0,12 0,34 -1,36 0,95 -0,60 -0,67Mdia 0,00 0,00 0,00 0,00 0,00 0,00 0,00

    Varincia 1,00 1,00 1,00 1,00 1,00 1,00 1,00Desvio padro 1,00 1,00 1,00 1,00 1,00 1,00 1,00

    Dados originais

    Dados autoescalados

    Pr-processamento - Detalhes

  • 5/20/2018 Slides aula coment rios.pdf

    77/133

    77

    Pr processamento Detalhes

    Escolha do pr-tratamento dos dados: essencial

    para o xito de qualquer anlise.

    Deteco de amostras anmalas (outliers): Estes

    pr-tratamentos permitem a identificao de amostrasoutliers.

    Modelos de calibrao: Centrar os dados na mdia

    Medidas de espectroscopia: Possuem alta correlao

    entre as variveis (centradas na mdia).

    Reflexes

  • 5/20/2018 Slides aula coment rios.pdf

    78/133

    78

    Que tipo de pr-processamento deve ser aplicado

    em espectros de massa?

    Que tipo de pr-processamento deve ser aplicado

    para dados cromatogrficos obtidos com uma arranjo

    de diodos?

    Anlise exploratria dos dados

  • 5/20/2018 Slides aula coment rios.pdf

    79/133

    79

    Anlise exploratria dos dados

    Permite extrair o mximo de informao de um

    conjunto de dados.

    Tcnicas:

    Anlise de Componentes Principais

    (PCA, Principal Component Analysis)

    Anlise de Agrupamentos Hierrquicos

    (HCA, Hierarchical Cluster Analysis)

    PCA

  • 5/20/2018 Slides aula coment rios.pdf

    80/133

    80

    PCAA Anlise de Componentes Principais

    uma ferramenta quimiomtrica quereduz as dimenses originais de umdeterminado conjunto de dadosnumricos.

    Fundamentao da PCA

  • 5/20/2018 Slides aula coment rios.pdf

    81/133

    81

    Varivel 1

    Varivel 2

    PC1

    PC2 PC3

    Componentes Principais (PC)

  • 5/20/2018 Slides aula coment rios.pdf

    82/133

    82

    Componentes Principais (PC)

    Os novos eixos (PC) so ortogonais

    entre si (completamente nocorrelacionados)

    So construdos em ordemdecrescente da quantidade devarincia que descrevem (primeirofator descreve maior varincia nos

    dados que o segundo...)

    Determinao da dimensionalidadeintrnseca do conjunto de dados

    Componentes Principais (PC)

  • 5/20/2018 Slides aula coment rios.pdf

    83/133

    83

    Co po e es c pa s ( C)

    PC: Nmero menor que as

    variveis originais (Reduo devariveis)

    Direo que melhor explica osdados: 1PC

    Base da PCA: Calcular autovalorese autovetores de uma matriz de

    varincia-covarincia

    Posto de matriz, autovalores e

  • 5/20/2018 Slides aula coment rios.pdf

    84/133

    84

    autovetoresPosto de uma matriz

    Nmero de linhas ou colunas linearmenteindependentes.

    Autovalores e Autovetores Clculo de sub-sistemas muito menores para

    dados que apresentam muitas variveis(dimenses)

    A = x Autovetor

    AutovalorVarincia e Covarincia

  • 5/20/2018 Slides aula coment rios.pdf

    85/133

    85

    AF Fe AF Fe

    297,7 7,3 0,6 -0,4257,5 9,3 0,2 1,3

    338,7 10,9 1,0 2,6

    271,6 8,7 0,3 0,8

    306,7 9,3 0,7 1,2

    ... ... ... ...

    107,5 6,3 -1,4 -1,2

    97,0 5,6 -1,5 -1,7

    151,7 7,4 -0,9 -0,3

    141,2 7,8 -1,0 0,0139,9 8,7 -1,0 0,8

    Mdia 241 8 0 0

    SD 98 1 1 1

    Variveis Auto. Varincia (s2):

    Espalhamento dos dados aoredor do seu valor mdiopara uma nica varivel

    Covarincia (Cov):Distribuio dos dados

    multivariados e suasrelaes

    onde

    1

    2

    2

    n

    xds )( xxxd i

    1

    )()(

    n

    FexxAFxxCOV

    ii

    Clculos

  • 5/20/2018 Slides aula coment rios.pdf

    86/133

    86

    AF Fe AF Fe

    297,7 7,3 0,6 -0,4 0,6 -0,4 -0,2257,5 9,3 0,2 1,3 0,2 1,3 0,2338,7 10,9 1,0 2,6 1,0 2,6 2,6271,6 8,7 0,3 0,8 0,3 0,8 0,2306,7 9,3 0,7 1,2 0,7 1,2 0,8

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    107,5 6,3 -1,4 -1,2 -1,4 -1,2 1,697,0 5,6 -1,5 -1,7 -1,5 -1,7 2,5

    151,7 7,4 -0,9 -0,3 -0,9 -0,3 0,3141,2 7,8 -1,0 0,0 -1,0 0,0 -0,1139,9 8,7 -1,0 0,8 -1,0 0,8 -0,8

    Mdia 241 8 0 0 Soma 11,8SD 98 1 1 1

    1 1

    Variveis Auto.

    Varincia (s2)

    AFxxi Fexxi ))(( FexxAFxx ii

    Matriz varincia e covarincia

  • 5/20/2018 Slides aula coment rios.pdf

    87/133

    87

    COV = 11,829 = 0,4

    AF Fe

    AF 1,0 0,4Fe 0,4 1,0COVAFFe

    Matriz varincia e covarincia

  • 5/20/2018 Slides aula coment rios.pdf

    88/133

    88

    0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0

    0,2

    0,4

    0,6

    0,8

    1,0

    1,2

    1,4

    S2

    Fe

    S2AF

    Graficamente

    Cov AFFe

    Cov FeAF

    Matriz varincia e covarincia

  • 5/20/2018 Slides aula coment rios.pdf

    89/133

    89

    0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0

    0,2

    0,4

    0,6

    0,8

    1,0

    1,2

    1,4S2

    Fe

    S2AF

    Projeo de umaelipse

    eAutovalores

  • 5/20/2018 Slides aula coment rios.pdf

    90/133

    90

    0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0

    0,2

    0,4

    0,6

    0,8

    1,0

    1,2

    1,4S2

    Fe

    S2AF

    PC1

    PC2 Autovalorda PC1Autovalor

    da PC2

    Autovetores

  • 5/20/2018 Slides aula coment rios.pdf

    91/133

    91

    0,0 0,2 0,4 0,6 0,8 1,00,0

    0,2

    0,4

    0,6

    0,8

    1,0

    0,86

    0,92

    Sen = 0,921,26

    = 0,73

    Cos =0,86

    1,26= 0,68

    Sen = 0,68Cos = -0,73

    PC2

    PC1

    Varincia explicada

  • 5/20/2018 Slides aula coment rios.pdf

    92/133

    92

    1,26

    0,

    65

    PC2

    PC1

    Varincia PC1 =1,26

    1,26 + 0,65x 100 = 66%

    Varincia PC2 =0,65

    1,26 + 0,65x 100 = 34%

    Matriz de Scores

  • 5/20/2018 Slides aula coment rios.pdf

    93/133

    93

    PC1 = 0,68AFi+ 0,73Fei

    PC2 = -0,73AFi+ 0,68Fei

    PC1 = Cos AFi+ Sen Fei

    PC2 = Cos AFi+ Sen Fei

    AF Fe PC1 PC20,6 -0,4 0,1 -0,7

    0,2 1,3 1,0 0,7

    1,0 2,6 2,6 1,0

    0,3 0,8 0,8 0,30,7 1,2 1,4 0,4

    ...

    ...

    ...

    ...

    -1,4 -1,2 -1,8 0,2

    -1,5 -1,7 -2,3 -0,1-0,9 -0,3 -0,8 0,5

    -1,0 0,0 -0,7 0,8

    -1,0 0,8 -0,1 1,3

    ScoresAuto.

    Matriz de Loadings (Pesos)

  • 5/20/2018 Slides aula coment rios.pdf

    94/133

    94

    PC1 PC2

    AF 0,68 0,73Fe -0,73 0,68

    Matriz de Scores: 30 linhas(amostras) e 2 colunas (PC1 ePC2)

    Matriz de Loadings: 2 linhas(variveis AF e Fe) e 2 colunas(PC1 e PC2)

    Visualizao dos dados - Scores

  • 5/20/2018 Slides aula coment rios.pdf

    95/133

    95

    -4 -3 -2 -1 0 1 2 3-2,5

    -2,0

    -1,5

    -1,0-0,5

    0,0

    0,5

    1,0

    1,5

    M1

    M2

    M3

    M4 M5

    M6

    M7

    M8

    M9

    M10

    M11

    M12

    M13

    M14M15

    T1T2

    T3

    T4

    T5

    T6

    T7 T8T9

    T10

    T11

    T12

    T13T14

    T15Scores

    PC2(3

    4%)

    PC1 (66%)

    Visualizao dos dados - Loadings

  • 5/20/2018 Slides aula coment rios.pdf

    96/133

    96

    -0,80 -0,60 -0,40 -0,20 0,00 0,20 0,40 0,60 0,800,67

    0,68

    0,69

    0,70

    0,71

    0,72

    0,73

    0,74

    AF

    Fe

    Loadings

    PC2(34%)

    PC1 (66%)

    Scores e Loadings

  • 5/20/2018 Slides aula coment rios.pdf

    97/133

    97

    -4 -3 -2 -1 0 1 2 3-2,5

    -2,0

    -1,5

    -1,0

    -0,5

    0,0

    0,5

    1,0

    1,5

    M1

    M2

    M3

    M4M5

    M6

    M7

    M8

    M9

    M10

    M11

    M12

    M13

    M14

    M15

    T1

    T2

    T3

    T4

    T5

    T6

    T7 T8T9

    T10

    T11

    T12

    T13

    T14

    T15Scores

    PC2(3

    4%)

    PC1 (66%)

    -0,80 -0,40 0,00 0,40 0,800,67

    0,68

    0,69

    0,70

    0,71

    0,72

    0,73

    0,74

    AF

    Fe

    Loadings

    PC2

    (34%)

    PC1 (66%)

    g

    Dados originaisID AF Fe

  • 5/20/2018 Slides aula coment rios.pdf

    98/133

    98

    ID AF Fe

    M1 298 7,3

    M2 258 9,3

    M3 339 10,9

    M4 272 8,7

    M5 307 9,3M6 340 6,6

    M7 289 8,4

    M8 488 7,1

    M9 306 7,7

    M10 322 7,0

    M11 285 8,3

    M12 325 7,5

    M13 313 9,1

    M14 317 7,6

    M15 398 8,3

    T1 183 7,6

    T2 176 7,1

    T3 206 7,2

    T4 75 4,4

    T5 118 6,8

    T6 207 8,8

    T7 189 7,6T8 223 8,0

    T9 180 7,1

    T10 174 8,7

    T11 107 6,3

    T12 97 5,6

    T13 152 7,4

    T14 141 7,8

    T15 140 8,7

    Amostras

    -4 -3 -2 -1 0 1 2 3-2,5

    -2,0

    -1,5

    -1,0

    -0,5

    0,0

    0,5

    1,0

    1,5

    M1

    M2

    M3

    M4M5

    M6

    M7

    M8

    M9

    M10

    M11

    M12

    M13

    M14

    M15

    T1

    T2

    T3

    T4

    T5

    T6

    T7 T8T9

    T10

    T11

    T12

    T13

    T14

    T15Scores

    PC2(34%)

    PC1 (66%)

    AF

    Fe

    > AF

    < AF

    Representao

  • 5/20/2018 Slides aula coment rios.pdf

    99/133

    99

    X

    N

    K

    t = scoresp = loadings

    p1 p2

    = t1 + t2 + ... E

    ETPX

    Clculo dosscorese loadingsviaSVD

  • 5/20/2018 Slides aula coment rios.pdf

    100/133

    100

    SVD

    SVD = Singular Value Decomposition

    Decomposio de valores singulares

    X VTSU= xx

    V= Loadings

    UxS= Scores

    Exemplo numrico (SVD)

  • 5/20/2018 Slides aula coment rios.pdf

    101/133

    101

    400 401 402 403 404 405

    AmT1 0,139 0,139 0,140 0,141 0,142 0,144AmT2 0,236 0,237 0,238 0,241 0,243 0,245AmT3 0,352 0,354 0,357 0,360 0,364 0,367AmT4 0,481 0,485 0,488 0,493 0,498 0,503AmT5 0,603 0,608 0,613 0,619 0,625 0,630

    Mdia 0,362 0,365 0,367 0,371 0,374 0,378

    400 401 402 403 404 405AmT1 -0,223 -0,225 -0,228 -0,230 -0,232 -0,234AmT2 -0,126 -0,127 -0,129 -0,130 -0,131 -0,132AmT3 -0,010 -0,010 -0,011 -0,011 -0,011 -0,011AmT4 0,119 0,120 0,121 0,123 0,124 0,125AmT5 0,241 0,243 0,246 0,248 0,250 0,252Mdia 0,000 0,000 0,000 0,000 0,000 0,000

    Matriz X (Espectros de 400 a 405 nm)

    Matriz X centrada na mdia

    Matrizes U, S e VU

  • 5/20/2018 Slides aula coment rios.pdf

    102/133

    102

    UxS= Scores0,601 0,011 -0,410 0,521 0,447

    0,340 -0,131 0,805 -0,141 0,447

    0,028 -0,234 -0,429 -0,749 0,447

    -0,320 0,835 0,020 -0,017 0,447

    -0,648 -0,481 0,015 0,385 0,447

    U

    0,933 0,000 0,000 0,000 0,000

    0,000 0,001 0,000 0,000 0,0000,000 0,000 0,001 0,000 0,000

    0,000 0,000 0,000 0,000 0,000

    0,000 0,000 0,000 0,000 0,000

    S

    -0,398 -0,085 0,185 -0,263 0,771

    -0,403 0,285 0,315 0,247 -0,463

    -0,406 -0,506 -0,690 0,271 -0,080

    -0,410 -0,280 0,502 0,456 0,050

    -0,415 -0,168 0,065 -0,764 -0,403

    -0,418 0,741 -0,367 0,060 0,139

    V (transposta)

    Scores (UxS)

  • 5/20/2018 Slides aula coment rios.pdf

    103/133

    103

    A PC1 contm 100% da informao original

    As demais PCs contm rudos

    0,560 0,000 0,000 0,000 0,000

    0,317 0,000 0,001 0,000 0,000

    0,026 0,000 0,000 0,000 0,000

    -0,298 0,001 0,000 0,000 0,000

    -0,605 0,000 0,000 0,000 0,000Varincia 0,217 0,000 0,000 0,000 0,000

    Total 0,217

    99,9998 0,000 0,000 0,000 0,000

    Scores (UxS)

    Reconstrundo a matriz X

  • 5/20/2018 Slides aula coment rios.pdf

    104/133

    104

    0,601 0,000 0,000 0,000 0,000

    0,340 0,000 0,000 0,000 0,000

    0,028 0,000 0,000 0,000 0,000-0,320 0,000 0,000 0,000 0,000

    -0,648 0,000 0,000 0,000 0,000

    0,933 0,000 0,000 0,000 0,000

    0,000 0,000 0,000 0,000 0,0000,000 0,000 0,000 0,000 0,000

    0,000 0,000 0,000 0,000 0,000

    0,000 0,000 0,000 0,000 0,000

    -0,398 0,000 0,000 0,000 0,000-0,403 0,000 0,000 0,000 0,000

    -0,406 0,000 0,000 0,000 0,000

    -0,410 0,000 0,000 0,000 0,000

    -0,415 0,000 0,000 0,000 0,000

    -0,418 0,000 0,000 0,000 0,000

    S

    V (transposta)

    U

    Reconstrundo a matriz X

  • 5/20/2018 Slides aula coment rios.pdf

    105/133

    105

    -0,223 -0,225 -0,228 -0,230 -0,232 -0,234-0,126 -0,127 -0,129 -0,130 -0,131 -0,132-0,010 -0,010 -0,011 -0,011 -0,011 -0,0110,119 0,120 0,121 0,123 0,124 0,1250,240 0,243 0,246 0,248 0,250 0,253

    0,139 0,139 0,139 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,245

    0,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,607 0,613 0,619 0,625 0,630

    Matriz X centrada na mdia - Reconstruda

    Matriz X - Reconstruda

    Reconstrundo a matriz XMatriz X Original

  • 5/20/2018 Slides aula coment rios.pdf

    106/133

    106

    0,139 0,139 0,140 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,245

    0,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,608 0,613 0,619 0,625 0,630

    Matriz X - Original

    0,139 0,139 0,139 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,2450,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,607 0,613 0,619 0,625 0,630

    Matriz X - Reconstruda

    -0,000027 -0,000020 -0,000105 -0,000045 0,000006 0,000014-0,000042 -0,000012 0,000074 0,000008 -0,000016 -0,0000070,000011 -0,000038 -0,000072 0,000024 0,000005 -0,0000120,000166 0,000080 0,000174 -0,000031 -0,000117 -0,000132-0,000108 -0,000010 -0,000072 0,000045 0,000122 0,000137

    Matriz de erros

    Escolha do nmero decomponentes principais

  • 5/20/2018 Slides aula coment rios.pdf

    107/133

    107

    componentes principaisEspectros (Vis) de Amarelo Tartrazina e Amarelo

    Crepsculo (Corantes alimentcios)

    350 400 450 500 550

    0,000

    0,200

    0,400

    0,600

    0,800

    1,000

    1,200

    Comprimento de onda (nm)

    Abs

    Matriz: 54 linhas e1001 variveis

    (350 a 550 nm)

    Escolha do nmero decomponentes principais

  • 5/20/2018 Slides aula coment rios.pdf

    108/133

    108

    componentes principais

    PC1 = 81,5%PC2 = 18,4%Demais PC < 0,1%

    PC1 + PC2 100%

    PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10

    0

    30

    60

    90

    V

    arinciaexplicada(%)

    PC

    Anlise Hierrquica de Agrupamentos

  • 5/20/2018 Slides aula coment rios.pdf

    109/133

    109

    HCA: Hierarchical Cluster Analysis

    Agrupa dados comcaractersticas semelhantes

    em agrupamentos

    Objetivos

    Amostras prximas

    (pequenas distncias) so

    semelhantes

    Medidas de distncia e SimilaridadeDi i b d

  • 5/20/2018 Slides aula coment rios.pdf

    110/133

    110

    Distncia entre a e b: dab

    Mm

    j

    M

    bjajab xxd

    1

    1

    )(

    Distncia Euclideana

    Similaridade

    max

    1d

    ds abab

    AgrupamentosO bj t t d d d i il id d

  • 5/20/2018 Slides aula coment rios.pdf

    111/133

    111

    Os objetos so conectados por ordem de similaridade.

    importante definir a distncia de um objeto a um

    grupo ou entre grupos

    Tipos de conexes:

    -Conexo simples

    -Conexo completa

    -Conexo por meio de medianas

    -Conexo por meio de centrides

    -Conexo incremental-Conexo por meio de mdias de grupo

    -Conexo flexvel

    Exemplos de conexes

  • 5/20/2018 Slides aula coment rios.pdf

    112/133

    112

    Conexo simples

    Conexocompleta

    Conexo

    centride

    Formao do dendograma

  • 5/20/2018 Slides aula coment rios.pdf

    113/133

    113

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    114/133

    114

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    115/133

    115

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    116/133

    116

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    117/133

    117

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    118/133

    118

    1

    2

    3

    6

    5

    4

    7

  • 5/20/2018 Slides aula coment rios.pdf

    119/133

    119

    1

    2

    3

    6

    5

    4

    7

    Dendograma

  • 5/20/2018 Slides aula coment rios.pdf

    120/133

    120

    4

    5

    6

    2

    3

    1

    7 MaiorSimilaridade

    MenorSimilaridade

    MenorDistncia

    MaiorDistncia

  • 5/20/2018 Slides aula coment rios.pdf

    121/133

    121

    Exemplos de

    aplicao deHCA

    f C

  • 5/20/2018 Slides aula coment rios.pdf

    122/133

    122

    Artigo cientfico: Caractersticas desedimentos provenientes do Rio Betari no

    Parque Estadual Turstico do Alto Ribeira -Petar

    rea deestudo

  • 5/20/2018 Slides aula coment rios.pdf

    123/133

    123

    estudo

    Pontos de

    coleta(1 a 6)

    Os dadosP t H C O U T M O N T K P A Sil A P d

    Variveis

  • 5/20/2018 Slides aula coment rios.pdf

    124/133

    124

    Pontos pH C. O. Um. T. M. O. N. T. K. P Arg. Sil. Are. Ped.1 6,99 5,65 20 2,99 0,60 1,33 0,0 11,5 66,5 122 6,02 2,78 22 4,34 0,30 0,84 2,0 9,0 70,0 133 7,30 8,07 33 3,88 0,30 0,80 2,5 52,5 45,0 0

    4 6,21 21,27 34 6,04 0,75 1,17 4,0 20,0 76,0 05 6,21 3,14 39 6,74 0,45 0,71 6,0 22,5 42,5 116 6,94 34,77 14 5,05 0,45 1,19 4,0 64,0 24,0 1

    Pontos Agreg. CTC e. Zn pT. Cu pT. Cr pT. Mn pT. Fe pT. Ni pT. Cd pT. Pb pT.1 10 19,0 5497 104 64 2785 53841 41,31 10 75702 6 9,9 1412 133 37 1206 48231 31,98 2 18243 0 7,5 417 27 29 449 23591 0,00 0 2054 0 12,4 1033 95 43 421 33778 27,32 0 117

    5 18 2,9 330 109 30 1160 54725 28,00 0 1166 7 10,6 640 48 35 731 32325 24,66 0 636

    Pontos Al pT. Zn bD. Cu bD. Mn bD. Fe bD. Ni bD. Cd bD. Pb bD. Al bD.1 7990 5247 9 356 479 0,00 4,50 5281 9272 14090 802 7 205 864 1,83 1,25 556 6413 13788 180 5 286 538 0,00 0,00 101 5014 25723 69 17 301 2587 3,08 0,00 43 10345 25223 15 4 178 559 0,00 0,00 22 7266 18262 516 15 624 827 4,41 0,00 371 752

    6 pontos e 29 variveis (Tabela de dados)

    6 linhas e 29 colunas (Matriz de dados)

    Nmero de PCs

  • 5/20/2018 Slides aula coment rios.pdf

    125/133

    125

    PC1 PC2 PC3 PC4 PC50

    10

    20

    30

    40

    50

    V

    arinciaexplicad

    a(%)

    PC

    3 PCs so mais

    que suficientes!!!Por qu???

  • 5/20/2018 Slides aula coment rios.pdf

    126/133

    126

    -5 -4 -3 -2 -1 0 1 2 3-2

    -1

    0

    1

    2

    3

    1 2 3

    4

    5

    6

    PC2

    PC1

    -0,3 0,0 0,3

    -0,4

    -0,2

    0,0

    0,2

    0,4

    pH

    C. O.

    Um.

    T. M. O.

    N. T. K.

    P

    Arg.

    Sil.

    Are.

    Ped.

    Agreg.

    CTC e.

    Zn pT.

    Cu pT.

    Cr pT.

    Mn pT.

    Fe pT.

    Ni pT.

    Cd pT.

    Pb pT.

    Al pT.

    Zn bD.

    Cu bD.Mn bD.

    Fe bD.

    Ni bD.

    Cd bD.

    Pb bD.

    Al bD.

    PC2

    PC1

    Scores Loadings

  • 5/20/2018 Slides aula coment rios.pdf

    127/133

    127

    Scores Loadings

    -5 -4 -3 -2 -1 0 1 2 3

    -2

    -1

    0

    1

    1

    2 3

    4

    5

    6

    PC3

    PC1

    -0,3 0,0 0,3

    -0,4

    -0,3

    -0,2

    -0,1

    0,0

    0,1

    0,2

    0,3

    0,4

    pH

    C. O.Um.

    T. M. O.

    N. T. K.

    PArg.

    Sil.

    Are.

    Ped. Agreg.CTC e.

    Zn pT.

    Cu pT.

    Cr pT.

    Mn pT.

    Fe pT.

    Ni pT.

    Cd pT.Pb pT.

    Al pT.

    Zn bD.

    Cu bD.

    Mn bD.

    Fe bD.

    Ni bD.

    Cd bD.Pb bD.

    Al bD.

    PC3

    PC1

  • 5/20/2018 Slides aula coment rios.pdf

    128/133

    128

    Scores Loadings

    -2 -1 0 1 2 3-1,0

    -0,5

    0,0

    0,5

    1,0

    1

    23

    4

    5

    6

    PC3

    PC2-0,4 -0,2 0,0 0,2 0,4

    -0,4

    -0,3

    -0,2

    -0,1

    0,0

    0,1

    0,2

    0,3

    0,4

    pH

    C. O.Um.

    T. M. O.

    N. T. K.

    PArg.

    Sil.

    Are.

    Ped.Agreg.

    CTC e.

    Zn pT.

    Cu pT.

    Cr pT.

    Mn pT.

    Fe pT.

    Ni pT.

    Cd pT.Pb pT.

    Al pT.

    Zn bD.

    Cu bD.

    Mn bD.

    Fe bD.

    Ni bD.

    Cd bD.Pb bD.

    Al bD.

    PC3

    PC2

    Dendograma (Amostras)6

  • 5/20/2018 Slides aula coment rios.pdf

    129/133

    129

    3

    4

    5

    2

    1

    Dendograma (Variveis)

  • 5/20/2018 Slides aula coment rios.pdf

    130/133

    130

    Artigo cientfico: Caractersticas de amostras

  • 5/20/2018 Slides aula coment rios.pdf

    131/133

    131

    Artigo cientfico: Caractersticas de amostrasde chs com fluorescncia de raios-X

    Dendograma (Amostras)Verde

  • 5/20/2018 Slides aula coment rios.pdf

    132/133

    132

    Maa com canela

    Maa com canela

    Maa vermelha

    Lima limo

    Hortel

    Melissa com flor de laranjeira

    Morango

    BoldoBoldo

    Preto

    Camomila

    Cidreira

    Cidreira

    Cidreira

    Dendograma (Variveis)Mn

  • 5/20/2018 Slides aula coment rios.pdf

    133/133

    Fe

    Ca

    Zn

    Mg