anÁlise de medidas repetidas no tempojaguar.fcav.unesp.br/euclides/al_2011/s_mrt/sem_mrtf.doc ·...

27
ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO USANDO O SAS Euclides Braga MALHEIROS * Medidas repetidas no tempo ou espaço: medidas tomadas em uma seqüência de tempos ou espaços, em uma mesma unidade experimental. Os experimentos com medidas repetidas no tempo envolvem geralmente, além de possíveis fatores de controle local, 2 fatores: tratamentos e tempos, e são freqüentes em experimentos com animais, plantas, humanos, etc. O objetivo principal desse tipo de experimento é examinar e comparar as tendências dos tratamentos ao longo do tempo. Isto pode envolver comparações entre tratamentos dentro de cada tempo, ou comparações de tempos dentro de cada tratamento. Exemplo1: Cinco variedades de uma cultura (tratamentos), com 3 repetições, avaliadas ao longo do tempo (0, 30, 60, 90, 120 e 150 dias), em um experimento Inteiramente Casualizado. Os dados observados são apresentados na Tabela 1. Tabela 1. Dados de açúcar na cana, (pol%), obtidos em um DIC com 5 variedades de cana, 3 repetições, observados em 6 tempos de desenvolvimento da cultura. Variedades Rep. Tempo em dias 0 30 60 90 120 150 V1 1 11,82 14,86 13,84 15,53 15,49 15,82 2 12,07 14,44 13,92 15,47 16,34 18,64 3 12,45 14,18 13,76 14,35 15,93 16,52 V2 1 12,47 15,19 15,02 15,54 18,53 15,76 2 11,07 13,38 14,61 14,07 17,84 16,91 3 10,66 14,22 13,54 15,93 15,94 16,81 V3 1 12,92 14,49 13,40 13,68 16,26 14,78 2 10,29 14,42 14,62 15,84 16,29 15,62 3 12,83 13,92 15,69 15,12 14,91 17,22 V4 1 11,96 14,71 14,98 15,25 16,21 15,53 * Departamento de Ciências Exatas – FCAV/UNESP, Campus de Jaboticabal. 14870-000 Jaboticabal SP

Upload: votram

Post on 15-Dec-2018

219 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO USANDO O SAS

Euclides Braga MALHEIROS*

Medidas repetidas no tempo ou espaço: medidas tomadas em uma seqüência de tempos ou espaços, em uma mesma unidade experimental. Os experimentos com medidas repetidas no tempo envolvem geralmente, além de possíveis fatores de controle local, 2 fatores: tratamentos e tempos, e são freqüentes em experimentos com animais, plantas, humanos, etc. O objetivo principal desse tipo de experimento é examinar e comparar as tendências dos tratamentos ao longo do tempo. Isto pode envolver comparações entre tratamentos dentro de cada tempo, ou comparações de tempos dentro de cada tratamento.

Exemplo1:Cinco variedades de uma cultura (tratamentos), com 3 repetições, avaliadas ao longo do tempo (0, 30, 60, 90, 120 e 150 dias), em um experimento Inteiramente Casualizado.Os dados observados são apresentados na Tabela 1.

Tabela 1. Dados de açúcar na cana, (pol%), obtidos em um DIC com 5 variedades de cana, 3 repetições, observados em 6 tempos de desenvolvimento da cultura.

Variedades Rep. Tempo em dias0 30 60 90 120 150

V11 11,82 14,86 13,84 15,53 15,49 15,822 12,07 14,44 13,92 15,47 16,34 18,643 12,45 14,18 13,76 14,35 15,93 16,52

V21 12,47 15,19 15,02 15,54 18,53 15,762 11,07 13,38 14,61 14,07 17,84 16,913 10,66 14,22 13,54 15,93 15,94 16,81

V31 12,92 14,49 13,40 13,68 16,26 14,782 10,29 14,42 14,62 15,84 16,29 15,623 12,83 13,92 15,69 15,12 14,91 17,22

V41 11,96 14,71 14,98 15,25 16,21 15,532 13,38 15,07 13,62 15,39 15,77 16,513 10,37 15,78 13,33 14,50 16,66 16,34

V51 11,05 13,18 14,61 14,88 16,51 16,362 10,63 13,14 14,53 14,21 16,57 15,243 13,43 14,08 14,23 14,11 15,86 17,50

Fonte: Nogueira (1995)

MÉTODOS PARA ANALISAR MEDIDAS REPETIDAS NO TEMPO

1. Análise como parcelas subdivididas.Na literatura, encontram-se muitas abordagens para analisar dados em medidas repetidas (no tempo ou no espaço). Um procedimento comum é analisar os dados como se fosse um

* Departamento de Ciências Exatas – FCAV/UNESP, Campus de Jaboticabal. 14870-000 Jaboticabal SP

Page 2: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

experimento em Parcelas Subdivididas. O problema é que no delineamento em parcelas subdivididas pressupõe-se que a matriz de covariâncias entre as subparcelas seja do “Tipo 2I”, devido a casualização das mesmas dentro das parcelas, o que não ocorre em ensaios com medidas repetidas. Isso resulta muitas vezes em testes F incorretos na Análise da Variância. Veja Anexo 1.

Pelo Anexo, a matriz de variâncias e covariâncias entre tempos é:

= ,

onde i2 é a variância no tempo i, e ij é a covariância entre os tempos i e j. Na estrutura

homogênea i2=2 , i e ij=, ij.

Essa estrutura não é a esperada para dados com medidas repetidas no tempo, o que faz com que os testes F correspondentes a Tempo e interação Tempo x Trat podem não serem exatos. O que se encontra na literatura é que as medidas repetidas em uma mesma unidade experimental (animal, plantas ou humanos) são correlacionadas e que medidas em tempos mais próximos apresentam correlações mais altas que em tempos mais distantes. Uma estrutura que tem sido estudada é a autoregressiva.Segundo Huynh & Feldt (1970) uma condição necessária e suficiente para que os testes F sejam exatos, é que a matriz satisfaça a condição de esfericidade (ou circularidade), ou seja, que satisfaça a condição:

,

onde é a diferença entre as médias das variâncias e as medias das covariâncias.Esta condição, denominada condição H-F ou condição de esfericidade (ou circularidade) da matriz , eqüivale a especificar que as variâncias das diferenças entre pares de tempos sejam todas iguais, ou seja:

.Para exemplificar, verifique se a matriz abaixo satisfaz a condição de esfericidade:

Observe que : ; ; e assim por diante.

Logo a matriz satisfaz a condição de esfericidade.

Em 1984 o comando REPEATED foi incluído no PROC GLM do SAS, onde o teste de esfericidade , teste de Murchly, é realizado.

2

Page 3: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

Teste de Esfericidade da matriz usando o comando REPEATED do PROC GLM.Este comando do SAS exige que os Dados estejam na forma Multivariada (ver Anexo 2).

Sintaxe:

PROC GLM <opções 1>;CLASS <fator Tra.>;MODEL <Lista Var.Tempo>=<fator Trat.>/<opções 2>;

REPEATED <fator tempo> <nº níveis fator tempo> [<(níveis fator tempo)>] <tipo de contrastes>/<opções 3>;

RUN;

Uma das possíveis <opções 1> é: DATA=<SDS> - especifica o SAS-DATA-SET a ser usado.

Uma das possíveis <opções 2> é: NOUNI – não executa as análises unidimensionais, dentro de cada tempo.

Alguns dos possíveis <tipos de contrastes> são: CONTRAST [(nível referencial)] – gera contrastes entre cada nível do fator tempo

com o nível referencial. Quando o nível referencial não for especificado, considera o último.

POLYNOMIAL – gera contrastes de polinômios ortogonais para os níveis do fator tempo.

HELMERT – gera contrastes entre cada nível do fator tempo com a média dos subsequentes.

MEAN (nível referencial) – gera contrastes entre o cada nível (exceto o referencial) com a média dos outros.

PROFILE – gera contrastes entre níveis adjacentes do fator tempo.

A colocação dos níveis do fator tempo é opcional se forem equidistantes e necessário se não forem.

Algumas das <opções 3> são: CANONICAL – executa uma análise canônica das matrizes H e E. HTYPE=n – especifica o tipo da soma de quadrados a ser usado. NOM – Não executa a análise multivariada. NOUNI – Não executa as análises univariadas. PRINT|E|H|M|V – Imprime a matriz especificada:

E - matriz da soma de quadrados dos produtos cruzados para erros. Com a opção PRINTE o SAS apresenta o teste de esfericidade da matriz de covariâncias.

H - matriz da soma de quadrados dos produtos cruzados (SS&CP) para a Hipótese.M - matriz dos contrates.V - matriz dos auto-valores e auto-vetores associada ao teste.

SUMMARY – apresenta a tabela da análise da variância dos contrastes para o fator tempo.

Exercício 1 – (PROG1.SAS)

3

Page 4: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

Fazer um programa SAS para:a) Criar um SDS Importando o arquivo ASC II univariado (MRT1U.txt)b) Representar graficamente os perfis médios das variedades ao longo do tempo.c) Criar um SDS multivariado (MRT1M).d) Testar a esfericidade da matriz.e) Se a matriz for esférica realizar a análise da variância como parcelas subdivididas, caso

contrário crie um SDS permanente para MRT2U e MRT2M, para posterior análise.

PROGRAMA (Prog_1.SAS):/* EXEMPLO 1 - TESTE DA ESFERICIDADE DA MATRIZ*/OPTIONS LS=78 PS=64;DATA MRT1U;INFILE "C:\S_MRT\MRT1U.TXT";INPUT VR TP RP Y;PROC PRINT;RUN;

/* REPRESENTACAO GRAFICA - TENDENCIA DOS TRATAMENTOS AO LONGO DO TEMPO */OPTIONS LS=78 PS=64;PROC SORT DATA=MRT1U; BY VR TP; RUN;PROC MEANS MEAN NOPRINT;OUTPUT OUT=MRT1G MEAN=YG;BY VR TP;VAR Y;RUN;PROC PRINT DATA=MRT1G; RUN;PROC SORT DATA=MRT1G; BY TP VR;PROC GPLOT DATA=MRT1G;PLOT YG*TP=VR/LEGEND GRID HAXIS=0 TO 150 BY 30;SYMBOL1 COLOR=RED INTERPOL=JOIN VALUE=DOT;SYMBOL2 COLOR=BLUE INTERPOL=JOIN VALUE=DOT;SYMBOL3 COLOR=GREEN INTERPOL=JOIN VALUE=DOT;SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT;TITLE HEIGHT=1.4 "TENDENCIA DOS TRAT. AO LONGO DO TEMPO";RUN;

/*CRIACAO DO SAS-DATA-SET MULTIVARIADO A PARTIR DO UNIVARIADO */PROC SORT DATA=MRT1U; BY VR RP;PROC TRANSPOSE OUT=MRT1M(RENAME=(_0=T1 _30=T2 _60=T3 _90=T4 _120=T5 _150=T6));BY VR RP;ID TP;RUN;PROC PRINT DATA=MRT1M;RUN;

/* Análise usando o comando REPEATED do PROC GLM */PROC GLM DATA=MRT1M;CLASS VR;MODEL T1-T6=VR/NOUNI;REPEATED TP 6 POLYNOMIAL/PRINTE SUMMARY;RUN;

/* Análise como parcelas subdivididas */

4

Page 5: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

PROC GLM DATA=MRT1U;CLASS VR RP TP;MODEL Y=VR RP(VR) TP VR*TP/SS3;RANDOM RP(VR)/TEST;MEANS VAR/TUKEY E=RP(TR);LSMEANS VR*TP/SLICE=TP;LSMEANS VR*TP/SLICE=VR; RUN;

Resultado Gráfico:

Resultados do Teste de esfericidade.

Sphericity Tests Mauchly's Variables DF Criterion Chi-Square Pr > ChiSq Transformed Variates 14 0.1956602 13.214144 0.5097 Orthogonal Components 14 0.1956602 13.214144 0.5097

O SAS apresenta 2 testes de esfericidade. O primeiro depende do tipo de contrastes solicitado e o segundo é válido para qualquer conjunto de contrastes ortogonais.Observa-se com esses resultados que a condição de esfericidade da matriz é rejeitada ao nível de 10% de probabilidade. Assim sendo os dados podem ser analisados como Parcelas subdivididas.

Exemplo 2:Dados de IAF de 5 genótipos de leguminosa, obtidos num experimento DBC com 4 blocos, avaliados em 7 épocas (dias) - apresentados na Tabela 2.

Exercício 2 – (Prog_2.SAS) Fazer um programa SAS para:a) Criar um SDS Importando o arquivo ASC II multivariado (MRT2M.txt).b) Criar um SDS uniivariado (MRT2U).c) Representar graficamente os perfis médios das variedades ao longo do tempo.d) Testar a esfericidade da matriz.e) Se a matriz for esférica realizar a análise da variância como parcelas subdivididas, caso

contrário crie um SDS permanente para MRT2U e MRT2M, para posterior análise.Tabela 2. Dados de IAF de 5 genótipos de leguminosa, obtidos num experimento DBC

com 4 blocos, avaliados em 7 épocas (dias)

5

Page 6: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

Genótipo Bloco Número de dias88 104 120 137,5 153,5 181,5 209,5

1 1 0,13 0,39 0,46 0,52 1,18 0,87 0,511 2 0,31 0,25 1,07 0,44 1,11 1,41 1,081 3 0,22 0,40 0,53 3,61 1,11 0,98 0,781 4 0,08 0,17 0,97 1,11 1,70 0,92 0,742 1 0,13 0,36 0,89 0,62 1,64 1,61 1,422 2 0,27 0,10 0,53 0,60 1,52 1,01 1,092 3 0,13 0,41 1,03 3,60 1,92 0,56 1,092 4 0,08 0,55 0,62 1,04 2,47 1,45 1,123 1 0,84 1,44 2,31 6,07 3,90 3,42 2,003 2 0,45 1,18 2,66 3,88 4,03 3,09 0,993 3 0,67 2,39 4,25 6,33 4,13 3,46 0,963 4 1,28 3,45 5,04 5,57 3,87 0,36 0,774 1 0,42 0,80 0,72 1,07 1,20 1,08 1,264 2 0,15 0,40 0,42 0,85 0,66 0,85 0,714 3 0,22 0,30 0,77 0,94 1,44 1,49 0,624 4 0,28 0,36 0,74 0,73 1,62 1,84 1,365 1 0,67 1,77 2,09 3,27 3,92 2,36 2,725 2 0,66 1,07 2,39 4,19 4,89 1,86 1,615 3 1,41 2,55 3,87 4,62 3,62 3,87 0,025 4 1,30 2,16 5,78 8,62 7,92 0,26 0,26

Fonte: Castro (1999)

PROGRAMA (Prog_2.SAS):/* EXEMPLO 2 - ANÁLISE DE DADOS EM MEDIDAS REPETIDAS NO TEMPO*//* DADOS NA FORMA MULTIVARIADA*/OPTIONS LS=78 PS=64;DATA MRT2M;INFILE "C:\S_MRT\MRT2M.TXT";INPUT GN BL T1-T7;PROC PRINT DATA=MRT2M;RUN;/* GERAR O SDS NA FORMA UNIVARIADA*/DATA MRT2U (KEEP=GN BL TP Y);SET MRT2M;TP=88; Y=T1; OUTPUT MRT2U;TP=104; Y=T2; OUTPUT MRT2U;TP=120; Y=T3; OUTPUT MRT2U;TP=137.5; Y=T4; OUTPUT MRT2U;TP=153.5; Y=T5; OUTPUT MRT2U;TP=181.5; Y=T6; OUTPUT MRT2U;TP=209.5; Y=T7; OUTPUT MRT2U;RUN;PROC PRINT DATA=MRT2U;RUN;

/* REPRESENTACAO GRAFICA - TENDENCIA DOS TRATAMENTOS AO LONGO DO TEMPO */PROC SORT DATA=MRT2U; BY GN TP; RUN;PROC MEANS MEAN NOPRINT;OUTPUT OUT=MRT2G MEAN=YG;BY GN TP;VAR Y; RUN;PROC PRINT DATA=MRT2G; RUN;PROC GPLOT DATA=MRT2G;

6

Page 7: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

PLOT YG*TP=GN/LEGEND GRID;SYMBOL1 COLOR=RED INTERPOL=JOIN VALUE=DOT;SYMBOL2 COLOR=BLUE INTERPOL=JOIN VALUE=DOT;SYMBOL3 COLOR=GREEN INTERPOL=JOIN VALUE=DOT;SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT;TITLE HEIGHT=1.4 "TENDENCIA DOS TRAT. AO LONGO DO TEMPO";RUN;

/* Análise usando o comando REPEATED do PROC GLM */PROC GLM DATA=MRT2M;CLASS BL GN;MODEL T1-T7=BL GN/NOUNI;REPEATED TP 6 (88 104 120 137.5 153.5 181.5 209.5) POLYNOMIAL/PRINTE SUMMARY;RUN;

* CRIANDO SDS PERMANENTES;LIBNAME LOCAL "C:\S_MRT";DATA LOCAL.MRT2U; SET MRT2U;DATA LOCAL.MRT2M; SET MRT2M;RUN;

Gráfico dos perfis médios dos Genótipos ao longo do Tempo

Resultados do teste de esfericidade.

Sphericity Tests - Mauchly's Variables DF Criterion Chi-Square Pr > ChiSq Transformed Variates 20 0.0021259 60.168021 <.0001 Orthogonal Components 20 0.0021259 60.168021 <.0001

Observa-se com esses resultados que a condição de esfericidade da matriz é rejeitada, ao nível de 10% de probabilidade. Assim sendo os testes F da análise em parcelas subdivididas não são exatos.

2. Análise usando o PROC MIXED.

7

Page 8: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

O PROC MIXED é um procedimento utilizado para modelos mistos que é uma generalização do modelo linear geral, separando no modelo os efeitos fixos dos aleatórios e é escrito como: y=X+Z+ onde é o vetor dos parâmetros associados aos efeitos fixos, aos efeitos aleatórios, e vetor de erros aleatórios, sendo e não correlacionados, com esperanças nulas e matrizes de covariâncias G e R, respectivamente. O PROC MIXED permite informar a estrutura da matriz (G), através do comando RANDOM, e a dos erros (R) ), através do comando REPEATED.

Para este tipo de análise os dados devem estar na forma univariada.

A sintaxe do PROC MIXED é:

PROC MIXED <opções1>;CLASS <var. de classif.>; MODEL <var. dep.>=<efeitos fixos> / <opções2>; RANDOM <efeitos aleatórios em G> / <opções3>;REPEATED <efeito repetido> / <opções4>;MAKE “<Tabela>” OUT=<SDS>;RUN;

Algumas das <opções 1> são: DATA=<SDS> - especifica o SAS-DATA-SET a ser usado. METHOD=<ML|REML|MIVQUE0> - especifica o método a ser usado para estimar

os componentes da variância.

Algumas das <opções 2> são: HTYPE =<n> - especifica o tipo da soma de quadrados.

O comando RANDOM especifica os efeitos aleatórios do modelo Uma das possíveis <opções3 > é: TYPE =<CS|AR(1)|SIMPLE|UN|....> - especifica a estrutura da matriz G (dos efeitos

aleatórios), dentro de uma lista de opções.

O comando REPEATED especifica a estrutura de erros. Não tem nada a ver com o REPEATED do PROC GLM. Uma das possíveis <opções4 > é:

TYPE =<CS|AR(1)|SIMPLE|UN|....> - especifica a estrutura da matriz E (dos erros), dentro de uma lista de opções.

SUB=<efeito> - especifica o efeito que identifica a unidade experimental. É assumida completa independência entre tais unidades, de tal forma que este comando produz uma estrutura bloco-diagonal em R com blocos idênticos.

R – solicita a impressão da primeira matriz bloco-diagonal de R. RCORR - solicita a impressão da matriz R.

O comando MAKE é usado para criar arquivos a partir de Tabelas do OUTPUT. Algumas das Tabelas do comando MAKE são:

8

Page 9: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

FITTINGS - Tabela das estatísticas usadas na seleção do modelo. ML|REML|MIVQUE0 - Tabela das estimativas dos componentes da variância. TESTS – Testes de hipóteses associados aos efeitos fixos. Etc.

Os comandos CONTRAST, ESTIMATE e LSMEANS podem ser usadas da mesma forma do PROC GLM.

Como se viu até aqui a análise de medidas repetidas no tempo requer especial atenção na estrutura da matriz de variâncias e covariâncias. A análise de dados com medidas repetidas pelo PROC MIXED é feita em dois passos, ou sejam: 1) Avaliar a estrutura da matriz de covariâncias.2) Analisar a tendência dos tratamentos ao longo dos tempos.

Passo 1: Avaliação da estrutura da matriz de covariâncias para os dados do Exemplo 2.

Várias estruturas disponíveis no SAS podem ser avaliadas. Algumas delas são apresentadas a seguir:

Auto-Regr. 1ª ordem –AR(1) Auto-Regr. Harm. –ARH(1)

Composta Simétrica - CS Composta Sim. Harm – CSH

TOEP TOEPH

Desestruturada – UN Desestruturada – UN(1)

9

Page 10: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

Como a apresentação aqui tem um objetivo mais didático, apenas 3 estruturas serão estudadas, ou sejam: Composta simétrica –CS; Auto regressiva de 1ª ordem – AR(1), Toeplitx - TOEP. É interessante observar que o número de parâmetros a serem estimados depende da estrutura. Para t tempos, na CS o número de parâmetros é 2, na AR(1) é 2 e na UN é t(t+1)/2.

Exercício 3Fazer um programa SAS para, a partir dos SDS referentes ao Exemplo 2, avaliar qual dessas três estruturas melhor representa a estrutura de covariâncias entre os tempos.

PROGRAMA (Prog_2a.SAS):* USO DO PROC MIXED PARA TRES ESTRUTURAS - CS, AR(1) E UN;OPTIONS LS=78 PS=64 PAGENO=1;LIBNAME PASTA "C:\S_MRT";DATA MRT2U; SET PASTA.MRT2U;PROC PRINT DATA=MRT2U; RUN;

* PROCEDIMENTOS PARA A ANALISE USANDO O PROC MIXED;PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=CS SUB=GN*BL R RCORR;RUN;

PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=AR(1) SUB=GN*BL R RCORR;RUN;

PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=UN SUB=GN*BL R RCORR;RUN;

Dentre as diversas informações do output, a de interesse para a seleção da estrutura é a tabela dos critérios:

a) Para CS Fit Statistics -2 Res Log Likelihood 324.2 AIC (smaller is better) 330.2 AICC (smaller is better) 330.5

BIC (smaller is better) 328.4

10

Page 11: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

b) Para AR(1)Fit Statistics

-2 Res Log Likelihood 315.9 AIC (smaller is better) 321.9 AICC (smaller is better) 322.2 BIC (smaller is better) 320.1

c) Para UN Fit Statistics -2 Res Log Likelihood 205.8 AIC (smaller is better) 263.8 AICC (smaller is better) 287.0 BIC (smaller is better) 246.0

Com esses resultados no output observa-se várias estatísticas usadas para a seleção da melhor estrutura da matriz de covariâncias, ou sejam:RLL – Res Log Likelihood - RLL, AIC – Akaike's Information CriterionAICC - Akaike's Information Criterion com correção e BIC – Schwarz's Bayesian Criterion.

Os critérios AIC e BIC são ajustes do RLL e são os mais usados na literatura.Quanto menor o valor dessas estatísticas, melhor a estrutura.

O que interessa na prática é obter uma Tabela na forma da Tabela 3.

Tabela – 2 Estatísticas utilizadas para a escolha da melhor estrutura para a matriz de variâncias e covariâncias dos tempos.

Estrutura -2RLL AIC AICC BICCS 324,2 330,2 330,5 328,4AR(1) 315,9 321,9 322,2 320,1UN 205,8 263,8 287,0 246,0

A partir desta Tabela concluímos que dentre as três estruturas avaliadas, a desestruturada (UN) é a mais apropriada, independente do critério utilizado.

Exercício 4. Fazer um programa SAS, usando Macro Subprograma (ver Anexo 3) e que crie uma Tabela com as estatísticas para seleção, para todas as estruturas utilizadas.

PROGRAMA (Programa PROG_2c.SAS):OPTIONS LS=78 PS=64 PAGENO=1;LIBNAME PASTA "C:\S_MRT";DATA MRT2U; SET PASTA.MRT2U;PROC PRINT DATA=MRT2U; RUN;

* MACRO COM A COMANDO MAKE PARA SALVAR OS RESULTADOS DE INTERESSE;%MACRO SIGMA(SDSE,EST,SDSS,VAL);PROC MIXED DATA=&SDSE;CLASS GN BL TP;MODEL Y=GN TP GN*TP;

11

Page 12: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

RANDOM BL;REPEATED TP/TYPE=&EST SUB=GN*BL R RCORR;MAKE "FITTING" OUT=&SDSS(RENAME=(VALUE=&VAL));RUN;%MEND SIGMA;* CHAMANDO A MACRO PARA CADA ESTRUTURA;%SIGMA(MRT2U,CS,SDSCS,CS);%SIGMA(MRT2U,AR(1),SDSAR1,AR1);%SIGMA(MRT2U,UN,SDSUN,UN);PROC PRINT DATA=SDSCS;PROC PRINT DATA=SDSAR1;PROC PRINT DATA=SDSUN;RUN;

* JUNTANDO OS ARQUIVOS - TABELA DAS ESTATISTICAS;DATA RESULT;MERGE SDSCS SDSAR1 SDSUN;RUN;PROC PRINT DATA=RESULT;RUN;

Esse programa pode ser usado testando todas as estruturas disponíveis no SAS. Algumas das opções são:Estrutura Descrição ParâmetrosANTE(1) Ante-Dependence 2t-1AR(1) Autoregressive 2ARH(1) Heterogeneous Autoregressive t+1ARMA(1,1) ARMA(1,1) 3CS Compound Symmetric 2CSH Heterogeneous Compound Symmetric t+1FA(q) Factor Analytic q/2(2t-q+1)+tFA0(q) No Factor Analytic q/2(2t-q+1)HF Huynh-Feldt t+1LIN(q) General Linear qTOEP Toeplitz tTOEP(q) Banded Toeplitz qTOEPH Heterogeneous Toeplitz 2t-1TOEPH(q) Banded Heterogeneous Toeplitz t+q-1UN Unstructured t(t+1)/2UNAR(q) Banded q/2(2t-q+1)UNR Unstructured Corrs t(t+1)/2VC Variance Components q

Para apresentar mais informações sobre situações encontradas na prática, vamos fazer a análise completa do dados do Exemplo 3.

Exemplo 3: Dados de um experimento de degradação ruminal instalado num delineamento em quadrado latino 6x6 – 6 períodos, 6 animais e 6 tratamentos, avaliado em 10 tempos (3, 6,

12

Page 13: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

12, 24, 48, 60, 72, 84, 96 e 120h). Foram avaliadas três variáveis dependentes (Y1=DEG, Y2=FDN e Y3=FDA).Os dados encontram-se no arquivo MRT3U.TXT.

Exercício 5. Fazer um programa SAS, usando macros apropriadas, para:a) Importar o arquivo MRT3U.TXT.b) Criar o SDS MRT3M.TXTc) Representar graficamente o perfil médio dos tratamentos ao longo do tempo.d) Testar a esfericidade da matriz de covariâncias.e) Analisar os dados usando metodologias apropriadas.

PROGRAMA (Prog_3.SAS):/* Análise DE DADOS DE MEDISDAS REPETIDAS - DQL - usando o PROC MIXED */OPTIONS LS=78 PS=64 PAGENO=1;

* IMPORTANDO O ARQUIVO UNI (AU) - ARQUIVO ASC;DATA AUC;INFILE "C:\S_MRT\MRT3U.TXT" FIRSTOBS=2;INPUT TP PR AN TR Y1-Y3;LABEL Y1="DEG" Y2="FDN" Y3="FDA";PROC PRINT;RUN;

%LET Y=Y1;DATA AU; SET AUC;KEEP TP PR AN TR &Y;PROC PRINT;

RUN;

* CRIANDO O SDS MULTI (AM);PROC SORT DATA=AU; BY PR AN TR;PROC TRANSPOSE OUT=AM(RENAME=(_3=T1 _6=T2 _12=T3 _24=T4 _48=T5 _60=T6 _72=T7 _84=T8 _96=T9 _120=T10));BY PR AN TR;ID TP;RUN;PROC PRINT DATA=AM;RUN;DATA AM; SET AM;KEEP AN PR TR T1-T10;PROC PRINT;RUN;

*REPRESENTAÇÃO GRÁFICA;PROC SORT DATA=AU; BY TR TP;PROC MEANS NOPRINT;OUTPUT OUT=AG MEAN=YG;VAR &Y;BY TR TP;RUN;PROC GPLOT DATA=AG;PLOT YG*TP=TR/GRID;SYMBOL1 COLOR=RED INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL2 COLOR=BLUE INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL3 COLOR=GREEN INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;

13

Page 14: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL6 COLOR=CYAN INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;TITLE HEIGHT=1.4 C=BLUE "PERFIL DOS TRATAMENTOS AO LONGO DO TEMPO";RUN;

* TESTE DE ESFERICIDADE DA MATRIZ SIGMA;PROC GLM DATA=AM;CLASS PR AN TR ;MODEL T1-T10=PR AN TR/NOUNI;REPEATED TP 6 (3 6 12 24 48 60 72 84 96 120) POLYNOMIAL/PRINTE SUMMARY;RUN;

* ESCOLHA DA ESTRUTURA DE SIGMA;%MACRO E_SIGMA(SDSE,EST,SDSS,VAL);PROC MIXED DATA=&SDSE;CLASS PR AN TR TP;MODEL &Y=PR AN TR TP TR*TP/HTYPE=3 ;RANDOM AN PR;REPEATED TP/TYPE=&EST SUB=TR(PR AN) R RCORR;MAKE "FitStatistics" OUT=&SDSS(RENAME=(VALUE=&VAL));RUN;%MEND E_SIGMA;

DATA A; SET AU;PROC PRINT DATA=A; RUN;%E_SIGMA(A,ANTE(1),SDS_ANTE,V_ANTE);%E_SIGMA(A,AR(1),SDS_AR,V_AR);%E_SIGMA(A,ARH(1),SDS_ARH,V_ARH);%E_SIGMA(A,ARMA(1,1),SDS_ARMA,V_ARMA);%E_SIGMA(A,CS,SDS_CS,V_CS);%E_SIGMA(A,CSH,SDS_CSH,V_CSH);%E_SIGMA(A,FA0(1),SDS_FA0,V_FA0);%E_SIGMA(A,FA(1),SDS_FA1,V_FA1);%E_SIGMA(A,HF,SDS_HF,V_HF);%E_SIGMA(A,SIMPLE,SDS_SIMPLE,V_SIMPLE);%E_SIGMA(A,TOEP,SDS_TOEP,V_TOEP);%E_SIGMA(A,TOEPH,SDS_TOEPH,V_TOEPH);%E_SIGMA(A,UN,SDS_UN,V_UN);%E_SIGMA(A,UNAR,SDS_UNAR,V_UNAR);%E_SIGMA(A,UNCS,SDS_UNCS,V_UNCS);%E_SIGMA(A,UNR,SDS_UNR,V_UNR);%E_SIGMA(A,VC,SDS_VC,V_VC);RUN;

DATA RESULT; MERGE SDS_ANTE SDS_AR SDS_ARH SDS_ARMA SDS_CS SDS_CSH SDS_FA0 SDS_FA1 SDS_HF SDS_SIMPLE SDS_TOEP SDS_TOEPH SDS_UN SDS_UNAR SDS_UNCS SDS_UNR SDS_VC;*MERGE SDS_AR SDS_TOEP SDS_UN;RUN;PROC PRINT DATA=RESULT;RUN;

14

Page 15: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

Para a variável Y1 obteve-se:a) Gráfico:

b) Teste de esfericidade: Sphericity Tests Mauchly's Variables DF Criterion Chi-Square Pr > ChiSq Transformed Variates 44 3.8515E-6 196.93319 <.0001 Orthogonal Components 44 3.8515E-6 196.93319 <.0001

Pelos resultados a matriz não é esférica.

c) Estatísticas para escolha da estrutura:Obs Descr V_ANTE V_AR V_ARH V_ARMA V_CS

1 -2 Res Log Likelihood 1360.8 1616.1 1417.4 1615.0 1617.82 AIC (smaller is better) 1398.8 1620.1 1439.4 1621.0 1621.83 AICC (smaller is better) 1401.6 1620.1 1440.3 1621.1 1621.94 BIC (smaller is better) 1394.8 1619.7 1437.1 1620.4 1621.4

Obs V_CSH V_FA1 V_SIMPLE V_TOEP V_TOEPH V_UN V_UNR V_VC1 1442.0 1362.4 1624.4 1600.6 1400.9 1307.0 1307.0 1624.42 1464.0 1400.4 1626.4 1620.6 1438.9 1417.0 1417.0 1626.43 1464.9 1403.2 1626.4 1621.4 1441.8 1443.5 1443.5 1626.44 1461.7 1396.4 1626.2 1618.6 1435.0 1405.5 1405.5 1626.2

Observe que a melhor estrutura é a ANTE(1) (Ante-Dependence) e que as estruturas FAO, HF, UNAR e UNCS apresentaram problemas na convergência do método iterativo.

15

Page 16: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

ANEXO 1

MEDIDAS REPETIDAS NO TEMPO - USANDO O PROC MIXED

Como são os vetores e matrizes do modelo: y=X+Z+ para os dados do exemplo:

y=X+Z+onde: é o vetor dos parâmetros associados aos efeitos fixos

aos efeitos aleatórios, e vetor de erros aleatórios, e não correlacionados, com esperanças nulas e matrizes de covariâncias G e R,

respectivamente

Tabela 1. Dados pol%. 5 variedades com 3 repetições em 6 tempos.Variedades Rep.

Tempo em dias0 30 60 90 120 150

V11 11,82 14,86 13,84 15,53 15,49 15,822 12,07 14,44 13,92 15,47 16,34 18,643 12,45 14,18 13,76 14,35 15,93 16,52

V21 12,47 15,19 15,02 15,54 18,53 15,762 11,07 13,38 14,61 14,07 17,84 16,913 10,66 14,22 13,54 15,93 15,94 16,81

V31 12,92 14,49 13,40 13,68 16,26 14,782 10,29 14,42 14,62 15,84 16,29 15,623 12,83 13,92 15,69 15,12 14,91 17,22

V41 11,96 14,71 14,98 15,25 16,21 15,532 13,38 15,07 13,62 15,39 15,77 16,513 10,37 15,78 13,33 14,50 16,66 16,34

V51 11,05 13,18 14,61 14,88 16,51 16,362 10,63 13,14 14,53 14,21 16,57 15,243 13,43 14,08 14,23 14,11 15,86 17,50

Yijk = + Vi + Rj:i + Tk + VTik + Eijk

Vi , Tk e VTik são farores de efeitos fixos.Rj:i e Eijk são farores de efeitos aleatórios.

Rj:i N(0, ); Rj:i e Eijk são independentes mas Eijk não são

normalmente e independentemente distribuídos com média 0 e variância . = (, V1, V2, ..., V5, T1, T2, ... T6, VT11, VT12, … VT56)’ – dimensões 42x1,X tem dimensões 90x42 = (R1:1, R2:1, ..., R3:5) ’ – dimensões 15x1Z tem dimensões 90x15 tem dimensões 90x90 e é da forma:

16

Page 17: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89
Page 18: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

ANEXO 2

ARQUIVOS SAS (SDS) NAS FORMAS:UNIVARIADA E MULTIVARIADA

No SAS, a maioria dos procedimentos usa o SDS na forma univariada, as colunas são as variáveis e as linhas os registros. Alguns como o PROC GLM com o comando REPEATED usa o SDS na forma multivariada (uma coluna para cada tempo). Para exemplificar apresentamos essas duas formas para os dados do Exemplo 1.

Dados na forma univariada: Variedade Tempo Repetição Y

1 0 1 11.821 0 2 12.071 0 3 12.451 30 1 14.86... ... ... ...5 150 3 17.50

Dados na forma multivariada : Variedade Repetição T1 T2 ... T6

1 1 11.82 14.86 ... 15.821 2 12.07 14.44 ... 18.641 3 12.45 14.18 ... 16.522 1 12.47 15.19 ... 15.76... ... ... ... ... ...5 3 13.43 14.08 ... 17.50

Page 19: ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89

ANEXO 3

USO DE MACROS NO SAS

O SAS permite vários tipos de macros, apresentaremos dois que serão utilizados aqui.

1. Macro variáveis.

Uma macro variável permite definir um valor a uma variável no SAS.

Sintaxe para definir a macro:%LET <nome>=<valor>;

Sintaxe para chamar a macro:&<nome>

2. Macro subprograma com parâmetros.

Uma macro subprograma permite definir uma rotina à parte, variando alguns parâmetros, que podem ser parâmetros de entrada ou de saída. A rotina pode ser chamada tantas vezes quantas precisar.

Sintaxe para definir a macro:%macro <nome(par1,par2, ... )>;<subprograma incluindo os parâmetros precedidos por & (ex: &par1, &par2, etc.>)%mend <nome>;

Sintaxe para chamar a macro:%<nome(v_par1,v_par2, ... )>

onde v_par1, v_par2 são os valores dos parâmetros par1, par2, respectivamente.

19