uma nota didatica analise dados repetidos

Upload: vinicius

Post on 17-Feb-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    1/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 115

    Uma nota didctica breve no uso esclarecido de procedimentos

    estatsticos em anlise de dados repetidos no tempo.Um estudo guiado para investigadores das Cincias do Desporto

    Jos A. R. Maia1

    Rui M. Garganta1

    Andr Seabra1

    Vitor P. Lopes2

    Antnio Prista3

    Duarte Freitas4

    1Faculdade de Cincias do Desporto e de Educao FsicaUniversidade do Porto, Portugal

    2Instituto Politcnico de Bragana, Portugal3Faculdade de Cincias da Educao Fsica e DesportoUniversidade Pedaggica, Moambique

    4 Seco Autnoma de Educao Fsica e DesportoUniversidade da Madeira, Portugal

    RESUMOEste texto pretende ser um auxiliar didctico no uso esclareci-do de procedimentos estatsticos relativos anlise longitudi-nal de dados. Servir-nos-emos de um exemplo ilustrativo decomplexidade crescente para introduzir a estrutura de um deli-neamento de grupo nico e da essncia do ensaio de hiptesesestatsticas. De seguida apresentamos os principais resultadosdo uso de teste t e da anlise de varincia de medidas repeti-das. Os resultados so interpretados de modo formal e subs-tantivo, introduzindo um pensamento alternativo estruturabinria do resultado do ensaio de hipteses. O recurso a proce-dimentos grficos fortemente explorado. Finalmente, recorre-mos modelao hierrquica para salientar a sua riqueza e fle-xibilidade interpretativa no estudo de dados longitudinais.

    Palavras-chave: dados longitudinais, teste t, anlise de varincia,explorao grfica, modelao hierrquica.

    ABSTRACTA didactical note on the use of statistical procedures forlongitudinal data. A guide for researchers in Sport Sciences

    This report aims at being a didactical tool to instruct in the use of sta-tistical procedures related to the analysis of longitudinal data sets. Weshall use an example of growing complexity, so that we may introducethe basic ideas of a single group design and the essence of hypothesistesting. The main results of the t test and analysis of variance shall beanalyzed. These results are formally and substantively interpreted, andan alternative way of thinking is introduced, as a contrast to the bina-ry results of the hypothesis testing. We shall focus on graphic displaysof data. Finally, hierarchical modeling is introduced, mainly its richnessand flexibility in terms of interpretation of the data structure at hand.

    Key Words: longitudinal data, t test, analysis of variance,graphic displays, hierarchical modeling.

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    2/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]116

    INTRODUO

    O propsito essencial desta nota breve no o desubstituir captulos de um qualquer manual deEstatstica, to pouco instruir no uso exclusivo dosprocedimentos do t teste e da anlise de varincia(ANOVA)1. Pretende, isso sim, explorar diferentesalternativas de interrogar um conjunto de dadosrepetidos no tempo e, deste modo, ser um auxiliardidctico para um pesquisador iniciante que nemsempre capaz de se libertar do esteretipo de s seconcentrar na magnitude do valor da prova (p), quenem sempre sabe o que significa, mas que espera

    que seja sempre inferior ao mgico nmero de 5%.Isto, apesar de na maior parte das vezes no terreflectido seriamente porque que tal valor fixado,desde longa data, em 5%.Est pois lanado o propsito desta nota breve. Asua estratgia bem simples, e percorrer as seguin-tes etapas:Apresentaremos, em primeiro lugar, aspectos essen-ciais de um delineamento de grupo nico com obser-vaes repetidas no tempo. Por questes de naturezagrfica, e para no abordar procedimentos mais com-plexo2, limitaremos o nmero de observaes tempo-rais a trs.De seguida discutiremos, do ponto de vista formal esubstantivo, o problema do ensaio de hipteses e onvel do erro que se est disposto a correr pararejeitar uma hiptese nula verdadeira.Os dados para os dois pontos do tempo sero descri-tos e situados num contexto bem conhecido - resul-tados numricos da aplicao de um programa detreino para melhorar a fora explosiva dos msculosextensores do joelho.Em quarto lugar apresentaremos os resultados da

    aplicao do t teste, onde abordaremos duas inter-pretaes alternativas e bem mais interessantes - ado intervalo de confiana para a mdia das diferen-as e a magnitude do efeito.Passaremos explorao grfica dos resultados cen-trando a nossa ateno no comportamento ordenadodas diferenas e seu significado.Um novo aspecto do comportamento dos dados nosdois pontos do tempo ser explorado a partir danoo de estabilidade das mudanas intraindividuaisnas diferenas interindividuais. Ser utilizado, aqui,

    o coeficiente de correlao intraclasse.

    Apresentaremos de seguida a vantagem em ter mais

    do que dois pontos no tempo. O modelo estatsticoutilizado ser a ANOVA de medidas repetidas. Serolanadas e discutidas vrias possibilidades paraensaio de hipteses. Discutiremos o problemanuclear da simetria composta ou esfericidade e orecurso alternativo a uma anlise univariada ou mul-tivariada.Abordaremos, tal como no ponto anterior, interpreta-es alternativas ao teste formal de hipteses e queso os intervalos de confiana e o eta quadrado (2).O comportamento dos resultados ser exploradograficamente a partir dos diagramas de extremos equartis (Box plot) e do high-low-close dos dados orde-nados. A sua importncia e interpretao serosalientadas.Veremos o interesse em pesquisar aspectos da ten-dncia dos resultados e uma opo bem interessantepara o teste depost-hoc ou testes a posteriori.Trataremos, tambm, do problema da estabilidadeou tracking das mudanas intraindividuais no seio dogrupo de observaes, recorrendo ao coeficiente decorrelao intraclasse.Finalmente apresentaremos, ainda que de modo

    muito breve, diferentes formulaes ou modelos queimpem comportamentos distintos aos dados. Paratal recorreremos modelao hierrquica ou multi-nvel (MHMN), um modelo estatstico altamenteverstil e flexvel, e bem mais interessante do que aANOVA.Os procedimentos grficos e de anlise quantitativaesto implementados nossoftwares que utilizaremos,e que so o SPSS 12 e o SYSTAT 10. Pores rele-vantes dos outputs sero coladas no texto para faci-litar a sua apresentao e interpretao.

    DELINEAMENTO DE GRUPO NICOASPECTOS ESSENCIAIS.O plano conceptual e operativo de uma qualquer pes-quisa reclama do investigador, para alm do enquadra-mento terico das inquietaes que emergem dos pro-blemas a investigar, uma ateno redobrada validadedas variveis utilizadas e fiabilidade da informao,i.e., ao controlo apertado que faz de todo o processode avaliao e medio. A validade de generalizaodos seus resultados depende, sempre, do modo comoreflectiu e solucionou as questes centrais da validade

    interna e externa da sua pesquisa (3).

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    3/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 117

    O delineamento de grupo nico pode assumir vrias

    formas - desde a estrutura mais simples da pesquisaquasi-experimental de pr-ps, at ao estudo maissofisticado de cross-lagged panel (5, 8, 21).O delineamento de grupo nico, que procura marcarnuma estrutura longitudinal aspectos da histrianatural de um evento, exige um controlo apertadode todo o processo de medio, por forma a garantiruma elevada qualidade da informao. Este controloimplica a execuo de estudos-piloto prvios queinformem sobre a preciso de todo o protocolado deavaliao, bem como de uma estrutura designada de

    reliability in field, nica forma de controlar, para efei-tos de aprendizagem nas medies, e estimar a mag-nitude da varincia erro implcita em todos osmomentos de medio. Estes aspectos remetem-nos,necessariamente, para a frequncia de amostragemdas medies. Quando lidamos com o lato universodas aptides fsico-motoras, registos semestrais ouanuais so mais do que suficientes para evidenciarverdadeira mudana intraindividual. Contudo, porquestes de natureza operativa, pode acontecer quepor motivos de monitorizao do treino das aptideshaja a necessidade de impor uma outra estrutura natemporalidade das medies, que pode ser uma fre-quncia mensal (20). Aqui enfrentamos, necessaria-mente, aspectos de variabilidade intraindividual quepodem no representar uma verdadeira mudana euma quantidade associada verdadeira mudanaintraindividual. H pois que delinear a pesquisa nosentido de recorrer a procedimentos estatsticos sufi-cientemente flexveis para separar aquilo que varia-bilidade intraindividual e aquilo que mudanaintraindividual (11, 15, 16, 17).

    O PROBLEMA DO ENSAIO DE HIPTESESUm dos problemas centrais de toda a investigao denatureza emprica prende-se com o entendimentoclaro da estrutura conceptual e operativa do ensaiode hipteses, tal como entendida no quadro formalda estatstica inferencial.Convm que fique claro, desde j, que uma coisa ocontedo semntico da estrutura de uma qualquerhiptese substantiva avanada por um investigador eoutra coisa a sua transposio para o domnio daformulao simples em termos estatsticos.

    importante que se diga, e de modo inequvoco, que

    a(s) hiptese(s) avanada(s) pelo investigador rara-

    mente (so) colocada(s) prova em termos esta-tsticos. Dito por outras palavras, a hiptese doinvestigador nunca formalmente testada. Aquiloque se ensaia , to-somente, uma outra hiptesecontrria do investigador, e que este pretende rejei-tar, que se designa por hiptese nula. O caricatoda situao o seguinte: o investigador assume quea hiptese nula verdadeira (!), e no entanto preten-de rejeit-la em favor de uma alternativa (a sua hip-tese) que nunca testa formalmente, e que portantoaceita se se verificar que os dados fornecem evidn-

    cia substancial contra a hiptese nula.No ensaio de hipteses lida-se com dois conceitosintimamente associados e relativamente aos quaisnem sempre se entende a sua diferena e significado.So eles o nvel de significncia () e o valor daprova (p). Para ilustrar a confuso que se estabeleceentre a estrutura operativa do ensaio de hipteses, o e o p, vamos servir-nos de um exemplo muito bemrelatado (5), e que o seguinte:Suponha que um dado programa de treino capazde alterar o desempenho numa dada tarefa. O nvelde significncia foi previamente fixado em 5%.Depois de comparar as mdias dos grupos experi-mentais e de controlo (digamos com 10 sujeitoscada um), os resultados obtidos com o teste t inde-pendente foram os seguintes: t=2.7; graus de liber-dade=18; p=0.001. Marque agora com verdadeiroou falso as seguintes possibilidades de concluso:1 A hiptese nula, que estabelecia que no haviadiferenas entre populaes, rejeitada completa-mente;2 Encontrou-se a probabilidade da hiptese nula serverdadeira;

    3 Provou-se, de modo absoluto, a hiptese experi-mental;4 Pode deduzir-se a probabilidade da hiptese expe-rimental ser verdadeira;5 Sabe-se, se se rejeitar a hiptese nula, que existea probabilidade em cometer uma deciso errada;6 Tem-se uma experincia fivel no sentido em que,se fosse hipoteticamente repetida um grande nme-ro de vezes, se obteria um resultado significativo em99% das ocasies.De facto, as seis possibilidades de resposta esto

    todas erradas. Se quisermos interpretar o resultado

    Anlise de dados longitudinais

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    4/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]118

    da experincia com base no valor da prova, a sua

    correcta interpretao seria a seguinte: h uma pro-babilidade de 1 em 1000 em obter os dados observa-dos (ou um conjunto de dados que representem umdesvio mais extremo da hiptese nula) se a hiptesenula for verdadeira.Claramente que aquilo que o autor pretende eviden-ciar (fazendo eco das posies de um nmero cadavez maior de estatsticos e metodlogos) , to-somente, a informao extremamente limitada dovalor da prova (p) face natureza binria da decisoassociada ao teste de hipteses. A sua sugesto,

    muito mais esclarecedora em termos interpretativos, recorrer informao proveniente dos intervalosde confiana, da magnitude do efeito, ou da noode varincia explicada. este percurso que iremosapresentar com base num exemplo bem simples.

    OS DADOS DO ESTUDOOs dados desta ilustrao provm de um estudo reali-zado num conjunto de voleibolistas seniores masculi-nos. Tratou-se de uma pesquisa que pretendia mapeara histria natural da resposta ao treino dos atletasque foram submetidos a um programa especfico depliometria3, no sentido de melhorar substancialmenteo seu desempenho explosivo no salto vertical.A avaliao da impulso vertical foi realizada na pla-taforma de Bosco, e os resultados obtidos referem-seao salto com contra-movimento. Foi realizado umreteste com uma semana de intervalo numa sub-amostra de 10 atletas para estimar a fiabilidade doseu desempenho, e o valor obtido do coeficiente decorrelao intraclasse foi de 0.87.Os resultados dos 20 atletas so pois os seguintes(obtidos em 3 pontos do tempo espaados, cada um,

    de 1 ms).

    Quadro 1: Valores de impulso vertical (salto com contra-movimento)dos 20 atletas nos 3 pontos do tempo (valores em cm).

    Teste tSe partirmos do princpio, e sempre este o pontode partida desta pesquisa, que o programa foi bemdelineado, de esperar a sua eficcia que se traduzi-r, naturalmente, nos incrementos dos valores defora explosiva dos atletas j no 2 momento de ava-liao (i.e., em t2). pois esta a hiptese que oinvestigador gostaria de testar, mas que no conse-

    gue realizar de acordo com o formalismo estatsticodos ensaios de hipteses.

    Medidas descritivas e teste formalNo Quadro 2 temos os resultados das medidas des-critivas mais importantes. De t1 para t2 verificou-seum incremento no valor das mdias, de 41.57 cmpassou para 44.38 cm. Regista-se, tambm, um ligei-ro aumento na variao interindividual da perfor-mance no salto vertical no segundo momento deavaliao (de 2.04 para 2.36 cm).

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    5/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 119

    Quadro 2: Medidas descritivas do salto vertical de t1 (MOM1)para t2 (MOM2), output obtido no SPSS 12.

    Os principais resultados do teste t esto no Quadro3. O valor da mdia das diferenas de 2.82 cm(incremento mdio de t1 pata t2). Dado que t(19)=-

    6.655, p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    6/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]120

    Figura 1: Ganhos individuais de t1 para t2 expressos em termos percentuais.

    Uma forma grfica interessante e alternativa da ante-rior no olhar das alteraes que ocorrem de t1 parat2 a que representa, de modo ordenado, os resulta-dos numricos das diferenas de valores de cada

    atleta (Figura 2).

    Figura 2: Representao grfica dos ganhos em termos absolutos, ordena-

    dos pelo valor mais baixo (output obtido no SPSS 12).

    Estamos diante de uma representao que salienta

    alguma heterogeneidade individual na resposta aotreino e que pode ter explicaes variadas de nature-za neuro-muscular. H 1 atleta que diminui o seuvalor de impulso vertical, h quem ganhe de 1 a 2cm, de 3 a 4 cm, ou mais de 8 cm. A questo aexplorar saber a que se deve a circunstncia dehaver sujeitos com resistncia mudana nos seusvalores de fora explosiva, enquanto que h outrosde forte sensibilidade ao treino pliomtrico.

    Estabilidade

    Os atletas no tm todos o mesmo valor de partida(em t1), dado que o desvio-padro de 2.04 cm. pois provvel que a sua resposta ao treino seja dis-tinta (conforme vimos anteriormente). Nesta cir-cunstncia, importante verificar se os ganhos de t1para t2 evidenciam estabilidade, i.e., se no se iden-tificam cruzamentos nas trajectrias interindividuais(ver Figura 3).

    Figura 3: Trajectrias dos atletas de t1 (MOM1) para t2 (MOM2),grfico obtido no SYSTAT 10.

    De facto, h cruzamentos nas trajectrias dos atle-tas. O coeficiente de correlao intraclasse (obtidono SPSS 12) de 0.774 (ler na linha averagemeasures), com um intervalo de confiana de 0.429 a

    0.911 (ver poro do output no Quadro 4), indiciador

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    7/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 121

    de alguma instabilidade nos ganhos e que reflecte a ausncia de forte manuteno da posio relativa dos

    sujeitos no seio do grupo.

    Quadro 4: Estatsticas relativas ao coeficiente de correlao intraclasse ( average measures).

    ANOVADois pontos no tempo definem, exclusivamente, umarecta. Contudo, no pacfico, no domnio das vari-veis de interesse no territrio das Cincias doDesporto, que os fenmenos a observar tenham com-

    portamentos que possam ser descritos exclusivamen-te por rectas. Com mais pontos de registo temporal possvel identificar outros comportamentos nosdados, os quais podem ser de natureza no-linear.Ainda que a maioria dos autores sugira que 4 pontosso o mnimo necessrio para se ter uma noo maisadequada do comportamento de uma varivel, nesteexemplo s consideraremos 3 pontos, tal como foiexplicado no incio do texto.Aquilo que aqui se pretende verificar , uma vezmais, a hiptese substantiva do pesquisador. Dado

    que o programa foi bem delineado e os atletas res-ponderam com empenho e sem qualquer falta ao trei-no, de esperar que a sua resposta, ainda que evi-dencie alguma variabilidade, seja traduzida em incre-mentos distintos nas mdias nos trs pontos dotempo. A haver mudanas na fora explosiva dosmembros inferiores, a nica causa plausvel a quese refere aplicao do programa. No caso vertente, formulada, em termos estatsticos, a seguinte hip-tese: H0:1=2=3 (contra a alternativa, H1:i j,i.e., pelo menos duas mdias em dois pontos do

    tempo so significativamente diferentes). Uma vez

    Anlise de dados longitudinais

    mais enfrentamos a situao da ausncia de qualquerteste formal hiptese do investigador que refere,justamente, que o programa foi eficaz, e que portantoh diferenas significativas nos valores mdios defora explosiva em pelo menos dois pontos do tempo.

    Como no h um teste formal quilo que o investiga-dor pretende evidenciar, h que testar a validade deH0, e esperar que seja rejeitada! E bem mais difcil deentender a assuno de que verdadeira!

    Medidas descritivas e teste formalNo Quadro 5 esto descritos os resultados numri-cos das estatsticas elementares para os trs pontosno tempo. Verifica-se um incremento nas mdias,que mais ou menos equivalente entre pontos adja-centes no tempo. Constata-se, tambm, que a varia-

    bilidade do desempenho aumenta no tempo, j quese verifica um ligeiro incremento nos valores dosdesvios-padro.

    Quadro 5: Medidas descritivas da fora explosivanos trs pontos do tempo (output do SPSS 12).

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    8/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]122

    Independentemente de se assumir que os registos

    repetidos no tempo so independentes e provm deuma distribuio normal multivariada, importanteassumir, tambm (ainda que no seja uma condionecessria), simetria composta para a matriz de cova-rincia das medidas repetidas. Trata-se aqui de assumirque as varincias dos resultados nos 3 pontos dotempo so iguais e que as covarincias entre momen-

    tos so tambm iguais. Uma face da simetria composta

    refere-se, exclusivamente, noo de esfericidade oucircularidade, que trata da noo de que as varinciasnos trs pontos do tempo no devem ser significativa-mente diferentes entre si. O teste formal da ANOVAde medidas repetidas assenta nestes pressupostos.Uma forma de verificar o pressuposto da esfericidade recorrer ao teste W de Mauchly (ver Quadro 6).

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

    Quadro 6: Resultados do teste W de Mauchly ao pressuposto da esfericidade ( output do SPSS 12).

    Dado que o valor da prova do teste de 0.001, rejeitada a hiptese da esfericidade. A extenso destaviolao reflectida num parmetro designado deepsilon. Quando se verifica que a matriz de covarin-cia das medidas repetidas no viola o pressuposto deesfericidade, o parmetro epsilon igual a 1. O piorresultado da violao dado por 1/(k-1), em que k igual ao nmero de medidas repetidas. No nosso

    caso a estimativa de epsilon igual a 0.50 e corres-ponde ao limite inferior do epsilon, conforme vis-vel no Quadro 6. Greenhouse-Geisser e Huynh-Feldtpropem frmulas alternativas para o clculo desteparmetro e daqui que o seu resultado seja ligeira-mente diferente. Como foi violado o pressuposto daesfericidade h que recorrer a uma correco do testeF da ANOVA com base nas sugestes deGreenhouse-Geisser ou Huynh-Feldt. Estas correc-es modificam os valores dos graus de liberdadeconforme pode ser consultado no Quadro 7. Ainda

    que as correces de Greenhouse-Geisser e Huynh-

    Feldt sejam ligeiramente diferentes, uma(Greenhouse-Geisser) mais conservadora do que aoutra (Huynh-Feldt), o valor de epsilon, tradutor damagnitude da violao da esfericidade, no superiora 0.754 e o valor da prova sempre significativo emqualquer das situaes, sugerida a opo pela cor-reco de Greenhouse-Geisser. A concluso pois arejeio da hiptese nula, dado que

    F(1.316,25.008)=60.898, p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    9/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 123

    Quadro 7: Resultados da ANOVA com e sem violao do pressuposto da esfericidade (output do SPSS 12).

    Uma atitude diversa das explicaes anteriores recorrer a um teste multivariado (MANOVA - Anlise deVarincia Multivariada) que no precisa de assumir esfericidade para se obterem resultados correctos. Defacto, e tal como refere por exemplo (5), trata-se de um pressuposto demasiado forte para ser verificadonuma qualquer condio em que se tenha medidas repetidas no tempo, sobretudo devido natureza quasi-simplex5 de uma tal matriz de covarincia. O teste multivariado uma opo mais slida. Contudo, temvrias alternativas. Uma das mais utilizadas o de Wilks=0.139, que tem uma distribuio amostral muitocomplexa. usualmente aproximada para uma distribuio de 2 de Bartlett ou F de Rao, cujos resultados soF(2,18)=34.981, p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    10/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]124

    O problema a enfrentar agora o seguinte: se as

    mdias nos trs pontos do tempo no so iguais,onde que se situam as diferenas? H vrias alter-nativas para testespost-hoc6. Contudo, importantesalientar, ainda que se trate de um delineamento denatureza pr-experimental num nico grupo, que oteste a posteriori utilizado dever ser acompanhadode algum pensamento por parte do pesquisador.Dado que ele a pessoa que conhece bem o proble-

    ma e aquilo que est em jogo, deve ter uma atitu-

    de bem esclarecida sobre esta matria. S assim secompreende a sua opo e justificao. Ora, naausncia de uma qualquer explicao que suporte aescolha de um procedimento depost-hoc ou teste a

    posteriori, as sugestes que apresentaremos aquirepresentam pensamentos alternativos. A primeira,contrasta os trs momentos entre si (t1-t2; t1-t3; t2-t3) e efectuada com base no teste de Bonferroni7 eos resultados esto no Quadro 9.

    Quadro 9: Resultados do teste depost-hoc com ajustamento deBonferroni (output do SPSS 12).

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

    mais do que evidente dos resultados que se verifi-cam diferenas significativas (p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    11/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 125

    Quadro 11: Teste tendncia dos resultados (output do SPSS 12).

    Interpretao alternativaJ tivemos oportunidade de apresentar alguma argu-mentao para no nos atermos somente ao valor daprova que reflecte a necessidade exclusiva de umadeciso dicotmica. Bem pelo contrrio, aquilo quese exige largura de viso quando se explora umdado conjunto de dados, por forma a extrair deletoda a informao que contm. Daqui que se recorra,uma vez mais, aos intervalos de confiana e noode variabilidade explicada.No caso dos intervalos de confiana chamamos aateno do leitor para o Quadro 9. Nas duas ltimas

    colunas temos resultados numricos relativos aintervalos de confiana a 95% para as diferenasentre mdias. Assim, o intervalo do momento 2menos o momento 1=1.705 a 3.925; do momento 3para o momento 2=1.412 a 3.048, e do momento 3para o momento 1=3.484 a 6.606. Se centrarmos anossa ateno exclusivamente neste ltimo, verifica-mos que em termos populacionais a mudana espe-rada nos valores da fora explosiva se situam, apro-ximadamente, entre 4 e 7 cm. Uma vez mais a ques-to a colocar situa-se ao nvel da qualidade dointervalo destes ganhos, i.e., se reflectem aquilo que

    esperado pelo treinador e se reflectem um ganhosubstantivo em termos de desempenho.O eta quadrado parcial (2), sobretudo uma sobres-timativa do actual valor da magnitude do efeito(SPSS Advanced Models, pag. 327). Refere-se pro-poro de variabilidade total atribuvel ao factortempo. No caso do delineamento sobre as alteraesda fora explosiva, 79.1% (ver Quadro 11) da variabi-lidade total observada tem que ser imputada ao fac-tor tempo, que no mais do que o efeito do progra-ma. Chamamos a ateno que esta interpretao nodeve ser confundida com a que foi utilizada no teste

    t, por se tratar de conceitos e estatsticas diferentes.

    Anlise de dados longitudinais

    Representaes grficasO diagrama de extremos e quartis (Box plot) umarepresentao grfica extremamente interessante,dado salientar aspectos nucleares da uma qualquerdistribuio de valores numricos, sobretudo nosseus aspectos de medidas centrais e de disperso,bem como a eventual presena de resultados queultrapassam os valores adjacente inferior e superior,e que podem ser candidatos a outliers. Para alm desalientar alguma assimetria direita em t1 e t2,observa-se (a) ainda a presena de algumas observa-es discrepantes nos 3 momentos, (b) o incrementocontnuo da variabilidade dos resultados nos 3 pon-tos, (c) bem como o aumento do valor da mediana.

    Figura 4: Diagrama de extremos e quartis.

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    12/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]126

    Este diagrama de high-low-close (high=t3; close=t2;

    low=t1) representado na Figura 5, depois de ordenaros valores por t1, procura ilustrar vrios pontos: (a) aheterogeneidade dos valores de partida; (b) as diferen-as nos ganhos que nem sempre parecem estar condi-cionados aos valores iniciais; (c) a posio relativa dosganhos em t2 (MOM2) relativamente a t1 (MOM1) et3 (MOM3). pois uma representao grfica bemelucidativa do comportamento dspar na resposta aotreino, por exemplo, dos atletas 1, 8, 18 e 20.

    Figura 5: Diagrama de high-low-close.

    Estabilidade ou trackingA anlise da estabilidade ou tracking das mudanas

    intraindividuais nas diferenas que ocorrem entresujeitos requer agora um olhar bem mais amplo doque nos resultados do teste t.O primeiro passo consiste, justamente, em observaro traado das trajectrias dos sujeitos nos 3 pontosdo tempo, o que se encontra ilustrado na figuraseguinte.

    Figura 6:Spargheti plot das trajectrias individuais.

    Exige-se, agora, uma anlise mais detalhada e amplados resultados que se encontram no quadro seguinte:- Na matriz de covarincia os valores que mais nosinteressam so os que se encontram na diagonalprincipal (varincias dos resultados em cada pontodo tempo). Ora, notrio que a varincia vaiaumentando no tempo, produzindo um efeito deabertura de leque nas trajectrias dos sujeitos(confirmado pelos traados da figura anterior). Istosignifica que vai aumentando a heterogeneidade dosvalores da impulso vertical.- Uma forma expedita de identificar o tracking veri-ficar o comportamento dos valores de correlao dePearson entre os trs momentos. evidente que acorrelao entre t1 e t3 moderada (r=0.516).

    Contudo, acima do valor requerido para um trao oucaracterstica evidenciar tracking (r 0.50). alta-mente estvel o comportamento da fora explosivade t2 para t3 (r=0.899), ao contrrio do que aconte-ce de t1 para t2 (r=0.638). provvel que tal estabi-lidade esteja associada a efeitos de aprendizagem doprprio processo de avaliao e/ou resposta neuro-muscular ao treino.- A estabilidade global ou tracking dada pelo valordo coeficiente de correlao intraclasse que , nestemomento, de 0.859 (IC95%=0.702; 0.940), sugerin-do a manuteno moderada a elevada da posio

    relativa de cada sujeito no seio do grupo.

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    13/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 127

    Quadro 12: Resultados (do SPSS e SYSTAT) relativos estabilidade ou tracking.

    Anlise de dados longitudinais

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    14/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]128

    Modelao hierrquica ou multinvel (MHMN)

    No pretendemos terminar este ensaio breve semsugerir que, com base no pensamento, metodologiae estratgia altamente versteis e flexveis daMHMN8 possvel testar, para o mesmo conjunto dedados longitudinais, um corpo variado de hipteses-modelos hierarquicamente embricados (nestedwithin), por forma a identificar aquele que se afiguramais plausvel. Esta versatilidade na formulao demodelos nested within no possvel de realizar combase na ANOVA ou MANOVA. Formularemos qua-tro modelos9 para descrever10 o comportamento da

    fora explosiva dos membros inferiores.1 possvel que a varincia observada nos valoresde partida dos sujeitos (em t1) seja irrelevante, semqualquer significncia estatstica. Trata-se de variabi-lidade biolgica sem qualquer significado. Domesmo modo assumimos que no se verifica qual-quer divergncia substancial nas trajectrias dosatletas no que respeita aos seus ganhos de fora.Neste caso uma nica equao de regresso paratodo o grupo seria a explicao mais plausvel.

    Figura 7: Comportamento dos valores dos atletasem funo do tempo para o 1 modelo.

    2 Uma outra forma de olhar para o comportamentodos dados seria pensar que ainda que no haja varia-o significativa no momento inicial (um pontonico serve para descrever os resultados dos atletasem t1), bem possvel que as suas trajectrias sejamdiferentes, i.e., que haja varincia significativa nosdeclives das trajectrias dos diferentes atletas, resul-tado inequvoco das diferenas na sua resposta ao

    treino e que pode ser de natureza biolgica.

    Graficamente representaramos tal possibilidade

    como na figura 8.

    Figura 8: Comportamento dos valores dos atletasem funo do tempo para o 2 modelo.

    3 possvel pensar, ainda, num formato bem maisflexvel para o comportamento das trajectrias inte-rindividuais. No s os valores de partida dos sujei-tos so diferentes entre si, i.e., h varincia significa-tiva em t1 (hiptese contrria s anteriores), como

    se constata que no existe qualquer diferena nastrajectrias dos sujeitos (a sua resposta ao treino amesma, independentemente do seu valor de parti-da). Trata-se, pois, de especificar rectas paralelaspara todos os atletas. Os ganhos de fora explosivano tempo so descritos pelo mesmo declive, aquiloque se designa por estabilidade paralela e que poderepresentar-se assim (ver Figura 9).

    Figura 9: Comportamento dos valores dos atletas

    em funo do tempo para o 3 modelo.

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    15/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 129

    4 Finalmente, o modelo mais flexvel, do qual todos

    os outros no so mais de que aspectos parcelares,nested within, o que sugere que no s existe umavarincia substancial no momento inicial do estudo(os valores de fora explosiva so o resultado davariabilidade biolgica e do carcter residual damagnitude do destreino11), como tambm se verificauma forte heterogeneidade na resposta ao treino eque visvel no comportamento diferenciado dosvalores de fora explosiva. Portanto, teramos trajec-trias interindividuais bem diferentes (Figura 10).

    Figura 10: Comportamento dos valores dos atletasem funo do tempo para o 4 modelo.

    A forma mais adequada de testar a plausibilidadedestes 4 modelos pensar em termos da sua expan-so no que respeita ao nmero de parmetros a esti-mar. O primeiro modelo o mais simples, e osoutros mais complexos. Uma estatstica adequada

    para determinar a qualidade de ajustamento dosdados a uma dada hiptese a razo do logaritmo daverosimilhana (RV), do ingls log likelihood ratio.Com base no valor desta razo possvel testar aplausibilidade interpretativa de dois modelos, con-trastando o mais simples com um outro mais com-plexo e multiplicando o seu valor por -2, tal que aestatstica G = -2 * (RVmodelo mais restritivo RVmodelo maisexpansivo), e esperando que o resultado, que tem umadistribuio de 2 com nmero de graus de liberdadeigual diferena dos parmetros em cada modelo

    seja significativo (i.e., p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    16/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]130

    Quadro 14: Resultados mais importantes do output da MHMN.

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    17/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 131

    Anlise de dados longitudinais

    - evidente a presena de diferenas interindividuais

    nos valores de partida (ordenada), bem como nassuas trajectrias de modificao da capacidade desalto (declive), tal como referido nas estimativasindividuais apresentadas (Empiral Bayes Estimates).- O valor na ordenada (em t1) de 41.663 cm (erro-padro=0.428), com um resultado da estatsticaz=97.398, p

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    18/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133]132

    CORRESPONDNCIA

    Jos Antnio Ribeiro MaiaLaboratrio de Cineantropometriae Anlise de DadosFaculdade de Cincias do Desportoe de Educao FsicaUniversidade do PortoRua Dr. Plcido Costa, 914200-450 PortoPortugal

    [email protected]

    BILBIOGRAFIA

    1. Abelson RP (1995). Statistics as a principled argument.Mahawah: Lawrence Erlbaum Associates, Publishers.

    2. Bijleveld CCJH, van der Kamp LJT, Mooijaart A, van derKloot WA, van der Leeden R, van der Burg E (1998).Longitudinal data analysis. Designs, models and methods.Thousand Oaks: Sage Publications.

    3. Campbell DT, Stanley JC (1963).Experimental and quasi-experimental designs for research. Skokie: Rand McNally.

    4. Collins, L.M, Sayer, A.G. (Eds). (2001).New methods for theanalysis of change. Washington: American PsychologicalAssociation.

    5. Cuttance P, Ecob R (1987). Structural equation modeling byexample. Applications in educational, sociological, and behavioralresearch. Cambridge: Cambridge University Press.

    6. Everitt BS (1996).Making sense of statistics in psychology. Asecond-level course. Oxford: Oxford University Press.

    7. Field, A (2000).Discovering statistics using SPSS for windows.Advanced techniques for the beginner. Thousand Oaks: SagePublications.

    8. Finkel SE (1995). Causal analysis with panel data. SageUniversity paper series on Quantitative Applications in theSocial Sciences. Thousand Oaks: Sage Publications, 7-105.

    9. Hox J (2002).Multilevel analysis. Techniques and applications.Mahwah : Lawrence Erlbaum Associates, Publishers.

    10. Joreskog KG (1970). Estimating and testing of simplexmodels.British Journal of Mathematical and StatisticalPsychology 23:121-145.

    11. Joreskog KG, Sorbom D (1976). Statistical models andmethods for analysis of longitudinal data. In DJ Aigner, AS

    Goldberger (Eds.)Latent Variables in Socioeconomic Models.Amsterdam: North Holland, 285-325.12. Little, TD, Schnabel KU, Baumert J (2000).Modeling longi-

    tudinal and multilevel data. Practical issues, applied approaches,and specific examples. Mahwah: Lawrence ErlbaumAssociates, Publishers.

    13. Maia JAR, Beunen G, Lafevre J, Claessens A (1998). Testesempricos a formulaes desenvolvimentalistas: um estudocentrado na modelao da estrutura de covarincia. RevistaPaulista de Educao Fsica 12(2):160-180.

    14. Maia JAR, Beunen G, Lafevre J, Claessens A, Renson R,Vanreusel B (2003). Modeling stability and change instrength development: a study in adolescent boys.American Journal of Human Biology 4:579-591.

    15. Maia JAR, Lopes VP, da Silva RG, Seabra A (2002). A

    importncia do estudo do tracking (estabilidade e previso)em delineamentos longitudinais: um estudo aplicado epi-demiologia da actividade fsica e performance desporti-vo-motora.Revista Portuguesa de Cincias do Desporto2(4):41-56.

    16. Maia JAR, Lopes VP, da Silva RG, Seabra A, Ferreira JV,Cardoso MV (2003). Modelao hierrquica ou multinvel.Uma metodologia estatstica e um instrumento til depensamento na investigao em Cincias do Desporto.Revista Portuguesa de Cincias do Desporto. 3 (1):92-107.

    17. Marsh HW, Grayson D (1994). Longitudinal factor analy-sis: common, time-specific, item-specific and residual-error components of variance. Structural Equation Modeling1:116-145.

    18. Maxwell SE, Delaney HD (2000).Designing experiments and

    analyzing data. A model comparison perspective. Mahawah:

    Jos AR Maia, Rui M. Garganta, Andr Seabra, Vitor P. Lopes, Antnio Prista, Duarte Freitas

  • 7/23/2019 Uma Nota Didatica Analise Dados Repetidos

    19/19

    Revista Portuguesa de Cincias do Desporto, 2004, vol. 4, n 3 [115133] 133

    Lawrence Erlbaum Associates, Publishers.19. Raudenbush SW, Bryk AS (2002).Hierarchical linear models.

    Applications and data analysis methods. 2nd edition. ThousandOaks: Sage Publications.

    20. Silva PJMM (2003).Estudo da dinmica da performance emandebolistas jniores.Tese de Mestrado. Faculdade deCincias do Desporto e de Educao Fsica, Universidadedo Porto. Portugal.

    21. Spector PE (1981).Research Designs. Sage University Paperseries on Quantitative Applications in the Social Sciences,series n 35. Berverly Hills: Sage Publications.

    22. SPSS Advanced Models. Chicago: SPSS Inc.23. Stevens JP (2002).Applied multivariate statistics for the social

    sciences. 4th edition. Mahawah: Lawrence ErlbaumAssociates, Publishers.

    24. Taris TW (2000).A primer in longitudinal data analysis.Thousand Oaks. Sage Publications.

    25. Vincent WJ (1999) Statistics in Kinesiology. 2nd edition.Champaign: Human Kinetics.

    26. Ximnez C, Martin RS (2000).Anlisis de varianza commedidas repetidas. Madrid: Editorial la Muralla S.A.

    Anlise de dados longitudinais