trabalho de estatistica

12
Trabalho de Estatística Universidade Federal de Minas Gerais UFMG Bárbara Akemy Barbosa Cruz

Upload: barbara-akemy-barbosa-cruz

Post on 24-Jun-2015

475 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Trabalho de Estatistica

Trabalho de Estatística

Universidade Federal de Minas GeraisUFMG

Bárbara Akemy Barbosa Cruz

Page 2: Trabalho de Estatistica

01 de julho de 2010Sumário

1. Introdução

2. Estudos observacionais

3. Estudos experimental

4. Outliers

5. Gráfico de Box-plot

6. Histograma

7. Diagrama de dispersão

8. Referências Bibliográficas

Page 3: Trabalho de Estatistica

Introdução

Estudos estatísticos podem ser divididos em estudos observacionais, que observa e mede os dados, e em experimento, que aplica algum tratamento. Os estudos observacionais não tentam modificar os sujeitos objeto de estudo e podem ser divididos em:

Estudo Prospectivo(ou longitudinal ou de coorte):os dados são coletados no futuro, de grupos (chamados coortes) que compartilham fatores comum;

Estudo Transversal: os dados são observados, medidos e coletados em um ponto no tempo; Estudo Retrospectivo (ou de controle de caso): os dados são coletados do passado através de

exames de registro, entrevistas e etc.;Os experimentos, por sua vez, possuem elementos-chaves em seu planejamento, que são:

Controle de efeitos de variáveis através de planejamento de experimentos cegos, blocos, planejamento experimental rigorosamente controlado.

Replicação Aleatorização

O uso de gráficos em estatística é extremamente útil, uma vez que esses dão uma representação organizada e resumida dos dados trabalhados.Dentre os gráficos mais utilizados estão: diagrama de dispersão, histograma e box-plot.Um conceito relevante ao se analisar gráficos consiste em outliers que são valores amostrais que se localizam muito longe da grande maioria dos outros valores amostrais, e que devem ser identificados e analisados.

Page 4: Trabalho de Estatistica

Estudos observacionais

Estudos Transversais e de Caso-Controle

Estudos Transversais

Nesse tipo de estudo todas as medições são feitas em um único momento, sem período de acompanhamento. Esse tipo de delineamento é útil para descrever variáveis e seus padrões de distribuição, demonstrando, por exemplo, as características demográficas e clínicas de um grupo de estudo, podendo também ser usado para examinar associações. Um ponto positivo dos estudos transversais é que não é necessário esperar um desfecho para chegar a conclusões, isso faz com que esses estudos sejam rápidos e de baixo custo. Além disso, por não haver acompanhamento, não há perdas. Estudos transversais são os únicos que fornecem a prevalência de uma doença ou um fator de risco. Porém, nesse tipo de estudo é difícil estabelecer relações causais e estudar doenças raras em amostra de indivíduos da população geral. O fato de o estudo transversal medir apenas prevalência, e não incidência limita sua capacidade de estabelecer prognósticos, história natural e causa da doença.

Estudos de Caso-Controle

Os estudos de caso-controle surgiram como estudos epidemiológicos que buscavam identificar fatores de risco para doenças.São estudos em que se analisam grupos com a doença e outros sem ela, em seguida, investiga-se o passado a fim de levantar diferenças entre os dois grupos que expliquem porque os casos desenvolveram a doença e os controles não.O desfecho, nesse caso, para definir grupos controles e casos, é não possuir ou possuir a doença.Esses estudos não pode fornecer estimativas sobre a incidência ou prevalência de uma doença, pois a proporção de sujeitos com a doença no estudo é determinada pelo número de casos controles que o investigador decide amostrar.O que é possível fornecer são informações descritivas e uma estimativa da magnitude de associação entre cada variável preditora e a presença ou ausência da doença.Estudos de caso-controle são extremamente úteis para estudos com doenças raras ou com longos períodos de latência entre a exposição e a doença, já que com uma amostra relativamente pequena consegue-se chegar à resultados.Além disso, a abordagem retrospectiva desses estudos e seu potencial para estudar um número grande de variáveis preditoras os torna úteis para a geração de hipóteses sobre as causas de um novo surto da doença.São limitações importantes dos estudos de caso-controle: não poder estimar diretamente a incidência ou a prevalência da doença, nem o risco atribuível ou o excesso de risco; estudar apenas um desfecho(presença ou ausência da doença) e por fim a grande suscetibilidade a vieses, principalmente, de amostragem separada dos casos e dos controles e de medição diferencial(diferenças nas medições de casos e controles).

Estudos de Coorte

Estudos de Coorte Prospectivos (ou longitudinais)

Na pesquisa clínica, coorte é um grupo de sujeitos acompanhados no tempo. Em um estudo de coorte prospectivo, seleciona-se uma amostra de sujeitos e, então, mede-se em cada sujeito características, que poderão predizer desfechos subseqüentes. Feito isso, medições periódicas são feitas dos desfechos de interesse.Esse tipo de delineamento é uma estratégia para definir a incidência e investigar as potenciais causas de um condição clinica.Nele,variáveis importantes são medidas de forma completa.Estudos de coorte prospectivos se adequam bem para estudo de

Page 5: Trabalho de Estatistica

antecedentes de doenças fatais.Esses estudos são caros e ineficientes quando se estuda desfechos raros.Podem demandar números elevados de sujeitos acompanhados durante longos períodos de tempo.Essa desvantagem pode ser superada analisando-se registros ou amostras já coletadas,isto é, usando-se um delineamento de coorte retrospectivo.

Estudo de Coorte Retrospectivo

A diferença para o estudo de coorte prospectivo é que a montagem da coorte, as medições basais, o acompanhamento e os desfechos ocorrem todos no passado.Esse tipo de estudo só é possível se houver dados adequados de disponíveis sobre fatores de risco e os desfechos em uma coorte de sujeitos montadas por outros motivos.Nesse tipo de estudo, assim como no coorte prospectivo, as variáveis preditoras precedem os desfechos.Em comparação aos estudos prospectivos, o retrospectivos demandam menos tempo e recurso financeiro.Porém, em um estudo de coorte retrospectivo, o investigador tem controle limitado sobre a estratégia de amostragem da população,a natureza e a qualidade dos dados analisados, isso porque, a coorte é pré-estabelecida.

Estudo Experimental

Ensaios Clínicos Randomizados(aleatorizado)

Nesse tipo de estudo, investiga-se a relação causa efeito. Os ensaios clínicos apresentam um desenho experimental semelhante aos dos estudos de coorte, a não ser pela alocação nos grupos, que consiste em uma seleção em que todos os participantes tem a mesma chance de serem alocados para cada um dos grupos de estudo.Os sujeitos são colocados “aleatoriamente” para formar os grupos: o de estudo e o de controle, objetivando formar grupos com características semelhantes. Procede-se a intervenção em apenas um dos grupos (o de estudo), o outro (controle) serve para comparação dos resultados. No ensaio clínico randomizado procura-se verificar a incidência de casos, nos grupos de expostos e não-expostos. A relação entre os grupos é expressa pelo risco relativo. Esse é um delineamento adequado para responder o efeito de intervenções (qualquer manejo clínico oferecido aos participantes que podem ter um efeito nas suas condições de saúde - testes diagnósticos, tratamento, prevenção, rastreamento, modelo educacional).São vantagens desse tipo de estudo : tem-se alta credibilidade como produtor de evidências científicas; não existe dificuldade de grupo controle, nem de interpretar resultados e há determinação da cronologia dos eventos.Contudo,por questões éticas muitas situações não podem ser estudadas por este método; há possibilidade de perdas e recusas por parte das pessoas pesquisadas; necessidade de manter uma estrutura administrativa e técnica bem preparada, tendo custo, em geral,elevado.A randominização reduz o risco de desequilíbrio de fatores desconhecidos que poderiam influenciar o curso clínico dos participantes.Nenhum outro delineamento permite um equilíbrio destes fatores não conhecidos.

São critérios de seleção para um ensaio clínico: Critérios de inclusão

– Restringir a heterogeneidade de pacientes Critérios de exclusão

– Doença atípica– Outras doenças– Prognóstico muito ruim– Pouca cooperação

São fases de um ensaio clínico:

Fase I: resposta biológica de indivíduos saudáveis à droga Fase II: avalia o tratamento em indivíduos com a doença Fase III: estudo experimental

Page 6: Trabalho de Estatistica

Fase IV: efetividade em condições de campo

Outliers

São observações que apresentam um grande afastamento das restantes ou são inconsistentes com elas. Também chamadas por observações “anormais”, contaminantes, estranhas, extremas ou aberrantes. Na maioria das vezes, a razão da existência de um outlier determina a forma como administrá-lo. Assim, as principais causas que levam ao aparecimento de outliers são:

Detecção de fraudes; Variabilidade inerente dos elementos da população; Em análises médicas (resultados não esperados de tratamentos); Erros de medição; Erros de execução;

São alguns métodos para identificação de outliers: Gráficos (box-plot, diagrama de dispersão, histograma) Modelos de discordância Teste de Dixon Teste de Grubbs Z-scores

Z-Scores

Calcula-se os z-scores.Se o conjunto dos dados é pequeno (inferior a 50), valores que tenham zscores inferiores a -2.5 ou superiores a 2.5 devem ser consideradosoutliers.Se o conjunto dos dados é grande, valores que tenham z-socres inferiores a-3.3 ou superiores a 3.3 são tipicamente considerados outliers. Se o conjunto dos dados é muito grande (1000 ou mais), também valores mais extremos do que +-3.3 podem ser considerados dados normais e não outliers.

Gráfico de Box-Plot

Para construir um box-plot, desenhamos uma"caixa" com o nível superior dado pelo terceiro quartil (Q3) e o nível inferior pelo primeiro quartil(Q1). A mediana (Q2) é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os valores máximo e mínimo, que não sejam observações discrepantes. Os valores que estiverem no intervalo de Q3+1,5L e Q3+3L e no intervalo Q1-1,5L e Q1-3L, serão considerados outliers podendo, portanto ser aceitos na população com alguma suspeita.Os valores que forem maiores que Q3+3L e menores que Q1-3L devem ser considerados suspeitos de pertencer à população, devendo ser investigada a origem da dispersão. Estes pontos são chamados de extremos. O box-plot é útil, pois tanto a média como o desvio padrão podem não ser medidas adequadas para representar um conjunto de valores, uma vez que são afetados, de forma exagerada, por valores extremos. Além disso, apenas com estas duas medidas não temos idéia da assimetria da distribuição dos valores. Dessa forma, essa construção gráfica soluciona tais problemas.

Page 7: Trabalho de Estatistica

É necessário decidir o que fazer com as observações discordantes. A maneira mais simples de lidar com essas observações é eliminá-las. Esta abordagem, apesar de ser muito utilizada, não é aconselhável. Ela só se justifica no caso de os outliers serem devidos a erros cuja correção é inviável. Não sendo o caso, as observações consideradas como outliers devem ser tratadas cuidadosamente, pois contêm informação relevante sobre características subjacentes aos dados e poderão ser decisivas no conhecimento da população à qual pertence à amostra em estudo.

Histograma

De longe o método mais comum de apresentação de dados numéricos é o histograma, relacionado com o gráfico de barras para dados categóricos. O histograma consiste em retângulos contíguos com base nas faixas de valores da variável e com área igual à freqüência absoluta ou relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada densidade de freqüência ou simplesmente densidade definida pelo quociente da área pela amplitude da faixa.Pode ser usado na verificação de outliers.

Page 8: Trabalho de Estatistica

Diagrama de Dispersão

É um gráfico de pares de dados (x,y), com um eixo x horizontal e um y vertical.Os dados são colocados em pares que combinam cada valor de um conjunto de dados em com um valor correspondente de um segundo conjunto de dados.São úteis para demonstrar correlações entre os dados, agrupamento ou dispersão de uma das variáveis em relação à outra e a ocorrência de outliers.

Page 9: Trabalho de Estatistica

Referências Bibliográficas

Moroco, J. (2003), Análise Estatística de dados – com utilização do SPSS, Edições Sílabo,Lisboa.

Figueira, M.M.C, Identificação de Outliers, MILLENIUM nº12 – Outubro de 1998.

Triola,M.F.,Introdução à Estatística.Décima edição.2008.LTC. Capítulo2 Hulley,S.B. et al, Delineando a Pesquisa Clínica, uma abordagem epidemiológica.2ª

edição.2001.Artmed.Capítulos 7,8,10 e 11. SOARES JF, SIQUEIRA AL (1999). Introdução à estatística médica. Belo Horizonte, UFMG:

Coopmed Editora Médica. 300p. CALLEGARI-JACQUES SM (2003). Bioestaística – princípios e aplicações. Porto Alegre:

Artmed. 255p. http://www.scielo.br/img/revistas/prod/v12n1/a04q09.gif

http://www.anvisa.gov.br/institucional/snvs/coprh/cursos/met_epid.pdf

Em um estudo de coorte prospectivo, o investigador: seleciona uma amostra da população,mede as variáveis preditoras e mede, durante o acompanhamento, o desfecho(nesse caso uma doença que se desenvolveu em proporção maior nos sujeitos com o fator de risco.)

Em um estudo de coorte retrospectivo, o investigador: identifica uma coorte montada no passado, coleta dados sobre as variaveis preditoras (medidas no passado),coleta dados sobre as variáveis de desfecho(medidas no passado ou no presente)

No estudo transversal, o invetigador: seleciona uma amostra da população e mede as variáveis preditora e de desfecho.

Em um estudo de caso-controle, o investigador: seleciona uma amostra de uma população de sujeitos com a doença(casos), seleciona uma amostra de uma população em risco e sem a doença(controles), mede as variáveis preditoras.

Em um ensaio randomizado, o investigador: seleciona uma amostra da população, mede as variáveis basais,randomiza os participantes,aplica intervenções (se possível,uma delas um placebo cego), acompanha a coorte e mede as variaveis de desfecho e então , analisa os resultados.