curso de analise estatistica_unifesp_2007

Upload: gabriel

Post on 08-Jan-2016

5 views

Category:

Documents


0 download

DESCRIPTION

estatistica

TRANSCRIPT

  • Curso de Anlise EstatsticaUNIFESP 2007Prof. Dr. Clvis de Arajo [email protected]

  • FILOSOFIA DO CURSO um curso de estatstica que no exige conhecimento prvio e os conceitos so introduzidos atravs de exemplificao prtica, dando nfase na intuio e no na argumentao matemtica.

    O curso dividido em duas partes:Na primeira parte sero discutidos conceitos fundamentais de estatstica descritiva e inferencial, que permitem ao aluno entender a essncia do pensamento estatstico.

    Na segunda parte iremos realizar a anlise estatstica completa de projetos de pesquisa desde o planejamento at a concluso. Os projetos so escolhidos de forma a contemplar o ensino de diferentes tcnicas de anlise estatstica.

    importante que o aluno participe de todas as etapas de discusses com perguntas relacionadas com a sua rea de atuao.

    O material didtico distribudo apenas um guia do roteiro do curso.

  • Programa do CursoParte 1: Definies e conceitos bsicos.

    I - Definio de Estatstica;II - Interao entre a Estatstica e o Mtodo Cientfico;III - Tipos de variveis geradoras de dados;IV - Planejamento de pesquisa Observacional e Experimental : diferentes formas de obteno de dados;V - Descrio de um conjunto de dados obtidos por Levantamentos Populacionais, Amostrais ou Experimentos Controlados atravs de: medidas-resumo, tabelas e grficos apropriados para cada situao;VI - Conceitos essenciais para se entender a Anlise Estatstica Inferencial: erro amostral, intervalo de confiana para uma amostra e determinao de tamanho de amostra. VII - Noes sobre Teste de Hipteses para comparao de dois grupos, variveis Numricas e Categricas.VIII - Noes sobre Intervalo de Confiana para comparao de dois grupos, variveis Numricas e Categricas.

  • Programa do CursoParte 2: Anlise Estatstica de Projetos de Pesquisa com o uso do computador.

    I - Estudo da relao entre variveis categricas: Chi- Quadrado, Teste exato de Fisher.II - Estudo da relao entre uma varivel resposta numrica e variveis explicativas categricas: Anlise de Varincia.III - Estudo da relao entre variveis numricas: Anlise de Regresso.

    Referncias: - Practial Statistics For Medical Research, Douglas G. Alltman. Chapman& Hall/CRC - Introduo Estatstica Mdica, Jos Francisco Soares e Arminda Lucia Siqueira. Departamento de Estatstica UFMG

  • I Definio de Estatstica um campo de estudos que produz metodologia para:Decidir qual o melhor Plano para a realizao de uma Pesquisa cientfica ou observacional (analtica ou descritiva);

    Organizar e Sumarizar dados obtidos por classificao, contagem ou mensurao, ou transformaes destes, e

    Fazer inferncias sobre populaes de unidades (indivduos, objetos, animais) quando apenas uma parte (amostra) estudada (classificada, contada ou medida).

    Sub-reas da Estatstica:(1) Planejamento de experimentos e tcnicas de amostragem;(2) Estatstica Descritiva;(3) Estatstica Inferencial. CAP

  • II- Interao entre estatstica e pesquisa cientfica

  • III Tipos de variveis geradoras de dados

  • III - Tipos de variveis geradoras de dados

  • IV - Planejamento da PesquisaTipos de PesquisaIV.A. Observacional: coletamos informaes sobre variveis categricas e numricas de interesse, em indivduos de um ou mais grupos, mas no realizamos intervenes. Quanto forma de obteno dos dados, pode ser prospectivo, retrospectivo ou transversal.Exemplos: Levantamento Populacional, Levantamento Amostral e Estudo Epidemiolgico.

    IV.B. Experimental: coletamos as informaes como no caso anterior, mas os resultados so influenciados pelo pesquisador com intervenes. Em geral necessrio grupo controle. A forma de obteno dos dados , em geral, prospectiva, longitudinal. Exemplos: Ensaios Clnicos, experimentos nas reas de agronomia, industria e laboratrios.

  • IV.A Pesquisas ObservacionaisIV.A.1 Levantamentos populacionais

    Contnuos quando os eventos vo sendo registrados medida que ocorrem . Ex : registros de bitos, nascimentos, casamentos

    Peridicos so aqueles que acontecem ciclicamente. Ex: censos populacionais que ocorrem a cada 10 anos.

    Ocasionais so aqueles realizados sem preocupao de continuidade ou periodicidade pr estabelecidas.

    Obs: A anlise estatstica recomendada: Descritiva ou Exploratria de dados.

  • IV.A Pesquisas ObservacionaisIV.A.2 Levantamentos Amostrais

    - Etapas:

    Definio do objetivo;Descrio da populao (populao objetivo e amostrada);Unidade amostral e unidade de informao;Forma de obteno da informao (instrumentos de coleta);Escolha do Plano Amostral apropriado:Amostra casual simplesAmostra estratificadaAmostra em mltiplos estgios

  • - Condies de vida das famlias da RMSP;- Pesquisa de Emprego e Desemprego da RMSP;- Grau de satisfao dos usurios da SABESP;- Estimao da prevalncia de cefalia no municpio de Marlia- Grau de satisfao de usurios da rede hospitalar do municpio de Guarulhos;- Perfil scio-econmico dos favelados e encortiados do municpio de So Paulo;- Estudo do rendimento escolar na rede Estadual de Ensino na RMSP.IV.A Pesquisas Observacionais

    IV.A.2 Levantamentos Amostrais Exemplos

  • IV.A Pesquisas Observacionais

    IV.A.3 Estudos Epidemiolgicos So, em geral, necessrios quando informaes preliminarmente coletadas indicam que um estudo epidemiolgico mais detalhado deve ser conduzido para estudar a associao entre uma varivel resposta dicotmica (doena, bito) e variveis explicativas categricas e numricas

    COORTESEm estudos de coorte prospectivo todos os indivduos includos so no doentes e divididos em 2 grupos, expostos e no expostos. O coorte seguido por um perodo de tempo e taxas de incidncia da doena so comparadas entre expostos e no expostos. Este estudo tambm pode ser conduzido retrospectivamente selecionando dois grupos de indivduos expostos e no expostos comparando-se taxas de incidncia da doena em um perodo de tempo passado.

  • CASO-CONTROLEEm estudos de caso-controle um grupo de doentes (casos) e um grupo de no doentes (controles) so selecionados. A proporo de indivduos que foram expostos por um perodo de tempo calculada nos grupos e comparadas.

    TRANSVERSALEm estudos transversais ou de prevalncia, exposio a fatores de risco e de ocorrncia da doena so avaliados simultaneamente num ponto no tempo em um grupo de indivduos. Taxas de prevalncia da doena so comparadas entre expostos e no expostos.IV.A Pesquisas Observacionais

    IV.A.3 Estudos Epidemiolgicos

  • IV.B Pesquisa Experimental - Etapas:

    Objetivo;Descrio das situaes experimentais que serocomparadas (Tratamentos);Descrio da populao experimental;Escolha da unidade experimental;Escolha do Plano Experimental:Completamente casualizado (amostras no pareadas)Blocos casualizados (amostras pareadas)Experimentos Cross-over

  • IV.B Pesquisa Experimental

    Exemplo # 1 - Teste do efeito do Metoprolol em pacientes de 65 a 74 anos que tiveram Infarto Agudo do Miocrdio. Comentrios:Os pacientes foram aleatorizados a cada um dos grupos e aps o seguimento de 3 meses foi registrado o estado vital;O estudo um Ensaio Clnico completamente aleatorizado, prospectivo, com amostras independentes isto , no pareada o estudo da relao entre duas variveis categricas dicotmicas, uma resposta e a outra explicativa.

  • IV.B Pesquisa Experimental

    Exemplo # 2 Comparao de 3 grupos de gestantes - normais (N), tolerncia diminuda (TD) e diabticas (D) em relao a hemoglobina glicosilada (HbA). Comentrios: um plano experimental completamente casualizado com um critrio de classificao. Trs amostras independentes de 10 gestantes, uma para cada classe, amostras no pareadas.Estudo da relao entre uma varivel numrica resposta, (HbA) e uma explicativa categrica, classe de gestantes.

  • IV.B Pesquisa ExperimentalExemplo # 3: Estudo sobre perda de peso(kg) em obesos para 2 diferentes terapias e 4 diferentes dietas. Comentrios: um plano experimental completamente casualizado com dois critrios de classificao. So 8 amostras independentes de 5 indivduos, no pareadas, uma para cada combinao (dieta, terapia).Estudo da relao entre duas variveis categricas explicativas, dieta e terapia, e uma numrica, resposta.

  • IV.B Pesquisa Experimental Comentrios:1) O Plano Experimental utilizado foi Cross-Over. Cada indivduo submetido s 2 drogas em perodos diferentes. 30 indivduos recebem a droga A e os outros 30 recebem a droga B no primeiro perodo. Em um segundo perodo, aps a eliminao do efeito residual, os dois grupos recebem as drogas em ordem contrria. 2) So amostras pareadas onde cada indivduo controle dele mesmo.Exemplo # 4 : Comparao de duas drogas para normalizar a presso sangunea em hipertensos

  • V Anlise exploratria de dados A Anlise Descritiva ou Exploratria de dados consiste em obter: - Medidas que resumem informaes de um conjunto de dados quanto a posio central e variabilidade. - Grficos e tabelas que mostram a distribuio dos dados.

    Estes conceitos sero apresentados de acordo com o seguinte esquema:

    Varivel numrica 1) Medidas de Variabilidade e de Posio: Amplitude, Desvio padro, Mdia, Mediana e Quartil;2) Representao grfica: Histograma e Box-plot;3) Propriedades da distribuio normal.

    b) Varivel categrica

    medidas de variabilidade e de posio obtidas das frequencias. representao grfica: grfico de barras e pizza.

  • Varivel numrica: Exemplo 1: Duas amostras de 20 indivduos1) Medida de variabilidade Amplitude Amostra 1: Estatura mnima: 140 cmEstatura mxima: 180 cm Amostra 2: Estatura mnima: 150 cm Estatura mxima: 170 cm Questo 2: Quanto a variabilidade individual de uma amostra maior do que a outra?Resposta:Questo 1: Em qual das duas amostras os indivduos variam mais em relao estatura?Resposta: CONCEITOS:V Anlise exploratria de dados

  • Varivel numrica: Exemplo 2: Duas amostras de 6 indivduos(os valores abaixo representam a estatura, em cm) 1) medidas de variabilidade e de posio Media e Desvio padroAmostra 1: 150, 151, 153, 155, 158, 160Amostra 2: 150, 155, 155, 155, 155, 160 Questo 1: Em qual das duas amostras os indivduos variam mais em relao estatura? Resposta:Questo 2: Quanto a variabilidade de uma amostra maior que a da outra? Resposta:CONCEITOS:V Anlise exploratria de dados

  • Varivel numrica : 2) Representao grfica para amostras grandes - Histogramaa) Histograma (distribuio de freqncia emprica)V Anlise exploratria de dados

  • Varivel numrica : b)Representao grfica para amostras pequenas - BoxPlot : (forma de agrupar dados atravs dos percentis) Exemplo : Estudo sobre Diabetes Gestacional - Comparao de 3 grupos de gestantes, normais, tolerncia diminudas e diabticas em relao a hemoglobina glicosilada (HbA). Box-Plot do nvel de Hemoglobina glicosilada, segundo grupo de gestantes.V Anlise exploratria de dados

  • Varivel numrica: 3) Noes sobre a Distribuio NormalPropriedades da Distribuio Normal68% dos valores individuais esto entre - e + 90% dos valores individuais esto entre - 1,64 e + 1,6495% dos valores individuais esto entre - 1,96 e + 1,9699,7% dos valores individuais esto entre - 3 e + 3Mdia = Mediana = ModaCoeficiente de Assimetria = 0 [-1; 1] ou [-2;2]Coeficiente de Curtose = 0 [-1; 1] ou [-2;2]V Anlise exploratria de dados

  • Varivel numrica : 4) Curva normal ajustada distribuio de freqncia empricaV Anlise exploratria de dados

  • Varivel categrica : 1) medidas de variabilidade e de posioExemplo: Duas amostras de 20 indivduos classificados em relao ao sexo. .

    Questo 1: Em qual das duas amostras os indivduos variam mais em relao ao sexo? Resposta: Questo 2: Quanto a variabilidade de uma amostra maior que a da outra? Resposta:CONCEITOS:V Anlise exploratria de dados

  • Varivel categrica: 2) Representao grfica: grfico de barras e pizza V Anlise exploratria de dados

    Grf1

    76.6490765172

    23.3509234828

    Fonte : PED-Dez/1999

    Percentual

    Distribuio de Chefes de Famlias segundo gnero

    Plan1

    Quadro 3- Distribuio de Chefes de Famlias segundo gnero

    sexofreqnciaporcentagem (%)

    masculino174376.6

    feminino53123.4

    total2274100.00

    Fonte PED -Dez/1999

    masculino76.6

    feminino23.4

    Plan2

    Plan2

    76.6490765172

    23.3509234828

    Fonte : PED-Dez/1999

    Percentual

    Distribuio de Chefes de Famlias segundo gnero

    Plan3

  • VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.Essncia da Estatstica InferencialConsidere uma populao de indivduos representada por uma varivel numrica (Albumina Srica).

  • VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.Questo de interesse

    Queremos estimar por meio de uma amostra de tamanho n a mdia populacional .

  • Consideraes sobre a soluoa) Tipo de Amostra: Amostra probabilstica;

    b) Para qualquer tamanho de amostra n a mdia da amostra sempre diferente da mdia da populao;

    c) A distncia entre a mdia da amostra e a mdia da populao chamada de Erro Amostral (EA).VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.

  • Consideraes sobre a soluo d) Para uma determinada populao com uma determinada varincia, quanto maior for o tamanho da amostra menor ser o EA e) Para um determinado tamanho de amostra quanto mais espalhada for a populao em torno da mdia (varincia), maior ser o EA Concluso: Portanto podemos escrever que o erro amostral (EA) proporcional ao quociente

    Ou

  • Formulas para se calcular Erro amostral, tamanho da amostra e construir intervalo de confiana para mdias e propores

  • VII Comparao de dois grupos: (Testes de Hipteses) > - Roteiro para testes de hipteses

    a) Formulao das hipteses estatsticas: Hiptese Nula (Ho) Hiptese Alternativa (Ha)

    b) Determinao de uma medida de afastamento da hiptese

    c) Obteno de um Sistema de Referncia

    d) Calculo do valor p [ Nvel de Significncia observado, p-value ], que representa a probabilidade de errar quando o pesquisador rejeita Ho)

    CAP

  • VII Comparao de dois grupos: (Testes de Hipteses) EXEMPLO 1: Varivel Numrica, Amostras no pareadasComparao de motoristas que se declaram hiper-tensos e normais em relao ao ndice de Massa Corprea (IMC)

    Presso altaSimNoTotalN278522800Mdia28,0226,4626,72Varincia17,6437,3388,73Desvio-padro4,206,119,42Erro-padro0,250,270,23

  • VII Comparao de dois grupos: (Testes de Hipteses)Representamos o IMC mdio por: 1 , IMC mdio dos hipertensos 2, IMC mdio dos normais b) Medida de afastamento da hiptese nulaversusFormulao das Hipteses:Soluo:onde

  • Sistema de Referncia: Distribuio t-Student com (nsim+nno2) graus de liberdade;c) Nvel de Significncia Descritivo: p=0,0001;Concluso: O IMC mdio dos indivduos com presso alta estatisticamente maior do que o IMC mdio dos indivduos com presso normal (p=0,0001).

  • VII Comparao de dois grupos: (Testes de Hipteses)EXEMPLO 2: Varivel Categrica, Amostras no pareadasEstudo sobre presena de sintomas da doena entre vacinados e no vacinados

    Sintomas da doenaVacinadoNo vacinadoTotalSim5 (3,3%)45 (12,9%)50 (10,0%)No145 (96,7%)305 (81,7%)450 (90,0%)Total150 (100,0%)350 (100,0%)500 (100,0%)

  • VII Comparao de dois grupos: (Testes de Hipteses)Soluo:Formulao das Hipteses: b) Medida de afastamento da hiptese nula

  • c) Sistema de Referncia: Distribuio de Qui-quadrado com 1 grau de liberdade;d) Nvel de Significncia Descritivo: p=0,0011;Concluso: A proporo de indivduos com sintoma da doena, entre os vacinados, estatisticamente menor que entre os no vacinados (p=0,0011).VII Comparao de dois grupos: (Testes de Hipteses)

  • VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica) Clculo do erro padro (EP) da diferena entre as mdias; Roteiro para Intervalo de ConfianaVarivel Numrica:Clculo da diferena observada (d) entre as duas mdias;Clculo do erro amostral da diferena das mdias EA(x1 x2) = c(EP), onde c corresponde ao coeficiente de confiana;

  • VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica) Roteiro para Intervalo de Confiana (cont.)Varivel Numrica:Clculo do intervalo de confiana (IC)Interpretao do intervalo de confiana.

  • EXEMPLO 1: Varivel Numrica, Amostras no pareadasComparao de motoristas que se declaram hiper-tensos e normais em relao ao ndice de Massa Corprea (IMC)VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica)

  • Interpretao: Com 95% de Confiana, a diferena mdia de IMC entre hiper-tensos e normais foi de 1,56 kg/(cm)2, podendo atingir um valor mnimo de 0,76 kg/(m)2 e um valor mximo de 2,36 kg/(m)2

  • VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Clculo do erro padro (EP) da diferena entre as propores: Roteiro para Intervalo de ConfianaVarivel Categrica:Clculo da diferena observada (p1-p2) entre as duas propores;Clculo do erro amostral da diferena das propores EA(p1 p2) = c(EP), onde c o coeficiente de confiana;

  • VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Roteiro para Intervalo de Confiana (cont.)Varivel Categrica:Clculo do intervalo de confiana (IC)Interpretao do intervalo de confiana.

  • EXEMPLO 2: Varivel Categrica, Amostras no pareadasEstudo sobre presena de sintomas da doena entre vacinados e no vacinadosVIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica)

  • VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Interpretao:

    Com 95% de Confiana, a diferena da proporo de Indivduos com sintoma, entre os no vacinados e os vacinados, foi de 0,096 (9,6%), podendo atingir um valor mnimo de 0,051(5,1%) e um valor mximo de 0,141(14,1%).

    ************************************************