estatÍstica descritiva [modo de compatibilidade]

Post on 06-Jun-2015

3.813 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Curso de Pós Graduação em Gestão de Saúde Pública com ênfase em PSF

BIOESTATÍSTICABIOESTATÍSTICA

Eduardo Arrudas OrnelasBiólogo

á Mestre em Medicina Veterinária UFMG

Métodos estatísticosestatísticos

Estatística Descritiva

Estatística InferencialDescritiva Inferencial

Estatística descritiva:R ú j t d té i i d dReúne um conjunto de técnicas para sumarizar os dados(tabelas, quadros e gráficos) e medidas descritivas quepermitem tirar muitas informações contidas nos dadospermitem tirar muitas informações contidas nos dados.

Inferência estatística :Produzir afirmações sobre uma dada característica daProduzir afirmações sobre uma dada característica dapopulação, na qual estamos interessados, a partir deinformações colhidas de uma parte dessa população.ç p p p ç

Estatística Descritiva

• EnvolveC l d d–Coletar dados

–Apresentar dados–Caracterizar dados–Caracterizar dados

• Finalidade–Descrever dados

Estatística Inferencial

Envolve• Envolve–Estimativas–Teste de hipóteseTeste de hipótese

• Finalidade–Tomar decisões sobre característicasda população de uma coleta.

População e AmostraPopulação e Amostra

• População (ou universo): todos os NPopulação (ou universo): todos os Nmembros de uma classe ou grupo.

– Ex.: todos os alunos de pós graduação daDOCTUMDOCTUM

• Amostra é uma parte da populaçãoAmostra é uma parte da população,denotada por n.

– Ex.: todos os alunos de pós graduação emsaúde pública com ênfase em PSFsaúde pública com ênfase em PSF.

Características importantes dos dadosCaracterísticas importantes dos dados

1. Localização: Um valor representativo ou médiopindica onde se situa o centro dos dados.

2 V i ã : Um m did d t l d2. Variação: Uma medida do quanto os valores daamostra variam entre si.

3. Distribuição: A natureza ou a forma dedistribuição dos dados (tal como em forma de sino,uniforme ou assimétrica)

4 Tempo: Algumas características podem se alterar4. Tempo: Algumas características podem se alterarao longo do tempo.

Imp t t !!!Importante!!!

POPULAÇÃOPOPULAÇÃO AMOSTRAGEM

nNN

Distribuição de FreqüênciaDistribuição de Freqüência

lista dos valores dos dadoslista dos valores dos dados(ou individuais ou por grupos dei t l ) j t tintervalos), juntamente com ascorrespondentes freqüências oucontagens.

O d d t bé d idOs dados também podem ser resumidosconstruindo uma tabela de distribuição def üê ifreqüências.

Di t ib i ã d f üê i d iá l éDistribuição de freqüências de uma variável éuma lista dos valores que a variável pode

i ti f üê i dassumir, com as respectivas freqüências deocorrência.

Tabelas de contingência

Tabela de contingênciaTabela de contingência

Em estatística as tabelas de contingência são usadas pararegistar e analisar o relacionamento entre duas ou mais variáveisregistar e analisar o relacionamento entre duas ou mais variáveis,normalmente de escala nominal.

Suponhamos que temos duas variáveis sexo (masculino ouSuponhamos que temos duas variáveis, sexo (masculino oufeminino) e mão com que escreve (destro ou canhoto).Observamos os valores de ambas as variáveis de uma amostra

l d 100 U t b l d ti ê i d dcasual de 100 pessoas. Uma tabela de contingência pode ser usadapara expressar o relacionamento entre estas duas variáveis, comose segue:

MASCULINO FEMININO TOTALDESTROS 43 9 52DESTROS 43 9 52

CANHOTOS 44 4 48TOTAL 87 13 100

T b l d ti ê iTabela de contingência

VARIÁVEIS A B TOTALVARIÁVEIS A B TOTALC AC BC AC + BCD AD BD AD + BD

TOTAL AC + AD BC + BD A + B + C + D= N

FreqüênciaFreqüência

Freqüência absoluta (fa): o resultado do número de vezesFreqüênc a absoluta (fa) o resultado do número de vezesque o valor é observado na população.

ê l (f ) l d d d dFreqüência relativa (fr): o resultado obtido da divisãoentre a freqüência que o valor é observado na populaçãoe a quantidade de elementos da populaçãoe a quantidade de elementos da população.Geralmente é apresentada na forma de porcentagem.

fa (Skol)=9( )

fr(Skol)=9/25 = 0,36 ou 36%

A interpretação da freqüência e distribuição da amostra

• Quando se faz inferências estatísticas do ponto devista da freqüência, nós assumimos que nossos dados sãovista da freqüência, nós assumimos que nossos dados sãoamostras de uma população inteira.

é é â• A população é descrita pela média e variância dapopulação que são desconhecidas.

• A amostra é descrita pela média e variância da amostra.– A média e variância da amostra provêm estimativasm a ar ânc a a amostra pro m st mat assobre a média e variância da população inteira.– As estimativas são conhecidas com um grau deincerteza.

Variáveis Quantitativas:

Medidas de Posição:•MáximoMí i•Mínimo•Moda•Média•Média•Mediana•Quartil,Percentil, DecilQ , ,

M did d Di ãMedidas de Dispersão•Amplitude•Intervalo InterquartilIntervalo Interquartil•Variância•Desvio Padrão•Coeficiente de Variação

MEDIDAS DE MEDIDAS DE ÃPOSIÇÃOÇ

Medidas de tendência centralMedidas de tendência central

did d dê i l ãAs medidas da tendência central sãoparâmetros que permitem que se tenhap q p quma primeira idéia, um resumo, de comose distribuem os dados de umse distribuem os dados de umexperimento.

Medidas de posiçãoMedidas de posição

Máximo (Max): a maior observação

Mínimo (Min): a menor observação

Moda (Mo): é o valor (ou atributo, caractrerística) queocorre com maior frequenciaocorre com maior frequencia.

Dados: 5,3,4,3,9,4,5,6,6,5,6,6,8,8

Max 9Max = 9Min = 3Mo = 6Mo 6

Média

É a soma das medidas (resultados)di idid l ú ddividida pelo número de casos .

É a medida mais utilizada no entantoÉ a medida mais utilizada, no entantosofre bastante influência de valores

t È did i lextremos. È uma medida irreal.

Mediana

É o valor da variável a partir da posição central de umconjunto de dados n (dados ordenados) na qual a metade dos

s s s t i d l t d s t b icasos se encontra acima dele e a metade se encontra abaixo.

Obs: se o número de observações for ímpar, a mediana será oç p ,valor central da distribuição;Se o número for par a mediana será a média dos valorescentraiscentrais.

Pouco afetada por valores discrepantes existentes nop pconjunto (que costuma distorcer substancialmente o valor damédia)

Posição da mediana = n+1 / 2

cvcv

cv

cv cvcv

cv

cvcv cv cvcv

cvcv cvcvcv

Medidas separatrizesMedidas separatrizes

Permitem identificar a posição de um valor(caso)Permitem identificar a posição de um valor(caso)em relação ao conjunto de observações, além depossibilitar comparações entre diferentespossibilitar comparações entre diferentesséries de dados.

•Quartil•Decil•Decil•Percentil

Quartil (Q)Quartil (Q)

São representados pelo 1° (Q1) 2 °(Q2) 3°(Q3)São representados pelo 1 (Q1), 2 (Q2),3 (Q3).

O 2°(Q2) quartil indica que abaixo existem 50%O 2 (Q2) quartil indica que abaixo existem 50%da distribuição, logo, acima estão os outros 50%dos dados os quartis dividem a base em 4dos dados os quartis dividem a base em 4partes.

Decil (D)( )

São representados por por um conjunto de dadosd d D1 D2 D3 D9 d ilordenados D1,D2,D3........e D9 decil.

O 1° decil (D1) de um conjunto de dados informa queabaixo estão localizados 10% dos dados do conjunto deabaixo estão localizados 10% dos dados do conjunto deobservações e , assim sendo, acima estão os 90%restantes. Os outros decis são representados depforma semelhante.

5° decil (D5)= valor Mediano (Md).

Percentil (P)Sã t d j t d d d d dSão representados por um conjunto de dados ordenadosP1,D2,D3........e P99 percentil.O 1° percentil (P1) informa que 1% dos dados estãop ( ) f m qulocalizados abaixo desse valor, e, por seguinte os 99%restantes estão acima. A interpretação dos demais é feitade forma análogade forma análoga.

Percentil (P50)= mediana ou segundo quartil (Md)

Percentil (P25)= primeiro quartil (Q1)Percentil (P25)= primeiro quartil (Q1)

Percentil (P25)= primeiro quartil (Q1)

Percentil (P75)= terceiro quartil (Q3)

Percentil (P10)= primeiro decil (D1)

POPULAÇÃOÇ

AMOSTRAμ AMOSTRAμ

δX

S

p´P

p

Média Mediana Moda

DefiniçãoSoma das medidas divida pelo número 

de casosValor do meio.

Valor mais freqüente.

de casos.

Existência Sempre existe. Sempre existe.Pode existir, pode haver mais de uma.

Leva em conta todos os dados

Sim NãoNão

Afetado por Não Não

pvalores 

discrepadosSim

Não Não

Usado em muitos  Menos sensível a Vantagens

Usado em muitos métodos 

estatísticos.

Menos sensível a valores 

discrepados.

Apropriada a dados qualitativos.

MEDIDAS DE MEDIDAS DE ÃDISPERSÃO

Medidas de variabilidade (dispersão)Medidas de variabilidade (dispersão)

Tem como finalidade encontrar um valor queTem como finalidade encontrar um valor queresuma a variabilidade de um conjunto de dados.

•Amplitude de variação (A)Amplitude de variação (A)•Amplitude interquatil•Desvio Padrão (s ou DP)Desvio Padrão (s ou DP)•Variância (s2)•Coeficiente de variação (CV)Coeficiente de variação (CV)•Erro padrão (se ou e)

Amplitude

É a diferença entre o maior (Máximo) e o menor (Mínimo)valor que foi observado para a variável servindo paravalor que foi observado para a variável, servindo paracaracterizar a abrangência do estudo.

Amplitude de Variação(A)Diferença entre o mínimo e o máximo do conjunto ded ddados.

Amplitude interquartilAmplitude interquartilÉ a diferença entre os valores correspondentes ao 1°(Q1) e3°(Q3) quartil (percentil (P25) e (P75). Esta medida nãoq pconsidera os valore extremos do conjunto de dados.

Desvio Padrão (s)Desvio Padrão (s)

É uma estimativa da variabilidade dos escores deÉ uma estimativa da variabilidade dos escores deum grupo (amostra) em torno da média.

O desvio padrão (s ou DP) é a raiz quadrada daO desvio padrão (s ou DP) é a raiz quadrada davariância.

A unidade do desvio padrão é igual a unidade de medida das observações.

Variância (s2)Variância (s )

É a soma dos quadrados dos desvios de cadaÉ a soma dos quadrados dos desvios de cadaponto em torno da média aritmética.Caracteriza a dispersão dos pontos de umaCaracteriza a dispersão dos pontos de umaamostra potencializando as diferenças.

Expressa a média aritmética dos quadrados. É odesvio padrão elevado ao quadrado.desvio padrão elevado ao quadrado.

Coeficiente de variação (CV)

É uma medida de dispersão relativa que indica avariabilidade da amostra em relação a médiavariabilidade da amostra em relação a média.Resultado do desvio padrão dividido pela médiatransformando em percentual.transformando em percentual.

Permite comparar a dispersão de diferentesdistribuições (com diferentes médias e desvios padrões.Elimina o efeito da magnitude dos dados.

cvcv

cv

cv cvcv

cv cv

cvcv cv cvcv

cvcv cvcvcv

Erro padrão (se ou e)Erro padrão (se ou e)

Quociente entre o desvio padrão e a raiz quadradaQuociente entre o desvio padrão e a raiz quadradado tamanho da amostra. É uma mediada devariabilidade entre a média aritmética dos dados evariabilidade entre a média aritmética dos dados ea média que poderia ser encontrada em outrasamostras do mesmo tamanho, na mesma população.amostras do mesmo tamanho, na mesma população.

O erro amostral:

i f b d b õinforma sobre o quanto de erro nossas observaçõesapresentam sobre a realidade pesquisada. A estatísticabaseia-se na medição do erro que existe entre a estimativabaseia-se na medição do erro que existe entre a estimativade quanto uma amostra representa adequadamente apopulação da qual foi extraída. Assim o conhecimento dep p ç qteoria de conjuntos, análise combinatória e cálculo sãoindispensáveis para compreender como o erro se comporta

it d d É ( t l)e a magnitude do mesmo. É o erro (erro amostral) quedefine a qualidade da observação e do delineamentoexperimentalexperimental.

Ob i d !!!Obrigado!!!

Eduardo Arrudas Ornelasornelasea@hotmail.com

top related