aula bioestatistica

75
UNIVERSIDADE ESTADUAL DO CEARÁ UECE CENTRO DE CIÊNCIAS E TECNOLOGIA CECITEC CURSO DE LICENCIATURA PLENA EM CIÊNCIAS BIOLÓGICAS DISCIPLINA: BIOESTATÍSTICA III SEMESTRE PROFº. ALEXANDRE LOPES ANDRADE NOÇÕES BÁSICAS DE BIOESTATÍSTICA Tauá/Ceará 2012

Upload: aleniv

Post on 09-Jul-2015

3.993 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Aula bioestatistica

UNIVERSIDADE ESTADUAL DO CEARÁ – UECE

CENTRO DE CIÊNCIAS E TECNOLOGIA – CECITEC

CURSO DE LICENCIATURA PLENA EM CIÊNCIAS BIOLÓGICAS

DISCIPLINA: BIOESTATÍSTICA III SEMESTRE

PROFº. ALEXANDRE LOPES ANDRADE

NOÇÕES BÁSICAS DE BIOESTATÍSTICA

Tauá/Ceará2012

Page 2: Aula bioestatistica

1.CAP-DEFINIÇÃO

A Estatística pode ser definida como oconjunto de ferramentas para a coleta,organização, análise e interpretação dedados experimentais.

A Bioestatística consiste na aplicação daEstatística à Biologia.

Page 3: Aula bioestatistica

HISTÓRICO DA ESTATÍSTICA

• ANTIGUIDADE: os povos já registravam o número dehabitantes, nascimentos, óbitos. Faziam "estatísticas".

• IDADE MÉDIA: as informações eram tabuladas comfinalidades tributárias e bélicas.

• SÉC. XVI: surgem as primeiras análises sistemáticas, asprimeiras tabelas e os números relativos.

• SÉC. XVIII: a estatística com feição científica é batizadapor Gottfried Achemmel (1719-1772). As tabelas ficammais completas, surgem as primeiras representaçõesgráficas e os cálculos de probabilidades

Page 4: Aula bioestatistica

A estatística está presente em nosso dia-a-dia

• Nos jornais, revistas, nosnoticiários de televisão, napolítica, nos estudos epesquisas científicas, quandose calcula a porcentagem depessoas que concluíram oensino Fundamental, Médioe Superior... Crescimento Educacional – 2001 a 2010

Page 5: Aula bioestatistica

ESTATÍSTICA DESCRITIVA E INFERÊNCIAL

• Descritiva: é utilizada para descrever aobservação de fenômenos, uma realidadesocial, econômica ou outra qualquer, atravésde tabelas e/ou gráficos;

Page 6: Aula bioestatistica

Descritiva

Ano: Sede: Número de medalhas:

1972 Munique 2

1976 Montreal 2

1980 Moscou 4

1984 Los Angeles 8

1988 Seul 6

1992 Barcelona 3

1996 Atlanta 15

2000 Sydney 12

• A tabela abaixo mostra o número de medalhas de Ouro que o Brasil ganhou em olimpíadas, entre 1972 e 2000.

Page 7: Aula bioestatistica

Nº de medalhas

0

5

10

15

Nº de medalhas

Nº de medalhas

Descritiva

Page 8: Aula bioestatistica

ESTATÍSTICA DESCRITIVA E INFERÊNCIAL

• Indutiva: refere-se a um processo degeneralização, a partir de resultadosparticulares.

Page 9: Aula bioestatistica
Page 10: Aula bioestatistica

POPULAÇÃO E AMOSTRA

• População- É o conjunto da totalidade deindivíduos que apresentam uma característicacomum, cujo comportamento se quer analisar(finita ou infinita).

Page 11: Aula bioestatistica

• Amostra- É um subconjunto finito dapopulação, ou seja, é uma parte da populaçãoda qual se observa algumas características.

Page 12: Aula bioestatistica

VARIÁVEIS

Em Estatística trabalhamos com variáveis querepresentam as características dos elementosque formam o conjunto de dados.

As variáveis podem ser:

• Qualitativas

• Quantitativas

Page 13: Aula bioestatistica

VARIÁVEIS

Page 14: Aula bioestatistica

VARIÁVEIS

Page 15: Aula bioestatistica

APRESENTAÇÃO DE DADOS

1. Tabelas- são representações que resumemum conjunto de informações observadasnum fenômeno.

São partes de uma tabela:

• Titulo

• Cabeçalho

• Corpo

Page 16: Aula bioestatistica

TABELAS

Anos Produção por Toneladas

1995 20.000

1996 27.000

1997 27.500

1998 29.000

1999 29.800

2000 30.000

Produção de Café no Brasil 1995-2000TABELA 1.1

Fonte: Imaginária

Page 17: Aula bioestatistica

2. Series Estatísticas- são tabelas queapresentam uma distribuição de um conjuntode dados em função da época, do local ou daespécie.

APRESENTAÇÃO DE DADOS

Page 18: Aula bioestatistica

Série Cronológica

Anos Vendas

2000 30.000

2001 45.000

2002 75.000

2003 85.000

Vendas da Campanha 2000 a 2003TABELA 1.2

Fonte: Imaginária

Page 19: Aula bioestatistica

Região Quantidade de Crianças

Norte 200.000

Nordeste 600.000

Sudeste 1.100.000

Sul 400.000

Centro Oeste 180.000

Série Geográfica

Vacinação contra PoliomieliteBrasil- 1993

TABELA 1.3

Fonte: Imaginária

Page 20: Aula bioestatistica

Setor Industrial Quantidade (Toneladas)

Aço 400

Papel 180

Açúcar 90.000

Chocolate 40.000

Produção média de cada operário por setorBrasil- 2002

TABELA 1.4

Série Especifica

Fonte: Imaginária

Page 21: Aula bioestatistica

Gráficos Estatísticos

1. Por Setor

Fonte: Google Analytcs

Page 22: Aula bioestatistica

2. Linha:

Gráficos Estatísticos

Fonte: Associação brasileira de prevenção dos acidentes de Trânsito

Page 23: Aula bioestatistica

3. Colunas:

Gráficos Estatísticos

Fonte: Projeto Nacional de Telessaúde – Núcleo São Paulo

Page 24: Aula bioestatistica

2. CAP-DISTRIBUIÇÃO DE FREQUÊNCIA

• Distribuição de freqüência com intervalos declasse: quando o tamanho da amostra éelevado, é mais racional efetuar oagrupamento dos valores em vários intervalosde classe.

Page 25: Aula bioestatistica

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• CLASSE- São os intervalos de variação davariável. São sempre iguais, em todas asclasses

Ex: 3ª classe é representada pela freqüência dedados encontrados entre 49 e 53 cm (49 |---- 53)

Page 26: Aula bioestatistica

• LIMITES DE CLASSE- Sãoos extremos de cadaclasse. O menornúmero é o limiteinferior de classe e omaior número, o limitesuperior de classe. Ex:em 49 |------- 53 (classe3), o limite inferior é 49e o superior é 53.

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 27: Aula bioestatistica

• AMPLITUDE DO INTERVALO DE CLASSE-

É a medida obtida pela diferença entre olimite superior e inferior da classe. Ex: natabela anterior, a amplitude da classe 3ª éigual a 53 - 49 = 4

Também pela Fórmula: h= AA/K

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 28: Aula bioestatistica

• AMPLITUDE AMOSTRAL (AA)- É a diferençaentre o valor máximo e o valor mínimo daamostra (ROL). Em nosso exemplo, aamplitude da amostra é igual a 60 - 41 = 19.

Fórmula = −

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 29: Aula bioestatistica

• AMPLITUDE TOTAL (At)- É a diferença entre olimite superior da última classe e o limiteinferior da primeira classe.

At= Xmax- Xmin

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 30: Aula bioestatistica

• PONTO MÉDIO DA CLASSE- É o ponto quedivide o intervalo de classe em duas partesiguais. Também dado pela fórmula:

Xi= Linf+ Lsup /2

Ex: a classe 3ª

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 31: Aula bioestatistica

• NÚMERO DE CLASSES- A primeirapreocupação para a construção de umadistribuição de freqüência.

Para a determinação do número de classes deuma distribuição, usamos a Regra de Sturges:

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Page 32: Aula bioestatistica

PASSOS PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSE:

1. Organize os dados brutos em Rol;

2. Calcular a Amplitude Amostral (AA);

3. Calcular o Nº de Classes (K);

4. Calcular o Ponto Médio Xi= Liminf+Limsup ;

2

5. Confeccionar a Tabela.

Page 33: Aula bioestatistica

EXERCÍCIO

• Considere a distribuição de freqüência a seguir e responda (F) ou (V):

Diâmetro fi

4|.... 6

6|.... 8

8|.... 10

10|.... 12

12|.... 14

5

9

13

10

3

∑ 40

Page 34: Aula bioestatistica

• a) Menos de 85% tem diâmetro não inferior a 6cm ( ).

• b) 75% das observações estão no intervalo de 6|.... 12 ( )

• c) A soma dos pontos médios é inferior a soma da Fi ( )

• d) 32,5% das observações estão na 4ª classe ( )

• e) 27% das observações tem diâmetro baixo de 10cm

( )

Page 35: Aula bioestatistica
Page 36: Aula bioestatistica

3.CAP- MEDIDAS DE POSIÇÃO E DISPERSÃO

As medidas de posição mais importantes sãoas medidas de tendência central, que SÃOassim chamadas pelo fato de os dados seagruparem em torno dos valores centrais.

• Média Aritmética;

• Moda;

• Mediana.

Page 37: Aula bioestatistica

MEDIDAS DE POSIÇÃO

• Média Aritmética Simples ( X ):

Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número deles:

X = ∑ Xi

• Média Aritmética Ponderada ( X ): A média é considerada Ponderada quando somam-se valores (Pesos) diferentes ao conjunto das observações:

X = ∑ xi fi

n

∑ fi

Page 38: Aula bioestatistica

• Dados não agrupados:Ex: Sabendo-se que a produção de solvente do reatorA, durante uma semana, foi de 10, 14, 13, 15, 18, 16 e 12litros, temos, para produção média da semana:

x = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14

Ex2: Um professor aplicou quarto provas e atribuiu os seguintes pesos respectivamente: 1, 2, 3, 4. se um aluno tiver recebido as notas 8, 7, 9 e 9 nessa ordem, sua nota final será:

X= (8x1)+ (7x2)+ (9x3)+(9x4)= 85 = 8,5

Média Aritmética ( X )

7 7

1+2+3+4 10

Page 39: Aula bioestatistica

• Dados agrupados: Sem intervalo de classe:

Consideremos a distribuição relativa a 34 famílias de quatrofilhos, tomando para variável o numero de filhos do sexomasculino:

Nº de

meninos

fi

0

1

2

3

4

2

6

10

12

4

∑ = 31

Tabela 01:

Média Aritmética ( X )

Page 40: Aula bioestatistica

Média Aritmética ( X )

• Neste caso, como as freqüências são números indicadores daintensidade de cada valor da variável, elas funcionam comofatores de ponderação, o que nos leva a calcular a médiaaritmética ponderada, dada pela formula:

X = ∑ xi fi

∑ fi

Page 41: Aula bioestatistica

Xi fi Xifi0

1

2

3

4

2

6

10

12

4

0

6

20

36

16

∑ = 34 ∑ = 78

Tabela 02:

X= 78/34= 2,29 ou 2,3 Meninos

Page 42: Aula bioestatistica

• Dados agrupados: Com intervalo de classe:

Neste caso, convencionamos que todos os valores incluídosem um determinado intervalo de classe coincidem com o seuponto médio, e determinamos a média aritmética ponderada.

i Estaturas

(cm)

fi xi xifi

1

2

3

4

5

6

150 – 154

154 – 158

158 – 162

162 – 166

166 – 170

170 – 174

4

9

11

8

5

3

152

156

160

164

168

172

608

1404

1760

1312

840

516

∑ = 40 ∑ = 6440

Tabela 03:

Page 43: Aula bioestatistica

• Temos: ∑ xifi = 6440, ∑ fi = 40

x = 6440 = 161 cm40

Page 44: Aula bioestatistica
Page 45: Aula bioestatistica

• Moda (Mo): Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.

Dados não agrupados:A serie de dados:

7, 8, 9, 10, 10, 10, 11, 12, 13, 15

Tem moda igual a 10.

Podemos, entretanto, encontrar séries nas quais não exista valor modal:

3, 5, 8, 10, 12, 13 (amodal)

Na serie: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

Temos duas modas: 4 e 7 (bimodal).

MEDIDAS DE POSIÇÃO

Page 46: Aula bioestatistica

Moda (Mo):

• Dados agrupados: Sem intervalo de classe:

Uma vez agrupados os dados, épossível determinar imediatamentea moda, basta fixar da variável demaior freqüência.

Na distribuição da tabela 02, áfreqüência máxima (12)corresponde o valor 3 da variável.Logo: Mo = 3

Xi fi Xifi0

1

2

3

4

2

6

10

12

4

0

6

20

36

16

∑ = 34 ∑ =

78

Page 47: Aula bioestatistica

Moda (Mo):

• Dados agrupados: Com intervalo de classe:

A classe que apresenta a maior freqüência é denominada classe modal.

Temos então: Mo = l* + L*/2

L* = limite superior da classe modal

l* = limite inferior da classe modal

Page 48: Aula bioestatistica

Moda (Mo):

Na distribuição da tabela 03, á freqüência máxima (11) corresponde:

Mo = 158 + 162/2 = 160 Logo: Mo = 160 cm.

i Estaturas

(cm)

fi xi xifi

1

2

3

4

5

6

150 – 154

154 – 158

158 – 162

162 – 166

166 – 170

170 – 174

4

9

11

8

5

3

152

156

160

164

168

172

608

1404

1760

1312

840

516

∑ = 40 ∑ = 6440

Tabela 03:

Page 49: Aula bioestatistica

• Mediana (Md): É definida como o numero que seencontra no centro de uma serie de números, estando estesdispostos segundo uma ordem.

• Dados não agrupados:

Dada uma serie de valores, como, por exemplo:

5, 13, 10, 2, 18, 15, 6, 16, 9

Ordenação (crescente ou decrescente) dos valores:

2, 5, 6, 9, 10, 13, 15, 16, 18

Em seguida, tomamos aquele valor central que apresenta omesmo numero de elementos á direita e á esquerda númerosímpar de termos.

Temos então Md = 10

MEDIDAS DE POSIÇÃO

Page 50: Aula bioestatistica

Mediana (Md):

Se, porém, a serie dada tiver um numero par de termos, a mediana será o ponto médio.

Assim, a serie de valores:

2, 6, 7, 10 12, 13, 18, 21

Tem para mediana a média aritmética entre 10 e 12.

Logo: Md = 10 + 12/2 = 11; sendo assim a Md = 11

Page 51: Aula bioestatistica

Mediana (Md):

• Dados agrupados: Se os dados se agrupam em uma

distribuição de freqüência, o cálculo da mediana se processade modo muito semelhante àquele dos dados não agrupados.

Apenas compara-se o valor com a Fa.Emd = ∑ fi

2

Page 52: Aula bioestatistica

TABELA

Nº DE

MENINOSfi Fi

0

1

2

3

4

2

6

10

12

4

2

8

18

30

34

∑= 34

A mediana será aquele valor davariável que corresponde a talfreqüência acumulada:

Sendo: (∑ f1) ÷ 2 = 34 ÷ 2 = 17

Mediana (Md):

Page 53: Aula bioestatistica

Mediana (Md):

• Dados agrupados:

Se os valores da variável estiverem agrupados em classe o

cálculo da mediana será realizado pelo seguintes passos:

• 1) Determinamos as freqüências acumuladas.

• 2) Calculamos (∑ f1) ÷ 2.

• 3) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (∑ f1) ÷ 2 − classe mediana − e, em seguida, empregamos a fórmula:

Page 54: Aula bioestatistica

Md= l + c EMd- Fant

Onde :

l= Lim inferior da classe

c= Amplitude do intervalo de classe

Emd= Elemento da Mediana

fMd= Freqüência simples da mediana

Fant= Freqüência acumulada anterior à da classe mediana

FMd

Mediana (Md):

Page 55: Aula bioestatistica

TABELA 6

iESTATURAS

(cm)fi Fa

123456

150 ι— 154154 ι— 158158 ι— 162162 ι— 166166 ι— 170170 ι— 174

4911853

41324323740

∑ = 40

Mediana (Md):

Page 56: Aula bioestatistica

Quartis

Na estatística descritiva, um quartil é qualquer um dos trêsvalores que divide o conjunto ordenado de dados em quatropartes iguais, e assim cada parte representa 1/4 da amostraou população.

Assim, no caso duma amostra ordenada:

• primeiro quartil (designado por Q1/4) = quartil inferior = é ovalor aos 25% da amostra ordenada = 25º percentil

• segundo quartil (designado por Q2/4) = mediana = é o valoraté ao qual se encontra 50% da amostra ordenada = 50ºpercentil, ou 5º decil.

• terceiro quartil (designado por Q3/4) = quartil superior = valora partir do qual se encontram 25% dos valores mais elevados= valor aos 75% da amostra ordenada = 75º percentil

Page 57: Aula bioestatistica

MEDIDAS DE DISPERSÃO

As medidas de tendência central fornecem informações valiosasmas, em geral, não são suficientes para descrever ediscriminar diferentes conjuntos de dados.

As medidas de dispersão ou variabilidade permitem visualizar amaneira como os dados espalham-se (ou concentram-se) emtorno do valor central, são elas:

• Amplitude Total; Distância Interquartílica; Desvio Médio;Desvio Padrão ; Variância;e Coeficiente de Variação.

Page 58: Aula bioestatistica

MEDIDAS DE DISPERSÃO

• Amplitude Total (At); é a diferença entre o maior e o

menor valor do conjunto de dados.

At= Xmax- Xmin

Ex.: dados: 3, 4, 7, 8 e 8.

At= 8 – 3 = 5

Page 59: Aula bioestatistica

• Distância Interquartílica; é a diferença entre o

terceiro e o primeiro quartil de um conjunto de dados.

Dq= Q3- Q1

Fórmula das posições dos quartis:

Q1= Eq1= n Q3= Eq3= 3n

MEDIDAS DE DISPERSÃO

2

4 4

Page 60: Aula bioestatistica

Distância Interquartílica;

• Os Quartis são calculados a partir da fórmula:

hfi

facn

lQ

ANT4

inf1 hfi

facn

lQ

ANT4

2

inf2

hfi

facn

lQ

ANT4

3

inf3

Page 61: Aula bioestatistica

• Desvio Médio (Dm); é a diferença entre o valor

observado e a medida de tendência central (MédiaAritmética) do conjunto de dados.

Page 62: Aula bioestatistica

Desvio Médio (Dm);

• Calcular o desvio médio dos conjuntos de números apresentados do ex:

A= { 10,12,13,20,25,34,45}

B= {17,18,19,20,21,22,23 }

C= {-4, -3, -2, 3, 5 }

• Calcular a média X

• Calcular o somatório de todos os Xi – X em modulo | |

• Aplicar a fórmula

Page 63: Aula bioestatistica

• Variância (S2); é uma medida que expressa um desvio

quadrático médio do conjunto de dados, e sua unidade é oquadrado da unidade dos dados.

Page 64: Aula bioestatistica

• Desvio Padrão (S); é raiz quadrada da variância e sua

unidade de medida é a mesma que a do conjunto de dados.

Page 65: Aula bioestatistica

• Coeficiente de Variação; é uma medida de

variabilidade relativa, definida como a razão percentual entreo desvio padrão e a média, e assim sendo uma medidaadimensional expressa em percentual.

= ∙100 X

Page 66: Aula bioestatistica

4-CAP PROBABILIDADE

• Probabilidades- O estudo das probabilidades se faz

necessário em situações em que se conhece os desfechospossíveis de alguma situação, porém não se conhece qualdeles irá acontecer.

A probabilidade de um evento (E) é a divisão do número deresultados favoráveis pelo número de resultados possíveis (S).

P (E)= n(E)

S

Page 67: Aula bioestatistica

PROBABILIDADE

Alguns conceitos precisam ser apresentados para facilitar a

definição e entendimento das probabilidades.

São eles:

• Experimento Aleatório- é qualquer experimento em que épossível definir todos os resultados deste sem conhecer qualdeles será observado.

• Espaço Amostral- é o conjunto de todos os valores possíveisde um experimento aleatório. (S)

• Evento -é qualquer subconjunto de um espaço amostral. (E)

Page 68: Aula bioestatistica

• Ex: Lançamento de um dado:

S= {1,2,3,4,5,6,}

P (E1)= de ocorrer um número ímpar

P (E1)= 3/6 = ½

P (E2)= de ocorrer o nº 3

P (E2)= 1/6

• Ex2: Em um lançamento de uma moeda, qual a probabilidade de obter “cara”?

S = {Cara, Coroa}, n (S) = 2

P(E) = 1 / 2 = 0,5

PROBABILIDADE

Page 69: Aula bioestatistica

• Lançamento de dois dados:

P (E1)= (1, 3)

P (E2)= (1, 3) ou (3, 1)

Lançamento de duas moedas:

P (E1)= duas Caras

P (E2)= uma Cara e uma Coroa

P (E3)= duas Coroas

PROBABILIDADE

Page 70: Aula bioestatistica

• Propriedades:

1ª_ P(0)= 0

2ª_ P(S)= 1 ou 100%

3ª_ { P (par)= 1/2

{ P (ímpar)= 1/2

Logo: P(E) + P (E)= 1

4ª_ 0 < P (E) < 1

PROBABILIDADE

1/2 + 1/2= 2/2= 1

Page 71: Aula bioestatistica

Observação:

Probabilidade de 2 partos:

M=1/2

F= ½

(a + b)2 ou (M + F)2

Probabilidade de 3 partos:

(M+ F)3

PROBABILIDADE

S= { (M, F) (M, M) (F, M) (F, F)

Page 72: Aula bioestatistica

• A União de eventos (ou) probabilísticos é calculado pela fórmula:

P(E1 E2)= P(E1) + P(E2) - P(E1 E2)

Ex: Numa urna contém bolas...

UNIÃO DE EVENTOS

Page 73: Aula bioestatistica

• Condição:

E1 e E2 (E1 E2) = 0

P(E1 E2)= P(E1) + P(E2)

Ex; No lançamento de um dado....

EVENTOS MUTUAMENTE EXCLUSIVOS

Page 74: Aula bioestatistica

PROBABILIDADE CONDICIONAL

• Quando dois eventos E1 e E2 de um espaço amostral (S)qualquer ocorrem, chamamos de probabilidade E1

condicionada a E2 e representamos por P (E1/E2).

• Para o calculo utilizamos a fórmula:

P(E1/E2)= n (E1 E2)

Ex: No lançamento de um dado...

Page 75: Aula bioestatistica

REFERÊNCIAS BIBLIOGRÁFICAS

• Crespo, Antonio Arnot. Estatística Fácil. 17ª Edição. Saraiva,2002.

• Pereira, Paulo Henrique. Noções de Estatística. Papirus, 2004.