métodos quantitativos - alesp · galton e darwin: bioestatística após ler a origem das...

31
Métodos Quantitativos PROF. DR. Renato Vicente

Upload: dangkhue

Post on 01-Dec-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Métodos Quantitativos

PROF. DR. Renato Vicente

Page 2: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Método Estatístico

Amostra

PopulaçãoEstatística Descritiva

Teoria de Probabilidades

InferênciaEstatística

Page 3: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Aula 4A

Inferência Estatística: Um pouco de História

Page 4: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Um pouco mais de história: A Física Social

No tempo de Quetelet (Início do seculo 19) Probabilidades e Estatística eram utilizadas basicamente para análise de erros experimentais e para cálculo de seguros. Quetelet acreditava ser possível estender seu uso para todo tipo de fenômeno humano no que chamava de “Física Social”. Publicou em 1834 seu Essai de physique sociale. Introduziu a

Quetelet: 1796-1874

Essai de physique sociale. Introduziu a idéia do “homem médio”.

Page 5: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Galton e Darwin: Bioestatística

Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando origem ao ramo que levaria à Estatística moderna. Em 1869 Galton publicou Hereditary Genius tentando demonstrar quantitativamente que as características e habilidades as características e habilidades humanas seriam hereditárias.

Francis Francis GaltonGalton(1822(1822--1911)1911)Charles Darwin Charles Darwin

(1809(1809--1882)1882)

Page 6: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Quincunx de Galton

Galton propôs o aparato ao lado para ilustrar a formação da distribuição formação da distribuição normal.

http://www.jcu.edu/math/isep/Quincunx/Quincunx.html

Page 7: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Karl Pearson: Departamento de Estatística Protegido de Galton, Pearson escreveu sua biografia. Em 1911 foi responsável pela criação do primeiro Departamento de Estatística no mundo no University College London .

Sobre o trabalho de Galton escreveu: “Euinterpretei que... Galton ... quis dizer que há umacategoria mais ampla do que a conexão causal,que é a correlação,... e que este novo conceitoque é a correlação,... e que este novo conceitode correlação fez da psicologia, da antropologia,da medicina e da sociologia passíveis detratamento matemático. Foi Galton quem primeirome libertou do preconceito de que boa matemáticapoderia apenas ser aplicada a conexões de causae efeito em fenômenos naturais.”

Seu livro a Gramática da Ciência foi a primeiraleitura da Academia Olímpica, grupo de estudosliderado por Einstein quando tinha 23 anos.

Carl (Karl) Pearson (1857-1936)

Page 8: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Gosset (Student):Controle de Qualidade

William Gosset trabalhava na cervejaria Guinness.Em 1906, assistiu a um curso com Pearson. Juntos tiveram a idéia de aplicar métodos estatísticos no controle de qualidade da cervejaria. Por trabalhar na cervejaria, publicou seus artigos utilizando o pseudônimoStudent, pelo qual hoje conhecemos sua principal Student, pelo qual hoje conhecemos sua principal contribuição : o teste t de Student para testarmos hipóteses sobre a média amostral (veja exemplo dos Shoshoni e a razão áurea na Aula 2).

William Gosset (1876-1937)

Page 9: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Fisher: Estatística Moderna

Em 1913 Fisher enviou uma carta para Gosset Contendo uma justificativa teórica para a distribuição t. Esta seria o início de uma seqüência deu forma a boa parte da Estatística Moderna.

Em 1919 Fisher foi contratado pela Estação de Experimentos Agrícolas de Rothamstead , onde desenvolveu um grande número de ferramentas teóricas para exame de impactos agrícolas, entre teóricas para exame de impactos agrícolas, entre elas estavam métodos para estimação estatística, planejamento experimental e análise de variância.

William Gosset (1876-1937)

Page 10: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Aula 4B

A Distribuição Normal

Page 11: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

A Distribuição Normal FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e ENEM) Candidatos Inscritos - Total das Carreiras de Exatas

A distribuição normal é uma curva em forma de sino que aparece freqüentemente em todo tipo de observações.

Page 12: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Os parâmetros da distribuição normal

A distribuição Normal é totalmente descrita pela média e pelo desvio

padrão . Se mudarmos a média apenas deslocamos a curva pela abscissa. Se diminuirmos o desvio padrão tornamos a curva menos dispersa.

ms

Page 13: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Probabilidades de ocorrência

m

A freqüência de ocorrência dos dados em uma distribuição normal é bem definida para cada intervalo em torno da média.

Page 14: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Escore z

Sua altura é de 1,56 m. Você é alta?

Sua nota na FUVEST foi 60. Sua nota foi alta ?

O escore z permite que comparemos um valor específico com O escore z permite que comparemos um valor específico com a população levando-se em conta o valor típico e a dispersão.

A cada valor de z está associado um percentil.

valor – média

desvio padrão

Page 15: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Escore z

http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm

Page 16: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Peso de Meninos por Idade

Page 17: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Como fui na FUVEST?

http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM

Média = 41,1 Desvio Padrão = 15

Z = (60 – 41,1)/15 = 1,26P(Z<1,26) = 89,6%

Sua a nota foi alta.

Page 18: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Você é baixinha?

Amostra : n=115 (alunos da EACH)

MÉDIA = 1,71 m DP = 9 cm

Z = (1,56 – 1,71)/0,09 = -1,67

P(Z<-1,67) = 4,7 %Você muito provavelmente não é das mais altas !

Page 19: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Aula 4B

Distribuição Amostral e Estimação

Page 20: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Estatísticas

Uma estatística é uma quantidade calculada a partir de amostras medidas em uma população.

0.693 0.662 0.690 0.606 0.570

Exemplo: A razão áurea e as molduras Shoshoni.

0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933

A média, o desvio padrão, a mediana, os quartis, o máximo e o mínimo são estatísticas.

Page 21: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Distribuições amostrais

Uma distribuição amostral é a distribuição que obtemos quando calculamos uma estatística em várias amostras de uma população

Suponhamos que o quadro abaixo represente nossa população.

0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933

nossa população.

Page 22: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Distribuições amostrais

0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933

A média de nossa população é µ = 0,6605 e o desvio padrão populacional é σ=0,09. A distribuição está representada ao lado.

0.670 0.606 0.611 0.553 0.933

Coletando 4 amostras com tamanho n=2 obtivemos:

=0.721 =0.6435

=(0.628+0.668)/2=0.648

=(0.844+0.576)/2=0.710

Page 23: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Distribuições amostrais

0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933

A média amostral (média das médias de amostras) é µa = 0,668 e o desvio padrão amostral é σa=0.066.

Médias amostrais.Repare que esta é mais 0.670 0.606 0.611 0.553 0.933

Coletando 4 amostras com tamanho n=2 obtivemos:

=0.721 =0.6435

=(0.628+0.668)/2=0.648

=(0.844+0.576)/2=0.710

esta é mais estreita que a distribuiçãopopulacional

Page 24: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Distribuições amostrais

0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933

E se as amostras forem maiores, n=8 por exemplo.

0.670 0.606 0.611 0.553 0.933

Aqui temos 2 amostras com tamanho n=8

µa= 0,6606σa=0,025

Page 25: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Distribuições amostrais

ResumindoTamanho daAmostra (n)

Média das médias de amostraµa

Desvio padrão amostralσa

2 0,6680 0,066

8 0,6606 0,025

20 (população) 0,6605 0,09

Page 26: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Teorema do Limite Central

Para uma variedade ampla de distribuições a distribuição das médias amostrais tende a uma

http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html

tende a uma distribuição normal quando o número de amostras é grande.

Page 27: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Exemplo: Estimando a altura média da População

Amostra : n=115 (alunos da EACH)

1,71 m é um estimador para a média populacional

O desvio padrão DP=9cm é um estimador para o desvio padrão populacional.

Page 28: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Exemplo: Estimando a altura média da População

A distribuição amostral para amostras de tamanho n=115 terá média igual à média populacional e desvio padrão igual ao desvio padrão populacional dividido por √115 , ou seja

0,09/ √115 = 0,01

1,71 ± 0,01 m

Nossa estimativa será portanto

O quanto podemos confiar nessa estimativa da média ?

Page 29: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Exemplo: Estimando a altura média da População

O quanto podemos confiar nessa estimativa para a altura média ?

1,72m1,70m 1,74m1,68m

Note que: esta é a distribuição para nosso erro de estimativa da altura média.

Page 30: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Qualidade de Estimadores: Viés e Eficiência

Viés grande eficiência alta Viés pequeno eficiência baixa

Viés grande eficiência baixa Viés pequeno eficiência alta

Page 31: Métodos Quantitativos - ALESP · Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando

Qualidade de Estimadores: Viés e Eficiência

Média Amostral= (x1 + x2 + x3 + ... + xn)/n é não-viesado e eficiente (eficiência máxima)

Desvio Padrão Amostral = RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)}é não-viesado.