Download - Nocões de Estatística
-
BC-0005Bases Computacionais da
Cincia
2009
Aula 08Noes de Estatstica
Mdia, desvio padro, erro padroExercicos utilizao da base de dados da turma
-
Roteiro da Aula PARTE I Noes de Estatstica
O que Estatstica Descritiva e Estatstica Inferencial Medidas de Tendncia Central Medidas de Disperso
PARTE II Exerccios Determinao da altura mdia, peso mdio Grficos
idade X altura; idade x peso Histograma de times
-
Idade Altura Peso Taxa Pulsao
Presso Sistlica
Presso diastlica
Colesterol IMC
(anos) (m) (Kg) bat/min mmHg mmHg mg
58 1,8 76,1 68 125 78 522 23,522 1,68 64,9 64 107 54 127 2332 1,82 80,7 88 126 81 740 24,331 1,74 79,1 72 110 68 49 2628 1,72 68,7 64 110 66 230 23,346 1,76 75,1 72 107 83 316 24,341 1,69 60,8 60 113 71 590 21,356 1,71 90,7 88 126 72 466 31,120 1,73 78,8 76 137 85 121 26,254 1,67 62,6 60 110 71 578 22,517 1,6 70,3 96 109 65 78 27,573 1,73 84 72 153 87 265 27,952 1,86 86 56 112 77 250 24,925 1,72 68,1 64 119 81 265 23,129 1,73 94,2 60 113 82 273 31,617 1,8 106,7 64 125 76 272 32,841 1,56 79,5 84 131 80 972 32,852 1,94 99,3 76 121 75 75 26,532 1,68 74,7 84 132 81 138 26,420 1,77 61,8 88 112 44 139 19,720 1,66 73,9 72 121 65 638 26,829 1,78 73,1 56 116 64 613 23,1
Estatstica Quais so a altura, peso
e IMC mdios desta amostra?
Qual a altura mdia da turma?
Qual a taxa de aprovao no vestibular de uma determinada escola?
Qual a maior torcida presente nesta sala?
-
A Estaststica capaz de responder com maior exatido essas questes
Estatstica Descritiva apresentao, organizao e resumo dos dados Pode incluir a construo de grficos, tabelas e computao de vrias medidas, tais como, medidas de
tendncia central (mdia, mediana, moda), medidas de disperso (amplitude, desvio mdio, varincia, desvio padro), percentagem e outras
O propsito desta estatstica fazer com que os dados coletados sejam compreendidos mais facilmente
Estatstica Inferencial generalizao de uma amostra de dados para um grande nmero de sujeitos
mtodos estatsticos so usados para tirar concluses, fazer estimativas, predies e generalizaes sobre todo um conjunto de dados, estudando apenas parte dele, ou seja, a estatstica inferencial nos permite usar informaes de pequenos grupos para fazer inferncias sobre grandes grupos dos quais os dados foram retirados
-
Medidas de Tendncia Central Valor mdio ou tpico de um conjunto
de dados Mdia Aritmtica ou Mdia: utilizada
para dados quantitativos Mediana: utilizada para dados ordinais Moda: utilizada tambm para dados
nominais (variveis qualitativas)
-
Mdia Aritmtica o centro de gravidade dos dados
Soma de um conjunto de valores dividida pelo nmero de dados do conjunto :
N
XX
N
ii
=
=1
N
iX o nmero total de valores do conjunto
um valor do conjunto
Alunos Notas
1 3,0
2 5,0
3 6,0
4 4,0
5 5,0
6 8,0
7 9,0
8 6,0
9 2,0
10 5,0
Total 53
Mdia 5,3
Funo no Excel ou BrOffice: MDIA
2 3 4
5
6
8 90 1
-
Mediana: valor central do conjunto que divide a
distribuio em duas partes iguais (mesmo nmero de dados abaixo e acima do valor)
Os dados devem estar ordenados Notao: Mediana = Posio da mediana =>
No caso de um nmero par de sujeitos a mediana ser a mdia entre os dois valores centrais.
Dadas as alturas: 62 54 82 49 75 64 Ordene: 49 54 62 64 75 82 Med = 62+64 = 63
2
Notas Freqncia Simples
Freqncia Acumulada
2 1 1
3 1 2
4 1 3
5 3 6
6 2 8
7 1 9
8 1 10
9 1 11
iX
21+
=
Ni
Funo no Excel ou BrOffice: MED
i= 11 + 1 = 6 Posio 6 Nota 5
2
-
Moda a categoria que ocorre com
maior frequncia A moda pode no existir OU pode
no ser nica Exemplos:
1,1,3,3,5,7,7,7,11,13 moda 7 3,5,8,11,13,18 no tem moda 3,5,5,5,6,6,7,7,7,11,12 tem duas modas: 5,7 (bimodal)
Notas Freq.
2 1
3 1
4 1
5 3
6 2
7 1
8 1
9 1
Notas Freq.
2 1
3 3
4 1
5 1
7 3
8 1
9 1
01234
2 3 4 5 6 7 8 9
Frequncia
Nota
Distribuio Unimodal
01234
2 3 4 5 7 8 9
Frequncia
Nota
Distribuio Bimodal
Funo no Excel ou BrOffice: MODO
-
Caractersticas das medidas de tendncia central
Abaixo de 100100
300500
700900
10003000
5000acima de 5000
0
20000
40000
60000
80000
100000
120000
140000
160000
Renda Mdia Mensal (R$)
Freq
unc
ia
MdiaMediana
Moda
Mdia influncia de cada amostra depende de seu valor (os valores extremos influenciam fortemente)
Mediana influncia de cada amostra depende de sua posio (valor central)
Moda influncia de cada amostra depende de sua frequncia (valor com mais ocorrncia)
Mediana e Moda so menos influenciadas por valores extremos
Fonte: Censo Demogrfico IBGE 2000
-
Distribuio de Renda na Califrnia e nos EUA
-
Medidas de Disperso ou Variabilidade: quanto os dados numricos dispersam-se em torno de um valor
mdio Varincia: Soma dos quadrados dos desvios, onde desvio a
diferena entre cada dado e a mdia do conjunto.
Dados )(X
Desvios )( XX
Quadrados dos Desvios 2)( XX
0 -5 25 4 -1 1 6 1 1 8 3 9 7 2 4
5=X = 0)( XX = 40)( 2XX
Funo no Excel ou BrOffice: VAR2
2 ( ) 40 / 4 101
x Xs
N
= = =
-
Medidas de Disperso ou Variabilidade: Desvio Padro reflete o quanto os dados se
dispersam da mdia a raiz quadrada da varincia
Funo no Excel ou BrOffice: DESVPAD
2( )10 3,16
1x X
sN
= = =
-
Erro Padro da Mdia - EPMAlunos Notas
1 3,0
2 5,0
3 6,0
4 4,0
5 5,0
6 8,0
7 9,0
8 6,0
9 2,0
10 5,0
Total 53
Mdia 5,3
DVP 2,11
EPM 0,7
Quando se obtm uma amostra aleatria de tamanho n, estima-se a mdia populacional. bastante intuitivo supor que se uma nova amostra aleatria for realizada a estimativa obtida ser diferente daquela primeira. Desta forma, reconhece-se que as mdias amostrais esto sujeitas variao e formam populaes de mdias amostrais, quando todas as possveis amostras so retiradas de uma populao.
O erro padro analisa a variabilidade de uma mdia
Quanto maior o nmero de dados, menor o erro padro da mdia
1=
Ns
X
-
Erro Padro da Mdia - EPM
1=
Ns
X
No existe uma Funo direta no Excel ou BrOffice para clculo do EPM
Portanto, calcula-se a partir do desvio padro
EPM = s/ RAIZ (CONT.NM-1)Alunos Turma A Turma B
1 5 8
2 5 9
3 5 7
4 5 7
5 5 2
6 6 5
7 4 2
8 6 0
9 5 2
10 5 10
Total 53 53
Mdia 5,1 5,2DVP 0,57 3,49EPM 0,18 1,1Turma A Turma B
0
1
2
3
4
5
6
7
8
9
10
-
Distribuio Normal A distribuio normal (tambm chamada distribuio gaussiana, em homenagem
a Carl Friedrich Gauss) um importante modelo de distribuio estatstica, observado frequentemente em experimentos relacionados ao estudo de fenmenos de cincias to distintas quanto biologia, fsica e economia.
ExemploUm instituto de pesquisas realiza uma amostragem com 5000 pessoas para obter uma estimativa da altura mdia do brasileiro adulto. Estas pessoas so sorteadas para a pesquisa atravs de uma estratificao adequada, que reflita os dados de toda a populao do pas. Observe os resultados, categorizados por faixas de altura:
www.financasnet.com.br
Clculo da frequncia relativa (porcentagem) =
freq. Absoluta/ freq. total * 100
-
Distribuio Normal
Mdia: 1,653
Desvio Padro: 0,173
www.financasnet.com.br
Ela hipottica e essencial na tomada de decises em estatstica. Muitos dos testes estatsticos s tm validade se seus dados constiturem uma distribuio normal.
-
Caractersticas da Distribuio Normal Quanto mais valores so
plotados em uma distribuio, mais ela se assemelha a uma normal
determinada por dois parmetros: - Mdia da populao - Desvio padro da populao
Distribuio simtrica e unimodal em relao mdia
Valores de mdia, moda e mediana so iguais
rea total sob a curva igual a 100%, com exatos 50% distribudos esquerda da mdia e 50% sua direita
-
reas sob a Curva Normal A rea sob a curva de uma
distribuio normal fundamental na soluo de problemas. Ela corresponde a 100% dos dados
Uma rea de 34,13 % da totalidade dos dados delimitada entre a mdia e 1 desvio padro da mdia
Quando o desvio padro da mdia 2 a rea aumenta para 47,87%
Quando 3 a rea aumenta para 49,87%.
Estas propores so constantes em uma distribuio normal
-
Tipos de distribuio Distribuio Unimodal e Simtrica: Mdia, Mediana e Moda
so iguais!!!! o ponto de Freqncia Mxima (moda) tambm o mais
central (mediana) e o centro de gravidade (mdia) Em geral, em uma distribuio assimtrica:
A moda est sempre prxima ao pico A mdia est mais prxima da cauda (sofre influncia dos
valores extremos) mediana est entre a moda e mediana
Medida de Tendncia Central mais adequada: Distribuio Simtrica Mdia Distribuio Assimtrica Mediana ou Moda Distribuio Bimodal Modas
-
Tipos de Distribuio e medidas de tendncia central
Distribuio Unimodal e Simtrica:
Mdia, Mediana e Moda so iguais!!!!
Ponto de Freqncia Mxima (moda) tambm o mais central (mediana) e o centro de gravidade (mdia).
Distribuio assimtrica: A moda est sempre prxima ao
pico A mdia est mais prxima da
cauda (sofre influncia dos valores extremos)
A mediana est entre a moda e mediana
Distribuio Assimtrica
0
1
2
3
4
5
2 3 4 7 8 9 10N o ta
Fre
q
n
cia
M oda
M ediana
M dia
Distribuies assimtricas => mediana !!!Distribuio bimodal => Moda!!!
-
Exerccio 1 em sala: Idade Altura Peso Taxa
PulsaoPresso Sistlica
Presso diastlica
Colesterol IMC
(anos) (m) (Kg) bat/min mmHg mmHg mg
58 1,8 76,1 68 125 78 522 23,5
22 1,68 64,9 64 107 54 127 23
32 1,82 80,7 88 126 81 740 24,3
31 1,74 79,1 72 110 68 49 26
28 1,72 68,7 64 110 66 230 23,3
46 1,76 75,1 72 107 83 316 24,3
41 1,69 60,8 60 113 71 590 21,3
56 1,71 90,7 88 126 72 466 31,1
20 1,73 78,8 76 137 85 121 26,2
54 1,67 62,6 60 110 71 578 22,5
17 1,6 70,3 96 109 65 78 27,5
73 1,73 84 72 153 87 265 27,9
52 1,86 86 56 112 77 250 24,9
25 1,72 68,1 64 119 81 265 23,1
29 1,73 94,2 60 113 82 273 31,6
17 1,8 106,7 64 125 76 272 32,8
41 1,56 79,5 84 131 80 972 32,8
52 1,94 99,3 76 121 75 75 26,5
32 1,68 74,7 84 132 81 138 26,4
20 1,77 61,8 88 112 44 139 19,7
20 1,66 73,9 72 121 65 638 26,8
29 1,78 73,1 56 116 64 613 23,1
18 1,6 68,3 68 95 58 762 26,8
26 1,74 64,8 64 110 70 303 21,4
33 1,73 92,1 60 110 66 690 30,6
55 1,76 87,2 68 125 82 31 28,1
53 1,76 77,8 60 124 79 189 25,2
28 1,73 72,9 60 131 69 957 24,4
28 1,83 78,7 56 109 64 339 23,6
37 1,68 76,4 84 112 79 416 27,1
40 1,84 96 72 127 72 120 28,4
33 1,85 89,1 84 132 74 702 25,9
26 1,73 78 88 116 81 1252 26
53 1,74 96,5 56 125 84 288 31,7
36 1,79 61,7 64 112 77 176 19,3
34 1,62 53,8 56 125 77 277 20,5
42 1,81 85,1 56 120 83 649 26,1
18 1,67 74,1 60 118 68 113 26,7
44 1,73 76,5 64 115 75 656 25,4
20 1,68 68 72 115 65 172 24
Calcule Mdia, Mediana,Moda, desvio padro e erro padro dos dados abaixo
-
Exerccio 2 em sala: Um teste de memria foi aplicado a 10 idosos e 10 jovens com o objetivo de verificar o
declnio de memria decorrente do processo de envelhecimento. Alm do resultado do teste, foram registrados outros dados dos indivduos, tais como: idade, sexo e anos de escolaridade (ver apostila). Estas caractersticas foram registradas pois podem influenciar o desempenho dos indivduos nos testes. Construa uma planilha no BROffice utilizando os dados destas amostras.
a) Desempenho de cada sujeito: (varia de 0 a 20)Idosos: 16/17/19/19/15/17/18/20/20/16Jovens: 20/20/19/19/20/20/17/19/20/18
b) Calcule a mdia, desvio padro e erro padro da mdia do desempenho para idosos e jovens
c) Faa um grfico de colunas da mdia do desempenho de idosos e jovens, com o ttulo Teste de Memria
d) Inclua as barras de erros com o erro padro da mdia
e) Discuta a diferena do desempenho entre os grupos com base nos valores de mdia e erro.
-
Para inserir o erro padro no BROffice
Selecionar os valores de erro calculados na planilha
-
Exerccio 3 em Sala Considere a seguinte tabela de dados de
presso sangunea obtida para um grupo de 40 pessoas:
Indivduo Pres s o S is tlic a
Pres s o dia s tlic a
mmHg mmHg
1 1 2 5 7 8
2 1 0 7 5 4
3 1 2 6 8 1
4 1 1 0 6 8
5 1 1 0 6 6
6 1 0 7 8 3
7 1 1 3 7 1
8 1 2 6 7 2
9 1 3 7 8 5
1 0 1 1 0 7 1
1 1 1 0 9 6 5
1 2 1 5 3 8 7
1 3 1 1 2 7 7
1 4 1 1 9 8 1
1 5 1 1 3 8 2
1 6 1 2 5 7 6
1 7 1 3 1 8 0
1 8 1 2 1 7 5
1 9 1 3 2 8 1
2 0 1 1 2 4 4
2 1 1 2 1 6 5
2 2 1 1 6 6 4
2 3 9 5 5 8
2 4 1 1 0 7 0
2 5 1 1 0 6 6
2 6 1 2 5 8 2
2 7 1 2 4 7 9
2 8 1 3 1 6 9
2 9 1 0 9 6 4
3 0 1 1 2 7 9
3 1 1 2 7 7 2
3 2 1 3 2 7 4
3 3 1 1 6 8 1
3 4 1 2 5 8 4
3 5 1 1 2 7 7
3 6 1 2 5 7 7
3 7 1 2 0 8 3
3 8 1 1 8 6 8
3 9 1 1 5 7 5
4 0 1 1 5 6 5
Utilizando os dados de presso diastlica, calcule a mdia, desvio padro e construa duas tabelas de frequncia:
1) com intervalos de 5 batimentos (
-
Exerccio 1 para Casa Escolha um cruzamento que tenha o trfego controlado por um semforo.
Pode ser o que voc observa diretamente da janela de seu apartamento ou da padaria.
Enquanto voc toma um caf (isso opcional) conte o nmero de carros que passa (escolha uma direo e sentido) a cada intervalo de tempo em que o sinal verde. Tome no mnimo 30 medidas. Faa uma tabela que registre cada medida. Anote o cruzamento, direo, sentido e hora da experincia. Calcule a mdia e o desvio padro.
Elabore tabelas de frequncia considerando diferentes intervalos (observe que o intervalo aqui dado em nmero de carros). Faa os respectivos grficos de distribuio.
Faa uma nova srie de medidas para comparao. Pode ser outro cruzamento, outro horrio (hora do rush/trnsito livre, dia til/domingo) etc. Que concluses voc pode tirar comparando as duas sries? Baseie sua resposta nos valores mdios, desvio padro e forma da distribuio.
-
Exerccio 2 para Casa Finalizar exerccio da planilha de memria como est na apostila
Slide 1Slide 2Slide 3Slide 4Slide 5Slide 6Slide 7Slide 8Slide 9Slide 10Slide 11Slide 12Slide 13Slide 14Slide 15Slide 16Slide 17Slide 18Slide 19Slide 20Slide 21Slide 22Slide 23Slide 24Slide 25Slide 26