estatistica primeiras aulas.pdf
Post on 22-Nov-2015
17 Views
Preview:
TRANSCRIPT
-
1.AULA 01
1.CONCEITOS FUNDAMENTAIS
ESTATSTICA
Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos nas tomadas de deciso.
A estatstica divide-se em dois ramos:
ESTATSTICA DESCRITIVA
a parte da estatstica que se preocupa com a coleta, organizao e a descrio dos dados observados, porm sem tirar concluses mais genricas.
ESTATSTICA INDUTIVA OU INFERENCIAL
a parte que em baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar concluses para o comportamento da populao, dando a preciso dos resultados e com que probabilidade se pode confiar neles.
POPULAO OU UNIVERSO
um conjunto de indivduos ou objetos que apresentam pelo menos uma caracterstica comum.
AMOSTRA
-
um subconjunto finito de uma populao.
FENMENO
o nmero de resultados possveis. Assim, por exemplo: para o fenmeno nmero de filhos h um nmero de resultados possveis expresso atravs de nmeros naturais: 0, 1, 2, 3, ..., n
VARIVEL
, convenientemente, o conjunto de resultados possveis de um fenmeno.
Quando seus valores so expressos por atributos: cor dos olhos, sexo), etc ela denominada qualitativa.
Quando os seus valores so expressos em nmeros (salrios, idade dos alunos de uma escola, etc) ela denominada quantitativa. Uma varivel quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de varivel contnua; uma varivel que s pode assumir valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta.
Assim, o nmero de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = ( 1, 2, 3, ...), mas nunca valores como2,34 ou 5,76. Logo uma varivel discreta. J o peso desses alunos uma varivel contnua, pois um aluno pode pesar 72 kg, como 72,5 kg, como 72,53 kg, etc, dependendo esse valor da preciso da medida.
De modo geral, as medies do origem a variveis contnuas e as contagens ou enumeraes a varivel discretas.
Quando uma varivel quantitativa discreta ela manipulada como se apresenta. Entretanto quando a varivel quantitativa contnua h sempre um limite para a preciso com a qual a mensurao pode ser feita, o que nos leva a concluir que o valor verdadeiro nunca conhecido. Na verdade, os valores observados so discretos e aproximados.
-
Convencionaremos que a preciso da medida ser automaticamente indicada pelo nmero de decimais com que se escrevem os valores da varivel.
Assim, um valor 4,60 indica que a varivel em questo foi medida com a preciso de centsimos, no sendo exatamente o mesmo que 4,6, valor correspondente a uma preciso de dcimos.
Para suprimir unidades inferiores s de determinada ordem recorremos a tcnica de ARREDONDAMENTO DE DADOS.
1.ARREDONDAMENTO DE DADOS
A tcnica de arredondamento de dados normatizada pelo Instituto Brasileiro de Geografia e Estatstica, IBGE atravs da resoluo 886/66, da seguinte maneira:
Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3, 4, fica inalterado o ltimo algarismo a permanecer.
Ex. 53,24 passa a 53,2
Quando o primeiro algarismo a ser abandonado 6, 7, 8, 9, aumenta-se uma unidade o algarismo a permanecer.
Ex. 42,87 passa a 42,9
88, 08 passa a 88,1
Quando o primeiro algarismo a ser abandonado 5, h duas solues:
%2. Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.
Ex. 2,352 passa a 2,4
109,250003 passa a 109,3
%2. Se o 5 for o ltimo algarismo ou se ao 5 s se seguirem zeros, o ltimo algarismo a permanecer s ser aumentado de uma unidade se for impar.
Ex. 24,75 passa a 24,8
-
24,65 passa a 24,6
24,75000 passa a 24,8
24,65000 passa a 24,6
OBS
No devemos nunca fazer arredondamentos sucessivos.
EX. 17,3452 passa a 17,3 e no 17,35, a 17,4
Se tivermos a necessidade de um novo arredondamento, voltamos sempre aos dados originais.
1.
PRECISO
milsimo centsimo Dcimo unidade dezena centena milhar
3.876,55239 3.876,552 3.876,55 3.876,6 3.877 3.880 3.900 4.000
1.COMPENSAO
Compensar suprimir ou adicionar unidades conforme a preciso a ser requerida do resultado.
Supondo os dados abaixo, aos quais aplicamos as regras do arredondamento:
25,32 25,3
+ 17,85 + 17,8
-
10,44 10,4
31,17 31,2
84,78 84,8 84,7
Se arredondarmos a soma original para uma casa decimal vemos que o resultado 84,8; a nova soma com as parcelas arredondadas difere em uma unidade. Entretanto para a apresentao dos resultados, necessrio que desaparea tal diferena, o que possvel com a tcnica da COMPENSAO, conservando o mesmo nmero de casas decimais.
Praticamente, usamos descarregar a diferena na(s) maio(res) parcela(s). assim passamos a ter:
25,3
+ 17,8
10,4
31,3
84,8
AULA 02
APRESENTAO DOS DADOS
A apresentao dos dados pode ser efetuada de duas formas, no
-
mutuamente excludentes. A primeira a apresentao tabular, necessria quando se deseja uma apresentao sistemtica dos dados; a outra forma a grfica, que se constitui em um importante complemento apresentao tabular, principalmente por permitir uma visualizao quase imediata das distribuies dos valores estudados.
SRIES ESTATSTICAS
Segundo o Conselho Nacional de Estatstica, a organizao dos dados denomina-se srie estatstica, e esta dever apresentar, o ttulo, o cabealho, o corpo e o rodap.
Ttulo - conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?, Quando?, Onde?, localizado no topo da srie estatstica;
Cabealho - parte superior da tabela que especifica o contedo das colunas ( as categorias, as modalidades da varivel);
Corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;
Rodap elementos complementares da tabela, que so a fonte, as notas, as chamadas.
ELEMENTOS COMPONENTES DE UMA TABELA SRIE ESTATSTICA
TABELA 1 - VENDA DE TRATORES BRASIL 2000 - 2001 Ttulo
2000 2001 Cabealho
TRATORES 12.595 14.892 Corpo
COLHEITADEIRAS 2.003 2.010
-
Anfavea Fonte
De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou clulas devemos colocar:
Um trao horizontal ( -) quando o valor zero, no s quanto natureza das coisas como quanto ao resultado do inqurito;
Trs pontos (...) quando no temos os dados;
Um ponto de interrogao (?) quando temos dvida quanto exatido de determinado valor;
Zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expresso em numerais decimais, precisamos acrescentar parte decimal um nmero correspondente de zeros ( 0,0; 0,00; 0,000;...).
TIPOS DE SRIES ESTATSTICAS
Conforme o critrio de agrupamento, as sries classificam-se em 4 tipos: temporal ou cronolgica, geogrfica ou espacial, especfica ou categrica e distribuio de freqncias.
SRIE CRONOLGICA
a srie estatstica em que os dados so observados segundo poca de ocorrncia.
TABELA 2 ARRECADAO MENSAL DE ICMS NO PARAN 1991
-
MESES ARRECADAO R$ MESES ARRECADAO R$
JANEIRO 24.856 JULHO 48.931
FEVEREIRO 27.093 AGOSTO 53.564
MARO 30.912 SETEMBRO 60.310
ABRIL 36.870 OUTUBRO 69.065
MAIO 41.442 NOVEMBRO 83.857
JUNHO 42.042 DEZEMBRO 90.336
SEFA
SRIE GEOGRFICA
a srie em que os dados so observados segundo a localidade de ocorrncia.
TABELA 3 - METALRGICA S/A VENDAS POR REGIO (2003)
REGIO VENDAS (R$ 1000,00)
SUL 6.900
SUDESTE 7.700
CENTRO-OESTE 6.500
NORDESTE 5.800
NORTE 4.200
-
TOTAL 31.500
Dados fictcios
SRIE ESPECFICA
a srie em que os dados so observados segundo modalidades diferentes de ocorrncia.
TABELA 4 - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001
TIPO UNIDADES (2.000) UNIDADES(2.000)
TRATORES 12.595 14.892
COLHEITADEIRAS 2.003 2.010
Anfavea
DISTRIBUIO DE FREQNCIAS
o mtodo de agrupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o nmero ou a percentagem de cada classe.
Estatura de 40 alunos do Colgio A
-
I Estatura (cm)
fi xi fri Fi Fri
1 150 |--- 154 4 152 0,100 4 0,100
2 154 |--- 158 9 156 0,225 13 0,325
3 158 |--- 162 11 160 0,275 24 0,600
4 162 |--- 166 8 164 0,200 32 0,800
5 166 |--- 170 5 168 0,125 37 0,925
6 170 |--- 174 3 172 0,075 40 1,000
=40
1.REPRESENTAO GRFICA
A apresentao dos dados e respectivos resultados de sua anlise pode tambm ser feita sob a forma de figuras, em geral grficos ou diagramas.
Grficos devem ser auto-explicativos e de fcil compreenso, de preferncia sem comentrios inseridos. Devem ser simples, atrair a ateno do leitor e inspirar confiana.
Alguns pontos devem ser respeitados na construo de um grfico:
- o tamanho deve ser adequado sua publicao em revistas, peridicos, cartazes ou livros;
- deve ter sempre um ttulo;
- deve ser construdo em uma escala que no desfigure os fatos ou as relaes que se deseja destacar.
Os grficos podem ser cartogramas ou diagramas; entende-se por cartogramas o mapa geogrfico ou topogrfico em que as freqncias das
-
categorias de uma varivel so projetadas nas reas especficas do mapa, utilizando-se cores ou traados cujos significados constam em legendas anexadas s figuras.
Diagramas so grficos em que a magnitude das freqncias representada por certa mensurao de uma determinada figura geomtrica. Se a medida utilizada for o comprimento, tem-se o diagrama de ordenadas (grfico de linhas); caso se utilize superfcie de figura, tem-se diagrama de barras, histograma e grfico de setores, alem de grficos representativos de distribuies de freqncia.
GRFICO EM LINHAS - ARRECADAO MENSAL DE ICMS NO PARAN 1991
GRFICO EM COLUNAS MLTIPLAS - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001
Fonte: Anfavea
-
GRFICO EM BARRAS- METALRGICA S/A VENDAS POR REGIO (2002)
Fonte: Dados fictcios
GRFICO EM SETORES- METALRGICA S/A VENDAS POR REGIO (2001)
Fonte: Dados fictcios
GRFICO POLAR - ARRECADAO MENSAL DE ICMS NO PARAN 1991
Fonte: SEFA
-
HISTOGRAMA: ESTATURA DE 40 ALUNOS DO COLGIO A
Fonte: Dados fictcios
F
12
10
8
6
4
2
0
150 154 158 162 166 170 174 Estatura
-
GRFICO DE DISTRIBUIO DE FREQNCIA
HISTOGRAMA/POLGONO DE FREQNCIA - NMERO MDIO DE ACIDENTES POR MIL HOMENS/HORA EM UMA INDSTRIA
Dados fictcios
AULA 03
DISTRIBUIO DE FREQNCIAS
Distribuio de freqncias so descries de dados resultantes de variveis quantitativas agrupadas em classes.
TABELA PRIMITIVA
assim denominada quando os valores so diretamente organizados conforme coletados, isto sem critrios de ordem numrica.
Suponhamos termos feito uma coleta de dados relativos s estaturas de quarenta alunos, que compem uma amostra dos alunos de um colgio A, resultando na seguinte tabela de valores:
Estatura de 40 alunos do Colgio A
166
160
161 150 162 160 165 167 164 160
16
16 168 163 156 173 160 155 164 168
-
2 1
168 163 156 173 160 155 164 168
155
152
163 160 155 155 169 151 170 164
154
161
156 172 153 157 156 158 158 161
1.
2.
3.ROL
uma ordenao dos dados da tabela primitiva.
Estatura de 40 alunos do Colgio A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
1.
2.DISTRIBUIO DE FREQNCIA
uma ordenao em freqncias, sendo no exemplo anterior o numero de alunos componentes da amostra.
-
Estatura de 40 alunos do Colgio A
Estatura Freqncia Estatura Freqncia
150 1 163 2
151 1 164 3
152 1 165 1
153 1 166 1
154 1 167 1
155 4 168 2
156 3 169 1
157 1 170 1
158 2 172 1
160 5 173 1
161 4 Total 40
162 2
DISTRIBUIO DE FREQNCIA COM INTERVALOS DE CLASSES
uma representao dos valores em vrios intervalos; onde perde-se a sensibilidade ou pormenores mas ganha-se em simplicidade. No exemplo estudado agrupamos em intervalos de classe conforme critrios a serem estudados.
Estatura de 40 alunos do Colgio A
-
ESTATURA FREQNCIA
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
TOTAL 40
1.
1.ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA
Classes de freqncia, ou simplesmente classes - so os intervalos de variao da varivel
Limites de classe - so os extremos de cada classe
l1 = 150 L5 = 170
Amplitude de um intervalo de classe, ou simplesmente intervalo de classe a medida do intervalo que define a classe.
hi = Li li h2 = L2 l2 = 158 150 = 4 cm
Amplitude total de distribuio (AT) a diferena entre o limite superior da
-
ltima classe ( limite superior mximo) e o limite inferior da primeira classe (limite inferior mnimo)
AT = L(mx) l(mn) = 174 150 = 24 cm
Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra
AA = x(mx) x(mn) = 173 150 = 23 cm
Ponto mdio de uma classe (xi) o ponto que divide o intervalo de classe em duas partes iguais
xi = (li + Li) / 2 x2 = (154 + 158) / 2 = 156 cm
Note que a colocao de um ndice i para x para f e os demais elementos da tabela tem a finalidade de referncia. Deste modo x2 representa o segundo valor distinto da srie, f3 representa a freqncia simples do terceiro valor da srie e assim sucessivamente.
1.PASSOS PARA A CONSTRUO DE UMA DISTRIBUIO DE FREQNCIA
a. Estabelecer o nmero de classes
Pela frmula de Sturges:
i = 1 + 3,3 log n
-
Onde n representa o nmero total de observaes
Esta regra nos permite obter a seguinte tabela:
n i
3 |---| 5 3
6 |---| 11 4
12 |---| 22 5
23 |---| 46 6
47 |---| 90 7
91 |---| 181 8
182 |---| 362 9
... ...
i = 1 + 3,3 log n = 1 + 3,3 log 40 = 1 + 3,3 * 1,602 = 1 + 5,2866 = 6,2866 = 6
Portanto no exemplo usam-se 6 intervalos
b. Determinar a amplitude total dos dados
AT = L(mx) l (mn)
AT = (173 + 1) 154 = 24 cm
c. Estabelecer o intervalo ou amplitude de classe
h = AT / i
-
h = 24 / 6 = 4 cm
OBS: se h fosse decimal aplicar-se-ia o inteiro maior que o nmero dado, exemplo se h fosse 4,03 usar-se-ia 5 para amplitude de intervalo e no 4 como manda a regra de arredondamento, constituindo em estatstica a nica exceo a regra.
d. Estabelecer os limites dos intervalos, comeando com um inteiro em relao ao menor valor da srie.
O limite superior da primeira classe determinado acrescendo-se o valor de h ao limite mnimo. L1= 150 + 4 = 154 cm
O limite inferior da segunda classe igual ao limite mximo da primeira classe. l2 = 154 cm
1.TIPOS DE FREQNCIA
Estatura de 40 alunos do Colgio A
I Estatura (cm)
fi xi fri Fi Fri
1 150 |--- 154 4 152 0,100 4 0,100
2 154 |--- 158 9 156 0,225 13 0,325
-
3 158 |--- 162 11 160 0,275 24 0,600
4 162 |--- 166 8 164 0,200 32 0,800
5 166 |--- 170 5 168 0,125 37 0,925
6 170 |--- 174 3 172 0,075 40 1,000
=40
Freqncias Simples ou Absolutas (fi) so os valores que realmente representam o nmero de dados de cada classe.
Freqncias Relativas (fri) so os valores das razes entre as freqncias simples e a freqncia total.
Fri = fi / fi
Freqncia Acumulada (Fi) o total das freqncias de todos os valores inferiores ao limite superior de intervalo de uma dada classe.
Fi = f1 + f2 + .... + fi
Freqncia Acumulada Relativa (Fri) a freqncia acumulada da classe dividida pela freqncia total de distribuio.
Fri = Fi / fi
Fri = fr1 + fr2 + .... + fri
-
HISTOGRAMA
POLGONO DE FREQNCIA
So a representao grfica das distribuies de freqncia, onde no histograma os valores de fi so representados no eixo de y, paralelos aos limites de cada classe.
No polgono de freqncia as freqncias fi so representadas no eixo y porem no ponto mdio de cada classe.
I Estatura (cm) fi
1 150 |--- 154 4
2 154 |--- 158 9
3 158 |--- 162 11
4 162 |--- 166 8
5 166 |--- 170 5
6 170 |--- 174 3
=40
top related