introduÇÃo À estatÍstica

Post on 12-Feb-2016

78 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

INTRODUÇÃO À ESTATÍSTICA. PROFESSOR DORTA. ORIGEM. - PowerPoint PPT Presentation

TRANSCRIPT

42510011 0010 1010 1101 0001 0100 1011

INTRODUÇÃO À ESTATÍSTICA

PROFESSOR DORTA

4251

0011 0010 1010 1101 0001 0100 1011

ORIGEM• A palavra estatística, de origem latina,

significou por muito tempo “ciência sobre os assuntos do Estado. Os que governavam,

sentindo necessidade de informações, organizavam departamentos que tinham a

responsabilidade de fazer estas investigações.

4251

0011 0010 1010 1101 0001 0100 1011ORIGEM

• A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na

Universidade de Lena e adotada pelo acadêmico alemão Godofredo Achenwall.

Aparece como vocabulário na Enciclopédia Britânica em 1797, e adquiriu um

significado de coleta e classificação de dados, no início do século 19.

4251

0011 0010 1010 1101 0001 0100 1011APLICAÇÃO

• A Estatística trabalha com métodos científicos para coleta, organização, resumo

e apresentação de dados e também para a obtenção de conclusões e tomada de

decisões.

4251

0011 0010 1010 1101 0001 0100 1011EXEMPLO DE APLICAÇÃO:

• Todos nós temos um pouco de cientista. Quase que diariamente, temos “palpites” com relação a acontecimentos futuros em

nossas vidas, a fim de prever o que acontecerá em novas situações ou

experiências.

4251

0011 0010 1010 1101 0001 0100 1011

• À medida em que essas situações ocorrem, podemos, às vezes, confirmar nossas idéias; outras vezes, entretanto, não temos tanta sorte e, por isso, acabamos experimentando experiências desagradáveis.

• Por exemplo: Alguém poderia levantar a hipótese de que crianças socialmente isoladas assistem mais televisão do que crianças bem integradas em seus grupos - e, a partir daí, testa sua idéia através de pesquisa sistemática.

4251

0011 0010 1010 1101 0001 0100 1011

ALGUNS CONCEITOS IMPORTANTES

4251

0011 0010 1010 1101 0001 0100 1011POPULAÇÃO

• População: é o conjunto de todos os elementos dos quais desejamos pesquisar alguma característica.

• Ex: Censo Demográfico.

4251

0011 0010 1010 1101 0001 0100 1011POPULAÇÃO E AMOSTRA

• Muitas vezes é impraticável para o pesquisador observar todos os

elementos do grupo que pretende estudar. É preciso, então, recorrer à pesquisa com uma parte do todo.

4251

0011 0010 1010 1101 0001 0100 1011POPULAÇÃO E AMOSTRA

• Todos os elementos do grupo a ser estudado constituem a população. A

parte da população efetivamente examinada é a amostra.

4251

0011 0010 1010 1101 0001 0100 1011AMOSTRA

• Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de oitocentas pessoas. Nesse caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos analisar parte desses elementos.

4251

0011 0010 1010 1101 0001 0100 1011AMOSTRA

• É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos concluir que todos os elementos da população também o são.

4251

0011 0010 1010 1101 0001 0100 1011AMOSTRA

• Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a

conclusões erradas, mas este risco diminui à medida que aumenta a quantidade de

elementos a serem examinados.

4251

0011 0010 1010 1101 0001 0100 1011AMOSTRA

• Devemos estabelecer um mínimo de elementos para compor a amostra. Essa

quantidade não deve ser menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances de as

informações da amostra se afastarem demasiadamente daquelas que obteríamos

se examinássemos toda a população.

4251

0011 0010 1010 1101 0001 0100 1011AMOSTRA

• Além de estabelecer um critério para a quantidade de elementos que farão parte

da amostra, é importante estabelecer critérios de seleção desses elementos.

4251

0011 0010 1010 1101 0001 0100 1011

ALGUMAS FORMAS DE AMOSTRAGEM

4251

0011 0010 1010 1101 0001 0100 1011

I) AMOSTRAGEM ALEATÓRIA SIMPLES:

É o processo mais elementar e freqüentemente utilizado. É equivalente a

um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e

sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa seqüência, os quais corresponderão

aos elementos pertencentes à amostra.

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola:

• 1º - numeramos os alunos de 1 a 90.

• 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após misturar retiramos, um a um, nove números que formarão a amostra.

4251

0011 0010 1010 1101 0001 0100 1011

II) AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

• Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos.

4251

0011 0010 1010 1101 0001 0100 1011• Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do

exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino).

4251

0011 0010 1010 1101 0001 0100 1011

Logo, temos:

• Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios.

sexo população 10% amostramasculino 54 5,4 5feminino 36 3,6 4

total 90 9,0 9

4251

0011 0010 1010 1101 0001 0100 1011III) AMOSTRAGEM SISTEMÁTICA

Quando os elementos da população já se acham ordenados, não há necessidade de construir o sitema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.

4251

0011 0010 1010 1101 0001 0100 1011

• Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada

por 90 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte

procedimento: como 900/90 = 10, escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro elemento sorteado para a

amostra; os demais elementos seriam periodicamente considerados de 10 em 10. Assim,

suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 14ª casa, 24ª casa, 34ª casa,

44ª casa, etc.

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEL

Definição: É a característica a ser estudada.

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEL

• Exemplo: A fim de ter um perfil de seu “público”nos fins de semana, o proprietário de um cinema contratou dois pesquisadores para coletar dados referentes à sua clientela. Os pesquisadores escolheram seis objetos

de estudo: sexo, idade, nível de escolaridade, estado civil, renda mensal e

meio de transporte utilizado para chegar ao cinema.

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEL

• Num fim de semana foram entrevistados 19 freqüentadores desse cinema. Os resultados estão apresentados na tabela seguinte.

4251

0011 0010 1010 1101 0001 0100 1011

SEXO IDADE ESCOLARIDADE ESTADO CIVIL TRANSPORTE RENDA (em S.M.)

Masculino 28 M CASADO CARRO 11,8

Masculino 38 M CASADO CARRO 13,9

Feminino 24 S SOLTEIRA CARRO 12,4

Masculino 43 M CASADO CARRO 19,5

Feminino 32 S SEPARADA ÔNIBUS 12,1

Feminino 19 M SOLTEIRA A PÉ 5,0

Masculino 22 S SOLTEIRO ÔNIBUS 8,9

Masculino 25 M SOLTEIRO ÔNIBUS 13,3

Masculino 41 S CASADO A PÉ 14,7

Feminino 40 F SOLTEIRA CARRO 16,6

Feminino 35 S SOLTEIRA CARRO 9,3

Masculino 29 F CASADO CARRO 11,6

Feminino 31 F SOLTEIRA CARRO 10,2

Feminino 36 S CASADA CARRO 16,0

Feminino 48 M CASADA CARRO 18,8

Masculino 23 M SOLTEIRO A PÉ 15,4

Masculino 27 S SOLTEIRO A PÉ 10,7

Masculino 26 S SEPARADO ÔNIBUS 8,2

Masculino 29 S CASADO ÔNIBUS 12,5

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEL

• Algumas variáveis, como sexo, nível de escolaridade, estado civil e transporte,

apresentam como resultado uma qualidade, atributo ou preferência da pessoa

entrevistada. Variáveis dessa natureza recebem o nome de variáveis qualitativas.

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEL

• Outras variáveis, como idade e renda mensal apresentam como resposta um número, resultante nesse exemplo de mensuração. Variáveis assim definidas são chamadas variáveis quantitativas.

• Cabe ressaltar, que se os pesquisadores tivessem perguntado: “Quantas vezes por semana você costuma ir ao cinema?”, teríamos como objeto de estudo uma variável quantitativa, cujos valores assumidos são resultante de contagem.

4251

0011 0010 1010 1101 0001 0100 1011VARIÁVEIS: QUADRO RESUMO

VARIÁVEL

QUALITATIVA QUANTITATIVA

DISCRETA(contagem)

CONTÍNUA(mensuração)

4251

0011 0010 1010 1101 0001 0100 1011

• Situação: A direção de um parque contratou uma equipe de pesquisadores para

coletar algumas informações sobre seus freqüentadores. Os cem entrevistados

responderam às seguintes questões: sexo, idade, quantas vezes por semana vão ao

parque, período de visita (manhã, tarde ou noite), tempo de permanência e quantia

gasta nas dependências do parque. Cada um desses objetos de estudo corresponde a uma variável. Classifique as variáveis quanto ao

tipo.

4251

0011 0010 1010 1101 0001 0100 1011RESOLUÇÃO DO PROBLEMA

• Variáveis qualitativas: sexo e período de visita.

• Variáveis quantitativas I) Discreta: número de visitas por semana.II) Contínuas: idade, tempo de

permanência e quantia gasta nas dependências do parque.

4251

0011 0010 1010 1101 0001 0100 1011

SÉRIES ESTATÍSTICAS

• SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos.

• TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.

4251

0011 0010 1010 1101 0001 0100 1011

• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :

• um traço horizontal ( - ) quando o valor é zero; • três pontos ( ... ) quando não temos os dados; • zero ( 0 ) quando o valor é muito pequeno para

ser expresso pela unidade utilizada; • um ponto de interrogação ( ? ) quando temos

dúvida quanto à exatidão de determinado valor. • Obs: Os lados direito e esquerdo de uma tabela

oficial devem ser abertos. “Salientamos que em alguns documentos as tabelas não são abertas devido a limitações de editores como o html".

4251

0011 0010 1010 1101 0001 0100 1011

DISTRIBUIÇÃO DE FREQUÊNCIA

• É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores – número de vezes que a variável é observada na população estudada).

4251

0011 0010 1010 1101 0001 0100 1011EXEMPLO:

• Um repórter do jornal A Voz da Terra foi destacado para acompanhar a apuração de votos da eleição da diretoria do clube da cidade, a qual concorrem os candidatos A, B, C e D. O objetivo da pesquisa é a publicação da porcentagem de votos obtidos pelos candidatos.

4251

0011 0010 1010 1101 0001 0100 1011Como organizar os dados?

Os dados obtidos constituem os dados brutos.

O repórter poderá recorrer a uma organização numérica simples, registrada através de símbolos de fácil visualização:

4251

0011 0010 1010 1101 0001 0100 1011

TABELA PRIMITIVA OU DADOS BRUTOS: É uma tabela ou

relação de elementos que não foram numericamente organizados

Candidatos Votos

A

B

C

D

4251

0011 0010 1010 1101 0001 0100 1011

ROL DOS DADOS: É a tabela obtida após a

ordenação dos dados (crescente ou decrescente). Candidatos Votos

D 9

B 11

A 14

C 16

4251

0011 0010 1010 1101 0001 0100 1011

• Deste modo, ele terá iniciado o trabalho de tabulação dos dados. Apesar das anotações do repórter

trazerem todas as informações sobre estas eleições, é mais provável que seja publicada uma tabela, com número de votos de cada candidato e a respectiva

porcentagem de votos.

4251

0011 0010 1010 1101 0001 0100 1011

EXEMPLO DE DISTRIBUIÇÃO POR FREQÜÊNCIA:

Candidato Número de votos

Votos (%)

D 9 18

B 11 22

A 14 28

C 16 32

Total 50 100

4251

0011 0010 1010 1101 0001 0100 1011

• Na tabela do exemplo dado, a freqüência de votos do candidato A é 9, a do candidato B

é 11, a do C é 14 e a do D é 16. Estas freqüências, representadas na segunda

coluna, são as freqüências absolutas (F). Sua soma é igual a 50 que é o número total de observações. Na coluna “% de votos”, obtida a partir do cálculo de porcentagem

de votos de cada candidato, estão representadas as freqüências relativas (Fr).

4251

0011 0010 1010 1101 0001 0100 1011EXEMPLO 2:

• DADOS BRUTOS: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

• ROL: 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

4251

0011 0010 1010 1101 0001 0100 1011

Distribuição de freqüência:Dados Freqüência

41 3

42 2

43 1

44 1

45 1

46 2

50 2

51 1

52 1

54 1

57 1

58 2

60 2

Total 20

4251

0011 0010 1010 1101 0001 0100 1011

Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional

efetuar o agrupamento dos valores em vários intervalos de classe.

Classes Freqüência41 |----- 45 745 |----- 49 349 |----- 53 453 |----- 57 157 |----- 61 5

Total 20

4251

0011 0010 1010 1101 0001 0100 1011Cálculo do número de classes :

• Procurar no Google por: "Regra de Sturges"

4251

0011 0010 1010 1101 0001 0100 1011REPRESENTAÇÃO GRÁFICA

• Dados estatísticos podem ser representados tanto por tabelas quanto por gráficos.

4251

0011 0010 1010 1101 0001 0100 1011CLASSIFICAÇÃO:

• Diagramas;

• Pictogramas;

• Cartogramas.

4251

0011 0010 1010 1101 0001 0100 1011Diagramas

• São gráficos geométricos dispostos em duas dimensões. São os mais usados na

representação de séries estatísticas.

4251

0011 0010 1010 1101 0001 0100 1011

I) Gráficos em barras horizontais (gráfico de barras)

• Para sua construção, as freqüências são anotadas no eixo das abscissas, e os

valores da variável, no eixo das ordenadas.

4251

0011 0010 1010 1101 0001 0100 1011Gráficos em barras horizontais

4251

0011 0010 1010 1101 0001 0100 1011

Gráficos em barras verticais (gráfico de colunas)

• Como o próprio nome indica, nesse tipo de gráfico as freqüências serão representadas por colunas – retângulos com bases de mesma medida, cujas alturas correspondem às freqüências.

4251

0011 0010 1010 1101 0001 0100 1011

Gráfico de colunas 3D

4251

0011 0010 1010 1101 0001 0100 1011Gráfico de setores (Pizza)

• Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a

participação do dado no total. O total é representado pelo círculo, que fica dividido em

tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente

proporcionais aos dados da série. O gráfico em setores só deve ser empregado “quando há, no

máximo, sete dados”.

4251

0011 0010 1010 1101 0001 0100 1011Gráfico de setores

4251

0011 0010 1010 1101 0001 0100 1011Gráficos de linhas (poligonal)

• São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo.

As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo

gráfico.

4251

0011 0010 1010 1101 0001 0100 1011

Gráficos de linhas

Taxas Brutas de Nupcialidade

Brasil, 1979-1994

Fonte: Fundação IBGE, Anuário Estatístico do Brasil 1960/1991 e 1994

4251

0011 0010 1010 1101 0001 0100 1011II) PICTOGRAMAS

• São construídos a partir de figuras representativas da intensidade do fenômeno.

Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois

sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A

desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e

não de detalhes minuciosos.

4251

0011 0010 1010 1101 0001 0100 1011PICTOGRAMA

4251

0011 0010 1010 1101 0001 0100 1011III) CARTOGRAMAS

• São ilustrações relativas a cartas geográficas (mapas). O objetivo desse

gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas

geográficas ou políticas.

4251

0011 0010 1010 1101 0001 0100 1011CARTOGRAMA

4251

0011 0010 1010 1101 0001 0100 1011CARTOGRAMA

4251

0011 0010 1010 1101 0001 0100 1011CARTOGRAMA

4251

0011 0010 1010 1101 0001 0100 1011

MEDIDAS DE TENDÊNCIA CENTRAL

• Pesquisadores em muitos campos tem usado o termo “média” em questões tais como:

Quantos cigarros fuma, em média, o adolescente? Qual a nota média de um

universitário? Em média, quantos são os acidentes automobilísticos que resultam diretamente da ingestão de álcool ou de

outras drogas?

4251

0011 0010 1010 1101 0001 0100 1011

• Uma forma útil de descrever um grupo como um todo, consiste em encontrar um

único número que represente o que é “médio” ou “típico” naquele conjunto

particular de dados. Em pesquisa, tal valor é conhecido como medida de tendência central, uma vez que ela se localiza em

torno do meio ou centro de uma distribuição – onde a maior parte dos dados tende a

concentrar-se.

4251

0011 0010 1010 1101 0001 0100 1011MODA

• É o valor que ocorre com maior freqüência em uma série de valores.

• Mo é o símbolo da moda.

• Assim, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.

4251

0011 0010 1010 1101 0001 0100 1011

• A moda é facilmente reconhecida: basta, procurar o valor que mais se repete.

Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

• Há séries nas quais não existe valor modal.

Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda.

Neste caso, a série é denominada amodal.

4251

0011 0010 1010 1101 0001 0100 1011• Em outros casos, pode haver dois ou mais

valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais.

Exemplo: A série { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.

Portanto, ela é denominada série bimodal.

4251

0011 0010 1010 1101 0001 0100 1011

A MODA QUANDO OS DADOS ESTÃO AGRUPADOS

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de

maior freqüência.

4251

0011 0010 1010 1101 0001 0100 1011I) Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda:

basta fixar o valor da variável de maior freqüência.

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Qual é a moda das temperaturas na tabela abaixo:

• Resposta: 2º C é a temperatura modal, pois é a de maior freqüência.

temperatura freqüência

Oº C 3

1º C 9

2º C 12

3º C 6

4251

0011 0010 1010 1101 0001 0100 1011II) Com intervalos de classe

• A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método

mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação

de moda bruta.

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Calcule a estatura modal conforme a tabela abaixo.

Fórmula: Mo = (l + L) /2 Em que: l = limite inferior da

classe modal e L= limite superior da classe modal.

A classe modal é 58|----- 62, pois é a de maior freqüência. l =58 e L=62

• Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda).

Classes (em cm)

freqüência

54 |----- 58 9

58 |----- 62 11

62 |----- 66 8

66 |----- 70 5

4251

0011 0010 1010 1101 0001 0100 1011MEDIANA

• Quando dados são dispostos em ordem crescente ou decrescente, torna-se possível localizar a mediana (Md), que corresponde ao ponto central da distribuição.

4251

0011 0010 1010 1101 0001 0100 1011

I) Se a série dada tiver número ímpar de termos:

• A mediana será o dado que cai exatamente no meio da distribuição. A posição do valor mediano pode ser determinada pelo exame dos dados ou pela fórmula:

Posição da mediana = (n +1) /2

Em que n é o número de valores da distribuição.

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

• ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

• n = 9 , logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série

ordenada será a mediana

• A mediana é o 5º elemento = 2

4251

0011 0010 1010 1101 0001 0100 1011

II) Se a série dada tiver número par de termos:

• A mediana será sempre aquele ponto da distribuição que é antecedido e precedido por igual número de dados. Para uma distribuição com número par de dados, sempre há dois valores considerados “centrais”. Assim, a mediana é a média aritmética desses dois valores.

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 1, 4, 1, 3, 5, 6 }

• Ordenar a série { 0, 0, 1, 1, 1, 3, 3, 4, 5, 6 }

• Os valores centrais são 1 e 3.

• E a mediana da série é: (1+3)/2=2

4251

0011 0010 1010 1101 0001 0100 1011MÉDIA ARITMÉTICA

• A medida de tendência central mais comumente usada é a média aritmética, ,

cujo cálculo consiste em somar um conjunto de valores e dividir o total pelo número de valores.

x

4251

0011 0010 1010 1101 0001 0100 1011

Fórmula:

nx... xxx

n

x n321

n

1ii

x

4251

0011 0010 1010 1101 0001 0100 1011

• Exemplo: Calcular a média aritmética dos elementos do conjunto {2, 3, 8, 27}.

104

27832 x

4251

0011 0010 1010 1101 0001 0100 1011MÉDIA ARITMÉTICA PONDERADA

Exemplo:

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para

variável o número de filhos do sexo masculino. Calcularemos a quantidade

média de meninos por família:

4251

0011 0010 1010 1101 0001 0100 1011

Quadro resumo:Número de meninos Freqüência

(número de famílias)0 2

1 6

2 10

3 12

4 4

total 34

4251

0011 0010 1010 1101 0001 0100 1011

• Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:

n

nn

ii

i

ffffffff

f

fx

... .x... .x.x.x

.x

321

n332211

1

n

1ii

4251

0011 0010 1010 1101 0001 0100 1011

Voltando à tabela para resolver o problema proposto.

0 2 01 6 62 10 203 12 364 4 16

total 34 78

• Média Aritmética Ponderada:

ix if ii fx .

famíliapor meninos 3,23478 x

4251

0011 0010 1010 1101 0001 0100 1011

• Exercício: (Unifesp) Para ser aprovado num curso, um estudante precisa submeter-se a três provas

parciais durante o período letivo e uma prova final, com pesos 1, 1, 2 e 3 respectivamente, e obter média no mínimo igual a 7. Se um estudante

obteve nas provas parciais as notas 5, 7 e 5, respectivamente, a nota mínima

que necessita obter na prova final para ser aprovado é:

4251

0011 0010 1010 1101 0001 0100 1011

Logo, a média aritmética ponderada será:

9n

273

77

3n22

7 3211

3.n2.51.71.5

7

n

x

4251

0011 0010 1010 1101 0001 0100 1011

MÉDIA ARITMÉTICA (EM INTERVALOS DE CLASSE)

• Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

• Em que é o ponto médio de cada classe.

n

nn

ii

i

ffffffff

f

fx

... .x... .x.x.x

.x

321

n332211

1

n

1ii

ix

4251

0011 0010 1010 1101 0001 0100 1011

Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo.

• Aplicando a fórmula temos:

2.440 / 40 = 61

Logo, = 61 cm

estaturas (cm)

freqüência

ponto médio

50 |----- 54

4 52 208

54 |----- 58

9 56 504

58 |----- 62

11 60 660

62 |----- 66

8 64 512

66 |----- 70

5 68 340

70 |----- 74

3 72 216

Total 40 2440

x

)( if )( ix ii fx .

4251

0011 0010 1010 1101 0001 0100 1011MÉDIA GEOMÉTRICA

• Simples:

• Ponderada:

n...321G ...x.xx M nx

i

nf

fn

fff x...x.xx M ...321Gp321

4251

0011 0010 1010 1101 0001 0100 1011Exercício: Calcular a média geométrica dos elementos do conjunto {2, 3, 8, 27}.

Podemos proceder da seguinte forma:

63.23.2 3.3.2.2 2.3.8.27 M 4 444 334G

4251

0011 0010 1010 1101 0001 0100 1011MÉDIA HARMÔNICA

DEFINIÇÃO: É o inverso da média aritmética dos inversos.

FÓRMULA:

nxxxx

M

n

H 1...1111

321

nxxxx

n1...111

321

4251

0011 0010 1010 1101 0001 0100 1011

MEDIDAS DE VARIABILIDADE (MEDIDAS DE DISPERSÃO)

• AMPLITUDE;

• VARIÂNCIA;

• DESVIO PADRÃO.

4251

0011 0010 1010 1101 0001 0100 1011

MEDIDAS DE DISPERSÃO:INTRODUÇÃO

• Vimos que a moda, a mediana e a média podem ser usadas para resumir, num único número, aquilo que é “médio” ou “típico”

numa distribuição. Quando empregada sozinha, entretanto, qualquer medida de

tendência central fornece apenas uma visão incompleta de um conjunto de dados, portanto, pode distorcer tanto quanto

esclarecer.

4251

0011 0010 1010 1101 0001 0100 1011

ILUSTRANDO A SITUAÇÃO COLOCADA:

• Admita que em Honolulu (Havaí) e Houston (Texas) tenham quase a mesma temperatura média diária de 75º F. Será

que, por isso, podemos admitir que a temperatura é basicamente a mesma em

ambas as localidades?

4251

0011 0010 1010 1101 0001 0100 1011

• A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral,

entre 70º F e 80º F. Por outro lado, a temperatura em Houston pode diferir

estacionalmente, isto é, apresentar-se baixa em janeiro – cerca de 40º F – e alta em julho e agosto – próxima dos 100º F. Desnecessário dizer, que as praias de

Houston não estão cheias de gente o ano todo.

4251

0011 0010 1010 1101 0001 0100 1011

• Tal fato demonstra que necessitamos, além de uma medida de tendência central, de um índice que indique o grau de dispersão dos valores em torno do centro da distribuição. Desta forma, precisamos de uma medida indicativa que costumeiramente é chamada variabilidade, variação ou ainda dispersão.

• Voltando ao exemplo, podemos dizer que a distribuição de temperaturas em Houston tem maior variabilidade (é mais dispersa) do que a distribuição de temperaturas em Honolulu.

4251

0011 0010 1010 1101 0001 0100 1011AMPLITUDE TOTAL

• Pode-se obter uma medida de variabilidade rápida, embora não muito exata, pelo cálculo da amplitude total, que é a

diferença entre o maior e o menor valor da distribuição.

4251

0011 0010 1010 1101 0001 0100 1011

EXEMPLO:• Se a temperatura anual mais alta em

Honolulu foi de 88º F e a mais baixa, 62º F, a amplitude total da temperatura foi de 26º F (isto é, 88º F – 62º F = 26º F).

• Se o dia mais quente em Houston apresenta 102º F e o mais frio, 33º F, a amplitude total da temperatura anual em Houston foi de 69º F (isto é, 102º F – 33º F = 69º F).

4251

0011 0010 1010 1101 0001 0100 1011

DESVANTAGEM DA UTILIZAÇÃO DA AMPLITUDE COMO MEDIDA DE DISPERSÃO

• A amplitude é inteiramente dependente de apenas dois valores: o maior e o menor num dado conjunto de valores. Como resultado, a amplitude fornece, via de regra, um mero

índice grosseiro da variabilidade de uma distribuição.

4251

0011 0010 1010 1101 0001 0100 1011DESVIO PADRÃO

• É a medida de dispersão que leva em consideração a totalidade dos valores

da variável em estudo. É um indicador de variabilidade bastante estável.

4251

0011 0010 1010 1101 0001 0100 1011

• DESVIO:

• VARIÂNCIA:

• DESVIO PADRÃO:

xxd ii

ndddd n

223

22

212 ...

ndddd n

223

22

21 ...

4251

0011 0010 1010 1101 0001 0100 1011

Exercício: A distribuição das freqüências das alturas dos jogadores de futebol está mostrada na tabela a seguir:

Altura (m) Número de jogadores

1,65 |----- 1,75 2

1,75 |----- 1,85 6

1,85 |----- 1,95 8

1,95 |----- 2,05 4

4251

0011 0010 1010 1101 0001 0100 1011

b) Calcule a média e o desvio padrão dessa distribuição de freqüência.

Cálculo da média aritmética:Primeiro devemos calcular o ponto médio de cada

intervalo de classe e em seguida fazemos uso desses valores para calcular a média aritmética.

87,120

2,00 . 41,90 . 81,80 . 61,70 . 2 x

4251

0011 0010 1010 1101 0001 0100 1011

Cálculo dos desvios:

17,087,170,11 d

07,087,180,12 d

03,087,190,13 d

13,087,100,24 d

4251

0011 0010 1010 1101 0001 0100 1011

Cálculo da variância:

Cálculo do desvio padrão:

0,09 0,0081

0081,020

4.(0,13)(0,03) 8..(-0,07)6) (-017 2. 2222

2

4251

0011 0010 1010 1101 0001 0100 1011SIGNIFICADO DO DESVIO PADRÃO

• Após calcular o desvio padrão de uma de uma série o sujeito pode ficar com uma desagradável sensação relacionada com o significado do resultado.

• O que indica esse número? O que, exatamente, podemos dizer agora a respeito dessa distribuição que não poderíamos ter dito antes?

4251

0011 0010 1010 1101 0001 0100 1011

Tornando a noção de desvio padrão mais clara: uma ilustração.

• Uma importante característica da curva normal é auxiliar na

interpretação e compreensão do desvio padrão.

4251

0011 0010 1010 1101 0001 0100 1011Curva normal

• A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino.

• O aspecto mais marcante dessa curva é a simetria.

• O ponto de freqüência máxima dessa curva está situado no meio da distribuição, em que a média, a mediana e a moda coincidem.

4251

0011 0010 1010 1101 0001 0100 1011Curva normal

4251

0011 0010 1010 1101 0001 0100 1011Área sob a curva normal

4251

0011 0010 1010 1101 0001 0100 1011Área sob a curva normal

4251

0011 0010 1010 1101 0001 0100 1011Área sob a curva normal

4251

0011 0010 1010 1101 0001 0100 1011

• Podemos concluir, então, que a área total sob a curva normal compreendida entre e , inclui para efeitos

práticos, a totalidade dos dados sob qualquer curva normal (mais de 99%).

3 3

4251

0011 0010 1010 1101 0001 0100 1011

SITUAÇÃO: Para entendermos melhor essa característica, vamos examinar o que alguns antropólogos dizem a respeito da diferença

de QIs ligadas ao sexo.

• Alguns pesquisadores afirmam que homens e mulheres têm QI médio igual a 100.

Entretanto, esses QIs diferem acentuadamente em termos de variabilidade

em torno da média.

4251

0011 0010 1010 1101 0001 0100 1011

• A distribuição do QIs masculinos contém uma porcentagem maior de

valores extremos – representativos de sujeitos brilhantes e de sujeitos

medíocres – enquanto que a distribuição de QIs femininos contém

uma porcentagem maior de valores localizados próximos à média.

4251

0011 0010 1010 1101 0001 0100 1011• Em virtude do desvio padrão ser uma medida de variabilidade, essas diferenças ligadas ao sexo deveriam refletir no valor do desvio padrão de cada distribuição de

QIs. Poderíamos, assim, verificar, por exemplo, que para os indivíduos do

sexo masculino e que para os indivíduos do sexo feminino.

105

4251

0011 0010 1010 1101 0001 0100 1011

• Se conhecêssemos o desvio de cada conjunto de valores de QI e

admitíssemos que cada conjunto tivesse distribuição normal,

poderíamos estimar e, em seguida, comparar as porcentagens de

indivíduos do sexo masculino e indivíduos do sexo feminino

localizadas numa dada amplitude de QIs.

4251

0011 0010 1010 1101 0001 0100 1011

Distribuição de QIs masculinos

4251

0011 0010 1010 1101 0001 0100 1011

Distribuição de QIs femininos

4251

0011 0010 1010 1101 0001 0100 1011CONCLUSÕES

• O desvio padrão e a curva normal nos permite comparar os QIs femininos e

masculinos ao longo de toda a distribuição.

4251

0011 0010 1010 1101 0001 0100 1011

• Por exemplo: se medirmos a linha base da distribuição de QIs masculinos em unidades de desvio padrão, ficaremos sabendo que 68,25% dos valores caem entre -1sigma e + 1sigma. Desse modo, 68,25% dos representantes do sexo masculino terão, nas condições propostas QIs entre 90 e 110.

4251

0011 0010 1010 1101 0001 0100 1011

RESOLUÇÃO DOS EXERCÍCIOS DA APOSTILA DO ANGLO

AULAS 18 E 19 - ESTATÍSTICA

SETOR 1102

PÁGINA 19

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 1: Uma prova de matemática constou de 20 testes apresentando a seguinte distribuição por assunto:

ASSUNTO FREQUÊNCIA PORCENTAGEM

Geometria 6

Álgebra 8

Aritmética 4

Cálculo 2

TOTAL 20

a) Complete a coluna de porcentagem.b) Represente estes dados num gráfico de barras verticais.

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 1: Resolução (item a)

%101,0202

:Cálculo

%202,0204

:Aritmética

%404,0208 :Álgebra

%303,0206

:Geometria

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 1: Resolução (item a – continuação)

ASSUNTO FREQUÊNCIA PORCENTAGEM

Geometria 6 30%

Álgebra 8 40%

Aritmética 4 20%

Cálculo 2 10%

TOTAL 20 100%

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 1: Resolução (item b)

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 2: Nas aulas de Educação Física de um colégio são praticados três esportes: vôlei, futebol e basquete. Cada um dos 300 alunos opta por um único esporte. Sabendo que 75 alunos escolheram futebol, responda:

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 2: a) Quanto mede em graus o ângulo do setor circular

que corresponde ao número de alunos que optaram por futebol?

90 x 300360 . 75

x

75 360300

oo

o

x

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 2: b) Quantos alunos optaram por basquete, se o

ângulo do setor circular correspondente aos alunos que escolheram vôlei mede 120º.

125 Assim,

150

360300

150 36012090

360 basquetevôleifutebol

o

o

oooo

o

x

x

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3: Foram perguntadas as idades dos 10 primeiros alunos matriculados num determinado curso noturno e obteve-se a seguinte seqüência de idades:

17, 20, 19, 18, 21, 16, 18, 21, 21, 19

Pede-se, obter:

a) Idade médiab) Mediana (Md)c) Moda (Mo)d) Variância (σ2)e) Desvio padrão (σ)

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3a) Idade média: Resposta

19

1021.32019.218.21716

x

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

x

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3b) Mediana: Resposta

19

21919

:centrais termosdos Média

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

Md

Md

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3c) Moda: Resposta

21

:frequênciamaior com aparece quevalor

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

Mo

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3d) Variância: Resposta

8,2

1028

10)1921.(3)1920()1919.(2)1918.(2)1917()1916(

2

2

2222222

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 3e) Desvio padrão: Resposta

67,1

8,2

8,22

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 4: Dois estudantes, A e B, obtiveram as notas abaixo relativas aos quatro bimestres escolares.

A 6 4 5 5B 6 6 4 4

a) Calcule a média das notas de cada aluno.

b) Qual aluno teve uma atuação mais regular?

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 4a) Resposta

54

4466

54

5546

B

A

x

x

4251

0011 0010 1010 1101 0001 0100 1011

Exercício 4 b) Resposta

regular. mais atuação A teve estudante o , Como

1 44

4)54()54()56()56(

22

42

4)55()55()54()56(

A

2

22222

2

22222

B

BB

B

AA

A

4251

0011 0010 1010 1101 0001 0100 1011REFERÊNCIAS BIBLIOGRÁFICAS

• LEVIN, J. Estatística Aplicada a Ciências Humanas, 2ª edição. Trad. Sérgio Francisco Costa. USA: Editora Harbra, 1987.

• NAZARETH, H. Curso Básico de Estatística. São Paulo: Ática, 1994.

top related