tgf3_estatistica_aplicada

184
Semestre 3 Tecnologia em Gestão Financeira Caderno de Atividades Estatística Aplicada CLIQUEAQUI PARA VIRARAPÁGINA

Upload: fabiana-melo-da-silva

Post on 29-Dec-2015

79 views

Category:

Documents


38 download

TRANSCRIPT

Page 1: TGF3_Estatistica_Aplicada

Seme

stre

3Tecnologia em Gestão Financeira

Caderno de AtividadesEstatística Aplicada

CLIQUEAQUIPARAVIRARAPÁGINA

Page 2: TGF3_Estatistica_Aplicada

FICHA TÉCNICA

Equipe de Gestão EditorialRegina Cláudia FiorinJoão Henrique Canella FiórioPriscilla Ramos Capello

Análise de ProcessosJuliana Cristina e SilvaFlávia Lopes

Revisão TextualAlexia Galvão AlvesGiovana Valente FerreiraIngrid FavorettoJulio CamilloLuana Mercúrio

DiagramaçãoCélula de Inovação e Produção de Conteúdos

Caderno de AtividadesTecnologia em Gestão Financeira

DisciplinaEstatística Aplicada

Coordenação do CursoCarlos Eduardo Azevedo

Raquel de Oliveira Henrique

AutoriaIvonete Melo de Carvalho

Page 3: TGF3_Estatistica_Aplicada

ChancelerAna Maria Costa de Sousa

ReitoraLeocádia Aglaé Petry Leme

Pró-Reitor AdministrativoAntonio Fonseca de Carvalho

Pró-Reitor de GraduaçãoEduardo de Oliveira Elias

Pró-Reitor de ExtensãoIvo Arcangêlo Vedrúsculo Busato

Pró-Reitora de Pesquisa e PósGraduaçãoLuciana Paes de Andrade

Realização:

Diretoria de Planejamento de EAD José Manuel Moran Barbara Campos

Diretoria de Desenvolvimento de EAD Thais Costa de Sousa

Gerência de Design EducacionalRodolfo Pinelli Gabriel Araújo

© 2014 Anhanguera Educacional

Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou qualquer outro idioma.

Como citar esse documento:CARVALHO, Ivonete Melo de. Estatística Aplicada. Valinhos: Anhanguera Educacional, 2014. p. 1- 184. Disponível em: <http://www.anhanguera.com>. Acesso em: 3 mar. 2014.

Page 4: TGF3_Estatistica_Aplicada

ÍndiceÍndice

Page 5: TGF3_Estatistica_Aplicada

Tema 01: Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados 6

Tema 02: Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão 28

Tema 03: Assimetria e Curtose 50

Tema 04: Probabilidade 70

Tema 05: Análise de Regressão e Correlação 90

Tema 06: Distribuição de Probabilidade 112

Tema 07: Intervalos de Confiança 136

Tema 08: Testes de Hipóteses 160

Page 6: TGF3_Estatistica_Aplicada

seções

Tema 01Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados

Page 7: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 8: TGF3_Estatistica_Aplicada

Tema 01Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados

Page 9: TGF3_Estatistica_Aplicada

9

Conteúdo

Nessa aula você estudará:

• Uma visão geral da Estatística.

• Distribuição de frequências.

• Classificação de dados e variáveis.

• Construção de gráficos.

CONTEÚDOSEHABILIDADES

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 10: TGF3_Estatistica_Aplicada

10

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que é e para que serve a estatística?

• Como obter, tabular, representar e realizar análise numérica de dados?

• O que são e para que servem as variáveis qualitativas?

• O que são e para que servem as variáveis quantitativas?

CONTEÚDOSEHABILIDADES

LEITURAOBRIGATÓRIA

Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados

A estatística é a arte ou a ciência que se ocupa em levantar, tabular e analisar dados.

Para compreendê-la, você precisa adaptar-se a algumas definições. Os termos apresentados precisam ser incorporados por você.

Definições:

População = conjunto formado por todos os elementos cuja característica o investigador deseja conhecer.

Amostra = subconjunto da população.

Variável = a característica que se pretende conhecer.

Dado = informação (característica) a ser tratada.

Page 11: TGF3_Estatistica_Aplicada

11

LEITURAOBRIGATÓRIAUm exemplo: a professora Ivonete deseja conhecer a faixa etária de seus alunos EAD.

Aqui, a população é formada por todos os alunos de Ivonete; a variável (característica) a ser estudada é a faixa etária dos alunos.

Seguindo com o exemplo:

Ivonete possui vinte mil alunos. “20.000” é um número muito grande de pessoas a ser analisado. A demanda de tempo seria imensa. Para resolver essa questão, em vez de estudar toda a população, uma amostra dela (parte da população) poderá ser determinada. Veja como:

Cálculo do tamanho da amostra:

Considerando uma população de tamanho N e uma margem de erro e (em porcentagem) deve-se calcular o número índice n1:

2

1 e1n

=

Conhecido o número índice, o tamanho da amostra n será dado por:

1

1nNn*Nn

+=

No exemplo, se Ivonete admitir um erro de 2% sobre uma população de 20 mil alunos, ela terá:

500.20 52 0,0

11 222

1 ==

=

=

en

2,222.2500,22

000.000.0 5500.2000.0 2500.2*000.0 2*

1

1 ==+

=+

=nNnN

n ,isto é, n = 2.223.

Em bom português, Ivonete precisa obter 2.223 respostas à questão “qual sua idade?” para que sua investigação não apresente erro superior a 2%.

Importante: o tamanho de uma amostra será sempre dado por um número inteiro e positivo. Existem outras formas de determinar o tamanho de uma amostra. Uma delas é calcular 10% do tamanho da população. Outra diz que para populações pequenas não é necessário determinar amostra. Outro conceito será apresentado a você depois de estudar probabilidade.

Page 12: TGF3_Estatistica_Aplicada

12

De volta ao exemplo, o problema de Ivonete agora é obter a amostra. Para isso, ela poderá utilizar diferentes meios para coletar as respostas, mas, antes disso, será necessário determinar o tipo de amostra.

Os principais tipos de amostragem utilizados são os probabilísticos (todos os indivíduos da população têm a mesma chance de serem selecionados).

Os métodos mais comuns de amostragem probabilística são:

• Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios [veja como no Livro-Texto].

• Amostragem estratificada: subdivide-se a população em, no mínimo, dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se uma amostra de cada. Exemplo: homens e mulheres.

• Amostragem sistemática: escolhe-se um ponto de partida e então, sistematicamente, selecionam-se os outros. Por exemplo: o [5°, 15°, 25°, 35°] (etc.) indivíduos.

• Amostragem por conglomerados: divide-se a população em conglomerados (áreas), em seguida sorteiam-se algumas áreas e analisam-se todos os elementos dos conglomerados escolhidos. Por exemplo: bairros [de uma cidade]. (GIACOMELLO, 2012, p. 2, grifos nossos).

Bem, agora que você entendeu esses elementos essenciais, certamente vai compreender porque seguirei com exemplos que apresentam números menores (para simplificação de cálculos).

Para dar sequência ao estudo, suponha que o tamanho da amostra calculada por Ivonete fosse n = 40.

Para obter as respostas (dados) necessárias para conhecer a variável idade (em anos) de seus alunos, Ivonete postou a pergunta na área acadêmica e colheu as 50 primeiras respostas válidas. As idades estão apresentadas no quadro a seguir:

LEITURAOBRIGATÓRIA

Page 13: TGF3_Estatistica_Aplicada

13

18 23 25 30 22 32 44 35

23 41 30 28 32 23 44 37

44 27 32 30 32 30 30 18

35 23 25 28 25 30 30 30

26 25 25 23 32 44 23 30

Os dados coletados são quantitativos porque se referem a uma medida. Dados quantitativos podem ser contínuos (por exemplo: quanto dinheiro você tem na carteira) ou discretos (o número de filhos que você tem).

Caso Ivonete tivesse perguntado: “sexo – feminino ou masculino?”, as respostas não seriam uma medida, mas sim uma característica. Variáveis desse tipo são chamadas de qualitativas. Uma variável qualitativa pode ser nominal (feminino, masculino) ou ordinal (classe social).

Suponha que, entre as respostas coletadas, Ivonete tivesse obtido 24 respostas “masculino” e 16 respostas “feminino”.

Veja bem, você tem dois exemplos de variáveis para analisar: qualitativas e quantitativas.

Qualquer estudo estatístico (qualitativo ou quantitativo) deve começar pela construção de uma tabela.

No caso da variável “sexo”, organizarei a tabela em ordem alfabética, ou seja, construindo um ROL. As opções “feminino” e “masculino” são chamadas de categorias.

Variável: sexo

Feminino 16

Masculino 24

Total: 40

A tabela de coleta de dados pode ser transformada em uma tabela de frequências (frequência é o número de vezes que uma determinada resposta é obtida).

LEITURAOBRIGATÓRIA

Page 14: TGF3_Estatistica_Aplicada

14

A tabela de frequências apresenta: frequência simples – f – (número absoluto); frequência relativa – fr – (na forma decimal) e frequência percentual – f%.

Em estatística, trabalhar com porcentagens é essencial.

Veja como fica a tabela de frequências da variável “sexo”.

Sexo f fr f%

Feminino 16 0,4 40%

Masculino 24 0,6 60%

Total: 40 1,0 100%

Elaborada a tabela, podem-se representar os dados graficamente. No caso das variáveis qualitativas os tipos de gráficos mais comumente utilizados são: colunas, barras, setores circulares (formato de pizza) e pictóricos (figuras). Veja as ilustrações na figura a seguir:

Figura 1.1: Tipos de gráficos para variáveis qualitativas

Barras Colunas Setores Circulares Pictóricos

0 5 10 15 20 25 30

F

M

0

5

10

15

20

25

30

F M

Feminino

Masculino

Fonte: Elaboração da autora.

Agora, você aprenderá a tratar dados quantitativos.

Assim como nos dados qualitativos, a primeira providência é colocar os elementos em ordem (em rol). Como são medidas, devem ser colocadas em ordem numérica crescente.

LEITURAOBRIGATÓRIA

Page 15: TGF3_Estatistica_Aplicada

15

A lista de dados obtidos era assim:

18 23 25 30 22 32 44 35

23 41 30 28 32 23 44 37

44 27 32 30 32 30 30 18

35 23 25 28 25 30 30 30

26 25 25 23 32 46 23 30

Ordenando os dados do menor para o maior, a tabela ficará assim:

18 23 25 27 30 30 32 41

18 23 25 28 30 30 32 44

22 23 25 28 30 32 35 44

23 23 25 30 30 32 35 44

23 25 26 30 30 32 37 46

Na tabela ordenada, é fácil verificar que algumas idades se repetem e outras não. Assim que obter o rol (quando estiver trabalhando com dados quantitativos), o próximo passo é determinar a amplitude total dos dados em estudo. Não se assuste, é fácil. Para calcular a amplitude total basta subtrair, do maior valor obtido, o menor valor. No exemplo, você deverá fazer:

AT = 46 - 18 = 28

Depois da amplitude, você deverá calcular o número de classes (categorias) que comporá a tabela.

Para determinar o número de classes é preciso estar atento ao tamanho da amostra.

Para amostras com até 50 elementos, o número de classes é dado por: nk = . Para amostras com mais de 50 elementos, você deverá utilizar a regra de Sturges: )nlog(*3,31k += .

No exemplo, a amostra n = 40 deverá conter 73,60 4 ≅≅=k classes (o número de classes é sempre inteiro e positivo).

LEITURAOBRIGATÓRIA

Page 16: TGF3_Estatistica_Aplicada

16

Isso feito, você deverá calcular a amplitude das classes. A amplitude das classes é dada

por: KTAkA = . No exemplo: 4

78 2 =⇒= kAkA .

Depois disso, chega o momento de construir a tabela de frequências.

No caso de variável quantitativa, além de calcular frequência simples – f; frequência relativa – fr – e frequência percentual – f%; também será preciso calcular a frequência acumulada – F; a frequência acumulada relativa – Fr – e a frequência acumulada percentual – F%. Contudo, antes de contar as frequências, você deverá construir as classes.

A primeira classe começa com o menor valor obtido entre os dados tabelados; a esse valor adiciona-se a amplitude da classe: 18 + 4 = 22. A segunda classe começará no 22 e terminará no 26 e assim por diante até chegar na sétima classe que começará na 42 e terminará em 46.

Veja como fica a tabela de frequências da variável idade.

Idade f fr f% F Fr F%

18 ι— 22 02 0,050 05,0 02 0,050 05,0

22 ι—26 12 0,300 30,0 14 0,350 35,0

26 ι— 30 04 0,100 10,0 18 0,450 45,0

30 ι— 34 09 0,225 22,5 27 0,675 67,5

34 ι— 38 07 0,175 17,5 34 0,850 85,0

38 ι— 42 02 0,050 05,0 36 0,900 90,0

42 ι— 46 04 0,100 10,0 40 1,000 100,0

Total: 40 1,000 100%

O símbolo “ι—“ significa que o início do intervalo faz parte dele e o final somente o limita (em linguagem matemática: intervalo fechado à esquerda e aberto à direita).

Para obter a frequência de cada classe é preciso contar quantos elementos fazem parte dela. Por exemplo, na primeira classe estariam os números 18, 19, 20 e 21 que aparecessem – neste caso, somente o 18 aparece 2 vezes. Na segunda classe, deveriam aparecer os números 22, 23, 24 e 25 que aparecem 1 vez, 6 vezes, nenhuma vez e 5 vezes, respectivamente, portanto, a frequência simples é 12. Confira os demais valores tabelados.

LEITURAOBRIGATÓRIA

Page 17: TGF3_Estatistica_Aplicada

17

A ideia de acumular frequências também é simples. A primeira frequência acumulada (relativa ou percentual) é sempre igual à primeira frequência simples (relativa ou percentual). Da segunda frequência acumulada em diante, basta que você adicione o valor da frequência simples da próxima classe ao valor acumulado: 2 + 12 = 14.

Para representar graficamente dados quantitativos, os gráficos utilizados são o histograma, o polígono de frequências (simples) e a ogiva (frequências acumuladas). Vejas os gráficos na figura seguinte:

Figura 1.2: Tipos de gráficos para variáveis quantitativas

Histograma Polígono de frequências Ogiva

0

2

4

6

8

10

12

14

18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 0

5

10

15

20

25

30

35

40

45

18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 460

5

10

15

20

25

30

35

40

45

18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46

Fonte: Elaboração da autora.

Comentários:

Histograma é bem parecido com o gráfico de colunas, contudo, suas colunas são colaterais com todas as bases com a mesma dimensão.

O polígono de frequências é obtido considerando-se os valores médios de cada classe e a frequência relativa à classe estudada.

A ogiva também considera os pontos médios de cada classe em correspondência ao valor nela acumulado.

Leia no Livro-Texto, se possível, como tratar dados agrupados.

LEITURAOBRIGATÓRIA

Page 18: TGF3_Estatistica_Aplicada

18

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições desses exames e consultar a resolução comentada.

Page 19: TGF3_Estatistica_Aplicada

19

LINKSIMPORTANTESAcesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>.

Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução

comentada.

Vídeos

Assista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/

Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-

padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata

de produção da Editora Abril Cultural voltada para o público que prestará o ENEM.

Page 20: TGF3_Estatistica_Aplicada

20

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

Foi encomendado um estudo para ava-liação do curso “A” em uma Instituição de Ensino Superior. Para isso, aplicou-se um questionário e obtiveram-se respostas de 110 alunos.

Indique:

a) A variável em estudo.

b) A população em estudo.

c) A amostra escolhida.

Questão 2:

A variável “salário” é classificada como:

a) Qualitativa nominal.

b) Qualitativa ordinal.

c) Quantitativa contínua.

d) Quantitativa discreta.

e) Quantitativa ordinal.

Questão 3:

Uma população cuja característica deseja-se estudar apresenta 50 mil elementos. A margem de erro admitida pelo pesquisador é de 1%. Nessas condições, o tamanho da amostra será:

AGORAÉASUAVEZ

Page 21: TGF3_Estatistica_Aplicada

21

a) n = 50.000.

b) n = 10.000.

c) n = 8.334.

d) n = 5.000.

e) n = 500.

Questão 4:

Para tabelar uma amostra de dados quan-titativos de tamanho n = 100 elementos, o examinador deverá elaborar:

a) 10 classes.

b) 8 classes.

c) 7 classes.

d) 5 classes.

e) 4 classes.

Questão 5:

Chama-se questão aberta àquela cuja res-posta é livre. Uma questão é de múltipla escolha quando o investigador oferece as respostas a serem escolhidas pelo elemen-to pesquisado. Indique, entre as alternati-vas apresentadas, aquela cuja resposta deve ser obrigatoriamente livre:

a) Quantos livros você leu no último ano?

b) Quantos filhos você tem?

c) O bairro onde você mora é considerado um lugar tranquilo?

d) A que classe social você pertence?

e) Qual o título do último livro que você leu?

Texto para as questões de 6 a 10:

Considere os dados quantitativos representados na tabela. Com base nas orientações do item “Leitura Obrigatória” responda ao que se pede em seguida.

6 157 223 98 189119 142 99 75 241128 137 172 22 167115 29 217 29 142134 38 32 36 230

Questão 6:

Elabore uma tabela de frequências con-siderando cinco classes assim definidas:

0 ι— 50; 51 ι— 100; 101 ι— 150; 151 ι— 200; 201 ι— 250

Questão 7:

Elabore o histograma dos dados estudados.

Questão 8:

Elabore o polígono de frequência dos da-dos estudados.

AGORAÉASUAVEZ

Page 22: TGF3_Estatistica_Aplicada

22

Questão 9:

Elabore a ogiva dos dados estudados.

Questão 10:

Que informação você extrai ao analisar a ogiva?

AGORAÉASUAVEZ

Neste tema, você conheceu as definições iniciais da estatística e sua utilidade. Aprendeu como obter e classificar dados; construir tabelas e gráficos. Aprendeu, principalmente, que a estatística permite ao investigador conhecer qualquer elemento que componha sua área de atuação.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

FINALIZANDO

CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, Porto Alegre 16, 1997.

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

REFERÊNCIAS

Page 23: TGF3_Estatistica_Aplicada

23

REFERÊNCIASGIACOMELLO, C. P. Probabilidade e estatística. Centro de Ciências Exatas, da Natureza e de Tecnologia, Universidade de Caxias do Sul. Rio Grande do Sul, 2012.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p.124.

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

Amostra: subconjunto da população.

Dado: informação (característica) a ser tratada.

População: conjunto formado por todos os elementos cuja característica o investigador deseja conhecer.

Respostas válidas: são aquelas que não se desviam da pergunta elaborada. Exemplo: se, ao se perguntar “qual sua cor preferida?”, a resposta for “verde”, esta será válida.

Variável: a característica que se pretende conhecer.

GLOSSÁRIO

Page 24: TGF3_Estatistica_Aplicada

24

Questão 1

Resposta: Observando os detalhes do texto, as respostas serão: (a) qualidade de ensino; (b) Instituição de Ensino Superior; (c) 110 alunos.

Questão 2

Resposta: Alternativa C.

Questão 3

Resposta: Alternativa C.

Questão 4

Resposta: Alternativa B.

Questão 5

Resposta: Alternativa E.

Questão 6

Resposta: Após elaborar o rol, e com o auxílio de uma calculadora, você deverá obter:

Classes f fr f% F Fr F%

0 ι— 50 7 0,28 28 7 0,28 28

51 ι— 100 3 0,12 12 10 0,40 40

101 ι— 150 7 0,28 28 17 0,68 68

151 ι— 200 4 0,16 16 21 0,84 84

201 ι— 250 4 0,16 16 25 1,00 100

total 25 1,00 100

GABARITO

Page 25: TGF3_Estatistica_Aplicada

25

Questão 7

Resposta: Considerando as frequências simples:

0

1

2

3

4

5

6

7

8

0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250

Questão 8

Resposta: Considerando as frequências simples:

0

1

2

3

4

5

6

7

8

0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250

classes

frequ

ênci

as

GABARITO

Page 26: TGF3_Estatistica_Aplicada

26

Questão 9

Resposta: Considerando as frequências acumuladas:

0

5

10

15

20

25

30

0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250

classes

frequ

ênci

as

Questão 10

Resposta: Falando aproximadamente, metade dos valores acima do valor médio e metade dos valores abaixo do valor médio.

GABARITO

Page 27: TGF3_Estatistica_Aplicada
Page 28: TGF3_Estatistica_Aplicada

seções

Tema 02Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão

Page 29: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 30: TGF3_Estatistica_Aplicada

Tema 02Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão

Page 31: TGF3_Estatistica_Aplicada

31

Conteúdo

Nessa aula você estudará:

• Medidas de tendência central: média, moda e mediana.

• Medidas de dispersão: amplitude total, desvio, variância, desvio padrão, coeficiente de variação.

• Em que tipo de variáveis as diferentes medidas são aplicadas.

CONTEÚDOSEHABILIDADES

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 32: TGF3_Estatistica_Aplicada

32

CONTEÚDOSEHABILIDADES

LEITURAOBRIGATÓRIA

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que são e para que servem as medidas de tendência central?

• O que são e para que servem as medidas de dispersão?

• Média e desvio padrão devem ser sempre calculados?

• Por que variáveis qualitativas não apresentam as medidas de tendência central (exceto moda) e as medidas de dispersão?

Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão

Medidas de Tendência Central

As medidas de tendência central são:

• Medidas que representam um conjunto de dados relativos à observação de um determinado fenômeno (fato).

• Medidas que servem para orientar quanto à posição da distribuição dos dados no eixo das abscissas.

• Medidas que permitem a comparação de séries de dados entre si pelo confronto desses dados.

As principais medidas de tendência central são: média, mediana e moda.

Page 33: TGF3_Estatistica_Aplicada

33

LEITURAOBRIGATÓRIASão sinônimos de média:

• Esperança.

• Esperança matemática.

• Valor esperado.

• Expectância de uma variável aleatória.

Existem também os decis, quartis e percentis, que são chamados de separatrizes. As separatrizes não serão trabalhadas em detalhes neste caderno. Para tanto, consulte o Livro-Texto. No entanto, as suas definições serão apresentadas em seguida.

Por definição, o percentil divide uma distribuição de frequência em 100 partes iguais, ou

seja, ( )iP

in

iPi Fhf

P

100

*∑−+= , em que:

iP = limite inferior da classe Pi, em que i = 1,2,3,...,99

n = tamanho da amostra

∑ f = soma das frequências anteriores à classe Pi

h = amplitude da classe

FPi = frequência da classe Pi

Por definição, o decil divide uma distribuição de frequência em 10 partes iguais, isto é,

( )iD

in

iDi Fhf

D

0 1

*∑−+= , em que:

iD = limite inferior da classe Pi, em que i = 1,2,3,...,99

n = tamanho da amostra

∑ f = soma das frequências anteriores à classe Di

h = amplitude da classe

FDi = frequência da classe Di

Page 34: TGF3_Estatistica_Aplicada

34

O quartil, por definição, divide uma distribuição de frequência em 4 partes iguais. Para

calcular os quartis, deve-se fazer: ( )

1

1

*4

1Q

ni

Q Fhf

Q ∑−+= , em que:

1Q = limite inferior da classe do primeiro quartil

n = tamanho da amostra

∑ f = soma das frequências anteriores à classe quartílica

h = amplitude da classe quartílica

FQ1 = frequência da primeira classe quartílica

Coeficiente de CurtosePara que se determine o grau de achatamento da curva de distribuição de frequência de uma série de dados (coeficiente de curtose = k) é preciso determinar o terceiro e o primeiro quartis e o nonagésimo e o décimo percentis, por meio da seguinte fórmula:

)(*2 0 10 9

13

PPQQK−

−= (K = coeficiente de curtose)

• Q3 e Q1 – terceiro e primeiro quartis, respectivamente.

• P90 e P10 – nonagésimo e décimo percentis, respectivamente.

• Se K = 0,263 então a curva da distribuição é mesocúrtica (achatamento normal).

• Se K > 0,263 então a curva da distribuição é platicúrtica (mais achatada).

• Se K < 0,263 então a curva da distribuição é leptocúrtica (mais alongada).

Agora que você sabe o que são e para que servem os percentis, quartis e decis, é preciso apresentar a você a média, a mediana e a moda.

Média:

Média aritmética simples por definição é a soma de todos os valores xi observados (dados isolados) dividida pelo número de observações:

n

xx

n

1ii∑

==

LEITURAOBRIGATÓRIA

Page 35: TGF3_Estatistica_Aplicada

35

Exemplo: calcule a média aritmética simples do seguinte conjunto de valores: 7, 14, e 21.

Nesse caso: 4 13

1 24 17=

++=x

Por definição, para dados agrupados, a média será dada pela soma do produto dos valores observados pela frequência absoluta com que estes ocorrem, dividida pela soma das frequências absolutas da distribuição, ou seja:

=

== n

1ii

n

1iii

f

xfx

Exemplo: dada a tabela de distribuição a seguir:

ix 11 8 10 12

if 1 4 3 2

Calcule a média aritmética simples:

71 17 7

1 14 20 32 11 1

23422*2 13*0 14*81*1 1

1

1 ==+++

=+++

+++==

=

=n

ii

n

iii

f

xfx

Por definição, para dados agrupados em intervalos de classe, deve-se considerar xi o ponto médio do intervalo de classe.

Propriedades da média:

1) A média de uma constante é a própria constante.

2) Multiplicando uma variável aleatória x por uma constante, sua média ficará multiplicada por esta constante.

3) A média da soma ou da diferença de duas variáveis aleatórias é a soma ou a diferença das médias.

4) Somando ou subtraindo uma constante a uma variável aleatória, a sua média ficará somada ou subtraída da mesma constante.

5) A média do produto de duas variáveis aleatórias independentes é o produto das médias.

LEITURAOBRIGATÓRIA

Page 36: TGF3_Estatistica_Aplicada

36

Mediana:

Por definição:

1. Em uma série de n-observações ordenada de forma crescente, a mediana é o valor da observação que divide essa série em duas metades iguais: uma delas com valores inferiores e outra com valores superiores ao valor da mediana.

2. Se a série possuir um número par de termos (ou observações), não existirá um termo central, logo, para calcular o valor da mediana, basta dividir por dois o valor da soma dos termos centrais.

Moda:

Por definição, moda (ou modo) é o valor que mais aparece ou o de maior frequência simples (absoluta ou relativa) numa distribuição de frequência. A moda pode não existir, e, existindo, pode não ser única.

Uma distribuição pode ser:

• Amodal (quando não existe moda).

• Unimodal (uma só moda).

• Bimodal (quando tem duas modas).

• Multimodal (tem várias modas).

Diferenças entre média, mediana e moda:

Medida Vantagens Desvantagens

MédiaReflete cada valor

observado na distribuiçãoÉ influenciada por valores

extremos

MedianaMenos sensível a valores extremos se comparada à

média

Difícil de se determinar para grande quantidade de dados

ModaMaior quantidade de valores concentrados neste ponto

Não se adequa à análise matemática

LEITURAOBRIGATÓRIA

Page 37: TGF3_Estatistica_Aplicada

37

O valor da mediana tem de estar em algum ponto localizado entre o valor da média e o valor da moda, podendo ser igual à moda e/ou à média.

Essas três medidas podem definir a assimetria da curva de distribuição de frequência. Então:

Se

Média = Mediana = ModaEntão, a curva

de distribuição é:

Simétrica

Média < Mediana < Moda Assimetria negativa

Média > Mediana > Moda Assimetria positiva

Medidas de Dispersão

Medidas de dispersão são medidas cuja função é avaliar o quanto estão afastados ou concentrados os valores observados numa distribuição de frequência ou de probabilidades.

As principais medidas de dispersão são:

• Amplitude total (ou range).

• Desvio médio absoluto.

• Variância.

• Desvio padrão.

• Coeficiente de variação.

Amplitude total

Por definição, amplitude total é a diferença entre o maior e o menor valor observados, não dando a noção de quanto os valores intermediários estão afastados ou concentrados.

Observe a distribuição A: 2; 3; 4; 13; 18.

A amplitude total de A será: AT = 18 – 2 = 16

A amplitude total diz pouco a respeito de uma série de dados; para melhor avaliá-la, outros conceitos precisam ser agregados ao seu estudo. O primeiro conceito a ser criado é o de desvio, ou seja, a distância que cada um dos valores observados apresenta em relação à média ( xxi − ).

LEITURAOBRIGATÓRIA

Page 38: TGF3_Estatistica_Aplicada

38

Distribuição ADesvio

i xixxi −

1 2 2 - 8 = -62 3 3 - 8 = -53 4 4 - 8 = -44 13 13 - 8 = 55 18 18 - 8 = 10Σ 40 0

Observe que o somatório dos desvios em relação à média aritmética é igual a zero. Isso acontecerá em toda série de observações, pois “a soma dos desvios em relação à média aritmética sempre será nula”.

Você, então, deve estar se perguntando: “como avaliar a dispersão entre os valores observados em tal distribuição?”.

Uma das formas de resolver este problema é calculando a variância.

Variância:

Por definição, a variância é o somatório dos quadrados dos desvios dividido pelo número de observações (se população) ou número de observações menos um (se amostra).

No exemplo considerado:

Distribuição AValores dos desvios elevados

ao quadrado

i xixxi −

1 2 2 - 8 = -6 = 362 3 3 - 8 = -5 = 253 4 4 - 8 = -4 = 164 13 13 - 8 =5 = 255 18 18 - 8 = 10 = 100Σ 40 202

LEITURAOBRIGATÓRIA

Page 39: TGF3_Estatistica_Aplicada

39

Valor obtido para a variância ( 2σ ):

4,0 45

202

2

12 ==−

=∑=

n

xxn

ii

Lembre-se sempre de que, se houver uma distribuição para dados agrupados, você terá de multiplicar o quadrado de cada desvio pela respectiva frequência, fazendo a seguir a divisão pela soma das frequências. E, se os dados se apresentarem em intervalos de classe, será o ponto médio do intervalo de classe. Assim, a fórmula para cálculo da variância será:

=

=

=σ n

1ii

i

2n

1ii

2

F

F*xx

Para dados agrupados, considera-se a frequência no cálculo da variância, e quando os dados se apresentarem em intervalos de classe, xi será o ponto médio do intervalo de classe. Logo, a fórmula será:

• Para a variância populacional: n

SQD2 =σ

• Para a variância amostral: 1n

SQD2−

Desvio Padrão

Por definição, o desvio padrão é a raiz quadrada positiva da variância, isto é, 2σ=σ é o

desvio padrão para a população e 2ss = é o desvio padrão para uma amostra.

No exemplo dado, teremos: 6 3,64,0 4 ==Aσ

Coeficiente de Variação

Por definição, coeficiente de variação é expresso como o resultado da divisão do desvio padrão pela média. Corresponde a uma medida relativa de dispersão, útil para a comparação (em termos relativos) do grau de concentração em torno da média de séries distintas. Essa medida serve para avaliar a homogeneidade de séries estatísticas e pode ser expressa na forma unitária ou percentual.

LEITURAOBRIGATÓRIA

Page 40: TGF3_Estatistica_Aplicada

40

Retornando ao nosso exemplo:

%5,9 78

6 3,6 ==Avc

Utilizar-se-á como referência neste caderno a tabela para Coeficientes de Variação, de Jairo Simon da Fonseca e José Afonso Mazzon1.

1 Disponível na internet para consulta no seguinte site: <http://www.google.com.br/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0CEUQFjAD&url=http%3A%2F%2Fwww.rausp.usp.br%2Fdownload.asp%3Ffile%3D1201017.pdf&ei=TgYdU6nPA8SrkAfW8oGIBg&usg=AFQjCNFmRlUxGd2cG7vvNRscpYuQ9t0whQ&sig2=oL4N-psJGAB8UloClSJBUw&bvm=bv.62578216,d.eW0>. Acesso em: 10 mar. 2014.

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: resolva exercícios a respeito de medidas de tendência central e medidas de dispersão e consulte a resolução comentada.

Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no PAÍS e consultar a resolução comentada.

LEITURAOBRIGATÓRIA

Page 41: TGF3_Estatistica_Aplicada

41

LINKSIMPORTANTESAcesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Acesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

VídeosAssista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Page 42: TGF3_Estatistica_Aplicada

42

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

Um produto subiu de R$ 35,00 para R$ 40,00 no primeiro mês e de R$ 40,00 para R$ 52,00 no segundo mês. Qual o crescimento mensal médio, em reais, desse produto?

Questão 2:

Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A média das idades observadas, em anos, é igual a:

a) 35,18.

b) 35,12.

c) 37,12.

d) 40,13.

e) 42,15.

Questão 3:

Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A mediana das idades observadas, em anos, é igual a:

AGORAÉASUAVEZ

Page 43: TGF3_Estatistica_Aplicada

43

a) 36.

b) 38.

c) 40.

d) 42.

e) 44.

Questão 4:

Determinada empresa observou que seus funcionários gastam em média 6 horas por semana cuidando de seus e-mails pesso-ais durante o dia de trabalho. O desvio pa-drão observado foi de 4 horas semanais. Com base nas informações da situação hipotética anteriormente descrita, pode-se afirmar que o coeficiente de variação, de acordo com a classificação, é:

a) Baixo, próximo de zero.

b) Baixo, próximo de 15%.

c) Mediano, próximo de 15%.

d) Mediano, próximo de 30%.

e) Alto, acima de 50%.

Questão 5:

Num grupo de 16 alunos, as notas das pro-vas de Estatística foram todas iguais ou superiores a sete pontos. A mediana das notas do grupo é igual a 8,0 e a média 8,2.

Afirmação I: nessas condições, pode-se afirmar que a maior parte das notas foi in-ferior a 8,0.

Afirmação II: nessas condições, pode-se afirmar que a maior parte das notas foi su-perior a 8,0.

a) Somente a afirmação I está correta.

b) Somente a afirmação II está correta.

c) Ambas as afirmações estão corretas.

d) Ambas as afirmações estão erradas.

e) As informações se complementam.

Questão 6:

Calcule a média aritmética entre: 10, 15, 16, 23, 49, 50 e 60.

Texto para as questões 7 a 10:

Ao entrevistar um grupo de alunos, obtêm-se as seguintes respostas a respeito de suas idades:

20 21 22 20 22

23 25 20 25 24

20 24 25 23 23

22 21 22 20 25

Com bases nesses dados, calcule o que se pede nos exercícios seguintes.

AGORAÉASUAVEZ

Page 44: TGF3_Estatistica_Aplicada

44

Questão 7:

Calcule a idade média dos alunos e a me-diana entre as idades.

Questão 8:

Identifique a moda entre as idades dos alunos.

Questão 9:

Calcule a variância e o desvio padrão entre os dados apresentados.

Questão 10:

Calcule o coeficiente de variação e analise o resultado.

AGORAÉASUAVEZ

Neste tema, você aprendeu a trabalhar com medidas importantes para a estatística descritiva: medidas de tendência central e medidas de dispersão. Dê especial atenção ao cálculo da média e do desvio padrão. Observe também que essas medidas são aplicáveis para dados quantitativos. Dados qualitativos – expressos em categorias – não permitem tal cálculo; para estes, a única medida que se aplica é a observação da moda.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

FINALIZANDO

Page 45: TGF3_Estatistica_Aplicada

45

CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. In: PPGA, UFRGS, 16, Porto Alegre, 1997.

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, planejamento, implementação e contro-le. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124.

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

REFERÊNCIAS

Page 46: TGF3_Estatistica_Aplicada

46

Dispersão: proximidade ou distanciamento observado em um conjunto de dados numéricos.

Homogêneo: grupo que apresenta características comuns, por exemplo, notas próximas no caso de uma avaliação.

Heterogêneo: grupo que apresenta características distintas, por exemplo, notas distantes no caso de uma avaliação.

Série: conjunto de dados.

SQD: soma dos quadrados dos desvios.

Questão 1

Resposta: Os aumentos foram de R$ 5,00 e R$ 12,00, portanto houve um aumento total de R$ 17,00. Dividindo R$ 17,00 por 2 (= número de aumentos) você obterá R$ 8,50.

Questão 2

Resposta: Alternativa C.

Questão 3

Resposta: Alternativa A.

GLOSSÁRIO

GABARITO

Page 47: TGF3_Estatistica_Aplicada

47

Questão 4

Resposta: Alternativa E.

Questão 5

Resposta: Alternativa B.

Questão 6

Resposta: Substituindo os valores na fórmula da média:

6 8,1 37

2236

0 60 59 43 26 15 10 1≅=

++++++=x

Questão 7

Resposta: Calculando a média e a mediana:

Média: 5 3,2 20 2

4*5 22*4 23*3 24*2 22*1 25*0 2=

+++++=x

Mediana: 2 22

2 22 2=

+=med

Questão 8

Resposta: Lembrando que ela corresponde ao valor mais repetido, a moda entre as idades do grupo estudado é 20 anos.

Questão 9

Resposta: Para calcular o desvio padrão, é necessário, antes, calcular a variância:

ix x )xx( i −2

i )xx( −

20 22,35 -2,35 5,5225

20 22,35 -2,35 5,5225

20 22,35 -2,35 5,5225

20 22,35 -2,35 5,5225

20 22,35 -2,35 5,5225

21 22,35 -1,35 1,8225

GABARITO

Page 48: TGF3_Estatistica_Aplicada

48

ix x )xx( i −2

i )xx( −

21 22,35 -1,35 1,8225

22 22,35 -0,35 0,1225

22 22,35 -0,35 0,1225

22 22,35 -0,35 0,1225

22 22,35 -0,35 0,1225

23 22,35 0,65 0,4225

23 22,35 0,65 0,4225

23 22,35 0,65 0,4225

24 22,35 1,65 2,7225

24 22,35 1,65 2,7225

25 22,35 2,65 7,0225

25 22,35 2,65 7,0225

25 22,35 2,65 7,0225

25 22,35 2,65 7,0225

66,55

Cálculo da variância: 0 5,39 1

5 2,6 62 ==σ

Cálculo do desvio padrão: 7 8,10 5,3 ==σ

Questão 10

Resposta: Calculando o desvio padrão, tem-se:

%7 3,8100*5 3,2 2

7 8,1 ==vc

O coeficiente de variação é baixo, indicando que os dados são bem agrupados, isto é, próximos da média.

GABARITO

Page 49: TGF3_Estatistica_Aplicada
Page 50: TGF3_Estatistica_Aplicada

seções

Tema 03Assimetria e Curtose

Page 51: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 52: TGF3_Estatistica_Aplicada

Tema 03Assimetria e Curtose

Page 53: TGF3_Estatistica_Aplicada

53

Conteúdo

Nessa aula você estudará:

• O conceito de simetria e sua importância para a estatística.

• Gráfico em forma de sino (curva normal).

• Afastamentos do centro de simetria (grau de simetria).

• Grau de assimetria.

CONTEÚDOSEHABILIDADES

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 54: TGF3_Estatistica_Aplicada

54

CONTEÚDOSEHABILIDADESHabilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que é e para que serve o conceito de simetria?

• Construção do gráfico – curva normal?

• O que é e para que serve a assimetria?

• O que é e para que serve a medida denominada curtose?

CONTEÚDOSEHABILIDADES

Assimetria e Curtose

Para um conjunto de dados que esteja sendo analisado, além dos gráficos que você já estudou (histograma, polígono de frequência e ogiva), outro tipo de curva que pode ser elaborado recebe o nome de curva de frequência ou curva polida.

Os estudiosos em estatística costumam dizer que o polígono de frequência determina ou mostra ao leitor (pesquisador) a imagem real do fenômeno estudado, ao passo que a curva de frequência demonstra a tendência do estudo em elaboração.

Crespo (2009) é muito feliz quando afirma que depois do traçado de um polígono de frequência, é desejável, muitas vezes, que se lhe faça um polimento, a fim de mostrar o que seria tal polígono com um número maior de dados. Ao resultado deste “polimento” chama-se curva polida, isto é, a curva polida é a resultante de um grande número de dados, sem os vértices da linha poligonal.

Para que o “polimento” ocorra, é preciso que a partir das frequências reais seja elaborada uma tabela de frequências calculadas. A fórmula que você deve utilizar para esse fim é:

LEITURAOBRIGATÓRIA

Page 55: TGF3_Estatistica_Aplicada

55

LEITURAOBRIGATÓRIALEITURAOBRIGATÓRIA

42

c f 11i

+− ++= iii fff em que:

fci é a frequência considerada da classe calculada.

fi é a frequência simples da classe considerada.

fi-1 é a frequência simples da classe anterior à classe considerada.

fi+1 é a frequência simples da classe posterior à classe considerada.

Para que você compreenda bem, retornemos a um exemplo estudado na aula número 1 deste caderno. Trata-se das idades dos alunos de Ivonete. A tabela obtida naquela ocasião dizia:

I Idade fi fci

1 18 ι— 22 02 4,0

2 22 ι— 26 12 7,5

3 26 ι— 30 04 7,3

4 30 ι— 34 09 7,3

5 34 ι— 38 07 6,3

6 38 ι— 42 02 3,8

7 42 ι— 46 04 2,5

Total 40

Como obter a frequência calculada:

446 1

42 12*20

42c f 11

i ==++

=++

= +− iii fff

Calcule os demais elementos da tabela para ter certeza a respeito dos valores apresentados a você.

Page 56: TGF3_Estatistica_Aplicada

56

Os gráficos seriam:

Pontos médios em destaque Curva polida

A linha azul representa o polígono de frequências.

A linha vermelha mostra a curva polida que aproxima os dados apresentados no polígono de frequência.

Observe que não se trata de uma curva “centralizada” no plano cartesiano. Ela é deslocada para o lado esquerdo de quem lê a figura. Por esse motivo dizemos que ela é uma figura assimétrica.

Para relembrar o que é simetria, pense numa parábola. Uma parábola é simétrica pelo vértice, isto é, suas “metades” (consideradas em torno do vértice) são iguais. Veja a figura seguinte:

Figura 3.1: Parábola

Fonte: Elaboração da autora.

LEITURAOBRIGATÓRIA

Page 57: TGF3_Estatistica_Aplicada

57

Simetria é uma propriedade geométrica dos elementos, contudo para a Estatística, assimetria nada mais é do que o grau de desvio (afastamento da simetria) de uma distribuição de dados.

Para distribuições assimétricas, a média tende a situar-se do mesmo lado da moda (na cauda mais longa). Observe com muita atenção as seguintes figuras:

Figura 3.2: Distribuição Assimétrica à Direita (ou Assimetria Positiva)

Fonte: Elaboração da autora.

Figura 3.3: Distribuição Assimétrica à Esquerda (ou Assimetria Negativa)

Fonte: Elaboração da autora.

Figura 3.4: Distribuição Simétrica

Fonte: Elaboração da autora.

LEITURAOBRIGATÓRIA

Page 58: TGF3_Estatistica_Aplicada

58

Uma medida de assimetria é proporcionada pela diferença entre a média e a moda. Ela pode ser tomada sem dimensão por meio de uma divisão por uma medida de dispersão, como o desvio padrão.

Veja:

s)amodx(*3assimetria −

= (coeficiente de assimetria de Pearson)

No exemplo das idades dos alunos de Ivonete, a assimetria seria dada por:

Cálculo da média:

9,0 30 4

236.10 4

4*4 42*0 47*6 39*2 34*8 22 1*4 22*0 2

==

++++++=

x

x

9,0 30 4

236.10 4

4*4 42*0 47*6 39*2 34*8 22 1*4 22*0 2

==

++++++=

x

x

Cálculo da variância e do desvio padrão:

I Idade fi xi fi * xi fi * xi2

1 18 ι— 22 02 20 40 800

2 22 ι— 26 12 24 288 6.912

3 26 ι— 30 04 28 112 3.136

4 30 ι— 34 09 32 288 9.216

5 34 ι— 38 07 36 252 9.072

6 38 ι— 42 02 40 80 3.200

7 42 ι— 46 04 44 176 7.744

Total: 40 1.236 40.080

7 8,60 4

236.10 4080.0 4 2

=

−=σ

Portanto, 1 0,37 8,6

)4 29,0 3(*3≅

−=assimetria

LEITURAOBRIGATÓRIA

Page 59: TGF3_Estatistica_Aplicada

59

Em capítulo anterior, você verificou que o valor da mediana (que ocupa a posição central numa distribuição de frequência) deve estar em algum ponto entre o valor da média e o valor da moda, porém, pode ser igual à moda e/ou à média.

Você já sabe que com essas três medidas de posição, você pode determinar a assimetria da curva de distribuição de frequência. Também sabe que três casos podem ocorrer (ilustrados nas figuras anteriores):

• Média = Mediana = Moda: distribuição simétrica.

• Média < Mediana < Moda: distribuição assimétrica negativa.

• Média > Mediana > Moda: distribuição assimétrica positiva.

No exemplo de Ivonete: moda = 24; mediana = 30,89 e média = 30,9 de onde se pode concluir que a distribuição de frequência é assimétrica positiva.

Curtose

Ao desenhar um gráfico, a curva pode ser mais ampla ou mais compacta assim como pode ser mais alongada ou mais achatada. Interessa à estatística estudar o quanto uma curva poder ser alongada.

Curtose é, então, o grau de achatamento de uma distribuição, e é considerado muitas vezes em relação a uma distribuição normal.

Em tema anterior, quando o texto referiu-se ao estudo dos quartis, você aprendeu que conhecendo os valores dos quartis e dos percentis, pode-se determinar o coeficiente de curtose, que dá o grau de achatamento da curva de uma distribuição, por meio da seguinte fórmula:

)(*2 0 10 9

13

PPQQk−

−=

Em que: k = coeficiente de curtose; Q3 e Q1 terceiro e primeiro quartis, respectivamente; P90 e P10 nonagésimo e décimo percentis, respectivamente.

Se K = 0,263, então podemos dizer que a curva da distribuição é mesocúrtica (achatamento normal).

Se K > 0,263, então podemos dizer que a curva da distribuição é platicúrtica (mais achatada).

Se K < 0,263, então podemos dizer que a curva da distribuição é leptocúrtica (mais alongada).

LEITURAOBRIGATÓRIA

Page 60: TGF3_Estatistica_Aplicada

60

Graficamente:

Para desenhar a curva normal (curva em formato de sino), a equação utilizada é:

σµ−

πσ=

2x*5,0

e2*

1y em que:

y representa a ordenada (altura da curva para um determinado valor da variável x);

e = 2,71828 (base do logaritmo neperiano).

π = 3,1416.

µ = representa a média da população.

σ = representa o desvio padrão.

O gráfico (curva normal) dos valores recolhidos por Ivonete ficaria assim

LEITURAOBRIGATÓRIA

Page 61: TGF3_Estatistica_Aplicada

61

Para calcular a curtose dos dados referentes às idades de seus alunos, Ivonete deveria seguir os passos descritos a seguir:

(1) Calcular os valores do primeiro e do terceiro quartis, que, no caso de dados agrupados, ficariam assim:

3,2 37

4*)7 20 3(4 3

0 34

1204

*3

4,4 29

4*)8 10 1(8 2

0 140 4

4

3

1

=−

+=

==

=−

+=

==

Q

f

Q

f

i

i

3,2 37

4*)7 20 3(4 3

0 34

1204

*3

4,4 29

4*)8 10 1(8 2

0 140 4

4

3

1

=−

+=

==

=−

+=

==

Q

f

Q

f

i

i

3,2 37

4*)7 20 3(4 3

0 34

1204

*3

4,4 29

4*)8 10 1(8 2

0 140 4

4

3

1

=−

+=

==

=−

+=

==

Q

f

Q

f

i

i

3,2 37

4*)7 20 3(4 3

0 34

1204

*3

4,4 29

4*)8 10 1(8 2

0 140 4

4

3

1

=−

+=

==

=−

+=

==

Q

f

Q

f

i

i

(2) Calcular os valores do décimo e do nonagésimo percentis que, no caso de dados agrupados, ficariam assim:

1,9 37

4*)7 26 3(4 3

6 3100

0 4*0 9100*0 9

8,1 29

4*)8 14(8 2

40 10 4

100*0 1

0 9

0 1

=−

+=

==

=−

+=

==

P

f

P

f

i

i

1,9 37

4*)7 26 3(4 3

6 3100

0 4*0 9100*0 9

8,1 29

4*)8 14(8 2

40 10 4

100*0 1

0 9

0 1

=−

+=

==

=−

+=

==

P

f

P

f

i

i

1,9 37

4*)7 26 3(4 3

6 3100

0 4*0 9100*0 9

8,1 29

4*)8 14(8 2

40 10 4

100*0 1

0 9

0 1

=−

+=

==

=−

+=

==

P

f

P

f

i

i

1,9 37

4*)7 26 3(4 3

6 3100

0 4*0 9100*0 9

8,1 29

4*)8 14(8 2

40 10 4

100*0 1

0 9

0 1

=−

+=

==

=−

+=

==

P

f

P

f

i

i

(3) Por último, calcular o coeficiente de curtose:

228,0)8,1 21,9 3(*2

4,4 23,2 3)(*2 0 10 9

13 =−

−=

−−

=PP

QQk

Observe que, como 0,228 < 0,263, a curva obtida por Ivonete é leptocúrtica.

Busque, no Livro-Texto, mais exemplos como este discutido no caderno e, em seguida, resolva os exercícios propostos a você.

LEITURAOBRIGATÓRIA

Page 62: TGF3_Estatistica_Aplicada

62

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Page 63: TGF3_Estatistica_Aplicada

63

LINKSIMPORTANTESAcesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>.

Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução

comentada.

Vídeos

Assista aos vídeos com exercícios comentados e disponíveis no endereço a seguir a respeito

de confecção de gráficos. Eles, certamente, esclarecerão muitas de suas dúvidas, inclusive

a respeito de como confeccioná-los.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/

Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-

desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível, uma vez que se trata

de produção da Editora Abril Cultural voltada para o público que prestará o Enem.

Page 64: TGF3_Estatistica_Aplicada

64

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

Em seguida serão apresentadas a média e a moda de três diferentes distribuições de frequência. Determine o tipo de assimetria de cada uma delas e explique o significado de assimetria.

Distribuição Média Moda

A 52 52

B 45 50

C 48 46

Texto para as questões de 2 a 4:

Observe os dados apresentados na distri-buição de frequência em seguida:

Pontos de um teste

Pessoas que acertaram

4 ι— 8 10

8 ι— 12 25

12 ι— 16 35

16 ι— 20 40

20 ι— 24 25

24 ι— 28 10

28 ι— 32 5

Questão 2:

Nesse caso, o valor 16,5 (pontos no teste) é:

a) A mediana.

b) A média aritmética.

AGORAÉASUAVEZ

Page 65: TGF3_Estatistica_Aplicada

65

c) A moda.

d) A variância.

e) O desvio padrão.

Questão 3:

Qual o percentual de valores que se locali-za entre o último quartil e o P81?

a) 6

b) 19

c) 56

d) 77

e) 81

Questão 4:

O sexagésimo percentil divide a área de uma distribuição em quantas partes?

a) 2

b) 6

c) 40

d) 60

e) 100

Questão 5:

Se numa distribuição há 500 valores, então entre o segundo quartil e o quinquagésimo percentil quantos valores haverá?

a) 7

b) 13

c) 42

d) 48

e) Não haverá valores.

Texto para as questões 6 e 7:

Em uma distribuição de frequências foram encontradas as seguintes medidas:

• Média = 343,18.

• Moda = 27,50.

• Mediana = 31,67.

• Desvio padrão = 12,45.

Nessas condições, calcule o que pedem os exercícios 6 e 7.

Questão 6:

Classifique o tipo de assimetria.

Questão 7:

Calcule o coeficiente de assimetria.

AGORAÉASUAVEZ

Page 66: TGF3_Estatistica_Aplicada

66

AGORAÉASUAVEZQuestão 8:

Considere a distribuição de frequências re-lativa às massas corporais (aos pesos) de cem operários de uma fábrica:

Massa (kg) No de operários50 58 10

58 66 15

66 74 25

74 82 24

82 90 16

90 98 10

Determine o grau de assimetria.

Texto para as questões 9 e 10:

Considere as seguintes medidas, relativas a três distribuições de frequências:

Distribuições Q1 Q2 P10 P90

A 814 935 772 1.012

B 63,7 80,3 55,0 86,6

C 28,8 45,6 20,5 49,8

Questão 9:

Calcule os respectivos graus de curtose.

Questão 10:

Classifique cada uma das distribuições em relação à curva normal.

Page 67: TGF3_Estatistica_Aplicada

67

Neste tema, você conheceu as definições de assimetria e curtose e sua utilidade. Aprendeu, principalmente, que estes elementos ampliam sua percepção acerca de uma série de dados estatísticos.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M.V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

FINALIZANDO

REFERÊNCIAS

Page 68: TGF3_Estatistica_Aplicada

68

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p. 124.

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

REFERÊNCIAS

GLOSSÁRIO

Amostra: subconjunto da população.

Assimetria: condição da figura que não é simétrica.

Coeficiente: número que multiplica uma variável ou incógnita.

Curtose: grau de achatamento de uma curva.

Grau: medida, referência.

Simetria: condição da figura cujas partes são espelhos umas das outras.

Page 69: TGF3_Estatistica_Aplicada

69

GABARITO

Questão 1

Resposta: Observando os detalhes da tabela, você deverá obter a seguinte a análise: simétrica; assimétrica negativa e assimétrica positiva.

Questão 2

Resposta: Alternativa A.

Questão 3

Resposta: Alternativa A.

Questão 4

Resposta: Alternativa A.

Questão 5

Resposta: Alternativa A.

Questão 6

Resposta: Aplicando corretamente as fórmulas, você deverá obter: assimetria positiva.

Questão 7

Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,364.

Questão 8

Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,021.

Questão 9

Resposta: Aplicando corretamente as fórmulas, você deverá obter: (A) 0,2532, (B) 0,263 e (C) 0,287.

Questão 10

Resposta: Analisando o posicionamento das curvas, você deverá obter: (A) leptocúrtica, (B) mesocúrtica e (C) platicúrtica.

Page 70: TGF3_Estatistica_Aplicada

seções

Tema 04Probabilidade

Page 71: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 72: TGF3_Estatistica_Aplicada

Tema 04Probabilidade

Page 73: TGF3_Estatistica_Aplicada

73

Conteúdo

Nessa aula você estudará:

• A definição geral de probabilidade e os conceitos elementares de probabilidade.

• A utilidade da probabilidade.

• As fórmulas para calcular os diferentes tipos de probabilidades.

CONTEÚDOSEHABILIDADES

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 74: TGF3_Estatistica_Aplicada

74

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que é e para que serve a teoria das probabilidades?

• O que são e para que servem os diferentes tipos de eventos?

• Por que a probabilidade é medida em porcentagem?

• Qual a importância da probabilidade no mundo atual?

CONTEÚDOSEHABILIDADES

Probabilidade

Existem diferentes formas de se definir probabilidade.

Pode-se definir probabilidade a partir da frequência relativa (uma frequência relativa é uma estimativa de probabilidade).

Então, probabilidade é uma proporção em uma sequência muito grande de experimentos (FREITAS, 2003).

Segundo Paccola e Bianchini (1989, p. 143): “Um experimento que pode apresentar resultados diferentes, quando repetido nas mesmas condições, é chamado experimento aleatório. Chamamos de espaço amostral ao conjunto de todos os resultados possíveis de um experimento aleatório”.

O exemplo mais comum de experimento aleatório é o jogo de um dado não viciado; nesse caso, ao se jogar o dado, poderá ocorrer na face superior qualquer um dos números 1 a 6.

LEITURAOBRIGATÓRIA

Page 75: TGF3_Estatistica_Aplicada

75

LEITURAOBRIGATÓRIAEntão, o espaço amostral (representado por S) será dado por:

S = {1, 2, 3, 4, 5, 6}

n(S) = 6

Outro exemplo comum é o lançamento de uma moeda:

S = {cara, coroa}

n(S) = 2

Sobre o assunto, Paccola e Bianchini (1989, p. 144) dizem:

Chama-se evento (E)1 a qualquer subconjunto de um espaço amostral. Evento Elementar é aquele que possui um único elemento [...] Evento impossível é aquele que não possui nenhum elemento [...] Evento Certo é aquele que possui todos os elementos do espaço amostral [...] Evento complementar é o evento formado pelos elementos de S que não pertencem a E. O evento complementar é indicado por E .

Veja os exemplos:

No lançamento de uma moeda, os eventos possíveis de ocorrer são ou cara ou coroa. Dizer “as faces que não são cara” determina um evento elementar: coroa (se não é cara só pode ser coroa).

Se fosse escolhida a face 12 de uma moeda, observa-se um evento impossível uma vez que não existe moeda com um a face 12.

No caso da moeda, o exemplo de evento certo seria: sai cara ou sai coroa.

Já o evento complementar seria: se saiu cara, o evento complementar seria sair coroa e vice-versa.

De forma geral, todos os autores concordam que num experimento aleatório, sendo S um espaço equiprovável (espaço amostral onde todos os eventos têm a mesma chance de ocorrer), a probabilidade de ocorrer um evento (E) qualquer será dada por:

)S(n)E(n)E(p =

1 (E ) inclusão do símbolo no texto original realizado pela autora do caderno.

Page 76: TGF3_Estatistica_Aplicada

76

Propriedades:

Se E = (100%) 1 p(E) então S E Se(0%) 0 p(E) então E Se

===φ= então p(E) = 0 (0%)

Se E = S então p(E) = 1 (100%)

Em outras palavras, a probabilidade de ocorrer um evento qualquer E é dada por:

100%. p(E) % 0u o

1 p(E) 0

≤≤

≤≤

No exemplo das moedas, a probabilidade de ocorrer a face “cara” no lançamento de uma moeda é dada por:

S = {cara, coroa} → n(S) = 2

E = {cara} → n(E) = 1

%0 55,021

)()()(

1)(}{2)(},{

====

=⇒==⇒=

SnEnEp

EncaraESncoroacaraS

Também são pontos pacíficos entre os diversos autores as seguintes definições:

A probabilidade da união de dois eventos A e B é igual à soma das probabilidades desses eventos menos a probabilidade da intersecção de A com B, isto é

) B p(A -p(B) p(A) ) Bp(A +=

A soma da probabilidade de ocorrer um evento A com a probabilidade de não ocorrer o evento A (ocorrer o complementar de A) será sempre igual a 1, ou seja, 1)A( p p(A) =+

Veja os exemplos:

No lançamento de um dado, qual é a probabilidade de se obter o número 3 ou um número ímpar? (BIANCHINI ; PACCOLA, 1989, p. 147).

LEITURAOBRIGATÓRIA

Page 77: TGF3_Estatistica_Aplicada

77

S = {1, 2, 3, 4, 5, 6} → n(S) = 6

A = {3} → n(A) = 1

B = {1, 3, 5} → n(B) = 3

%0 55,021

63

61

63

61) Bp(A

1) Bn(A{3}} 5, 3{1,{3}BA3n(B)5}3,{1,B

1n(A){3}A6n(S)6}5,4,3,2,{1,S

====−+=

=⇒===⇒=

=⇒==⇒=

%0 55,021

63

61

63

61) Bp(A

1) Bn(A{3}} 5, 3{1,{3}BA3n(B)5}3,{1,B

1n(A){3}A6n(S)6}5,4,3,2,{1,S

====−+=

=⇒===⇒=

=⇒==⇒=

Exemplo de probabilidade do evento complementar: uma urna contém 5 bolas brancas,

4 amarelas e 3 verdes. Escolhendo-se duas bolas ao acaso, determine a probabilidade

de que: (a) ambas sejam brancas (b) ambas não sejam brancas (BIANCHINI; PACCOLA,

1989, p. 149).

• Passo 1: calcular de quantas maneiras pode-se escolher duas bolas quaisquer:

6 62

132!0 1* !2

!0 1*1 1*2 1! )22 1!*(2

!2 1)( 2 12 ===

−== CSn

• Passo 2: calcular o número de maneiras de se escolher duas bolas brancas:

%2,5 13 3

56 60 1

)()()(

0 120 2

!3* !2!3*4*5

! )25!*(2!5)( 5

2

====

===−

==

SnAnAp

CAn

%2,5 13 3

56 60 1

)()()(

0 120 2

!3* !2!3*4*5

! )25!*(2!5)( 5

2

====

===−

==

SnAnAp

CAn

• Passo 3: calcular o número de maneiras de se escolher duas bolas que não sejam

brancas:

%8,4 8152,01)(1)( =−=−= ApAp

LEITURAOBRIGATÓRIA

Page 78: TGF3_Estatistica_Aplicada

78

Em Bianchini e Paccola (1989, p. 150) encontram-se o exemplo e a definição:

No sorteio de um número natural e 1 a 10, alguém aposta que vai sair um múltiplo de 3. A probabilidade de acerto é, pois, a de ocorrer o evento A = {3, 6, 9}, ou seja, 0 1

3)( =Ap . Para causar suspense, a pessoa que realiza o sorteio anuncia que o número sorteado é ímpar. Constitui-se assim o evento B = {1, 3, 5, 7, 9}. Após essa informação, a probabilidade de acertos passou a ser a de ocorrer o evento }9,3{BA =∩ , tendo agora como espaço amostral o conjunto B.

Indicando a probabilidade de ocorrer o evento A tendo ocorrido o evento B por P(A/B) (Lê-se P de A dado B), ter-se-á:

)0)B(n()B(n

)BA(n)B/A(P >∩

=

Nesse caso:

52

)B(n)BA(n)B/A(P =

∩=

A esse tipo de probabilidade, em que ocorre um evento A tendo ocorrido um evento B, dá-se o nome de probabilidade condicional de A dado B.

Mais um exemplo, também de Bianchini e Paccola (1989, p. 150): No lançamento de dois dados, a soma dos pontos obtidos resultou em 5. Qual a probabilidade de um desses dados ter apresentado o número 2?

Para resolver o exercício:

O evento B “soma dos pontos obtidos resultou em 5” é:

B = {(1, 4); (2, 3); (3, 2); (4, 1)}

O evento BA ∩ “dar a soma 5 e um dos dados apresentar o número 2” é:

BA ∩ = {(2, 3); (3, 2)}

Nessas condições:

%0 521

)()()/( ==

∩=

BnBAnBAP

LEITURAOBRIGATÓRIA

Page 79: TGF3_Estatistica_Aplicada

79

Os matemáticos também concordam com a definição de que a probabilidade da intersecção de dois eventos A e B é igual à probabilidade de A multiplicada pela probabilidade condicional de B, dado A, isto é:

)A/B(p*)A(p)BA(p =∩

Veja o exemplo de Bianchini e Paccola (1989, p. 151):

Retira-se ao acaso uma bola de uma urna que contém 6 bolas brancas numeradas de 1 a 6 e 4 bolas amarelas numeradas de 7 a 10. Se a bola retirada é branca, qual é a probabilidade de ter saído um número par?

Solução:

O número de elementos do espaço amostral é n(S) = 10.

Indicando por A o evento “retirar uma bola branca” e por B “retirar uma bola com número par”, é evidente que desejamos calcular )BA(p ∩ , ou seja, a probabilidade de retirar uma bola branca com um número par. Temos:

53

0 16)( ==Ap

21

63

)A(n)BA(n)A/B(P ==

∩=

Logo, 0 13

21*

53)/(*)()( ===∩ ABpApBAp

Dois eventos são ditos independentes quando o fato de ocorrer um deles não influi na possibilidade de ocorrência do outro. Se A e B são eventos independentes, pode-se dizer que:

)B(p*)A(p)BA(p)A/B(P*)A(P)BA(p

=∩=∩

Os exemplos são de Bianchini e Paccola (1989, p. 152-153):

Exemplo 1

Uma urna contém 6 bolas brancas e 4 bolas pretas. Retirando-se sucessivamente duas bolas ao acaso, com reposição da primeira, qual é a probabilidade de ambas serem brancas?

Solução:

Como a 1ª bola retirada foi recolocada na urna, os eventos A e B tornam-se independentes, pois o evento “retirar uma bola branca na 2ª vez” não depende do que ocorreu na 1ª retirada.

Assim temos: %6 3100

6 30 16*

0 16)(*)()( ====∩ BpApBAp

LEITURAOBRIGATÓRIA

Page 80: TGF3_Estatistica_Aplicada

80

Exemplo 2:

Lançando-se um dado três vezes, qual é a probabilidade de se obter:

a) O número 4 somente no terceiro lançamento?

b) Somente uma vez o número 4?

Solução:

A probabilidade de se obter o número 4 no primeiro lançamento é 61

. Então a probabilidade de não se obter o número 4 no primeiro lançamento é 6

5611 =− .

A probabilidade de se obter o número 4 no primeiro lançamento também é 61

. Então a probabilidade de não se obter o número 4 no primeiro lançamento é

65

611 =− .

A probabilidade de se obter o número 4 no primeiro lançamento também é 61

. Então, a probabilidade do número 4 ocorrer somente no terceiro lançamento é:

2165 2

61*

65*

65

==p

O número 4 será obtido somente ou no primeiro ou no segundo ou no terceiro lançamento. Então, a probabilidade será igual a três vezes a probabilidade anterior:

2 75 2

2165 2*3 ==p

Pra finalizar, dois ou mais eventos são mutuamente exclusivos quando a realização de um excluía a realização de outro(s). Se os eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de ocorrência de cada evento em estudo: p = p1 + p2.

No exemplo da moeda, os eventos “cara” e “coroa” são mutuamente exclusivos.

No exemplo dos dados, a probabilidade de se tirar a face 2 ou a face 5 é de:

%3,3 331

62

61

61

===+=p

LEITURAOBRIGATÓRIA

Page 81: TGF3_Estatistica_Aplicada

81

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:SitesTeste os seus conhecimentos: resolva exercícios de estatística e consulte a resolução comentada.Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Page 82: TGF3_Estatistica_Aplicada

82

LINKSIMPORTANTESVídeosAssista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

Qual a probabilidade de sair um Ás de paus quando se retira uma carta de um baralho de 52 cartas?

Questão 2:

(FUVEST/SP – adaptada) No jogo da sena, seis números distintos são sorteados en-tre os números 1 e 50 (inclusive). A pro-babilidade de que, numa extração, os seis números sorteados sejam ímpares é de (aproximadamente):

AGORAÉASUAVEZ

Page 83: TGF3_Estatistica_Aplicada

83

a) 50%

b) 25%

c) 10%

d) 5%

e) 1%

Questão 3:

Lançando-se simultaneamente dois da-dos (não viciados), a probabilidade de que suas faces superiores exibam soma igual a 7 ou 9 é:

a) 61

b) 73

c) 94

d) 1 12

e) 8 15

Questão 4:

Uma urna contém 9 bolas, sendo 4 brancas e 5 pretas. Duas bolas são escolhidas ao acaso, sem reposição e sucessivamente. Calcule a probabilidade de ambas as bolas serem brancas:

a) 61

b) 94

c) 1 80 2

d) 92

e) 1 86 1

Questão 5:

A probabilidade de um casal ter um filho do sexo masculino é de 0,25. Então, a proba-bilidade do casal ter dois filhos de sexos diferentes é de:

a) 6 1

1

b) 83

c) 6 1

9

d) 6 13

e) 43

Texto para as questões 6 e 7:

Em um lote de 12 peças, quatro são de-feituosas. Nessas condições, calcule o que se pede nos dois exercícios seguintes.

AGORAÉASUAVEZ

Page 84: TGF3_Estatistica_Aplicada

84

AGORAÉASUAVEZQuestão 6:

Sendo retirada apenas uma peça, calcule a probabilidade de ela (a peça retirada) ser defeituosa.

Questão 7:

Sendo retirada apenas uma peça, calcule a probabilidade de ela (a peça retirada) não ser defeituosa.

Questão 8:

No lançamento de um dado, qual a pro-babilidade de se obter um número não inferior a 5?

Questão 9:

Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.

Questão 10:

Uma urna A contém três bolas brancas, quatro pretas e duas verdes; a urna B con-tém cinco bolas brancas, duas pretas e uma verde; a urna C contém duas bolas brancas, três pretas e quatro verdes. Uma bola é retirada de cada urna. Qual é a pro-babilidade de que as três bolas retiradas da primeira, segunda e terceira urnas sejam branca, preta e verde, respectivamente?

Neste tema, você aprendeu a trabalhar com probabilidade. Dê especial atenção aos termos aqui utilizados porque entender o tipo de eventos que ocorre é metade do caminho andado para resolver problemas propostos. Releia o texto, busque mais informações no Livro-Texto e pela internet.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

FINALIZANDO

Page 85: TGF3_Estatistica_Aplicada

85

BIANCHINI, Edwaldo; PACCOLA, Herval. Matemática 2. 1. ed. São Paulo: Moderna, 1989.

CRESPO, Antônio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M.V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

FREITAS, Corina da Costa et. al. Estatística Curso 1. São José dos Campos: INPE, 2003.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21. Anais... 1997, Rio das Pedras, RJ. p. 124.

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

REFERÊNCIAS

Page 86: TGF3_Estatistica_Aplicada

86

GLOSSÁRIO

GABARITO

Espaço amostral: é o conjunto de todos os resultados possíveis de um experimento aleatório.

Espaço equiprovável: é aquele onde todos os eventos têm a mesma chance de ocorrer.

Evento: qualquer subconjunto do espaço amostral.

Experimento aleatório: um experimento que pode apresentar resultados diferentes, quando repetido nas mesmas condições.

Probabilidade: proporção em uma sequência muito grande de experimentos.

Questão 1

Resposta: Em qualquer baralho (não viciado), haverá apenas um Ás de paus, portanto a

probabilidade de encontrá-lo é p = 2 5

1=p .

Questão 2

Resposta: Alternativa E.

Questão 3

Resposta: Alternativa E.

Page 87: TGF3_Estatistica_Aplicada

87

Questão 4

Resposta: Alternativa A.

Questão 5

Resposta: Alternativa B.

Questão 6

Resposta: Sendo quatro peças defeituosas em 12, você deverá calcular: %3,3 331

2 14

===p.

Questão 7

Resposta: Sendo oito peças não defeituosas em 12, você deverá calcular:

%6,6 632

313

311 ==

−=−=p

Questão 8

Resposta: A probabilidade de se obter um número não inferior a 5 é a probabilidade de se

obter 5 ou 6, então: %3,3 331

62

61

61

===+=p

Questão 9

Resposta: Nesse caso, a soma deverá ser 10, 11 ou 12. Para que a soma seja 10, a probabilidade será determinada pelo aparecimento de (4, 6) ou (5, 5) ou (6, 4), ou seja:

6 33

0 1 =p

Para que a soma seja 11, a probabilidade será determinada pelo aparecimento de (5, 6) ou

(6, 5), ou seja: 6 3

21 1 =p

Para que a soma seja 12, a probabilidade será determinada pelo aparecimento de (6, 6), ou

seja, 6 3

12 1 =p

Como os eventos apresentados são mutuamente exclusivos, ter-se-á:

%6,6 161

6 36

6 31

6 32

6 33

===++=p

GABARITO

Page 88: TGF3_Estatistica_Aplicada

88

Questão 10

Resposta: Considerando as probabilidades de retirada de cada bola, de cada urna, você deverá obter:

94p

41

82p

31

93p

C

B

A

=

==

==

94p

41

82p

31

93p

C

B

A

=

==

==

94p

41

82p

31

93p

C

B

A

=

==

==

Sendo os eventos independentes e simultâneos, você deverá fazer:

7 21

94*

41*

31

==p

GABARITO

Page 89: TGF3_Estatistica_Aplicada
Page 90: TGF3_Estatistica_Aplicada

seções

Tema 05Análise de Regressão e Correlação

Page 91: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 92: TGF3_Estatistica_Aplicada

Tema 05Análise de Regressão e Correlação

Page 93: TGF3_Estatistica_Aplicada

93

CONTEÚDOSEHABILIDADES

Conteúdo

Nessa aula você estudará:

• O conceito de regressão matemática.

• O conceito de correlação.

• Como efetuar a análise de regressão (regressão linear).

• Como efetuar correlação entre duas variáveis.

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 94: TGF3_Estatistica_Aplicada

94

CONTEÚDOSEHABILIDADES

Análise de Regressão

O objetivo da análise de regressão é determinar a relação existente entre uma característica qualquer de interesse experimental, dependente, e outra característica independente, tomadas juntas.

Para entender o que é dependência, veja os exemplos:

1. O médico pediatra tem interesse em definir uma relação funcional entre o peso e a altura de bebês (curva de crescimento).

2. O economista busca estabelecer uma função que explique o comportamento das vendas, em unidades de um produto, considerando o preço pelo qual o produto é vendido.

A matemática, de forma geral, oferece a ferramenta ideal para resolver esse tipo de problema: a “teoria das funções”. Dela, você utilizará dois conceitos fundamentais:

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que é e para que serve o conceito de análise de regressão?

• Como se dá a construção do gráfico – regressão?

• O que é e para que serve estabelecer correlação entre variáveis?

• O que é e para que serve um gráfico de correlação?

LEITURAOBRIGATÓRIA

Page 95: TGF3_Estatistica_Aplicada

95

LEITURAOBRIGATÓRIAy = variável que interessa estudar e cujo comportamento futuro se pretende prever. Trata-se da variável dependente que existe no modelo (porque o seu valor depende do valor de x).

x = variável que influencia no comportamento de y e define o seu valor.

A estatística oferece meios aos estudiosos de se chegar à relação entre as variáveis y e x: um processo denominado “análise de regressão”.

Diagrama de Dispersão

Uma maneira prática para determinar a relação1 entre as variáveis dependentes e independentes é a construção do gráfico denominado de “diagrama de dispersão”, que pode fornecer uma forma aproximada da regressão. Quando se obtém uma dispersão desordenada de pontos assinalados no gráfico, conclui-se que é difícil determinar a relação entre as características em estudo.

Diagrama de dispersão – sua confecção consiste na plotagem dos pontos obtidos por cálculo ou levantamento, em um sistema de coordenadas cartesianas, que permite uma visualização dos seus posicionamentos, propiciando uma interpretação aproximada do comportamento das variáveis em estudo. Veja o exemplo:

Observe que, no gráfico anterior, os pontos foram distribuídos ao longo de um segmento de reta. A Estatística nos permite determinar que reta é essa.

1 Nesse caso, a expressão matemática que relacionas as variáveis.

Page 96: TGF3_Estatistica_Aplicada

96

Determinação da Equação da Reta

Do estudo da função do primeiro grau, sabe-se que a equação geral da reta (gráfico da função de primeiro grau) é y = a + bx.

Para escrever a equação da reta é necessário obter os valores de a e b de tal forma que a reta estabelecida esteja tão próxima quanto possível dos pontos assinalados no “diagrama de dispersão”. Assim, para diminuir as discrepâncias, há necessidade de se ajustar a reta por meio da análise de regressão.

Lembre-se de que a reta ficará determinada quando você conhecer os coeficientes a e b. Para conhecê-los (ou determiná-los), você adotará o método dos mínimos quadrados (MMQ).

Segundo esse método, pode-se avaliar os parâmetros a e b pela aplicação das seguintes fórmulas:

∑ ∑∑ ∑ ∑

−−

=

−=

22 )(* xxn

yxyxnb

exbya

e

∑ ∑∑ ∑ ∑

−−

=

−=

22 )(* xxn

yxyxnb

exbya

Em que n = tamanho da amostra.

Exemplo: Observa-se que um determinado produto tem o seu custo calculado com base na quantidade produzida, conforme a tabela a seguir:

Quantidade (x) 10 12 14 16 18 20

Custos em R$ (y) 100 112 119 130 139 142

Nessas condições, deve-se:

a) Construir o diagrama de dispersão e verificar se há uma relação entre as variáveis.

b) Ajustar uma reta aos dados.

c) Traçar a reta ajustada.

d) Determinar o custo para 22 unidades.

LEITURAOBRIGATÓRIA

Page 97: TGF3_Estatistica_Aplicada

97

Para resolver o problema proposto, será necessário esboçar o diagrama, como pede o item (a). Veja:

0

20

40

60

80

100

120

140

160

0 5 10 15 20 25

Para calcular a equação da reta: y + a + bx, conforme solicitado em (b) ter-se-á, inicialmente, que calcular o valor de b, que é dado por:

∑ ∑∑ ∑ ∑

−= 22 )(

* xxn

yxyxnb

Em que: n = número de dados.

Σxy – Somatório da multiplicação dos valores de x e y.

Σx – Somatório da variável x.

Σy – Somatório da variável y.

Σx2 – Somatório de cada valor de x elevado ao quadrado.

(Σx)2 – Somatório dos valores de x elevado ao quadrado.

LEITURAOBRIGATÓRIA

Page 98: TGF3_Estatistica_Aplicada

98

Para facilitar o cálculo, construiu-se o quadro a seguir:

n x y xy x2

1 10 100 1000 1002 12 112 1344 1443 14 119 1666 1964 16 130 2080 2565 18 139 2502 3246 20 142 2840 400Σ 90 742 11432 1420

Analisando o quadro, você observará que:

n = 6; Σxy = 11.432; Σx = 90; Σy = 742; Σx2 = 1420

Então:

( )1 3,4

4201812

0 9420.1*6742*0 9432.1 1*6

.

2

22

≅=−

−=

−=

∑∑∑ ∑∑

b

xxn

yxyxnb

( )1 3,4

4201812

0 9420.1*6742*0 9432.1 1*6

.

2

22

≅=−

−=

−=

∑∑∑ ∑∑

b

xxn

yxyxnb

Para calcular o valor do coeficiente “a”:

2 0,9 55 1*1 3,47 6,123

5 160 9

7 6,1236

742

≅−=

===

≅==

−=

aa

nx

x

ny

y

xbya

2 0,9 55 1*1 3,47 6,123

5 160 9

7 6,1236

742

≅−=

===

≅==

−=

aa

nx

x

ny

y

xbya

2 0,9 55 1*1 3,47 6,123

5 160 9

7 6,1236

742

≅−=

===

≅==

−=

aa

nx

x

ny

y

xbya

2 0,9 55 1*1 3,47 6,123

5 160 9

7 6,1236

742

≅−=

===

≅==

−=

aa

nx

x

ny

y

xbya

2 0,9 55 1*1 3,47 6,123

5 160 9

7 6,1236

742

≅−=

===

≅==

−=

aa

nx

x

ny

y

xbya

A equação da reta será: y = 59,02 + 4,31 x.

Conhecendo a equação da reta, pode-se esboçar o gráfico ajustado (a seguir), conforme determina a orientação (c):

LEITURAOBRIGATÓRIA

Page 99: TGF3_Estatistica_Aplicada

99

0

20

40

60

80

100

120

140

160

1 2 3 4 5 6

Para finalizar, deve-se responder ao item (d):

y = 59,02 + 4,31 x

Se x = 22, então:

y = 59,02 + 4,31 x

y = 59,02 + 4,31*22

y = 59,02 + 94,82

y = 153,84

Correlação:

Estudar correlação consiste em medir o grau de variação existente entre duas variáveis aleatórias.

A diferença entre regressão e correlação é que na primeira há duas variáveis em que uma é considerada dependente e a outra independente, ao passo que na segunda, as duas variáveis apresentam relação mútua.

Veja, peso e altura de pessoas poderiam ser estudados em correlação – tanto o peso pode depender da altura como esta, do peso.

LEITURAOBRIGATÓRIA

Page 100: TGF3_Estatistica_Aplicada

100

Coeficiente de Correlação

Em alguns casos, existe o interesse em se determinar o grau de associação entre as duas variáveis. Essa associação é medida pelo coeficiente de correlação (r), que é determinado pela fórmula:

( ) ( )

−=

∑∑∑ ∑∑ ∑ ∑

2222 yy*n*xx*n

y*x)y*x(*nr

O valor de r pode variar de –1 a +1, significando, respectivamente, correlação negativa e correlação positiva entre as variáveis. O valor zero indica que não existe correlação. Outros valores intermediários propiciam inferências sobre o comportamento interativo entre as variáveis.

As figuras a seguir apresentam, de forma aproximada, o valor de r em função do comportamento (variação) simulado de duas variáveis distintas.

Veja como calcular o coeficiente de correlação:

Exemplo: observa-se que um determinado produto tem o seu custo calculado com base na quantidade produzida, conforme segue:

Quantidade (x) 10 12 14 16 18 20

Custos em R$ (y) 100 112 119 130 139 142

LEITURAOBRIGATÓRIA

Page 101: TGF3_Estatistica_Aplicada

101

Para resolver o problema, elabora-se uma tabela auxiliar para a fórmula:

( ) ( )

−=

∑∑∑ ∑∑ ∑ ∑

2222 yy*n*xx*n

y*x)y*x(*nr

Tabela Auxiliar:

n x y xy x2 y2

1 10 100 1.000 100 10.000

2 12 112 1.344 144 12.544

3 14 119 1.666 196 14.161

4 16 130 2.080 256 16.900

5 18 139 2.502 324 19.321

6 20 142 2.840 400 20.164

Σ 90 742 11.432 1.420 93.090

Substituindo os valores observados na linha de totalização, na fórmula, ter-se-á:

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

( )[ ] ( )[ ]

[ ] [ ]

[ ] [ ]

[ ] [ ]

9 9,08 2,1830

181233499201812

7976*4201812

550564558540*810085206678068592

)742(93090*6*)0 9(1420*6742*0 911432*6

***

*) (*

22

2222

=

==

=

−−−

=

−−

−=

−−

−=

∑∑∑ ∑∑ ∑ ∑

r

r

r

r

r

yynxxn

yxyxnr

Nessas condições, pode-se afirmar que a correlação entre as variáveis “preço” e “quantidade” é muito alta.

LEITURAOBRIGATÓRIA

Page 102: TGF3_Estatistica_Aplicada

102

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: faça exercícios a respeito de análise de regressão e correlação e veja a resolução comentada.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Page 103: TGF3_Estatistica_Aplicada

103

LINKSIMPORTANTESAcesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

VídeosAssista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

AGORAÉASUAVEZ

Page 104: TGF3_Estatistica_Aplicada

104

Questão 3:Ao analisar o diagrama de dispersão entre duas variáveis aleatórias x e y, optou-se por utilizar uma forma de relação tal que y = a + bx para a previsão de y em função de x (os valores de a e b foram obtidos pelo método dos mínimos quadrados). Essas duas vari-áveis apresentam um coeficiente de corre-lação linear igual a r, tal que r > 0. Então, o

a) Valor de b poderá ser inferior a zero.

b) Coeficiente de correlação linear entre as variáveis (2x) e (5y) também é igual a r.

c) Valor de b é igual ao inverso do valor do coeficiente de correlação linear.

Questão 1:

Construa um diagrama de dispersão para a amostra formada pelos seguintes pontos: (1; 2), (5; 6), (2; 4), (2; 3), (3; 5) e (5;10).

Questão 2:(ESAF/2005 – Auditor Fiscal da Receita Federal – Área Tecnologia da Informação – Prova 1) Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os se-guintes salários mensais (em salários mínimos):

Identificação do casal 1 2 3 4 5 6 7 8 9 10Salário do marido (y) 30 25 18 15 20 20 21 20 25 27Salário da esposa (x) 20 25 12 10 10 20 18 15 18 23

Sabe-se que:

∑ ∑∑ ∑∑= == ==

=====0 1

1

0 1

1

20 1

1

0 1

1

20 1

13171;171;3940;5069;221

i iii

i iii

ii xxyxyy

i

Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres.

a) 0,72

b) 0,75

c) 0,68

d) 0,81

e) 0,78

AGORAÉASUAVEZ

Page 105: TGF3_Estatistica_Aplicada

105

d) Coeficiente de correlação linear entre as variáveis (0,5x) e (0,5y) é igual a 0,5r.

e) Valor de b é igual ao coeficiente de correlação linear, pois r > 0.

Questão 4:

Considerando o par de variáveis (x, y), em que x representa o custo médio por metro quadrado (em R$) e y representa os atribu-tos Sudeste, Norte, Sul, Centro-Oeste ou Nordeste, assinale a opção correta.

a) A correlação linear de Pearson entre x e y é positiva.

b) As variáveis x e y são qualitativas.

c) As variáveis x e y formam uma série geográfica.

d) O gráfico de x versus y é um histograma.

e) As variáveis x e y são quantitativas.

Questão 5:

Ao se estudar a relação entre as variáveis “consumo de energia elétrica” (x) e “volu-me de produção nas empresas industriais” (y), foi encontrada a equação de regres-são: y = 1,81x + 0,001 Nessas condições, é correto afirmar que:

a) Quanto maior o volume de produção, maior o consumo de energia elétrica.

b) Quanto menor o volume de produção, maior o consumo de energia elétrica.

c) O consumo de energia independe do volume de produção.

d) Independentemente da quantidade produzida pela indústria, não haverá alteração do custo da energia.

e) A indústria não pagaria nada se não produzisse nada.

Questão 6:

A despesa mensal estimada de uma famí-lia mediana (marido, esposa e dois filhos) é representada pela equação ŷ = (ŷ = des-pesa e x = renda mensal líquida expressa em salários mínimos). Nessas condições, calcule:

a) A despesa mensal de uma família com renda líquida mensal de 10 salários-mínimos.

b) A equação serviria para estimar a des-pesa mensal de uma família de 5 pessoas com renda líquida de 12 salários-mínimos? Justifique.

Questão 7:

Uma empresa verificou as despesas com matéria-prima observadas nos últimos cin-co pedidos de acordo com a quantidade a ser produzida.

AGORAÉASUAVEZ

Page 106: TGF3_Estatistica_Aplicada

106

Custo (y) Produção (x)80 1244 451 670 1161 8

Considerando a amostra descrita, determi-ne a equação de regressão linear que re-presenta a função custo de produção.

Questão 8:Estime a reta de regressão do custo de fa-bricação correspondente a uma amostra de 20 elementos em que a soma das quanti-dades produzidas (x) é igual a 200; a soma dos custos de produção (y) é igual a R$ 300,00; a soma do produto da quantidade produzida pelo custo de produção é igual a R$ 6.200,00 e a soma do quadrado das quantidades produzidas é igual a 3.600.

Questão 9:

Estime a reta de regressão de regressão que melhor represente o conjunto de dados apresentado na sequência:

X Y1 102 303 404 505 656 70

Estime a reta de regressão populacional;

Questão 10:

Ajuste os seguintes dados e calcule o co-eficiente de correlação entre a “renda” e o “consumo” apresentados:

Anos Rendas (y) Consumo (c)(unidades monetárias constantes)

1957 2,0 1,6

1958 2,1 1,7

1959 2,4 2,0

1960 2,4 2,1

1961 2,5 2,2

1962 2,8 2,5

1963 3,0 2,6

AGORAÉASUAVEZ

Page 107: TGF3_Estatistica_Aplicada

107

Neste tema, você conheceu as definições de análise de regressão e correlação e sua utilidade. Aprendeu, principalmente, que esses elementos ampliam sua percepção acerca de uma série de dados estatísticos.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.

FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

REFERÊNCIAS

FINALIZANDO

Page 108: TGF3_Estatistica_Aplicada

108

REFERÊNCIASMORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1: Probabilidade. 7. ed. São Pau-lo: Pearson Makron Books, 1999.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

Correlação: relação mútua.

Diagrama: gráfico, representação.

Parâmetro: valor de referência.

Regressão: volta a algum ponto; retorno a uma referência.

Variável: ente cujo valor se modifica ao longo do tempo.

GLOSSÁRIO

Page 109: TGF3_Estatistica_Aplicada

109

Questão 1

Resposta: Localizando os pontos no plano cartesiano, ter-se-á:

0

2

4

6

8

10

12

0 1 2 3 4 5 6

Questão 2

Resposta: Alternativa B.

Questão 3

Resposta: Alternativa B.

Questão 4

Resposta: Alternativa C.

Questão 5

Resposta: Alternativa A.

GABARITO

Page 110: TGF3_Estatistica_Aplicada

110

Questão 6

Resposta: As respostas são:

(a) 2,8.

(b) Não, houve mudança de parâmetros.

Questão 7

Resposta: y = 26,28 + 4,26x.

Questão 8

Resposta: Você deverá obter: y = 38,19 + 2,32x.

Questão 9

Resposta: y = 2,66 + 11,86x.

Questão 10

Resposta: O coeficiente de correlação será r = 0,987.

GABARITO

Page 111: TGF3_Estatistica_Aplicada
Page 112: TGF3_Estatistica_Aplicada

seções

Tema 06Distribuição de Probabilidade

Page 113: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 114: TGF3_Estatistica_Aplicada

Tema 06Distribuição de Probabilidade

Page 115: TGF3_Estatistica_Aplicada

115

CONTEÚDOSEHABILIDADES

Conteúdo

Nessa aula você estudará:

• Distribuições de probabilidade.

• Distribuição binomial.

• Outras distribuições discretas de probabilidade.

• Introdução às distribuições normais de probabilidade.

• Distribuição normal padrão.

• Propriedades.

• Gráficos.

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 116: TGF3_Estatistica_Aplicada

116

CONTEÚDOSEHABILIDADES

Distribuições de Probabilidade

Antes de ir direto ao assunto, é preciso rever conceitos:

Princípio Fundamental da Contagem

Se um evento pode ocorrer de m maneiras diferentes e um segundo evento de n maneiras, o número de maneiras que os dois eventos podem ocorrer é (m* n) maneiras.

Permutações

Uma aplicação importante do Princípio Fundamental da Contagem é a determinação do número de maneiras em que n objetos podem ser arranjados em ordem ou permutação.

Uma permutação é um arranjo ordenado de objetos.

O número de permutações de n objetos diferentes é:

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que é e para que serve uma distribuição de probabilidade?

• O que é e para que serve uma função de distribuição de probabilidade (f.d.p.)?

• Por que e quando utilizar a distribuição normal?

• Por que e quando utilizar a distribuição de Poisson?

• Por que e quando utilizar a distribuição binomial?

LEITURAOBRIGATÓRIA

Page 117: TGF3_Estatistica_Aplicada

117

LEITURAOBRIGATÓRIAPn = n!

n! = n * (n - 1) * (n - 2) * (n - 3) * ... 3 * 2 * 1

Importante:

==

1!01!1

Arranjos

Correspondem ao número de combinações de p objetos selecionados em um grupo de n

objetos, cuja ordem fundamental é dada por: ! )(

!pn

nA pn −=

Combinações

O número de combinações de p objetos selecionados em um grupo de n objetos, sem

importar a ordem é dada por: ! )!*(

!pnp

nC pn −= .

Entrando no assunto:

Variável Aleatória

Variável aleatória é aquela que representa um valor numérico associado a cada um dos resultados de um experimento probabilístico. Uma variável aleatória pode ser:

• Discreta: dir-se-á que a variável é discreta quando houver um número finito ou contável de possíveis resultados a serem enumerados.

• Contínua: dir-se-á que a variável é contínua quando houver um número infinito ou incontável de possíveis resultados a serem enumerados. Nesse caso, os resultados são apresentados por um intervalo de números reais.

Uma distribuição discreta de probabilidade é aquela que enumera cada valor que a variável aleatória pode assumir ao lado de sua probabilidade. Uma distribuição de probabilidade deve satisfazer às seguintes condições:

∑ =

≤≤

1)x(P)2(

1)x(P0)1(

∑ =

≤≤

1)x(P)2(

1)x(P0)1(

Page 118: TGF3_Estatistica_Aplicada

118

A estatística e a probabilidade caminham de mãos dadas. Pode-se observar tal comportamento quando se deseja medir a tendência central de uma distribuição de probabilidades por meio de sua média e determinar a variabilidade por meio de sua variância e de seu desvio padrão.

A média de uma variável aleatória discreta é dada por ∑=µ )x(P*x que significa dizer “multiplique cada valor ‘x’ por sua probabilidade e some todos os resultados”.

Já a variância é definida por ∑ µ−=σ )x(P*)x( 22

O desvio padrão continua sendo dado pela raiz quadrada da variância.

O Valor esperado de uma variável aleatória discreta é igual à média da variável aleatória:

∑=µ= )x(P*x)x(E .

É necessário que você conheça essas definições para compreender o significado de distribuição de probabilidades. Aliás, uma distribuição de probabilidades mostra ao investigador a possibilidade de ocorrência de cada resultado provável numa pesquisa.

São vários os métodos para efetuar uma distribuição. Nesta aula, você fixará sua atenção em três deles: distribuição binomial, distribuição normal e distribuição de Poisson.

A Distribuição Binomial

Um experimento é dito binomial quando se trata de uma experiência probabilística que deve atender aos seguintes requisitos:

(1) O experimento deve ser repetido um número fixo de vezes, sendo cada uma destas independente das demais.

(2) Há somente dois resultados possíveis: sucesso ou fracasso.

(3) A probabilidade de um sucesso P(S) é a mesma em cada tentativa.

(4) A variável aleatória x conta o número de tentativas com sucesso.

Suponha que “n” experimentos independentes sejam executados; suponha ainda que n é um número fixo e que cada experimento resulta num “sucesso” com probabilidade p e em um “fracasso” com probabilidade 1 - p. O número total de sucessos, x, é uma variável aleatória cujos parâmetros são n e p.

LEITURAOBRIGATÓRIA

Page 119: TGF3_Estatistica_Aplicada

119

A probabilidade de obtermos x = k (probabilidade de algo acontecer: um sucesso ou um fracasso), denotada por P(k), pode ser encontrada através da expressão:

knk ppknk

nkPkxP −−−

=== )1(*! )(!

!)()( que também poderá ser escrita assim:

xnxxnxxn qp

xnxnqpCxP −−

−== **

! )!*(!**)( ,

Símbolo Significado

n Número de repetições de um experimento.

p = P(S) Probabilidade de ocorrer sucesso numa única tentativa.

q = (F) = 1 – p Probabilidade de ocorrer fracasso numa única tentativa.

x Representa a contagem do número de sucessos em n tentativas.

Veja: uma moeda é lançada 10 vezes e o número total de caras é contado (neste caso, “cara” seria um sucesso). A possibilidade de, em duas tentativas, acertar uma “cara” será dada por:

n = 10

x = 2

%4,404395,05,0*5 45,0*5,0*5 4)2(

5 420 9

!8*1*2!8*9*0 1

!8* !2!0 1

! )!*(!

0 182

2,0 1

≅===

====−

=

Pxnx

nC

%4,404395,05,0*5 45,0*5,0*5 4)2(

5 420 9

!8*1*2!8*9*0 1

!8* !2!0 1

! )!*(!

0 182

2,0 1

≅===

====−

=

Pxnx

nC

A média de uma variável aleatória binomial é (n * p) e a variância é n * p * (1 - p). Então:

5,2)0 5,01(*0 5,0*0 1)1(**

50 5,0*0 1)*(

2 =−=−=

===

ppn

pn

σ

µ

LEITURAOBRIGATÓRIA

Page 120: TGF3_Estatistica_Aplicada

120

A distribuição é chamada geométrica quando satisfaz aos seguintes requisitos:

• Uma tentativa é repetida até que um sucesso ocorra.

• As tentativas repetidas são independentes umas das outras.

• A probabilidade de sucesso p é constante para cada tentativa.

Nesse caso, a probabilidade de que o primeiro sucesso ocorra na tentativa x é dada por:

P(x) = p * qx-1, onde q = 1 - p

No exemplo da face “cara” da moeda, você teria:

P(2) = 0,5 * 0,52-1 = 0,5 = 0,25 = 25%

A Distribuição de Poisson

Outro exemplo de distribuição comum é a distribuição de Poisson, que é frequentemente utilizada para modelar dados de contagem.

É uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz as seguintes condições:

• O experimento consiste na contagem do número de vezes x que um evento ocorre em um determinado intervalo.

• A probabilidade de que um evento ocorra é a mesma para cada intervalo.

• A probabilidade de que haja exatamente “x” ocorrências em um intervalo é:

!xe)x(P

x µ−µ= em que “e” é o número de Euler.

• O número de ocorrências em um intervalo independe do número de ocorrências em outros intervalos.

A variância de uma distribuição de Poisson é igual a sua média.

LEITURAOBRIGATÓRIA

Page 121: TGF3_Estatistica_Aplicada

121

Distribuição Normal – Propriedades:

• A média, a mediana e a moda são iguais.

• A curva normal tem formato de sino e é simétrica em torno da média.

• A área total sob a curva normal é igual à 1.

• A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo.

• Entre μ – σ e μ + σ, o gráfico curva-se para baixo. À esquerda de μ – σ e à direita de μ + σ, o gráfico curva-se para cima.

Lembre-se do gráfico:

Distribuição normal padrão:

É uma distribuição normal com média 0 (zero) e desvio padrão de 1 (um).

LEITURAOBRIGATÓRIA

Page 122: TGF3_Estatistica_Aplicada

122

Propriedades:

• A área acumulada está próxima de zero para escores z próximos de z = -3,49.

• A área acumulada cresce à medida que o escore z também cresce.

• A área acumulada para z = 0 é 0,5.

• A área acumulada está próxima de 1 para escores z próximos de z = 3,49.

Probabilidade e distribuição normal:

Se uma variável aleatória x é distribuída normalmente, é possível obter a probabilidade de que x caia num determinado intervalo, calculando a área sob a curva normal para o intervalo dado.

Como, então, fazer isso?

• Convertendo os limites do intervalo para o escore z.

• Consultando a tabela normal padrão.

Para obter o escore “z”, basta fazer: σµ−

=xz – o escore “z” é dado pelo quociente do valor

da variável aleatória subtraído da média dividido pelo desvio padrão.

Veja um trecho da tabela normal:

No Livro-Texto você encontrará a tabela na íntegra.

Se você considerar uma amostra em vez de toda a população, pode-se dizer que terá uma distribuição amostral.

Distribuição amostral é a distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente colhidas de uma população.

LEITURAOBRIGATÓRIA

Page 123: TGF3_Estatistica_Aplicada

123

Se a estatística da amostra é sua média, teremos uma distribuição amostral de média das amostras.

Propriedades:

• A média das médias das amostras xµ é igual à média da população μ: µ=µx .

• O desvio padrão da média das amostras é igual ao desvio padrão populacional dividido

pela raiz quadrada de n: nxσ

=σ .

• O desvio padrão da distribuição amostral de médias das amostras é chamado de erro padrão da média.

Teorema do Limite Central

Descreve a relação entre as distribuições amostrais das médias das amostras e a população de onde foram tiradas as amostras.

Seamostrasdetamanhon,emquen≥30,foremtiradasdeumapopulaçãoqualquer,commédia μ e um desvio padrão σ, então a distribuição amostral de médias das amostras se aproximará de uma distribuição normal.

Se a própria população for normalmente distribuída, a distribuição amostral das médias das amostras será normalmente distribuída para qualquer tamanho de amostra n.

Em ambos os casos, a distribuição amostral das médias tem média igual à média da população, ou seja, μmédia = μ

E a distribuição amostral de médias das amostras tem uma variância igual a 1/n vezes a

variância da população, ou seja, n

)( 2

2média

σ=σ .

A fórmula para o erro padrão da média, dada no Teorema do Limite Central, baseia-se na hipótese de que a população tenha infinitos elementos. É o caso da amostragem com reposição.

A fórmula também é válida se o tamanho da amostra for pequeno quando comparado ao da população.

LEITURAOBRIGATÓRIA

Page 124: TGF3_Estatistica_Aplicada

124

A distribuição amostral de médias das amostras será normal com uma média igual à média da população, e o erro padrão da média será:

1NnN*

nx −−σ

Aproximação normal para uma distribuição binomial:

Se n * p ≥ 5, então a variável aleatória binomial “x” tem distribuição aproximadamentenormal, com média μ = n * p e desvio padrão dado por:

q*p*n=σ

Ao utilizar uma distribuição normal contínua para aproximar uma probabilidade binomial, é necessário mover 0,5 unidade para a esquerda e para a direita do ponto médio a fim de incluir todos os valores possíveis de “x” no intervalo; tem-se, nesse caso, uma correção pela continuidade.

Exemplo – Numa empresa, um consultor levanta a seguinte questão com relação à montagem de uma peça da linha de produção: sabendo que a montagem dessa dura, em média, 75 segundos com um desvio padrão de 6 segundos, qual a probabilidade de um trabalhador da fábrica ser escolhido ao acaso para montar uma peça entre 70 e 75 segundos?

Resolução: construindo o gráfico, ter-se-á:

Aplicando a fórmula: 3 8,06

5 70 7=⇒

−=⇒

−= zzxxz

σ .

Consultando a tabela normal padrão (transcrição do trecho da tabela):

LEITURAOBRIGATÓRIA

Page 125: TGF3_Estatistica_Aplicada

125

Com isso, você concluirá que a probabilidade solicitada é de 29,67%.

Não se esqueça: leia o Livro-Texto e os demais textos de apoio sugeridos.

LEITURAOBRIGATÓRIA

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: faça exercícios sobre distribuição de probabilidades e veja a resolução comentada.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Page 126: TGF3_Estatistica_Aplicada

126

LINKSIMPORTANTESAcesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Acesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Consulte também as seguintes bibliografias: Assista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Page 127: TGF3_Estatistica_Aplicada

127

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

A probabilidade de se encontrar o sinal de trânsito aberto numa determinada esquina é de 0,20. Qual a probabilidade de que seja necessário passar pelo local 5 vezes, para encontrar o sinal aberto pela primeira vez?

Questão 2:

Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras (número aproximado)?

a) 50%

b) 40%

c) 25%

d) 12%

e) 1,25%

Questão 3:Numa estrada há 2 acidentes para cada 100 km. Qual a probabilidade (em números aproximados) de que em 300 km ocorram 5 acidentes?

a) 87,53%

b) 75,34%

c) 53,48%

d) 16,06%

e) 6,23%

AGORAÉASUAVEZ

Page 128: TGF3_Estatistica_Aplicada

128

Questão 4:

Sendo x: N(20, 4), o valor reduzido corres-pondente a x1 = 14 é:

a) z = -3.

b) z = -2.

c) z = -1.

d) z = 0.

e) z = 3.

Questão 5:Um fabricante de baterias sabe, por expe-riência passada, que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem distribuição próxima da nor-malidade. Oferece-se uma garantia de 312 dias, isto é, trocam-se as baterias que apresentarem falhas nesse período. Fa-bricam-se 10.000 baterias mensalmente. Quantas deverão ser trocadas pelo uso da garantia, mensalmente?

a) 10.

b) 12.

c) 15.

d) 18.

e) 20.

Questão 6:Qual a probabilidade de que um dado deva ser lançado 15 vezes para que na décima quinta vez ocorra a face 6 pela primeira vez?

Questão 7:Numa criação de coelhos, 40% são ma-chos. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos?

Questão 8:Calcule a média e a variância da variável ale-atória y = 3x + 2, sendo x : B (n = 20; p = 0,6).

Texto para as questões 9 e 10:

Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média de 150.000 km e desvio padrão 5.000 km.

Questão 9:Determine qual a probabilidade de que um carro, escolhido ao acaso entre os fabri-cados por essa firma, tenha um motor que dure menos de 170.000 km?

Questão 10:Determine qual a probabilidade de que um carro, escolhido ao acaso entre os fabri-cados por essa firma, tenha um motor que dure entre 140.000 e 165.000 km?

AGORAÉASUAVEZ

Page 129: TGF3_Estatistica_Aplicada

129

Depois dos diferentes temas já estudados, você percebe que a Estatística, aliada a algumas ferramentas de cálculo, proporciona ao investigador condições de resolver problemas que envolvam diferentes áreas do conhecimento humano. Uma dessas ferramentas é o cálculo das probabilidades de ocorrência de um determinado evento aliado ao conhecimento da média e do desvio padrão.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.

FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

REFERÊNCIAS

FINALIZANDO

Page 130: TGF3_Estatistica_Aplicada

130

REFERÊNCIASMATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

MORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1: Probabilidade. 7. ed. São Pau-lo: Pearson Makron Books, 1999.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

Aleatória: qualquer uma.

Arranjo: combinação cuja ordem dos termos é fundamental.

Combinação: arranjo segundo o qual a ordem dos termos não tem importância.

Permutação: um arranjo ordenado de objetos.

Variável aleatória: aquela variável que representa um valor numérico associado a cada um dos resultados de um experimento probabilístico.

GLOSSÁRIO

Page 131: TGF3_Estatistica_Aplicada

131

Questão 1

Resposta: Sendo:

x = número de vezes necessárias para encontrar o sinal aberto.

p = 0,20

q = 0,80

Ter-se-á: P(x = 5) = 0,804 * 0,20 = 0,08192 = 8,192%

Questão 2

Resposta: Alternativa C.

Questão 3

Resposta: Alternativa D.

Questão 4

Resposta: Alternativa A.

Questão 5

Resposta: Alternativa E.

GABARITO

Page 132: TGF3_Estatistica_Aplicada

132

Questão 6

Resposta: Sendo:

x = número de lançamentos necessários para o aparecimento da primeira face 6.

65q

61p

=

=

65q

61p

=

=

Ter-se-á: %298,101298,061*

65)5 1(

4 1

==

==xP

Questão 7

Resposta: Sendo:

x = número de coelhos machos.

p = 0,40

q = 0,60

Ter-se-á (utilize uma calculadora para auxiliar você):

%948,9 9)2(99948,0)00049,000003,0(1)2(

6,0*4,0*10 26,0*4,0*

00 21)2(

} )1()0({1)2()2(1)2(

9 110 20

=≥=+−=≥

+

−=≥

=+=−=≥<−=≥

xPxP

xP

xPxPxPxPxP

%948,9 9)2(99948,0)00049,000003,0(1)2(

6,0*4,0*10 26,0*4,0*

00 21)2(

} )1()0({1)2()2(1)2(

9 110 20

=≥=+−=≥

+

−=≥

=+=−=≥<−=≥

xPxP

xP

xPxPxPxPxP

%948,9 9)2(99948,0)00049,000003,0(1)2(

6,0*4,0*10 26,0*4,0*

00 21)2(

} )1()0({1)2()2(1)2(

9 110 20

=≥=+−=≥

+

−=≥

=+=−=≥<−=≥

xPxP

xP

xPxPxPxPxP

%948,9 9)2(99948,0)00049,000003,0(1)2(

6,0*4,0*10 26,0*4,0*

00 21)2(

} )1()0({1)2()2(1)2(

9 110 20

=≥=+−=≥

+

−=≥

=+=−=≥<−=≥

xPxP

xP

xPxPxPxPxP

%948,9 9)2(99948,0)00049,000003,0(1)2(

6,0*4,0*10 26,0*4,0*

00 21)2(

} )1()0({1)2()2(1)2(

9 110 20

=≥=+−=≥

+

−=≥

=+=−=≥<−=≥

xPxP

xP

xPxPxPxPxP

GABARITO

Page 133: TGF3_Estatistica_Aplicada

133

GABARITOQuestão 8

Resposta: A resolução é simples:

μ = n * p = 20 * 0,3 = 6

σ2 = n * p * q = 20 * 0,3 * 0,7 = 4,2

então:

μy = μ(3x + 2) = 3 * μ + 2 = 3 * 6 + 2 = 20

σ2y = σ2

(3x + 2) = 9 * σ2 = 9 * 4,2 = 37,8

Questão 9

Resposta: Resolução:

000.5000.150

000.5 000.150

:

−=

==

xz

mkmk

mkmemotorodduraçãoxσµ

000.5000.150

000.5 000.150

:

−=

==

xz

mkmk

mkmemotorodduraçãoxσµ

Então:

%9968,99499968,05,0)4z0(P5,0)4z(P)000.170x(P

4000.5

000.150000.170z

=+=≤≤+=≤=<

=−

=

P(x<170.000)=P(z≤4)=0,5+P(0≤z≤4)=0,5+0,499968=99,9968%

Page 134: TGF3_Estatistica_Aplicada

134

Questão 10

Resposta: Do exercício 9 tem-se que:

000.5000.150

000.5 000.150

:

−=

==

xz

mkmk

mkmemotorodduraçãoxσµ

000.5000.150

000.5 000.150

:

−=

==

xz

mkmk

mkmemotorodduraçãoxσµ

Então:

%59,97)000.165x000.140(P498650,0477250,0)000.165x000.140(P

)3z0(P)0z2(P)3z2(P)000.165x000.140(P

3000.5

000.150000.165z

2000.5

000.150000.140z

2

1

=<<+=<<

≤≤+≤≤=≤≤−=<<

=−

=

−=−

=

%59,97)000.165x000.140(P498650,0477250,0)000.165x000.140(P

)3z0(P)0z2(P)3z2(P)000.165x000.140(P

3000.5

000.150000.165z

2000.5

000.150000.140z

2

1

=<<+=<<

≤≤+≤≤=≤≤−=<<

=−

=

−=−

=

P(140<x<165.000)=P(-2≤z≤3)=P(2≤z≤0)+P(0≤z≤3)

P (140.000 < x < 165.000) = 0,477250 + 0,498650

P (140.000 < x < 165.000) = 97,59%

GABARITO

Page 135: TGF3_Estatistica_Aplicada
Page 136: TGF3_Estatistica_Aplicada

seções

Tema 07Intervalos de Confiança

Page 137: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 138: TGF3_Estatistica_Aplicada

Tema 07Intervalos de Confiança

Page 139: TGF3_Estatistica_Aplicada

139

CONTEÚDOSEHABILIDADES

Conteúdo

Nessa aula você estudará:

• Uma visão geral a respeito de intervalos de confiança.

• Definições importantes tais como as de estimador, estimativa e estimação.

• Pontos comuns e diferenças na avaliação de amostras e populações.

• A importância da média e do desvio padrão.

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 140: TGF3_Estatistica_Aplicada

140

CONTEÚDOSEHABILIDADES

Intervalos de Confiança

Para este estudo, será necessário que você retome o conceito fundamental de amostra (subconjunto de uma população).

Outros conceitos fundamentais:

Todos os elementos apresentados em seguida correspondem a definições e foram, em geral, parafraseados do material Estatística – Curso 1, organizado pela professora doutora Corina da Costa Freitas, cuja bibliográfica encontra-se disponível no final deste capítulo e a quem reportamos nosso respeito e admiração profissional.

Estimativa amostral é a avaliação de um parâmetro da população com utilização dos dados de uma amostra. Ela pode ser classificada como intervalar ou pontual.

• A estimativa pontual acontece quando se faz uma única estimativa para um determinado parâmetro populacional.

• Já a estimativa intervalar acontecerá quando for feita uma estimativa de um intervalo de valores possíveis, no qual se admite que esteja o parâmetro populacional. Aqui,

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• O que são e para que servem a estimação, a estimativa e o estimador?

• Como obter a análise inferencial de um conjunto de dados?

• O que são e para que servem os intervalos de confiança?

• Em que e para que se aplicam os intervalos de confiança?

LEITURAOBRIGATÓRIA

Page 141: TGF3_Estatistica_Aplicada

141

LEITURAOBRIGATÓRIAobtém-se um intervalo de valores (em torno do parâmetro amostral) no qual se julga (com um risco conhecido de erro) que esteja o parâmetro da população. A esse intervalo chamamos intervalo de confiança.

Estimador corresponde ao modelo matemático utilizado para se fazer uma estimativa. Segundo Morettin (2000, p. 41), as qualidades de um bom estimador são: consistência, ausência de vício, eficiência e suficiência.

Estimação é o processo que consiste no uso de dados da amostra para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções, entre outros.

Inferência corresponde à metodologia pela qual se possibilita avaliar característica(s) de uma população com base nos dados de uma amostra.

Estimador não tendencioso corresponde a todo estimador em que o modelo matemático no qual o valor esperado na amostra é igual ao valor real de uma população.

Estude com atenção o raciocínio demonstrado em seguida, ele permitirá que você entenda os estimadores importantes em uma pesquisa.

Considere uma variável aleatória x (por exemplo, a altura de um grupo de indivíduos de uma região da cidade) associada à população-alvo cuja média populacional seja μ e a variância populacional seja σ2, da qual seja extraída uma amostra de tamanho n representada pelos elementos x1, x2, x3, ..., xn.

Considerando as condições expostas, os estimadores serão:

Média Amostral: x)x(E = (E denota o valor esperado da média).

Variância Amostral:

==σ ∑

nx

V)x(V i2

x (V designa a variância de cada componente).

Proporção Amostral: nx

p iA∑=

(os valores que xi assume são:

AeventoosatisfaznãoesAeventoosatisfazes

0 1

.)

Page 142: TGF3_Estatistica_Aplicada

142

Veja bem, quando um pesquisador sai a campo, ele pode deparar-se com grande abrangência de variáveis de pesquisa.

Entenda o que a estatística quer dizer com isso: se Ivonete (professora) deseja conhecer bem o seu grupo de alunos, ela precisa buscar diversas informações que determinem o perfil do alunado; entre essas informações, pode-se citar: idade, perfil socioeconômico, sexo, tempo disponível para estudo, distância entre o local de residência e o polo, entre outras.

Dessa vastidão de variáveis, destaca-se, em especial, um caso muito importante:

• A variável aleatória x possuir distribuição normal1.

Quando isso ocorre, diz-se que: ),(Nx 2σµ≈ . Então, segundo Morettin (2000, p. 41), a média amostral µ=)x(E será um estimador não tendencioso da média da população.

Observando a variância2, o investigador obterá, no caso de a amostra ser independente:

)n

,(Nxentão),(Nxn

)x(V2

2

2

x σµσµ

σ

≈≈⇒=

Essa propriedade afirma a você que a variância da média amostral é um estimador não tendencioso da variância da população, bastando para isso fazer a multiplicação pelo tamanho da amostra, desde que essa amostra seja coletada de forma independente.

Simplificando o raciocínio, se uma variável aleatória possui distribuição normal na população, a média amostral também possuirá distribuição normal.

Alguns outros conceitos são fundamentais para a compreensão do significado e da importância dos intervalos de confiança. São eles: proporção e graus de liberdade.

1 Segundo Morettin (1999, p.140 ), a variável possui distribuição normal quando o ponto máximo da função é dado por: a curva é simétrica em relação à media e os pontos de inflexão são (média ± desvio padrão).

2 Lembre-se de que a variância nada mais é do que a soma dos quadrados dos desvios dividida pelo número de elementos da população em estudo, ou o número de elementos menos um, no caso da amostra.

LEITURAOBRIGATÓRIA

Page 143: TGF3_Estatistica_Aplicada

143

Proporção

De maneira geral, você sabe que uma proporção é uma igualdade entre duas ou mais razões. Para a estatística, uma proporção tem o mesmo significado que tem uma frequência simples.

Quando p é a proporção de um evento na população, tem-se: E(pA) = p

Quando a amostra for independente, tem-se: n)p̂1(*p̂)p(V A

A−

=

Graus de Liberdade

Levando-se em conta que já tenha estudado graus de liberdade, você, portanto, sabe que essa medida informa o número de informações independentes de uma amostra (n) subtraído do número (k) de parâmetros da população a serem estimados (além do próprio parâmetro de estudo). Contudo, é importante relembrar o conceito e reforçar que cada tipo de análise requer um grau de liberdade diferente do outro.

Intervalo de Confiança

Ao avaliar o valor de um parâmetro da população, com base em valores de uma amostra, o que o pesquisador tem é uma estimativa, com a qual ele poderá avaliar o resultado obtido como correto ou não.

Na tentativa de eliminar possíveis erros, o intervalo de confiança estabelece essa estimativa, criando um intervalo matemático capaz de medir a validade dos valores obtidos na amostra da população em estudo.

Segundo Morettin (2000, p. 43):

A estimação por pontos de um parâmetro não possui uma medida do possível erro cometido na estimação.

Uma maneira de expressar a precisão é estabelecer limites, que com certa probabilidade incluam o verdadeiro valor do parâmetro da população.

Esses limites são chamados “limites de confiança”: determinam um Intervalo de Confiança, no qual deverá estar o verdadeiro valor do parâmetro.

Logo, a estimação por intervalo consiste na fixação de dois valores tais que )1( α− seja a probabilidade de que o intervalo, por eles determinado, contenha

o verdadeiro valor do parâmetro.

α : nível de incerteza ou grau de desconfiança.

)1( α− : coeficiente de confiança ou nível de confiabilidade.

LEITURAOBRIGATÓRIA

Page 144: TGF3_Estatistica_Aplicada

144

A notação utilizada é: ],[)%)1(,( 21 µµαµ =−CI

• Nível de confiabilidade ou nível de confiança: corresponde à probabilidade de que o intervalo encontrado contenha o valor real do parâmetro procurado. O nível de confiança será dado por )1( α− .

• Nível incerteza, grau de desconfiança ou nível de significância: corresponde à probabilidade de que o intervalo encontrado não contenha o valor real do parâmetro procurado, isto é, a probabilidade de que o valor do parâmetro em estudo tenha, realmente, um valor fora do intervalo construído. O nível de significância é chamado de α .

De acordo com padrões internacionais: (a) a estatística preferencialmente citará o nível de significância no relatório de uma pesquisa; e (b) o nível de significância (que deverá ser estipulado pelo pesquisador) será em torno de α = 0,05. isto é, um risco de 5,0% (no máximo).

As fórmulas apresentadas em seguida são muito importantes para a obtenção de Intervalos de Confiança (IC). Preste bastante atenção nelas; acompanhe a explanação do professor durante a aula; veja também os exemplos propostos no seu Livro-Texto e assista aos vídeos propostos mais à frente neste texto: a simbologia é muito carregada, embora os procedimentos sejam simples de ser executados.

Não esmoreça! Vamos ao trabalho!

Intervalo de Confiança para a Média

Será necessário observar se as seguintes condições iniciais foram respeitadas:

x seja a variável em análise

x tenha distribuição normal:

≈xedetindependenaleatóriaamostraumasejaxxxx

Nxnormaloãdistribuiçtenhaxanálisemeiávelasejax

n ,...,,,,),(:

var

321

2σµ

x1, x2, x3, ..., xn, seja uma amostra aleatória independente de x

≈xedetindependenaleatóriaamostraumasejaxxxx

Nxnormaloãdistribuiçtenhaxanálisemeiávelasejax

n ,...,,,,),(:

var

321

2σµ

LEITURAOBRIGATÓRIA

Page 145: TGF3_Estatistica_Aplicada

145

Intervalo de Confiança da Média3

Se as condições iniciais foram respeitadas e levando-se em conta as propriedades de estimadores,

tem-se que )n

,(Nx2σ

µ≈ ; e, aplicando-se as propriedades da normal, chega-se a: )1,0(N

n

xz ≈−

=σµ

,

então, ao utilizar os modelos matemáticos da distribuição normal, chega-se a:

ασµ

−=

<−

<−=<<− 1z

n

xzP)zZz(P 0000

Fazendo-se as devidas simplificações, ter-se-á o intervalo:

nzxa

nzxed σσ ** 00 +−

nzxa

nzxed σσ ** 00 +− que é chamado de Intervalo de Confiança da média ao nível de

significância α .

Erro Padrão de Estimativa

Considerando tudo o que foi estudado até aqui, você é capaz de concluir que quem determina

o erro padrão ou o desvio padrão da média populacional é o quociente desvio padrão pela raiz

quadrada do tamanho da população, isto é, nσ

. Contudo, nem sempre é possível trabalhar

com a população toda. Nesse caso, é necessário optar por uma amostra, para que, então, o

pesquisador possa cometer o chamado erro padrão de estimativa que é dado por n

*z0σ

e também conhecido como margem de erro, sendo simbolizado pela letra e.

No decorrer deste texto, para calcular o Intervalo de Confiança para a média populacional era necessário conhecer o valor da variância populacional.

Ao trabalhar com uma amostra, pode acontecer que a variância seja desconhecida. Nesse caso, sendo a amostra pequena, para encontrar o intervalo de confiança deve-se partir do teorema:

Se ),(Nx 2σµ≈ com ),(Nx 2σµ≈ desconhecida, então,

ns

xt µ−= (distribuição

t-Student com (n-1) graus de liberdade.

3 Demonstração original na íntegra em Morettin, 2000, p. 45-52.

LEITURAOBRIGATÓRIA

Page 146: TGF3_Estatistica_Aplicada

146

Propriedades da Distribuição t-Student

1. O teorema afirma que se a variância populacional for desconhecida, para construir o intervalo de confiança da média usa-se a distribuição t e não a “normal”.

2. A curva do gráfico é simétrica e semelhante à curva da distribuição N (0, 1), porém um pouco mais longa.

3. Quando o número de graus de liberdade é um valor suficientemente grande, a distribuição t-Student se aproxima da Normal Padrão.

4. Se o número de graus de liberdade for acima de 35, quando utilizar tabelas, usa-se a distribuição N(0, 1) para encontrar os valores de t.

Intervalo de Confiança da média com variância desconhecida

Pelas características estudadas, você chegará a:

ns*tx

ns*tx 00 +<<− µ

com distribuição t-Student com (n-1) graus de liberdade (FREITAS, 2003, p. 279).

Exemplo4: tempo estimado de duração de cirurgias cardíacas.

Quanto ao tempo de cirurgia, os valores encontrados para indivíduos do sexo feminino foram (em minutos):

Quanto ao tempo de cirurgia, os valores encontrados para indivíduos do sexo feminino foram (em minutos):

200 265 345 210 240 230 250270 205 265 210 325 230 220255 285 295 260 220 250 130230 240 280 310 225 250 255260 200 270 235 195 230

Considerando os dados apresentados, construa o intervalo de confiança para o tempo médio de duração deste tipo de cirurgia, para indivíduos do sexo feminino, ao nível de 5,0% de significância.

4 TEODORO, 2005, p. 43.

LEITURAOBRIGATÓRIA

Page 147: TGF3_Estatistica_Aplicada

147

Solução:

Estimativas pontuais:

Média: 3,2454 3

230...265200≅

+++=x

Variância: 5 1,674.114 3

)3,245230(...)3,245200( 222 =

−−++−

=s .

Desvio Padrão: 2 9,0 45 1,654.1 ≅=s .

Variância desconhecida com a utilização de t-Student

Graus de Liberdade: 34 – 1 = 33;

Na tabela, ao nível de 5,0%: t = 2,0345

O Intervalo será:

7 5,2592 0,2314 32 9,0 4*0345,23,245

4 32 9,0 4*0345,23,245

<<

+<<−

µ

µ

7 5,2592 0,2314 32 9,0 4*0345,23,245

4 32 9,0 4*0345,23,245

<<

+<<−

µ

µ

Intervalo de Confiança para a Proporção p

Lembre-se de que proporção (ou frequência) é a razão entre o total de resultados em conformidade com uma condição preestabelecida e o total de resultados existentes.

Para que uma proporção possa ser avaliada é preciso que se crie um intervalo de confiança de p utilizando-se diretamente a distribuição normal; então, das fórmulas que já são conhecidas, pode-se escrever:

n)p̂1(*p̂*zp̂p

n)p̂1(*p̂*zp̂ AA

0AAA

0A−

+<<−

Aqui, o erro padrão é dado por: n

)p̂1(*p̂ AA − e o erro padrão da estimativa por:

n)p̂1(*p̂*ze AA

0−

=

LEITURAOBRIGATÓRIA

Page 148: TGF3_Estatistica_Aplicada

148

Exemplo5: fatores que contribuem com o peso da criança ao nascer.

Numa pesquisa, foram observadas 19.189 crianças que nasceram em 2002 em Goiânia (GO). Destas, 1.124 nasceram com peso abaixo de 2.500g, sendo classificadas como desnutridas.

Considerando as informações do texto, vamos construir, ao nível de 5,0% de significância, o intervalo de confiança da proporção de crianças que nascem desnutridas.

Resolvendo:

Seja p a proporção, na população de todas as crianças, daquelas que, ao nascer, que sejam desnutridas.

Sabe-se que

==

124.1)(189.9 1

ann

Portanto:

Na tabela Normal Padrão, ao nível de 5%, tem-se que o valor crítico de z é z0 = 1,96

Nessas condições, o erro padrão de estimativa é:

0033,0189.9 1

)0586,01(*0586,0*6 9,1 ≅−

=e

O intervalo de confiança será dado por:

0,0586 - 0,0033 < p < 0,0586 + 0,0033

0,0553 < p < 0,0619

5 GIGLIO et al, 2005, p. 131.

LEITURAOBRIGATÓRIA

Page 149: TGF3_Estatistica_Aplicada

149

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos ao fazer exercícios sobre estatística e veja a resolução comentada. Amplie sua visão a respeito da estatística lendo e estudando o material disponível nos sites indicados em seguida.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 7 jan. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

Acesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 7 jan. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 7 jan 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Page 150: TGF3_Estatistica_Aplicada

150

LINKSIMPORTANTESAcesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 7 jan. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

VídeosAssista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 14 jan. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

AGORAÉASUAVEZ

Page 151: TGF3_Estatistica_Aplicada

151

Questão 1:

De uma população qualquer, retira-se uma amostra de 100 elementos, e nela en-contram-se 20 sucessos. Ao nível de 1%, construa um intervalo de confiança para a proporção real de sucessos na população.

Questão 2:

(BACEN-2005 – adaptada) Os preços de um produto têm uma distribuição normal com desvio padrão populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra aleatória de tamanho n = 100, com um determinado nível de confian-ça, apurou-se para a média desses preços um IC (intervalo de confiança) dado por [R$ 61,08; R$ 68,92]. A mesma média amostral foi obtida quadruplicando-se o tamanho da amostra anterior e utilizando-se o mesmo nível de confiança. Nos dois casos consi-derou-se infinito o tamanho da população. O novo intervalo de confiança foi:

a) [R$ 61,20; R$ 68,80].

b) [R$ 61,33; R$ 68,67].

c) [R$ 61,57; R$ 68,43].

d) [R$ 62,06; R$ 67,94].

e) [R$ 63,04; R$ 66,96].

Questão 3:

(BACEN-2005 – adaptada) A distribuição dos valores de aluguéis dos imóveis em cer-ta localidade é bem representada por uma curva normal com desvio padrão populacio-nal de R$ 200,00. Uma amostra aleatória de 100 imóveis deste local determinou um IC para a média destes valores, com determi-nado nível de confiança, como [R$ 540,00; R$ 660,00]. A mesma média amostral foi obtida com outro tamanho de amostra, com mesmo nível de confiança anterior, sendo o novo intervalo [R$ 560,00; R$ 640,00]. Nos dois casos, considerou-se a população com tamanho infinito. O tamanho da amostra considerado no segundo caso foi de:

a) 225.

b) 256.

c) 324.

d) 400.

e) 625.

Questão 4:

A massa corporal de recém-nascidos do sexo feminino em determinada comunida-de tem distribuição normal com média P e desvio padrão desconhecido. Uma amostra de 16 crianças indicou uma massa média de 3,0 kg e desvio padrão amostral igual a 0,8 kg. O intervalo de confiança para P, com co-eficiente de confiança de 96% é dado por:

AGORAÉASUAVEZ

Page 152: TGF3_Estatistica_Aplicada

152

a) 3,0 ± 0,37.

b) 3,0 ± 0,41.

c) 3,0 ± 0,45.

d) 3,0 ± 0,68.

e) 3,0 ± 0,73.

Questão 5:Um encarregado de controle de qualidade deseja estimar a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho suficientemente gran-de. Sabe-se que p deve estar próxima de 0,5 (de acordo com registros anteriores). Que ta-manho deve ter a amostra se o encarregado desejar que o erro de estimação seja no má-ximo de 2%, com confiança de 90%?

a) 800.

b) 1.082.

c) 1.241.

d) 1.530.

e) 1.681.

Questão 6:

De uma população normal X, com 92 =σ , tira-

-se uma amostra de 25 observações, obten-

do-se ∑=

=5 2

1152

iix . Determine um IC de limi-

tes de 90% para µ.

Questão 7:

De uma população de 1.000 elementos com distribuição aproximadamente normal, com variância 92 =σ = 400, tira-se uma amos-tra de 25 elementos, obtendo-se 150x = . Estabeleça um IC para µ, ao nível de 5%.

Texto para as questões 8, 9 e 10:

De uma população normal com desvio pa-drão 92 =σ = 5, retira-se uma amostra de 50 elementos e se obtém 150x = = 42.

Questão 8:

Estabeleça um IC para a média ao nível de 5%.

Questão 9:

Calcule o erro de estimação ao nível de 5%.

Questão 10:

Paraqueoerroseja≤1,comprobabilidadede acerto de 95%, qual deverá ser o tama-nho da amostra?

AGORAÉASUAVEZ

Page 153: TGF3_Estatistica_Aplicada

153

Neste tema, você não só conheceu as definições a respeito de intervalos de confiança e sua utilidade, mas também aprendeu como obtê-los tanto para a população quanto para uma amostra dela. Resolva, portanto, os exercícios para praticar os conceitos aprendidos. Busque (e compreenda) outros pontos de vista, consultando a bibliografia utilizada como base para este trabalho.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS, Corina da Costa et al. Estatística: Curso I. São José dos Campos: INPE, 2003.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

GIGLIO, Margareth Rocha Peixoto et al. Baixo peso ao nascer em coorte de recém-nasci-dos em Goiania-Brasil no ano de 2000. Revista Bras. Ginecol. Obstet., v. 27, n. 3, p.130-136, mar. 2005.

REFERÊNCIAS

FINALIZANDO

Page 154: TGF3_Estatistica_Aplicada

154

REFERÊNCIASKOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e Con-trole. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

MORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1 – Probabilidade. 7. ed. São Paulo: Pearson Makron Books, 1999.

________. Estatística Básica – Volume 2 – Inferência. São Paulo: Pearson Education do Brasil, 2000.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

TEODORO. Roberta Rubiane Vaz Teodoro. Estudo Epidemiológico de pacientes subme-tidos à revascularização do miocárdio em hospital escola do Centro - Oeste (Trabalho de Conclusão de Curso). Goiás: PUC, 2005.

Page 155: TGF3_Estatistica_Aplicada

155

Amostra: corresponde a um conjunto de informações obtido em uma pesquisa que, graças à impossibilidade de se fazer o censo, é utilizado para tirar conclusões sobre parâmetros e/ou características de uma população.

Estimação: é o procedimento que consiste no uso de dados da amostra para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções, entre outros.

Estimador: corresponde ao modelo matemático utilizado para se fazer uma estimativa.

Estimativa amostral: avaliação de um parâmetro da população com utilização dos dados de uma amostra, podendo ser classificada como intervalar ou pontual.

Inferência: metodologia pela qual se permite avaliar característica(s) de uma população com base nos dados de uma amostra.

GLOSSÁRIO

Page 156: TGF3_Estatistica_Aplicada

156

Questão 1

Resposta: Considerando n = 100; x = 20 (número de sucessos na amostra); %1=α .

] %8 2,0 3, %2 7,9[) %9 9,(

9 9,0) %8 2,0 3%2 7,9(

9 9,0)3028,00972,0(

9 9,0)4 0,0*7 5,22,04 0,0*7 5,22,0(

7 5,2

4 0,0100

8,0*2,0

8,02,01ˆ1ˆ

2,0100

0 2ˆ

5,9 4

00

0

=

=≤≤

=≤≤

=+≤≤−

==

==

=−=−=

===

pCI

pP

pP

pP

zz

pq

nxp

α

σ

Questão 2

Resposta: Alternativa E.

Questão 3

Resposta: Alternativa A.

GABARITO

Page 157: TGF3_Estatistica_Aplicada

157

Questão 4

Resposta: Alternativa C.

Questão 5

Resposta: Alternativa E.

Questão 6

Resposta:

%0 1=α

)064,7;096,5() %0 9,(

0 9,0)064,7096,5(

0 9,0)6,0*4 6,18 0,66,0*4 6,18 0,6(

4 6,1

6,053

5 29

8 0,65 2

152

%5 4

2

=

=<<

=+<<−

==

====

==

µ

µ

µ

σσ

α

CI

P

P

zz

n

x

x

Questão 7

Resposta:

%5;130x25;n 400; 1.000; N 2 ===== ασ

)5 7,157;5 2,142() %5 9,(

5 9,0)5 7,1575 2,142(

5 9,0)5 9,3*6 9,11505 9,3*6 9,1150(

6 9,1

5 9,3110005 21000*

50 2

1*

%5,7 4

2

=

=<<

=+<<−

==

≅−−

=−−

=

µ

µ

µ

σσ

α

CI

P

P

zz

NnN

nx

GABARITO

Page 158: TGF3_Estatistica_Aplicada

158

)5 7,157;5 2,142() %5 9,(

5 9,0)5 7,1575 2,142(

5 9,0)5 9,3*6 9,11505 9,3*6 9,1150(

6 9,1

5 9,3110005 21000*

50 2

1*

%5,7 4

2

=

=<<

=+<<−

==

≅−−

=−−

=

µ

µ

µ

σσ

α

CI

P

P

zz

NnN

nx

Questão 8

Resposta:

%5;2 4x; 0 5n ;5 ==== ασ

)9 3,3 4;1 6,0 4() %5 9,(

5 9,0)9 3,3 41 6,0 4(

5 9,0)1 7,0*6 9,12 41 7,0*6 9,12 4(

6 9,1

1 7,00 5

5

%5,7 4

2

=

=<<

=−<<−

==

≅==

µ

µ

µ

σσ

α

CI

P

P

zz

nx

Questão 9

Resposta:

Veja )x(e µ−= e x

xzσ

µα

−= então e*z x =σα

Nessas condições: 9 3,11 7,0*6 9,1* ===x

ze σα

GABARITO

Page 159: TGF3_Estatistica_Aplicada

159

Questão 10

Resposta: Se 5 9,0)1( =≤eP então n = ?

elementosn

n

n

n

n

zz

6 9

4 0,6 9

8,9

5*6 9,1

1*6 9,1

6 9,1

2

%5,7 4

==

σ

α

GABARITO

Page 160: TGF3_Estatistica_Aplicada

seções

Tema 08Testes de Hipóteses

Page 161: TGF3_Estatistica_Aplicada

SeçõesSeções

Page 162: TGF3_Estatistica_Aplicada

Tema 08Testes de Hipóteses

Page 163: TGF3_Estatistica_Aplicada

163

CONTEÚDOSEHABILIDADES

Conteúdo

Nessa aula você estudará:

• O que é hipótese e o que é tese.

• O que é hipótese nula e o que é hipótese alternativa.

• Em que situações se aplicam testes estatísticos.

• O teste t, o teste z, o Qui-quadrado.

Introdução ao Estudo da Disciplina

Caro(a) aluno(a).

Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.

Roteiro de Estudo:

Ivonete Melo de CarvalhoEstatística Aplicada

Page 164: TGF3_Estatistica_Aplicada

164

CONTEÚDOSEHABILIDADES

Testes de Hipóteses

Testes Estatísticos

Testes estatísticos são ferramentas utilizadas para validar o trabalho do pesquisador. Para entender seu significado e sua abrangência, além de conceituá-los, deve-se aplicá-los sobre uma mesma situação-problema.

Exemplo: dois gerentes de uma unidade de uma grande empresa de prestação de serviços discutem, entre si, para saber qual deles possui clientes mais satisfeitos em suas respectivas carteiras, na tentativa de melhorar os serviços prestados. Para medir o grau de satisfação, aplicam um questionário com questões intervalares de 5 pontos. A tabela apresenta os resultados obtidos:

Gerente 11 2 3 2 4 3 3 3 4 4 Total

573 4 3 2 1 3 4 2 4 2

Gerente 22 4 5 3 3 4 2 5 4 5 Total

693 3 4 5 3 2 1 3 4 2

Habilidades

Ao final, você deverá ser capaz de responder as seguintes questões:

• Para que serve um teste estatístico?

• Onde e por que utilizar o teste t?

• Onde e por que utilizar o teste z?

• Onde e por que utilizar o Qui-quadrado?

LEITURAOBRIGATÓRIA

Page 165: TGF3_Estatistica_Aplicada

165

LEITURAOBRIGATÓRIATestes de hipóteses:

Dá-se o nome de testes de hipóteses àqueles com os quais se supõe (ou não) verdadeira uma situação inicial; eles podem ser de dois diferentes tipos: teste t e teste z. A diferença entre os dois está no tamanho da amostra e no fato de a variância ser (ou não) conhecida.

Para realizá-los, considera-se:

• Teste T: amostra menor que 30 e variância desconhecida.

• Teste Z: amostra maior ou igual a 30 e variância conhecida ou não.

Definições importantes:

Teste de hipótese é uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com base em elementos amostrais.

Hipótese é a teoria que se deseja comprovar como correta. Existirão sempre duas hipóteses, H0 que é a hipótese nula (ou probanda) e H1: hipótese alternativa. Geralmente a hipótese alternativa H1 representa a suposição que o pesquisador quer provar, sendo a hipótese nula H0 formulada com o expresso propósito de ser rejeitada.

Conseguindo-se rejeitar H0, a hipótese alternativa (H1) terá de ser aceita, conseguindo, então, o pesquisador provar o que queria.

Erro é uma falha na avaliação de uma hipótese e podem ser de dois tipos:

• Erro Tipo I (α): A hipótese nula é verdadeira e o pesquisador a rejeita.

• Erro Tipo II (β): A hipótese nula é falsa e o pesquisador a aceita.

A probabilidade de cometer Erros do Tipo I chama-se Nível de Significância do Teste, dado por α. Já a probabilidade de β não pode ser calculada, a menos que se especifique um valor alternativo para µ.Opoderoupotênciadotesteédadopor(1−β).

Page 166: TGF3_Estatistica_Aplicada

166

Resumindo:

Se H0 é:

Verdadeira Falsa

PesquisadorAceita H0 Decisão Correta Erro tipo II

Rejeita H0 Erro tipo I Decisão Correta

Teste Bicaudal ou Bilateral

00 :H µµ = e 01 :H µµ ≠ em que é a média populacional e 0µ é o valor suposto para a média populacional.

Representação Gráfica:

RA é a região de aceitação da hipótese nula e RC é a região crítica ou região de rejeição. A fronteira entre essas regiões será dada por um valor tabelado (Tabela de Distribuição Normal ou da Tabela da Distribuição t-Student).

Figura 8.1: Teste Unicaudal ou Unilateral à Direita

0100 :He :H µµµµ >=

Fonte: Elaboração da autora.

LEITURAOBRIGATÓRIA

Page 167: TGF3_Estatistica_Aplicada

167

Figura 8.2: Teste Unicaudal ou Unilateral à Esquerda

0100 :He :H µµµµ <=

Fonte: Elaboração da autora.

As figuras 8.1 e 8.2 anteriores são representações de curvas normais. Para amostras pequenas utiliza-se a tabela t-Student, de acordo com o seguinte parâmetro:

TamanhoVariância

PopulacionalTipo de

Distribuição

Grande n 30≥Conhecida Normal

Desconhecida Normal

Pequeno n 30<Conhecida Normal

Desconhecida t-Student

O teste T ou Distribuição t-Student só será utilizado quando a amostra for pequena, n < 30, e a variância populacional for desconhecida.

Se a amostra for grande, a partir de 30 elementos, sendo, ou não, conhecida a variância populacional, usa-se a Tabela da Distribuição Normal para arbitrar o valor ZTAB, ou seja, aplica-se o teste Z.

Teste T

Uma de suas finalidades é determinar (ou não) a igualdade entre duas médias, supondo independência e normalidade das observações. Para aplicá-lo, é necessária a presença de pelo menos dois grupos cujas variâncias podem, ou não, ser iguais, pois há alternativas de teste para ambas as situações.

LEITURAOBRIGATÓRIA

Page 168: TGF3_Estatistica_Aplicada

168

Considere somente variâncias iguais entre si.

Teste T para duas amostras não relacionadas: o teste é largamente utilizado para verificar se a diferença entre as médias aritméticas entre duas amostras pode, ou não, ser considerada grande para ser significativa.

No problema apresentado, o primeiro gerente obteve média 2,85 e o segundo, 3,45, o que sugeriria que o segundo gerente foi mais eficiente.

Nesse caso, o teste t visa comprovar se a diferença entre as médias é (ou não) significativa e, também, explicar se tal diferença não se deve a erro amostral.

É importante destacar que, em amostras pequenas, existe uma tendência para que as médias das amostras sejam diferentes mesmo que oriundas da mesma população. Assim, o teste t busca determinar se o grau de diferença entre os grupos observados não se deve a outros fatores e não a erro de amostragem.

Os passos lógicos para execução do teste são:

1. Determinar H0, não havendo diferenças entre as médias.

2. Determinar H1, para a existência de diferença entre as médias.

3. Estabelecer um nível de significância.

4. Calcular t, sendo os graus de liberdade, φ = n1 + n2 – 2

xsxt µ−

=

Sendo: nsSx = e 2

n

1i

2 )xx(1n

1S ∑ −−

=

Ou:

+

−++

+=

212

21

21

11*2

1 nnnn

QSQS

xxt em que SQ é a soma dos quadrados e x e x 21 são as

médias de cada grupo.

LEITURAOBRIGATÓRIA

Page 169: TGF3_Estatistica_Aplicada

169

No problema: % 5; 5 3,1 :H3,15 :H 10 =≠= αµµ e

Tabelando os elementos apresentados e realizando todos os cálculos necessários (utilize a planilha Excel) ter-se-á:

2G 2G 11 m-G 22 m-G 211 )m-G( 2

22 )m-G(

1 2 -1,85 -1,45 3,4225 2,1025

2 4 -0,85 0,55 0,7225 0,3025

3 5 0,15 1,55 0,0225 2,4025

2 3 -0,85 -0,45 0,7225 0,2025

4 3 1,15 -0,45 1,3225 0,2025

3 4 0,15 0,55 0,0225 0,3025

3 4 0,15 0,55 0,0225 0,3025

3 5 0,15 1,55 0,0225 2,4025

4 4 1,15 0,55 1,3225 0,3025

4 5 1,15 1,55 1,3225 2,4025

3 3 0,15 -0,45 0,0225 0,2025

4 3 1,15 -0,45 1,3225 0,2025

3 4 0,15 0,55 0,0225 0,3025

2 5 -0,85 1,55 0,7225 2,4025

1 3 -1,85 -0,45 3,4225 0,2025

3 2 0,15 -1,45 0,0225 2,1025

4 1 1,15 -2,45 1,3225 6,0025

2 3 -0,85 -0,45 0,7225 0,2025

4 4 1,15 0,55 1,3225 0,3025

2 2 -0,85 -1,45 0,7225 2,1025

total 57 69 18,55 24,95

média 2,85 3,45

LEITURAOBRIGATÓRIA

Page 170: TGF3_Estatistica_Aplicada

170

Efetuando a substituição:

| 2,85 3,45 | 0,60 0,60t6,4 1 0,64|18,55 24,95 | 1 1 **38 10 3820 20 2 20 20

t 1,7733 1,77

−= = =

+ + + − ≅ ≅

| 2,85 3,45 | 0,60 0,60t6,4 1 0,64|18,55 24,95 | 1 1 **38 10 3820 20 2 20 20

t 1,7733 1,77

−= = =

+ + + − ≅ ≅

Sendo t = 1,77 e t tabelado igual a 2,02 com 38 graus de liberdade, rejeita-se a hipótese nula em prol da hipótese verdadeira.

Conclui-se, portanto, que os dois grupos de clientes estão satisfeitos e que provavelmente as diferenças entre as médias sejam em razão do erro de amostragem.

Teste Z

Aliviados por não precisar competir entre si, os gerentes resolveram juntar os 40 questionários e testar suas respostas regionalmente; o tamanho da amostra passa a ser considerado grande, e o teste a ser utilizado é o teste z que terá por objetivo verificar a igualdade entre uma média conhecida (numa dada população) e outra calculada pelo pesquisador (numa amostra).

O procedimento é, basicamente, o mesmo que no teste t: (1) Determinar H0; (2) Determinar H1; (3) Estabelecer um nível de significância; e (4) Calcular

1 2

1 2

1 2 1 2

x xz

ó ó 1 1*n n 2 n n

+=

++ + −

ou

Considerando os dados do exemplo, ter-se-á:

x 3,15

ó 43,5 6,59

=

= ≅x 3,15

ó 43,5 6,59

=

= ≅

LEITURAOBRIGATÓRIA

Page 171: TGF3_Estatistica_Aplicada

171

Aplicando o teste:

H0: µ = 3,15; H1 = µ = 3,15; e α = 5%

Zcalc = 0 é menor que Ztab = 1,65, então aceite H0 como hipótese verdadeira.

Teste do Qui-quadrado para independência (duas amostras)

Verifica se as distribuições de duas ou mais amostras não relacionadas diferem significativamente em relação a determinada variável.

Condições para a execução do teste

1. Exclusivamente para variáveis nominais e ordinais.

2. Preferencialmente para amostras grandes.

3. Observações independentes.

4. Não se aplica se 20% das observações forem inferiores a 5.

5. Não pode haver frequências inferiores a 1.

6. Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo outro critério específico.

7. Qualquer que seja o teste, sempre os procedimentos são iniciados pela determinação das hipóteses:

8. H0: as variáveis são independentes ou não estão relacionadas; aqui se assume que não há diferenças nas proporções das populações – amostras – estudadas, ou seja: H0: p1 = p2 . H1 contradiz H0.

9. Estabelecer o nível de significância.

10. Determinar a região de rejeição de H0.

LEITURAOBRIGATÓRIA

Page 172: TGF3_Estatistica_Aplicada

172

11. Determinar o valor dos graus de liberdade: )1C(*)1L( −−=φ , em que L é o número de linhas da tabela a ser estudada e C, o número de colunas.

12. Encontrar o valor de ∑ −=

célulassatodas

e

fff

2

202 )(χ em que fo é a frequência observável e fe é a

frequência normal esperada.

Para calcular a proporção, basta fazer: 1 2

1 2

x x xpn n n

+= =

+ , em que x representa os sucessos

obtidos e n, o número de elementos da amostra.

Sendo o Qui-Quadrado calculado maior do que o tabelado, rejeita-se H0 em prol de H1.

No exemplo, suponha que a pesquisa aplicada pelos gerentes girasse em torno do item “conhecimentos específicos dos produtos oferecidos pela empresa”.

Gerentes

1 2

Possíveis notas

Frequência

Observada

Frequência

Esperada

Frequência

Observada

Frequência

EsperadaTotais

1 2 1,5 1 1,5 3,0

2 5 4,5 4 4,5 9,0

3 7 6,5 6 6,5 13,0

4 6 5,5 5 5,5 11,0

5 0 2,0 4 2,0 4,0

total 20 20 20 20 40

Aplicando o teste:

φ = (2 - 1) * (2 - 1) = 1

grau de liberdade

0 1 2 1 1 2H : p p ; H : p p= ≠

LEITURAOBRIGATÓRIA

Page 173: TGF3_Estatistica_Aplicada

173

fo feo e(f f )− 2

o e(f f )−2

o e

2

(f f )f−

2 1,5 -0,5 0,25 0,167

1 1,5 0,5 0,25 0,167

5 4,5 -0,5 0,25 0,056

4 4,5 0,5 0,25 0,056

7 6,5 -0,5 0,25 0,038

6 6,5 0,5 0,25 0,038

6 5,5 -0,5 0,25 0,045

5 5,5 0,5 0,25 0,045

0 2,0 2 4 2,000

4 2,0 -2 4 2,000

∑ 4,612

Para %5=α e grau de liberdade 1, a tabela nos informa uma leitura de 3,841, ou seja, 841,3612,4 2

tab2calc =>= χχ , portanto, H0 deve ser aceita como verdadeira.

Distribuição F

A distribuição F de Fisher-Snedecor é uma distribuição de probabilidade contínua que surge frequentemente como a distribuição nula de uma estatística de teste, particularmente na análise da variância. Também conhecida como distribuição F de Fisher (Ronald Fisher) ou distribuição F de Snedecor (George W. Snedecor), mede a razão entre duas qui-quadrado independentes.

A distribuição F de Snedecor depende de dois graus de liberdade. O primeiro (m) é o grau de liberdade do numerador e o segundo (n) do denominador.

Cada parâmetro é associado ao tamanho amostral menos um. Uma das possíveis representações da função densidade de probabilidade F, em termos da função Gama, é dada por:

LEITURAOBRIGATÓRIA

Page 174: TGF3_Estatistica_Aplicada

174

),0[,3,2,1,) (*

2*

2

***2

2

222 1*

, ∞∈=+

Γ

Γ

+

Γ=

+

xnmnxmnm

xnmnm

Fnm

mnm

nm

Propriedades da distribuição F (de Snedecor)

(1) Média, expectância ou valor esperado 2m

m)x(E−

==µ , em que m é o grau de liberdade do numerado;

(2) )4n(*)2m(*m

)2nm(*m2)x(V2

2

−−−+

=σ=

LINKSIMPORTANTES

Quer saber mais sobre o assunto? Então:

SitesTeste os seus conhecimentos: faça exercícios a respeito de testes de hipóteses e veja a resolução comentada. Amplie sua visão a respeito da estatística lendo e estudando o material disponível nos sites indicados em seguida.

Acesse o site “Exercícios – Brasil Escola”.

Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

LEITURAOBRIGATÓRIA

Page 175: TGF3_Estatistica_Aplicada

175

LINKSIMPORTANTESAcesse o site “Portal Action”.

Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.

Acesse o site “Exercícios – Professor Cardy”.

Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.

Acesse o site “Matematiquês”.

Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.

Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.

VídeosAssista aos vídeos com exercícios comentados.

Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 14 jan. 2014.

Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).

Page 176: TGF3_Estatistica_Aplicada

176

Instruções:

Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.

Questão 1:

De uma população normal com variância 36, toma-se uma amostra causal de ta-manho 16, obtendo-se 3 4=x . Ao nível de 10%, teste as hipóteses:

≠=

5 4:5 4:

1

0

µµ

HH

Questão 2:

Seja ).5 2,(: µNx . Para o teste da média 5 1=µ contra 2 1=µ , retirou-se uma amos-

tra aleatória de 16 elementos de x, tendo-se observado para a média amostral o valor 13. Determine o nível descritivo do teste.

a) 0,065

b) 0,060

c) 0,055

d) 0,010

e) 0,005

Questão 3:

Sabe-se, por experiência, que 5% da pro-dução de um determinado artigo é defeitu-osa. Um novo empregado é contratado. Ele produz 600 peças do artigo com 82 defeitu-osas. Ao nível de 15%, verifique se o novo empregado produz peças com maior índice de defeitos que o existente.

AGORAÉASUAVEZ

Page 177: TGF3_Estatistica_Aplicada

177

a) Sim, rejeita-se H0.

b) Sim, rejeita-se H1.

c) Não, aceita-se H0.

d) Não, aceita-se H1.

e) Os dados são insuficientes para se obter a análise adequada.

Questão 4:

Uma fábrica de automóveis anuncia que seus carros consomem, em média, onze litros por 100 quilômetros, com desvio pa-drão de 0,8 litro. Uma revista decide testar essa afirmação e analisa 35 carros des-sa marca, obtendo 11,4 litros por 100 km, como consumo médio. Admitindo que o consumo tenha distribuição normal, ao ní-vel de 10%, o que a revista concluirá sobre o anúncio da revista?

a) O anúncio não é verdadeiro, rejeita-se H0.

b) O anúncio não é verdadeiro, rejeita-se H1.

c) O anúncio é verdadeiro, rejeita-se H0.

d) O anúncio é verdadeiro, rejeita-se H1.

e) Os dados são insuficientes para se obter a análise adequada.

Questão 5:

Leia com atenção o problema descrito a seguir e responda: qual valor de zcalc para os dados propostos?

A altura dos adultos de uma cidade tem distribuição normal com média de 164cm e desvio padrão de 5,82cm. Deseja-se saber se as condições sociais desfavorá-veis vigentes na parte pobre dessa cidade causam um retardamento do crescimento dessa população. Para isso, levantou-se uma amostra de 144 adultos dessa parte da cidade, obtendo-se a média de 162cm. Pode esse resultado indicar que os adul-tos residentes na área são em média mais baixos que demais habitantes da cidade ao nível de 5%?

a) -4,124

b) -1,64

c) 0,485

d) 1,64

e) 5,82

Questão 6:

Para os dados do problema do exercício número 5, a hipótese levantada deve, ou não, ser rejeitada?

AGORAÉASUAVEZ

Page 178: TGF3_Estatistica_Aplicada

178

Questão 7:

Em uma experiência sobre percepção ex-trassensorial, um indivíduo “A”, em uma sala isolada, é solicitado a declarar a cor vermelha ou preta (em números iguais) de cartas tiradas ao acaso de um baralho de 50 cartas, por outro indivíduo “B”, co-posicionado em outra sala. Se “A” identifi-ca corretamente 32 cartas, esse resultado é significativo ao nível de 5% para indicar que “A” tem PES?

Questão 8:

Um candidato a deputado estadual afir-ma que terá 60% dos votos dos eleitores de uma cidade. Um instituto de pesquisas colhe uma amostra de 300 eleitores des-sa cidade, encontrando 160 que votarão no candidato. Esse resultado mostra que a afirmação do candidato é verdadeira, ao nível de 5%?

Questão 9:

A vida média de uma amostra de 100 lâm-padas produzidas por uma fábrica foi cal-culada em 1.570 horas, com desvio padrão de 120 horas. Sabe-se que a duração das lâmpadas dessa fábrica tem distribuição normal com média de 1600 horas. Ao nível de 1%, teste se houve alteração na dura-ção média das lâmpadas.

Questão 10:

Teste

>=

0 5:0 5:

1

0

µµ

HH , dados:

2 5;100; %5;42 ==== xnασ

AGORAÉASUAVEZ

Page 179: TGF3_Estatistica_Aplicada

179

Neste tema, você conheceu as definições a respeito de testes de hipóteses e sua utilidade. Aprendeu como obtê-los tanto para a população quanto para uma amostra dela. Resolva, portanto, os exercícios para praticar os conceitos aprendidos. Busque (e compreenda) outros pontos de vista, consultando a bibliografia utilizada como base para este trabalho.

Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!

BELLO, Pedro. Estatística FCC. Rio de Janeiro: Ferreira, 2008.

CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.

CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.

FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.

REFERÊNCIAS

FINALIZANDO

Page 180: TGF3_Estatistica_Aplicada

180

REFERÊNCIASLABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

MORETTIN, Luiz Gonzaga. Estatística Básica: volume 2 – Inferência. São Paulo: Pearson Education do Brasil, 2000.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124.

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.

Erro: é uma falha na avaliação de uma hipótese.

Expectância: o mesmo que média ou valor esperado.

Hipótese: é a teoria que se deseja comprovar como correta.

Testes de hipóteses: são aqueles com os quais se supõe (ou não) verdadeira uma situação inicial.

Testes estatísticos: são ferramentas utilizadas para validar o trabalho do pesquisador.

GLOSSÁRIO

Page 181: TGF3_Estatistica_Aplicada

181

Questão 1

Resposta: O teste é bilateral e α = 10%. Nesse caso, a RNR (região de não rejeição) será P (|z| < z0) = 1- α.

zα = z5% = 1,64 → P (|z| < 1,64) = 0,90

.HrejeitasenãoRNR43xcomo

)46,4754,42(P

)5,1*64,1455,1*64,145(P

)*z*z(P:RNR

5,146

90,0)64,1|z(|P64,1zz

0

H

H

HxHx

x

%5

0

0

00

∈=

<<

+<<−

<+<<−

==

=<⇒==

µ

µ

µσµµσµ

σ

αα

α

.HrejeitasenãoRNR43xcomo

)46,4754,42(P

)5,1*64,1455,1*64,145(P

)*z*z(P:RNR

5,146

90,0)64,1|z(|P64,1zz

0

H

H

HxHx

x

%5

0

0

00

∈=

<<

+<<−

<+<<−

==

=<⇒==

µ

µ

µσµµσµ

σ

αα

α

P (45 - 164 * 1,5 < μH0 < 45 + 1,64 * 1,5)

P (42,54 < μH0 < 47,46)

como . 3 4

)46,4754,42(

)5,1*64,1455,1*64,145(

)**(:

5,146

90,0)64,1|(|64,1

0

%5

0

0

00

HrejeitaesnãoRNRxcomo

P

P

zzPRNR

zPzz

H

H

HxHx

x

∈=

<<

+<<−

<+<<−

==

=<⇒==

µ

µ

µσµµσµ

σ

αα

α

Questão 2

Resposta: Alternativa C.

Questão 3

Resposta: Alternativa A.

Questão 4

Resposta: Alternativa A.

Questão 5

Resposta: Alternativa A.

GABARITO

Page 182: TGF3_Estatistica_Aplicada

182

Questão 6

Resposta: Não, a hipótese levantada não deve ser rejeitada, pois a média CRx 162∈= ; portanto, rejeita-se H0.

Questão 7

Resposta: Analisando-se os dados apresentados e construindo-se o IC, pode-se concluir que “A” tem PES.

Questão 8

Resposta: Considerando que CRzcalc ∈ , deve-se considerar que a afirmação do candidato é falsa, a 5% de risco.

Questão 9

Resposta: Considerando que RNRzcalc ∈ , não é significativa a alteração da vida média das lâmpadas a 1%.

Questão 10

Resposta: Considerando que zcalc = 10,0, deve-se rejeitar a hipótese probanda.

GABARITO

Page 183: TGF3_Estatistica_Aplicada
Page 184: TGF3_Estatistica_Aplicada