Download - TGF3_Estatistica_Aplicada
Seme
stre
3Tecnologia em Gestão Financeira
Caderno de AtividadesEstatística Aplicada
CLIQUEAQUIPARAVIRARAPÁGINA
FICHA TÉCNICA
Equipe de Gestão EditorialRegina Cláudia FiorinJoão Henrique Canella FiórioPriscilla Ramos Capello
Análise de ProcessosJuliana Cristina e SilvaFlávia Lopes
Revisão TextualAlexia Galvão AlvesGiovana Valente FerreiraIngrid FavorettoJulio CamilloLuana Mercúrio
DiagramaçãoCélula de Inovação e Produção de Conteúdos
Caderno de AtividadesTecnologia em Gestão Financeira
DisciplinaEstatística Aplicada
Coordenação do CursoCarlos Eduardo Azevedo
Raquel de Oliveira Henrique
AutoriaIvonete Melo de Carvalho
ChancelerAna Maria Costa de Sousa
ReitoraLeocádia Aglaé Petry Leme
Pró-Reitor AdministrativoAntonio Fonseca de Carvalho
Pró-Reitor de GraduaçãoEduardo de Oliveira Elias
Pró-Reitor de ExtensãoIvo Arcangêlo Vedrúsculo Busato
Pró-Reitora de Pesquisa e PósGraduaçãoLuciana Paes de Andrade
Realização:
Diretoria de Planejamento de EAD José Manuel Moran Barbara Campos
Diretoria de Desenvolvimento de EAD Thais Costa de Sousa
Gerência de Design EducacionalRodolfo Pinelli Gabriel Araújo
© 2014 Anhanguera Educacional
Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou qualquer outro idioma.
Como citar esse documento:CARVALHO, Ivonete Melo de. Estatística Aplicada. Valinhos: Anhanguera Educacional, 2014. p. 1- 184. Disponível em: <http://www.anhanguera.com>. Acesso em: 3 mar. 2014.
ÍndiceÍndice
Tema 01: Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados 6
Tema 02: Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão 28
Tema 03: Assimetria e Curtose 50
Tema 04: Probabilidade 70
Tema 05: Análise de Regressão e Correlação 90
Tema 06: Distribuição de Probabilidade 112
Tema 07: Intervalos de Confiança 136
Tema 08: Testes de Hipóteses 160
seções
Tema 01Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados
SeçõesSeções
Tema 01Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados
9
Conteúdo
Nessa aula você estudará:
• Uma visão geral da Estatística.
• Distribuição de frequências.
• Classificação de dados e variáveis.
• Construção de gráficos.
CONTEÚDOSEHABILIDADES
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
10
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é e para que serve a estatística?
• Como obter, tabular, representar e realizar análise numérica de dados?
• O que são e para que servem as variáveis qualitativas?
• O que são e para que servem as variáveis quantitativas?
CONTEÚDOSEHABILIDADES
LEITURAOBRIGATÓRIA
Introdução à Estatística e à Estatística Descritiva: Parte I – Levantamento e Apresentação de Dados
A estatística é a arte ou a ciência que se ocupa em levantar, tabular e analisar dados.
Para compreendê-la, você precisa adaptar-se a algumas definições. Os termos apresentados precisam ser incorporados por você.
Definições:
População = conjunto formado por todos os elementos cuja característica o investigador deseja conhecer.
Amostra = subconjunto da população.
Variável = a característica que se pretende conhecer.
Dado = informação (característica) a ser tratada.
11
LEITURAOBRIGATÓRIAUm exemplo: a professora Ivonete deseja conhecer a faixa etária de seus alunos EAD.
Aqui, a população é formada por todos os alunos de Ivonete; a variável (característica) a ser estudada é a faixa etária dos alunos.
Seguindo com o exemplo:
Ivonete possui vinte mil alunos. “20.000” é um número muito grande de pessoas a ser analisado. A demanda de tempo seria imensa. Para resolver essa questão, em vez de estudar toda a população, uma amostra dela (parte da população) poderá ser determinada. Veja como:
Cálculo do tamanho da amostra:
Considerando uma população de tamanho N e uma margem de erro e (em porcentagem) deve-se calcular o número índice n1:
2
1 e1n
=
Conhecido o número índice, o tamanho da amostra n será dado por:
1
1nNn*Nn
+=
No exemplo, se Ivonete admitir um erro de 2% sobre uma população de 20 mil alunos, ela terá:
500.20 52 0,0
11 222
1 ==
=
=
en
2,222.2500,22
000.000.0 5500.2000.0 2500.2*000.0 2*
1
1 ==+
=+
=nNnN
n ,isto é, n = 2.223.
Em bom português, Ivonete precisa obter 2.223 respostas à questão “qual sua idade?” para que sua investigação não apresente erro superior a 2%.
Importante: o tamanho de uma amostra será sempre dado por um número inteiro e positivo. Existem outras formas de determinar o tamanho de uma amostra. Uma delas é calcular 10% do tamanho da população. Outra diz que para populações pequenas não é necessário determinar amostra. Outro conceito será apresentado a você depois de estudar probabilidade.
12
De volta ao exemplo, o problema de Ivonete agora é obter a amostra. Para isso, ela poderá utilizar diferentes meios para coletar as respostas, mas, antes disso, será necessário determinar o tipo de amostra.
Os principais tipos de amostragem utilizados são os probabilísticos (todos os indivíduos da população têm a mesma chance de serem selecionados).
Os métodos mais comuns de amostragem probabilística são:
• Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios [veja como no Livro-Texto].
• Amostragem estratificada: subdivide-se a população em, no mínimo, dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se uma amostra de cada. Exemplo: homens e mulheres.
• Amostragem sistemática: escolhe-se um ponto de partida e então, sistematicamente, selecionam-se os outros. Por exemplo: o [5°, 15°, 25°, 35°] (etc.) indivíduos.
• Amostragem por conglomerados: divide-se a população em conglomerados (áreas), em seguida sorteiam-se algumas áreas e analisam-se todos os elementos dos conglomerados escolhidos. Por exemplo: bairros [de uma cidade]. (GIACOMELLO, 2012, p. 2, grifos nossos).
Bem, agora que você entendeu esses elementos essenciais, certamente vai compreender porque seguirei com exemplos que apresentam números menores (para simplificação de cálculos).
Para dar sequência ao estudo, suponha que o tamanho da amostra calculada por Ivonete fosse n = 40.
Para obter as respostas (dados) necessárias para conhecer a variável idade (em anos) de seus alunos, Ivonete postou a pergunta na área acadêmica e colheu as 50 primeiras respostas válidas. As idades estão apresentadas no quadro a seguir:
LEITURAOBRIGATÓRIA
13
18 23 25 30 22 32 44 35
23 41 30 28 32 23 44 37
44 27 32 30 32 30 30 18
35 23 25 28 25 30 30 30
26 25 25 23 32 44 23 30
Os dados coletados são quantitativos porque se referem a uma medida. Dados quantitativos podem ser contínuos (por exemplo: quanto dinheiro você tem na carteira) ou discretos (o número de filhos que você tem).
Caso Ivonete tivesse perguntado: “sexo – feminino ou masculino?”, as respostas não seriam uma medida, mas sim uma característica. Variáveis desse tipo são chamadas de qualitativas. Uma variável qualitativa pode ser nominal (feminino, masculino) ou ordinal (classe social).
Suponha que, entre as respostas coletadas, Ivonete tivesse obtido 24 respostas “masculino” e 16 respostas “feminino”.
Veja bem, você tem dois exemplos de variáveis para analisar: qualitativas e quantitativas.
Qualquer estudo estatístico (qualitativo ou quantitativo) deve começar pela construção de uma tabela.
No caso da variável “sexo”, organizarei a tabela em ordem alfabética, ou seja, construindo um ROL. As opções “feminino” e “masculino” são chamadas de categorias.
Variável: sexo
Feminino 16
Masculino 24
Total: 40
A tabela de coleta de dados pode ser transformada em uma tabela de frequências (frequência é o número de vezes que uma determinada resposta é obtida).
LEITURAOBRIGATÓRIA
14
A tabela de frequências apresenta: frequência simples – f – (número absoluto); frequência relativa – fr – (na forma decimal) e frequência percentual – f%.
Em estatística, trabalhar com porcentagens é essencial.
Veja como fica a tabela de frequências da variável “sexo”.
Sexo f fr f%
Feminino 16 0,4 40%
Masculino 24 0,6 60%
Total: 40 1,0 100%
Elaborada a tabela, podem-se representar os dados graficamente. No caso das variáveis qualitativas os tipos de gráficos mais comumente utilizados são: colunas, barras, setores circulares (formato de pizza) e pictóricos (figuras). Veja as ilustrações na figura a seguir:
Figura 1.1: Tipos de gráficos para variáveis qualitativas
Barras Colunas Setores Circulares Pictóricos
0 5 10 15 20 25 30
F
M
0
5
10
15
20
25
30
F M
Feminino
Masculino
Fonte: Elaboração da autora.
Agora, você aprenderá a tratar dados quantitativos.
Assim como nos dados qualitativos, a primeira providência é colocar os elementos em ordem (em rol). Como são medidas, devem ser colocadas em ordem numérica crescente.
LEITURAOBRIGATÓRIA
15
A lista de dados obtidos era assim:
18 23 25 30 22 32 44 35
23 41 30 28 32 23 44 37
44 27 32 30 32 30 30 18
35 23 25 28 25 30 30 30
26 25 25 23 32 46 23 30
Ordenando os dados do menor para o maior, a tabela ficará assim:
18 23 25 27 30 30 32 41
18 23 25 28 30 30 32 44
22 23 25 28 30 32 35 44
23 23 25 30 30 32 35 44
23 25 26 30 30 32 37 46
Na tabela ordenada, é fácil verificar que algumas idades se repetem e outras não. Assim que obter o rol (quando estiver trabalhando com dados quantitativos), o próximo passo é determinar a amplitude total dos dados em estudo. Não se assuste, é fácil. Para calcular a amplitude total basta subtrair, do maior valor obtido, o menor valor. No exemplo, você deverá fazer:
AT = 46 - 18 = 28
Depois da amplitude, você deverá calcular o número de classes (categorias) que comporá a tabela.
Para determinar o número de classes é preciso estar atento ao tamanho da amostra.
Para amostras com até 50 elementos, o número de classes é dado por: nk = . Para amostras com mais de 50 elementos, você deverá utilizar a regra de Sturges: )nlog(*3,31k += .
No exemplo, a amostra n = 40 deverá conter 73,60 4 ≅≅=k classes (o número de classes é sempre inteiro e positivo).
LEITURAOBRIGATÓRIA
16
Isso feito, você deverá calcular a amplitude das classes. A amplitude das classes é dada
por: KTAkA = . No exemplo: 4
78 2 =⇒= kAkA .
Depois disso, chega o momento de construir a tabela de frequências.
No caso de variável quantitativa, além de calcular frequência simples – f; frequência relativa – fr – e frequência percentual – f%; também será preciso calcular a frequência acumulada – F; a frequência acumulada relativa – Fr – e a frequência acumulada percentual – F%. Contudo, antes de contar as frequências, você deverá construir as classes.
A primeira classe começa com o menor valor obtido entre os dados tabelados; a esse valor adiciona-se a amplitude da classe: 18 + 4 = 22. A segunda classe começará no 22 e terminará no 26 e assim por diante até chegar na sétima classe que começará na 42 e terminará em 46.
Veja como fica a tabela de frequências da variável idade.
Idade f fr f% F Fr F%
18 ι— 22 02 0,050 05,0 02 0,050 05,0
22 ι—26 12 0,300 30,0 14 0,350 35,0
26 ι— 30 04 0,100 10,0 18 0,450 45,0
30 ι— 34 09 0,225 22,5 27 0,675 67,5
34 ι— 38 07 0,175 17,5 34 0,850 85,0
38 ι— 42 02 0,050 05,0 36 0,900 90,0
42 ι— 46 04 0,100 10,0 40 1,000 100,0
Total: 40 1,000 100%
O símbolo “ι—“ significa que o início do intervalo faz parte dele e o final somente o limita (em linguagem matemática: intervalo fechado à esquerda e aberto à direita).
Para obter a frequência de cada classe é preciso contar quantos elementos fazem parte dela. Por exemplo, na primeira classe estariam os números 18, 19, 20 e 21 que aparecessem – neste caso, somente o 18 aparece 2 vezes. Na segunda classe, deveriam aparecer os números 22, 23, 24 e 25 que aparecem 1 vez, 6 vezes, nenhuma vez e 5 vezes, respectivamente, portanto, a frequência simples é 12. Confira os demais valores tabelados.
LEITURAOBRIGATÓRIA
17
A ideia de acumular frequências também é simples. A primeira frequência acumulada (relativa ou percentual) é sempre igual à primeira frequência simples (relativa ou percentual). Da segunda frequência acumulada em diante, basta que você adicione o valor da frequência simples da próxima classe ao valor acumulado: 2 + 12 = 14.
Para representar graficamente dados quantitativos, os gráficos utilizados são o histograma, o polígono de frequências (simples) e a ogiva (frequências acumuladas). Vejas os gráficos na figura seguinte:
Figura 1.2: Tipos de gráficos para variáveis quantitativas
Histograma Polígono de frequências Ogiva
0
2
4
6
8
10
12
14
18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 0
5
10
15
20
25
30
35
40
45
18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 460
5
10
15
20
25
30
35
40
45
18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46
Fonte: Elaboração da autora.
Comentários:
Histograma é bem parecido com o gráfico de colunas, contudo, suas colunas são colaterais com todas as bases com a mesma dimensão.
O polígono de frequências é obtido considerando-se os valores médios de cada classe e a frequência relativa à classe estudada.
A ogiva também considera os pontos médios de cada classe em correspondência ao valor nela acumulado.
Leia no Livro-Texto, se possível, como tratar dados agrupados.
LEITURAOBRIGATÓRIA
18
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições desses exames e consultar a resolução comentada.
19
LINKSIMPORTANTESAcesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>.
Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução
comentada.
Vídeos
Assista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/
Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-
padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata
de produção da Editora Abril Cultural voltada para o público que prestará o ENEM.
20
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
Foi encomendado um estudo para ava-liação do curso “A” em uma Instituição de Ensino Superior. Para isso, aplicou-se um questionário e obtiveram-se respostas de 110 alunos.
Indique:
a) A variável em estudo.
b) A população em estudo.
c) A amostra escolhida.
Questão 2:
A variável “salário” é classificada como:
a) Qualitativa nominal.
b) Qualitativa ordinal.
c) Quantitativa contínua.
d) Quantitativa discreta.
e) Quantitativa ordinal.
Questão 3:
Uma população cuja característica deseja-se estudar apresenta 50 mil elementos. A margem de erro admitida pelo pesquisador é de 1%. Nessas condições, o tamanho da amostra será:
AGORAÉASUAVEZ
21
a) n = 50.000.
b) n = 10.000.
c) n = 8.334.
d) n = 5.000.
e) n = 500.
Questão 4:
Para tabelar uma amostra de dados quan-titativos de tamanho n = 100 elementos, o examinador deverá elaborar:
a) 10 classes.
b) 8 classes.
c) 7 classes.
d) 5 classes.
e) 4 classes.
Questão 5:
Chama-se questão aberta àquela cuja res-posta é livre. Uma questão é de múltipla escolha quando o investigador oferece as respostas a serem escolhidas pelo elemen-to pesquisado. Indique, entre as alternati-vas apresentadas, aquela cuja resposta deve ser obrigatoriamente livre:
a) Quantos livros você leu no último ano?
b) Quantos filhos você tem?
c) O bairro onde você mora é considerado um lugar tranquilo?
d) A que classe social você pertence?
e) Qual o título do último livro que você leu?
Texto para as questões de 6 a 10:
Considere os dados quantitativos representados na tabela. Com base nas orientações do item “Leitura Obrigatória” responda ao que se pede em seguida.
6 157 223 98 189119 142 99 75 241128 137 172 22 167115 29 217 29 142134 38 32 36 230
Questão 6:
Elabore uma tabela de frequências con-siderando cinco classes assim definidas:
0 ι— 50; 51 ι— 100; 101 ι— 150; 151 ι— 200; 201 ι— 250
Questão 7:
Elabore o histograma dos dados estudados.
Questão 8:
Elabore o polígono de frequência dos da-dos estudados.
AGORAÉASUAVEZ
22
Questão 9:
Elabore a ogiva dos dados estudados.
Questão 10:
Que informação você extrai ao analisar a ogiva?
AGORAÉASUAVEZ
Neste tema, você conheceu as definições iniciais da estatística e sua utilidade. Aprendeu como obter e classificar dados; construir tabelas e gráficos. Aprendeu, principalmente, que a estatística permite ao investigador conhecer qualquer elemento que componha sua área de atuação.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
FINALIZANDO
CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, Porto Alegre 16, 1997.
FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
REFERÊNCIAS
23
REFERÊNCIASGIACOMELLO, C. P. Probabilidade e estatística. Centro de Ciências Exatas, da Natureza e de Tecnologia, Universidade de Caxias do Sul. Rio Grande do Sul, 2012.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p.124.
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
Amostra: subconjunto da população.
Dado: informação (característica) a ser tratada.
População: conjunto formado por todos os elementos cuja característica o investigador deseja conhecer.
Respostas válidas: são aquelas que não se desviam da pergunta elaborada. Exemplo: se, ao se perguntar “qual sua cor preferida?”, a resposta for “verde”, esta será válida.
Variável: a característica que se pretende conhecer.
GLOSSÁRIO
24
Questão 1
Resposta: Observando os detalhes do texto, as respostas serão: (a) qualidade de ensino; (b) Instituição de Ensino Superior; (c) 110 alunos.
Questão 2
Resposta: Alternativa C.
Questão 3
Resposta: Alternativa C.
Questão 4
Resposta: Alternativa B.
Questão 5
Resposta: Alternativa E.
Questão 6
Resposta: Após elaborar o rol, e com o auxílio de uma calculadora, você deverá obter:
Classes f fr f% F Fr F%
0 ι— 50 7 0,28 28 7 0,28 28
51 ι— 100 3 0,12 12 10 0,40 40
101 ι— 150 7 0,28 28 17 0,68 68
151 ι— 200 4 0,16 16 21 0,84 84
201 ι— 250 4 0,16 16 25 1,00 100
total 25 1,00 100
GABARITO
25
Questão 7
Resposta: Considerando as frequências simples:
0
1
2
3
4
5
6
7
8
0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250
Questão 8
Resposta: Considerando as frequências simples:
0
1
2
3
4
5
6
7
8
0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250
classes
frequ
ênci
as
GABARITO
26
Questão 9
Resposta: Considerando as frequências acumuladas:
0
5
10
15
20
25
30
0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250
classes
frequ
ênci
as
Questão 10
Resposta: Falando aproximadamente, metade dos valores acima do valor médio e metade dos valores abaixo do valor médio.
GABARITO
seções
Tema 02Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão
SeçõesSeções
Tema 02Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão
31
Conteúdo
Nessa aula você estudará:
• Medidas de tendência central: média, moda e mediana.
• Medidas de dispersão: amplitude total, desvio, variância, desvio padrão, coeficiente de variação.
• Em que tipo de variáveis as diferentes medidas são aplicadas.
CONTEÚDOSEHABILIDADES
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
32
CONTEÚDOSEHABILIDADES
LEITURAOBRIGATÓRIA
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que são e para que servem as medidas de tendência central?
• O que são e para que servem as medidas de dispersão?
• Média e desvio padrão devem ser sempre calculados?
• Por que variáveis qualitativas não apresentam as medidas de tendência central (exceto moda) e as medidas de dispersão?
Estatística Descritiva – Parte II: Medidas de Tendência Central e Medidas de Dispersão
Medidas de Tendência Central
As medidas de tendência central são:
• Medidas que representam um conjunto de dados relativos à observação de um determinado fenômeno (fato).
• Medidas que servem para orientar quanto à posição da distribuição dos dados no eixo das abscissas.
• Medidas que permitem a comparação de séries de dados entre si pelo confronto desses dados.
As principais medidas de tendência central são: média, mediana e moda.
33
LEITURAOBRIGATÓRIASão sinônimos de média:
• Esperança.
• Esperança matemática.
• Valor esperado.
• Expectância de uma variável aleatória.
Existem também os decis, quartis e percentis, que são chamados de separatrizes. As separatrizes não serão trabalhadas em detalhes neste caderno. Para tanto, consulte o Livro-Texto. No entanto, as suas definições serão apresentadas em seguida.
Por definição, o percentil divide uma distribuição de frequência em 100 partes iguais, ou
seja, ( )iP
in
iPi Fhf
P
100
*∑−+= , em que:
iP = limite inferior da classe Pi, em que i = 1,2,3,...,99
n = tamanho da amostra
∑ f = soma das frequências anteriores à classe Pi
h = amplitude da classe
FPi = frequência da classe Pi
Por definição, o decil divide uma distribuição de frequência em 10 partes iguais, isto é,
( )iD
in
iDi Fhf
D
0 1
*∑−+= , em que:
iD = limite inferior da classe Pi, em que i = 1,2,3,...,99
n = tamanho da amostra
∑ f = soma das frequências anteriores à classe Di
h = amplitude da classe
FDi = frequência da classe Di
34
O quartil, por definição, divide uma distribuição de frequência em 4 partes iguais. Para
calcular os quartis, deve-se fazer: ( )
1
1
*4
1Q
ni
Q Fhf
Q ∑−+= , em que:
1Q = limite inferior da classe do primeiro quartil
n = tamanho da amostra
∑ f = soma das frequências anteriores à classe quartílica
h = amplitude da classe quartílica
FQ1 = frequência da primeira classe quartílica
Coeficiente de CurtosePara que se determine o grau de achatamento da curva de distribuição de frequência de uma série de dados (coeficiente de curtose = k) é preciso determinar o terceiro e o primeiro quartis e o nonagésimo e o décimo percentis, por meio da seguinte fórmula:
)(*2 0 10 9
13
PPQQK−
−= (K = coeficiente de curtose)
• Q3 e Q1 – terceiro e primeiro quartis, respectivamente.
• P90 e P10 – nonagésimo e décimo percentis, respectivamente.
• Se K = 0,263 então a curva da distribuição é mesocúrtica (achatamento normal).
• Se K > 0,263 então a curva da distribuição é platicúrtica (mais achatada).
• Se K < 0,263 então a curva da distribuição é leptocúrtica (mais alongada).
Agora que você sabe o que são e para que servem os percentis, quartis e decis, é preciso apresentar a você a média, a mediana e a moda.
Média:
Média aritmética simples por definição é a soma de todos os valores xi observados (dados isolados) dividida pelo número de observações:
n
xx
n
1ii∑
==
LEITURAOBRIGATÓRIA
35
Exemplo: calcule a média aritmética simples do seguinte conjunto de valores: 7, 14, e 21.
Nesse caso: 4 13
1 24 17=
++=x
Por definição, para dados agrupados, a média será dada pela soma do produto dos valores observados pela frequência absoluta com que estes ocorrem, dividida pela soma das frequências absolutas da distribuição, ou seja:
∑
∑
=
== n
1ii
n
1iii
f
xfx
Exemplo: dada a tabela de distribuição a seguir:
ix 11 8 10 12
if 1 4 3 2
Calcule a média aritmética simples:
71 17 7
1 14 20 32 11 1
23422*2 13*0 14*81*1 1
1
1 ==+++
=+++
+++==
∑
∑
=
=n
ii
n
iii
f
xfx
Por definição, para dados agrupados em intervalos de classe, deve-se considerar xi o ponto médio do intervalo de classe.
Propriedades da média:
1) A média de uma constante é a própria constante.
2) Multiplicando uma variável aleatória x por uma constante, sua média ficará multiplicada por esta constante.
3) A média da soma ou da diferença de duas variáveis aleatórias é a soma ou a diferença das médias.
4) Somando ou subtraindo uma constante a uma variável aleatória, a sua média ficará somada ou subtraída da mesma constante.
5) A média do produto de duas variáveis aleatórias independentes é o produto das médias.
LEITURAOBRIGATÓRIA
36
Mediana:
Por definição:
1. Em uma série de n-observações ordenada de forma crescente, a mediana é o valor da observação que divide essa série em duas metades iguais: uma delas com valores inferiores e outra com valores superiores ao valor da mediana.
2. Se a série possuir um número par de termos (ou observações), não existirá um termo central, logo, para calcular o valor da mediana, basta dividir por dois o valor da soma dos termos centrais.
Moda:
Por definição, moda (ou modo) é o valor que mais aparece ou o de maior frequência simples (absoluta ou relativa) numa distribuição de frequência. A moda pode não existir, e, existindo, pode não ser única.
Uma distribuição pode ser:
• Amodal (quando não existe moda).
• Unimodal (uma só moda).
• Bimodal (quando tem duas modas).
• Multimodal (tem várias modas).
Diferenças entre média, mediana e moda:
Medida Vantagens Desvantagens
MédiaReflete cada valor
observado na distribuiçãoÉ influenciada por valores
extremos
MedianaMenos sensível a valores extremos se comparada à
média
Difícil de se determinar para grande quantidade de dados
ModaMaior quantidade de valores concentrados neste ponto
Não se adequa à análise matemática
LEITURAOBRIGATÓRIA
37
O valor da mediana tem de estar em algum ponto localizado entre o valor da média e o valor da moda, podendo ser igual à moda e/ou à média.
Essas três medidas podem definir a assimetria da curva de distribuição de frequência. Então:
Se
Média = Mediana = ModaEntão, a curva
de distribuição é:
Simétrica
Média < Mediana < Moda Assimetria negativa
Média > Mediana > Moda Assimetria positiva
Medidas de Dispersão
Medidas de dispersão são medidas cuja função é avaliar o quanto estão afastados ou concentrados os valores observados numa distribuição de frequência ou de probabilidades.
As principais medidas de dispersão são:
• Amplitude total (ou range).
• Desvio médio absoluto.
• Variância.
• Desvio padrão.
• Coeficiente de variação.
Amplitude total
Por definição, amplitude total é a diferença entre o maior e o menor valor observados, não dando a noção de quanto os valores intermediários estão afastados ou concentrados.
Observe a distribuição A: 2; 3; 4; 13; 18.
A amplitude total de A será: AT = 18 – 2 = 16
A amplitude total diz pouco a respeito de uma série de dados; para melhor avaliá-la, outros conceitos precisam ser agregados ao seu estudo. O primeiro conceito a ser criado é o de desvio, ou seja, a distância que cada um dos valores observados apresenta em relação à média ( xxi − ).
LEITURAOBRIGATÓRIA
38
Distribuição ADesvio
i xixxi −
1 2 2 - 8 = -62 3 3 - 8 = -53 4 4 - 8 = -44 13 13 - 8 = 55 18 18 - 8 = 10Σ 40 0
Observe que o somatório dos desvios em relação à média aritmética é igual a zero. Isso acontecerá em toda série de observações, pois “a soma dos desvios em relação à média aritmética sempre será nula”.
Você, então, deve estar se perguntando: “como avaliar a dispersão entre os valores observados em tal distribuição?”.
Uma das formas de resolver este problema é calculando a variância.
Variância:
Por definição, a variância é o somatório dos quadrados dos desvios dividido pelo número de observações (se população) ou número de observações menos um (se amostra).
No exemplo considerado:
Distribuição AValores dos desvios elevados
ao quadrado
i xixxi −
1 2 2 - 8 = -6 = 362 3 3 - 8 = -5 = 253 4 4 - 8 = -4 = 164 13 13 - 8 =5 = 255 18 18 - 8 = 10 = 100Σ 40 202
LEITURAOBRIGATÓRIA
39
Valor obtido para a variância ( 2σ ):
4,0 45
202
2
12 ==−
=∑=
n
xxn
ii
Aσ
Lembre-se sempre de que, se houver uma distribuição para dados agrupados, você terá de multiplicar o quadrado de cada desvio pela respectiva frequência, fazendo a seguir a divisão pela soma das frequências. E, se os dados se apresentarem em intervalos de classe, será o ponto médio do intervalo de classe. Assim, a fórmula para cálculo da variância será:
∑
∑
=
=
−
=σ n
1ii
i
2n
1ii
2
F
F*xx
Para dados agrupados, considera-se a frequência no cálculo da variância, e quando os dados se apresentarem em intervalos de classe, xi será o ponto médio do intervalo de classe. Logo, a fórmula será:
• Para a variância populacional: n
SQD2 =σ
• Para a variância amostral: 1n
SQD2−
=σ
Desvio Padrão
Por definição, o desvio padrão é a raiz quadrada positiva da variância, isto é, 2σ=σ é o
desvio padrão para a população e 2ss = é o desvio padrão para uma amostra.
No exemplo dado, teremos: 6 3,64,0 4 ==Aσ
Coeficiente de Variação
Por definição, coeficiente de variação é expresso como o resultado da divisão do desvio padrão pela média. Corresponde a uma medida relativa de dispersão, útil para a comparação (em termos relativos) do grau de concentração em torno da média de séries distintas. Essa medida serve para avaliar a homogeneidade de séries estatísticas e pode ser expressa na forma unitária ou percentual.
LEITURAOBRIGATÓRIA
40
Retornando ao nosso exemplo:
%5,9 78
6 3,6 ==Avc
Utilizar-se-á como referência neste caderno a tabela para Coeficientes de Variação, de Jairo Simon da Fonseca e José Afonso Mazzon1.
1 Disponível na internet para consulta no seguinte site: <http://www.google.com.br/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0CEUQFjAD&url=http%3A%2F%2Fwww.rausp.usp.br%2Fdownload.asp%3Ffile%3D1201017.pdf&ei=TgYdU6nPA8SrkAfW8oGIBg&usg=AFQjCNFmRlUxGd2cG7vvNRscpYuQ9t0whQ&sig2=oL4N-psJGAB8UloClSJBUw&bvm=bv.62578216,d.eW0>. Acesso em: 10 mar. 2014.
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: resolva exercícios a respeito de medidas de tendência central e medidas de dispersão e consulte a resolução comentada.
Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no PAÍS e consultar a resolução comentada.
LEITURAOBRIGATÓRIA
41
LINKSIMPORTANTESAcesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
Acesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
VídeosAssista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
42
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
Um produto subiu de R$ 35,00 para R$ 40,00 no primeiro mês e de R$ 40,00 para R$ 52,00 no segundo mês. Qual o crescimento mensal médio, em reais, desse produto?
Questão 2:
Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A média das idades observadas, em anos, é igual a:
a) 35,18.
b) 35,12.
c) 37,12.
d) 40,13.
e) 42,15.
Questão 3:
Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A mediana das idades observadas, em anos, é igual a:
AGORAÉASUAVEZ
43
a) 36.
b) 38.
c) 40.
d) 42.
e) 44.
Questão 4:
Determinada empresa observou que seus funcionários gastam em média 6 horas por semana cuidando de seus e-mails pesso-ais durante o dia de trabalho. O desvio pa-drão observado foi de 4 horas semanais. Com base nas informações da situação hipotética anteriormente descrita, pode-se afirmar que o coeficiente de variação, de acordo com a classificação, é:
a) Baixo, próximo de zero.
b) Baixo, próximo de 15%.
c) Mediano, próximo de 15%.
d) Mediano, próximo de 30%.
e) Alto, acima de 50%.
Questão 5:
Num grupo de 16 alunos, as notas das pro-vas de Estatística foram todas iguais ou superiores a sete pontos. A mediana das notas do grupo é igual a 8,0 e a média 8,2.
Afirmação I: nessas condições, pode-se afirmar que a maior parte das notas foi in-ferior a 8,0.
Afirmação II: nessas condições, pode-se afirmar que a maior parte das notas foi su-perior a 8,0.
a) Somente a afirmação I está correta.
b) Somente a afirmação II está correta.
c) Ambas as afirmações estão corretas.
d) Ambas as afirmações estão erradas.
e) As informações se complementam.
Questão 6:
Calcule a média aritmética entre: 10, 15, 16, 23, 49, 50 e 60.
Texto para as questões 7 a 10:
Ao entrevistar um grupo de alunos, obtêm-se as seguintes respostas a respeito de suas idades:
20 21 22 20 22
23 25 20 25 24
20 24 25 23 23
22 21 22 20 25
Com bases nesses dados, calcule o que se pede nos exercícios seguintes.
AGORAÉASUAVEZ
44
Questão 7:
Calcule a idade média dos alunos e a me-diana entre as idades.
Questão 8:
Identifique a moda entre as idades dos alunos.
Questão 9:
Calcule a variância e o desvio padrão entre os dados apresentados.
Questão 10:
Calcule o coeficiente de variação e analise o resultado.
AGORAÉASUAVEZ
Neste tema, você aprendeu a trabalhar com medidas importantes para a estatística descritiva: medidas de tendência central e medidas de dispersão. Dê especial atenção ao cálculo da média e do desvio padrão. Observe também que essas medidas são aplicáveis para dados quantitativos. Dados qualitativos – expressos em categorias – não permitem tal cálculo; para estes, a única medida que se aplica é a observação da moda.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
FINALIZANDO
45
CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. In: PPGA, UFRGS, 16, Porto Alegre, 1997.
FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
KOTLER, P. Administração de Marketing: Análise, planejamento, implementação e contro-le. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124.
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
REFERÊNCIAS
46
Dispersão: proximidade ou distanciamento observado em um conjunto de dados numéricos.
Homogêneo: grupo que apresenta características comuns, por exemplo, notas próximas no caso de uma avaliação.
Heterogêneo: grupo que apresenta características distintas, por exemplo, notas distantes no caso de uma avaliação.
Série: conjunto de dados.
SQD: soma dos quadrados dos desvios.
Questão 1
Resposta: Os aumentos foram de R$ 5,00 e R$ 12,00, portanto houve um aumento total de R$ 17,00. Dividindo R$ 17,00 por 2 (= número de aumentos) você obterá R$ 8,50.
Questão 2
Resposta: Alternativa C.
Questão 3
Resposta: Alternativa A.
GLOSSÁRIO
GABARITO
47
Questão 4
Resposta: Alternativa E.
Questão 5
Resposta: Alternativa B.
Questão 6
Resposta: Substituindo os valores na fórmula da média:
6 8,1 37
2236
0 60 59 43 26 15 10 1≅=
++++++=x
Questão 7
Resposta: Calculando a média e a mediana:
Média: 5 3,2 20 2
4*5 22*4 23*3 24*2 22*1 25*0 2=
+++++=x
Mediana: 2 22
2 22 2=
+=med
Questão 8
Resposta: Lembrando que ela corresponde ao valor mais repetido, a moda entre as idades do grupo estudado é 20 anos.
Questão 9
Resposta: Para calcular o desvio padrão, é necessário, antes, calcular a variância:
ix x )xx( i −2
i )xx( −
20 22,35 -2,35 5,5225
20 22,35 -2,35 5,5225
20 22,35 -2,35 5,5225
20 22,35 -2,35 5,5225
20 22,35 -2,35 5,5225
21 22,35 -1,35 1,8225
GABARITO
48
ix x )xx( i −2
i )xx( −
21 22,35 -1,35 1,8225
22 22,35 -0,35 0,1225
22 22,35 -0,35 0,1225
22 22,35 -0,35 0,1225
22 22,35 -0,35 0,1225
23 22,35 0,65 0,4225
23 22,35 0,65 0,4225
23 22,35 0,65 0,4225
24 22,35 1,65 2,7225
24 22,35 1,65 2,7225
25 22,35 2,65 7,0225
25 22,35 2,65 7,0225
25 22,35 2,65 7,0225
25 22,35 2,65 7,0225
66,55
Cálculo da variância: 0 5,39 1
5 2,6 62 ==σ
Cálculo do desvio padrão: 7 8,10 5,3 ==σ
Questão 10
Resposta: Calculando o desvio padrão, tem-se:
%7 3,8100*5 3,2 2
7 8,1 ==vc
O coeficiente de variação é baixo, indicando que os dados são bem agrupados, isto é, próximos da média.
GABARITO
seções
Tema 03Assimetria e Curtose
SeçõesSeções
Tema 03Assimetria e Curtose
53
Conteúdo
Nessa aula você estudará:
• O conceito de simetria e sua importância para a estatística.
• Gráfico em forma de sino (curva normal).
• Afastamentos do centro de simetria (grau de simetria).
• Grau de assimetria.
CONTEÚDOSEHABILIDADES
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
54
CONTEÚDOSEHABILIDADESHabilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é e para que serve o conceito de simetria?
• Construção do gráfico – curva normal?
• O que é e para que serve a assimetria?
• O que é e para que serve a medida denominada curtose?
CONTEÚDOSEHABILIDADES
Assimetria e Curtose
Para um conjunto de dados que esteja sendo analisado, além dos gráficos que você já estudou (histograma, polígono de frequência e ogiva), outro tipo de curva que pode ser elaborado recebe o nome de curva de frequência ou curva polida.
Os estudiosos em estatística costumam dizer que o polígono de frequência determina ou mostra ao leitor (pesquisador) a imagem real do fenômeno estudado, ao passo que a curva de frequência demonstra a tendência do estudo em elaboração.
Crespo (2009) é muito feliz quando afirma que depois do traçado de um polígono de frequência, é desejável, muitas vezes, que se lhe faça um polimento, a fim de mostrar o que seria tal polígono com um número maior de dados. Ao resultado deste “polimento” chama-se curva polida, isto é, a curva polida é a resultante de um grande número de dados, sem os vértices da linha poligonal.
Para que o “polimento” ocorra, é preciso que a partir das frequências reais seja elaborada uma tabela de frequências calculadas. A fórmula que você deve utilizar para esse fim é:
LEITURAOBRIGATÓRIA
55
LEITURAOBRIGATÓRIALEITURAOBRIGATÓRIA
42
c f 11i
+− ++= iii fff em que:
fci é a frequência considerada da classe calculada.
fi é a frequência simples da classe considerada.
fi-1 é a frequência simples da classe anterior à classe considerada.
fi+1 é a frequência simples da classe posterior à classe considerada.
Para que você compreenda bem, retornemos a um exemplo estudado na aula número 1 deste caderno. Trata-se das idades dos alunos de Ivonete. A tabela obtida naquela ocasião dizia:
I Idade fi fci
1 18 ι— 22 02 4,0
2 22 ι— 26 12 7,5
3 26 ι— 30 04 7,3
4 30 ι— 34 09 7,3
5 34 ι— 38 07 6,3
6 38 ι— 42 02 3,8
7 42 ι— 46 04 2,5
Total 40
Como obter a frequência calculada:
446 1
42 12*20
42c f 11
i ==++
=++
= +− iii fff
Calcule os demais elementos da tabela para ter certeza a respeito dos valores apresentados a você.
56
Os gráficos seriam:
Pontos médios em destaque Curva polida
A linha azul representa o polígono de frequências.
A linha vermelha mostra a curva polida que aproxima os dados apresentados no polígono de frequência.
Observe que não se trata de uma curva “centralizada” no plano cartesiano. Ela é deslocada para o lado esquerdo de quem lê a figura. Por esse motivo dizemos que ela é uma figura assimétrica.
Para relembrar o que é simetria, pense numa parábola. Uma parábola é simétrica pelo vértice, isto é, suas “metades” (consideradas em torno do vértice) são iguais. Veja a figura seguinte:
Figura 3.1: Parábola
Fonte: Elaboração da autora.
LEITURAOBRIGATÓRIA
57
Simetria é uma propriedade geométrica dos elementos, contudo para a Estatística, assimetria nada mais é do que o grau de desvio (afastamento da simetria) de uma distribuição de dados.
Para distribuições assimétricas, a média tende a situar-se do mesmo lado da moda (na cauda mais longa). Observe com muita atenção as seguintes figuras:
Figura 3.2: Distribuição Assimétrica à Direita (ou Assimetria Positiva)
Fonte: Elaboração da autora.
Figura 3.3: Distribuição Assimétrica à Esquerda (ou Assimetria Negativa)
Fonte: Elaboração da autora.
Figura 3.4: Distribuição Simétrica
Fonte: Elaboração da autora.
LEITURAOBRIGATÓRIA
58
Uma medida de assimetria é proporcionada pela diferença entre a média e a moda. Ela pode ser tomada sem dimensão por meio de uma divisão por uma medida de dispersão, como o desvio padrão.
Veja:
s)amodx(*3assimetria −
= (coeficiente de assimetria de Pearson)
No exemplo das idades dos alunos de Ivonete, a assimetria seria dada por:
Cálculo da média:
9,0 30 4
236.10 4
4*4 42*0 47*6 39*2 34*8 22 1*4 22*0 2
==
++++++=
x
x
9,0 30 4
236.10 4
4*4 42*0 47*6 39*2 34*8 22 1*4 22*0 2
==
++++++=
x
x
Cálculo da variância e do desvio padrão:
I Idade fi xi fi * xi fi * xi2
1 18 ι— 22 02 20 40 800
2 22 ι— 26 12 24 288 6.912
3 26 ι— 30 04 28 112 3.136
4 30 ι— 34 09 32 288 9.216
5 34 ι— 38 07 36 252 9.072
6 38 ι— 42 02 40 80 3.200
7 42 ι— 46 04 44 176 7.744
Total: 40 1.236 40.080
7 8,60 4
236.10 4080.0 4 2
=
−=σ
Portanto, 1 0,37 8,6
)4 29,0 3(*3≅
−=assimetria
LEITURAOBRIGATÓRIA
59
Em capítulo anterior, você verificou que o valor da mediana (que ocupa a posição central numa distribuição de frequência) deve estar em algum ponto entre o valor da média e o valor da moda, porém, pode ser igual à moda e/ou à média.
Você já sabe que com essas três medidas de posição, você pode determinar a assimetria da curva de distribuição de frequência. Também sabe que três casos podem ocorrer (ilustrados nas figuras anteriores):
• Média = Mediana = Moda: distribuição simétrica.
• Média < Mediana < Moda: distribuição assimétrica negativa.
• Média > Mediana > Moda: distribuição assimétrica positiva.
No exemplo de Ivonete: moda = 24; mediana = 30,89 e média = 30,9 de onde se pode concluir que a distribuição de frequência é assimétrica positiva.
Curtose
Ao desenhar um gráfico, a curva pode ser mais ampla ou mais compacta assim como pode ser mais alongada ou mais achatada. Interessa à estatística estudar o quanto uma curva poder ser alongada.
Curtose é, então, o grau de achatamento de uma distribuição, e é considerado muitas vezes em relação a uma distribuição normal.
Em tema anterior, quando o texto referiu-se ao estudo dos quartis, você aprendeu que conhecendo os valores dos quartis e dos percentis, pode-se determinar o coeficiente de curtose, que dá o grau de achatamento da curva de uma distribuição, por meio da seguinte fórmula:
)(*2 0 10 9
13
PPQQk−
−=
Em que: k = coeficiente de curtose; Q3 e Q1 terceiro e primeiro quartis, respectivamente; P90 e P10 nonagésimo e décimo percentis, respectivamente.
Se K = 0,263, então podemos dizer que a curva da distribuição é mesocúrtica (achatamento normal).
Se K > 0,263, então podemos dizer que a curva da distribuição é platicúrtica (mais achatada).
Se K < 0,263, então podemos dizer que a curva da distribuição é leptocúrtica (mais alongada).
LEITURAOBRIGATÓRIA
60
Graficamente:
Para desenhar a curva normal (curva em formato de sino), a equação utilizada é:
σµ−
−
πσ=
2x*5,0
e2*
1y em que:
y representa a ordenada (altura da curva para um determinado valor da variável x);
e = 2,71828 (base do logaritmo neperiano).
π = 3,1416.
µ = representa a média da população.
σ = representa o desvio padrão.
O gráfico (curva normal) dos valores recolhidos por Ivonete ficaria assim
LEITURAOBRIGATÓRIA
61
Para calcular a curtose dos dados referentes às idades de seus alunos, Ivonete deveria seguir os passos descritos a seguir:
(1) Calcular os valores do primeiro e do terceiro quartis, que, no caso de dados agrupados, ficariam assim:
3,2 37
4*)7 20 3(4 3
0 34
1204
*3
4,4 29
4*)8 10 1(8 2
0 140 4
4
3
1
=−
+=
==
=−
+=
==
∑
∑
Q
f
Q
f
i
i
3,2 37
4*)7 20 3(4 3
0 34
1204
*3
4,4 29
4*)8 10 1(8 2
0 140 4
4
3
1
=−
+=
==
=−
+=
==
∑
∑
Q
f
Q
f
i
i
3,2 37
4*)7 20 3(4 3
0 34
1204
*3
4,4 29
4*)8 10 1(8 2
0 140 4
4
3
1
=−
+=
==
=−
+=
==
∑
∑
Q
f
Q
f
i
i
3,2 37
4*)7 20 3(4 3
0 34
1204
*3
4,4 29
4*)8 10 1(8 2
0 140 4
4
3
1
=−
+=
==
=−
+=
==
∑
∑
Q
f
Q
f
i
i
(2) Calcular os valores do décimo e do nonagésimo percentis que, no caso de dados agrupados, ficariam assim:
1,9 37
4*)7 26 3(4 3
6 3100
0 4*0 9100*0 9
8,1 29
4*)8 14(8 2
40 10 4
100*0 1
0 9
0 1
=−
+=
==
=−
+=
==
∑
∑
P
f
P
f
i
i
1,9 37
4*)7 26 3(4 3
6 3100
0 4*0 9100*0 9
8,1 29
4*)8 14(8 2
40 10 4
100*0 1
0 9
0 1
=−
+=
==
=−
+=
==
∑
∑
P
f
P
f
i
i
1,9 37
4*)7 26 3(4 3
6 3100
0 4*0 9100*0 9
8,1 29
4*)8 14(8 2
40 10 4
100*0 1
0 9
0 1
=−
+=
==
=−
+=
==
∑
∑
P
f
P
f
i
i
1,9 37
4*)7 26 3(4 3
6 3100
0 4*0 9100*0 9
8,1 29
4*)8 14(8 2
40 10 4
100*0 1
0 9
0 1
=−
+=
==
=−
+=
==
∑
∑
P
f
P
f
i
i
(3) Por último, calcular o coeficiente de curtose:
228,0)8,1 21,9 3(*2
4,4 23,2 3)(*2 0 10 9
13 =−
−=
−−
=PP
QQk
Observe que, como 0,228 < 0,263, a curva obtida por Ivonete é leptocúrtica.
Busque, no Livro-Texto, mais exemplos como este discutido no caderno e, em seguida, resolva os exercícios propostos a você.
LEITURAOBRIGATÓRIA
62
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
63
LINKSIMPORTANTESAcesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>.
Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução
comentada.
Vídeos
Assista aos vídeos com exercícios comentados e disponíveis no endereço a seguir a respeito
de confecção de gráficos. Eles, certamente, esclarecerão muitas de suas dúvidas, inclusive
a respeito de como confeccioná-los.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/
Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-
desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível, uma vez que se trata
de produção da Editora Abril Cultural voltada para o público que prestará o Enem.
64
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
Em seguida serão apresentadas a média e a moda de três diferentes distribuições de frequência. Determine o tipo de assimetria de cada uma delas e explique o significado de assimetria.
Distribuição Média Moda
A 52 52
B 45 50
C 48 46
Texto para as questões de 2 a 4:
Observe os dados apresentados na distri-buição de frequência em seguida:
Pontos de um teste
Pessoas que acertaram
4 ι— 8 10
8 ι— 12 25
12 ι— 16 35
16 ι— 20 40
20 ι— 24 25
24 ι— 28 10
28 ι— 32 5
Questão 2:
Nesse caso, o valor 16,5 (pontos no teste) é:
a) A mediana.
b) A média aritmética.
AGORAÉASUAVEZ
65
c) A moda.
d) A variância.
e) O desvio padrão.
Questão 3:
Qual o percentual de valores que se locali-za entre o último quartil e o P81?
a) 6
b) 19
c) 56
d) 77
e) 81
Questão 4:
O sexagésimo percentil divide a área de uma distribuição em quantas partes?
a) 2
b) 6
c) 40
d) 60
e) 100
Questão 5:
Se numa distribuição há 500 valores, então entre o segundo quartil e o quinquagésimo percentil quantos valores haverá?
a) 7
b) 13
c) 42
d) 48
e) Não haverá valores.
Texto para as questões 6 e 7:
Em uma distribuição de frequências foram encontradas as seguintes medidas:
• Média = 343,18.
• Moda = 27,50.
• Mediana = 31,67.
• Desvio padrão = 12,45.
Nessas condições, calcule o que pedem os exercícios 6 e 7.
Questão 6:
Classifique o tipo de assimetria.
Questão 7:
Calcule o coeficiente de assimetria.
AGORAÉASUAVEZ
66
AGORAÉASUAVEZQuestão 8:
Considere a distribuição de frequências re-lativa às massas corporais (aos pesos) de cem operários de uma fábrica:
Massa (kg) No de operários50 58 10
58 66 15
66 74 25
74 82 24
82 90 16
90 98 10
Determine o grau de assimetria.
Texto para as questões 9 e 10:
Considere as seguintes medidas, relativas a três distribuições de frequências:
Distribuições Q1 Q2 P10 P90
A 814 935 772 1.012
B 63,7 80,3 55,0 86,6
C 28,8 45,6 20,5 49,8
Questão 9:
Calcule os respectivos graus de curtose.
Questão 10:
Classifique cada uma das distribuições em relação à curva normal.
67
Neste tema, você conheceu as definições de assimetria e curtose e sua utilidade. Aprendeu, principalmente, que estes elementos ampliam sua percepção acerca de uma série de dados estatísticos.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M.V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.
FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
FINALIZANDO
REFERÊNCIAS
68
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p. 124.
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
REFERÊNCIAS
GLOSSÁRIO
Amostra: subconjunto da população.
Assimetria: condição da figura que não é simétrica.
Coeficiente: número que multiplica uma variável ou incógnita.
Curtose: grau de achatamento de uma curva.
Grau: medida, referência.
Simetria: condição da figura cujas partes são espelhos umas das outras.
69
GABARITO
Questão 1
Resposta: Observando os detalhes da tabela, você deverá obter a seguinte a análise: simétrica; assimétrica negativa e assimétrica positiva.
Questão 2
Resposta: Alternativa A.
Questão 3
Resposta: Alternativa A.
Questão 4
Resposta: Alternativa A.
Questão 5
Resposta: Alternativa A.
Questão 6
Resposta: Aplicando corretamente as fórmulas, você deverá obter: assimetria positiva.
Questão 7
Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,364.
Questão 8
Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,021.
Questão 9
Resposta: Aplicando corretamente as fórmulas, você deverá obter: (A) 0,2532, (B) 0,263 e (C) 0,287.
Questão 10
Resposta: Analisando o posicionamento das curvas, você deverá obter: (A) leptocúrtica, (B) mesocúrtica e (C) platicúrtica.
seções
Tema 04Probabilidade
SeçõesSeções
Tema 04Probabilidade
73
Conteúdo
Nessa aula você estudará:
• A definição geral de probabilidade e os conceitos elementares de probabilidade.
• A utilidade da probabilidade.
• As fórmulas para calcular os diferentes tipos de probabilidades.
CONTEÚDOSEHABILIDADES
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
74
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é e para que serve a teoria das probabilidades?
• O que são e para que servem os diferentes tipos de eventos?
• Por que a probabilidade é medida em porcentagem?
• Qual a importância da probabilidade no mundo atual?
CONTEÚDOSEHABILIDADES
Probabilidade
Existem diferentes formas de se definir probabilidade.
Pode-se definir probabilidade a partir da frequência relativa (uma frequência relativa é uma estimativa de probabilidade).
Então, probabilidade é uma proporção em uma sequência muito grande de experimentos (FREITAS, 2003).
Segundo Paccola e Bianchini (1989, p. 143): “Um experimento que pode apresentar resultados diferentes, quando repetido nas mesmas condições, é chamado experimento aleatório. Chamamos de espaço amostral ao conjunto de todos os resultados possíveis de um experimento aleatório”.
O exemplo mais comum de experimento aleatório é o jogo de um dado não viciado; nesse caso, ao se jogar o dado, poderá ocorrer na face superior qualquer um dos números 1 a 6.
LEITURAOBRIGATÓRIA
75
LEITURAOBRIGATÓRIAEntão, o espaço amostral (representado por S) será dado por:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
Outro exemplo comum é o lançamento de uma moeda:
S = {cara, coroa}
n(S) = 2
Sobre o assunto, Paccola e Bianchini (1989, p. 144) dizem:
Chama-se evento (E)1 a qualquer subconjunto de um espaço amostral. Evento Elementar é aquele que possui um único elemento [...] Evento impossível é aquele que não possui nenhum elemento [...] Evento Certo é aquele que possui todos os elementos do espaço amostral [...] Evento complementar é o evento formado pelos elementos de S que não pertencem a E. O evento complementar é indicado por E .
Veja os exemplos:
No lançamento de uma moeda, os eventos possíveis de ocorrer são ou cara ou coroa. Dizer “as faces que não são cara” determina um evento elementar: coroa (se não é cara só pode ser coroa).
Se fosse escolhida a face 12 de uma moeda, observa-se um evento impossível uma vez que não existe moeda com um a face 12.
No caso da moeda, o exemplo de evento certo seria: sai cara ou sai coroa.
Já o evento complementar seria: se saiu cara, o evento complementar seria sair coroa e vice-versa.
De forma geral, todos os autores concordam que num experimento aleatório, sendo S um espaço equiprovável (espaço amostral onde todos os eventos têm a mesma chance de ocorrer), a probabilidade de ocorrer um evento (E) qualquer será dada por:
)S(n)E(n)E(p =
1 (E ) inclusão do símbolo no texto original realizado pela autora do caderno.
76
Propriedades:
Se E = (100%) 1 p(E) então S E Se(0%) 0 p(E) então E Se
===φ= então p(E) = 0 (0%)
Se E = S então p(E) = 1 (100%)
Em outras palavras, a probabilidade de ocorrer um evento qualquer E é dada por:
100%. p(E) % 0u o
1 p(E) 0
≤≤
≤≤
No exemplo das moedas, a probabilidade de ocorrer a face “cara” no lançamento de uma moeda é dada por:
S = {cara, coroa} → n(S) = 2
E = {cara} → n(E) = 1
%0 55,021
)()()(
1)(}{2)(},{
====
=⇒==⇒=
SnEnEp
EncaraESncoroacaraS
Também são pontos pacíficos entre os diversos autores as seguintes definições:
A probabilidade da união de dois eventos A e B é igual à soma das probabilidades desses eventos menos a probabilidade da intersecção de A com B, isto é
) B p(A -p(B) p(A) ) Bp(A +=
A soma da probabilidade de ocorrer um evento A com a probabilidade de não ocorrer o evento A (ocorrer o complementar de A) será sempre igual a 1, ou seja, 1)A( p p(A) =+
Veja os exemplos:
No lançamento de um dado, qual é a probabilidade de se obter o número 3 ou um número ímpar? (BIANCHINI ; PACCOLA, 1989, p. 147).
LEITURAOBRIGATÓRIA
77
S = {1, 2, 3, 4, 5, 6} → n(S) = 6
A = {3} → n(A) = 1
B = {1, 3, 5} → n(B) = 3
%0 55,021
63
61
63
61) Bp(A
1) Bn(A{3}} 5, 3{1,{3}BA3n(B)5}3,{1,B
1n(A){3}A6n(S)6}5,4,3,2,{1,S
====−+=
=⇒===⇒=
=⇒==⇒=
%0 55,021
63
61
63
61) Bp(A
1) Bn(A{3}} 5, 3{1,{3}BA3n(B)5}3,{1,B
1n(A){3}A6n(S)6}5,4,3,2,{1,S
====−+=
=⇒===⇒=
=⇒==⇒=
Exemplo de probabilidade do evento complementar: uma urna contém 5 bolas brancas,
4 amarelas e 3 verdes. Escolhendo-se duas bolas ao acaso, determine a probabilidade
de que: (a) ambas sejam brancas (b) ambas não sejam brancas (BIANCHINI; PACCOLA,
1989, p. 149).
• Passo 1: calcular de quantas maneiras pode-se escolher duas bolas quaisquer:
6 62
132!0 1* !2
!0 1*1 1*2 1! )22 1!*(2
!2 1)( 2 12 ===
−== CSn
• Passo 2: calcular o número de maneiras de se escolher duas bolas brancas:
%2,5 13 3
56 60 1
)()()(
0 120 2
!3* !2!3*4*5
! )25!*(2!5)( 5
2
====
===−
==
SnAnAp
CAn
%2,5 13 3
56 60 1
)()()(
0 120 2
!3* !2!3*4*5
! )25!*(2!5)( 5
2
====
===−
==
SnAnAp
CAn
• Passo 3: calcular o número de maneiras de se escolher duas bolas que não sejam
brancas:
%8,4 8152,01)(1)( =−=−= ApAp
LEITURAOBRIGATÓRIA
78
Em Bianchini e Paccola (1989, p. 150) encontram-se o exemplo e a definição:
No sorteio de um número natural e 1 a 10, alguém aposta que vai sair um múltiplo de 3. A probabilidade de acerto é, pois, a de ocorrer o evento A = {3, 6, 9}, ou seja, 0 1
3)( =Ap . Para causar suspense, a pessoa que realiza o sorteio anuncia que o número sorteado é ímpar. Constitui-se assim o evento B = {1, 3, 5, 7, 9}. Após essa informação, a probabilidade de acertos passou a ser a de ocorrer o evento }9,3{BA =∩ , tendo agora como espaço amostral o conjunto B.
Indicando a probabilidade de ocorrer o evento A tendo ocorrido o evento B por P(A/B) (Lê-se P de A dado B), ter-se-á:
)0)B(n()B(n
)BA(n)B/A(P >∩
=
Nesse caso:
52
)B(n)BA(n)B/A(P =
∩=
A esse tipo de probabilidade, em que ocorre um evento A tendo ocorrido um evento B, dá-se o nome de probabilidade condicional de A dado B.
Mais um exemplo, também de Bianchini e Paccola (1989, p. 150): No lançamento de dois dados, a soma dos pontos obtidos resultou em 5. Qual a probabilidade de um desses dados ter apresentado o número 2?
Para resolver o exercício:
O evento B “soma dos pontos obtidos resultou em 5” é:
B = {(1, 4); (2, 3); (3, 2); (4, 1)}
O evento BA ∩ “dar a soma 5 e um dos dados apresentar o número 2” é:
BA ∩ = {(2, 3); (3, 2)}
Nessas condições:
%0 521
)()()/( ==
∩=
BnBAnBAP
LEITURAOBRIGATÓRIA
79
Os matemáticos também concordam com a definição de que a probabilidade da intersecção de dois eventos A e B é igual à probabilidade de A multiplicada pela probabilidade condicional de B, dado A, isto é:
)A/B(p*)A(p)BA(p =∩
Veja o exemplo de Bianchini e Paccola (1989, p. 151):
Retira-se ao acaso uma bola de uma urna que contém 6 bolas brancas numeradas de 1 a 6 e 4 bolas amarelas numeradas de 7 a 10. Se a bola retirada é branca, qual é a probabilidade de ter saído um número par?
Solução:
O número de elementos do espaço amostral é n(S) = 10.
Indicando por A o evento “retirar uma bola branca” e por B “retirar uma bola com número par”, é evidente que desejamos calcular )BA(p ∩ , ou seja, a probabilidade de retirar uma bola branca com um número par. Temos:
53
0 16)( ==Ap
21
63
)A(n)BA(n)A/B(P ==
∩=
Logo, 0 13
21*
53)/(*)()( ===∩ ABpApBAp
Dois eventos são ditos independentes quando o fato de ocorrer um deles não influi na possibilidade de ocorrência do outro. Se A e B são eventos independentes, pode-se dizer que:
)B(p*)A(p)BA(p)A/B(P*)A(P)BA(p
=∩=∩
Os exemplos são de Bianchini e Paccola (1989, p. 152-153):
Exemplo 1
Uma urna contém 6 bolas brancas e 4 bolas pretas. Retirando-se sucessivamente duas bolas ao acaso, com reposição da primeira, qual é a probabilidade de ambas serem brancas?
Solução:
Como a 1ª bola retirada foi recolocada na urna, os eventos A e B tornam-se independentes, pois o evento “retirar uma bola branca na 2ª vez” não depende do que ocorreu na 1ª retirada.
Assim temos: %6 3100
6 30 16*
0 16)(*)()( ====∩ BpApBAp
LEITURAOBRIGATÓRIA
80
Exemplo 2:
Lançando-se um dado três vezes, qual é a probabilidade de se obter:
a) O número 4 somente no terceiro lançamento?
b) Somente uma vez o número 4?
Solução:
A probabilidade de se obter o número 4 no primeiro lançamento é 61
. Então a probabilidade de não se obter o número 4 no primeiro lançamento é 6
5611 =− .
A probabilidade de se obter o número 4 no primeiro lançamento também é 61
. Então a probabilidade de não se obter o número 4 no primeiro lançamento é
65
611 =− .
A probabilidade de se obter o número 4 no primeiro lançamento também é 61
. Então, a probabilidade do número 4 ocorrer somente no terceiro lançamento é:
2165 2
61*
65*
65
==p
O número 4 será obtido somente ou no primeiro ou no segundo ou no terceiro lançamento. Então, a probabilidade será igual a três vezes a probabilidade anterior:
2 75 2
2165 2*3 ==p
Pra finalizar, dois ou mais eventos são mutuamente exclusivos quando a realização de um excluía a realização de outro(s). Se os eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de ocorrência de cada evento em estudo: p = p1 + p2.
No exemplo da moeda, os eventos “cara” e “coroa” são mutuamente exclusivos.
No exemplo dos dados, a probabilidade de se tirar a face 2 ou a face 5 é de:
%3,3 331
62
61
61
===+=p
LEITURAOBRIGATÓRIA
81
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:SitesTeste os seus conhecimentos: resolva exercícios de estatística e consulte a resolução comentada.Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
82
LINKSIMPORTANTESVídeosAssista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
Qual a probabilidade de sair um Ás de paus quando se retira uma carta de um baralho de 52 cartas?
Questão 2:
(FUVEST/SP – adaptada) No jogo da sena, seis números distintos são sorteados en-tre os números 1 e 50 (inclusive). A pro-babilidade de que, numa extração, os seis números sorteados sejam ímpares é de (aproximadamente):
AGORAÉASUAVEZ
83
a) 50%
b) 25%
c) 10%
d) 5%
e) 1%
Questão 3:
Lançando-se simultaneamente dois da-dos (não viciados), a probabilidade de que suas faces superiores exibam soma igual a 7 ou 9 é:
a) 61
b) 73
c) 94
d) 1 12
e) 8 15
Questão 4:
Uma urna contém 9 bolas, sendo 4 brancas e 5 pretas. Duas bolas são escolhidas ao acaso, sem reposição e sucessivamente. Calcule a probabilidade de ambas as bolas serem brancas:
a) 61
b) 94
c) 1 80 2
d) 92
e) 1 86 1
Questão 5:
A probabilidade de um casal ter um filho do sexo masculino é de 0,25. Então, a proba-bilidade do casal ter dois filhos de sexos diferentes é de:
a) 6 1
1
b) 83
c) 6 1
9
d) 6 13
e) 43
Texto para as questões 6 e 7:
Em um lote de 12 peças, quatro são de-feituosas. Nessas condições, calcule o que se pede nos dois exercícios seguintes.
AGORAÉASUAVEZ
84
AGORAÉASUAVEZQuestão 6:
Sendo retirada apenas uma peça, calcule a probabilidade de ela (a peça retirada) ser defeituosa.
Questão 7:
Sendo retirada apenas uma peça, calcule a probabilidade de ela (a peça retirada) não ser defeituosa.
Questão 8:
No lançamento de um dado, qual a pro-babilidade de se obter um número não inferior a 5?
Questão 9:
Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.
Questão 10:
Uma urna A contém três bolas brancas, quatro pretas e duas verdes; a urna B con-tém cinco bolas brancas, duas pretas e uma verde; a urna C contém duas bolas brancas, três pretas e quatro verdes. Uma bola é retirada de cada urna. Qual é a pro-babilidade de que as três bolas retiradas da primeira, segunda e terceira urnas sejam branca, preta e verde, respectivamente?
Neste tema, você aprendeu a trabalhar com probabilidade. Dê especial atenção aos termos aqui utilizados porque entender o tipo de eventos que ocorre é metade do caminho andado para resolver problemas propostos. Releia o texto, busque mais informações no Livro-Texto e pela internet.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
FINALIZANDO
85
BIANCHINI, Edwaldo; PACCOLA, Herval. Matemática 2. 1. ed. São Paulo: Moderna, 1989.
CRESPO, Antônio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M.V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.
FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
FREITAS, Corina da Costa et. al. Estatística Curso 1. São José dos Campos: INPE, 2003.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21. Anais... 1997, Rio das Pedras, RJ. p. 124.
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
REFERÊNCIAS
86
GLOSSÁRIO
GABARITO
Espaço amostral: é o conjunto de todos os resultados possíveis de um experimento aleatório.
Espaço equiprovável: é aquele onde todos os eventos têm a mesma chance de ocorrer.
Evento: qualquer subconjunto do espaço amostral.
Experimento aleatório: um experimento que pode apresentar resultados diferentes, quando repetido nas mesmas condições.
Probabilidade: proporção em uma sequência muito grande de experimentos.
Questão 1
Resposta: Em qualquer baralho (não viciado), haverá apenas um Ás de paus, portanto a
probabilidade de encontrá-lo é p = 2 5
1=p .
Questão 2
Resposta: Alternativa E.
Questão 3
Resposta: Alternativa E.
87
Questão 4
Resposta: Alternativa A.
Questão 5
Resposta: Alternativa B.
Questão 6
Resposta: Sendo quatro peças defeituosas em 12, você deverá calcular: %3,3 331
2 14
===p.
Questão 7
Resposta: Sendo oito peças não defeituosas em 12, você deverá calcular:
%6,6 632
313
311 ==
−=−=p
Questão 8
Resposta: A probabilidade de se obter um número não inferior a 5 é a probabilidade de se
obter 5 ou 6, então: %3,3 331
62
61
61
===+=p
Questão 9
Resposta: Nesse caso, a soma deverá ser 10, 11 ou 12. Para que a soma seja 10, a probabilidade será determinada pelo aparecimento de (4, 6) ou (5, 5) ou (6, 4), ou seja:
6 33
0 1 =p
Para que a soma seja 11, a probabilidade será determinada pelo aparecimento de (5, 6) ou
(6, 5), ou seja: 6 3
21 1 =p
Para que a soma seja 12, a probabilidade será determinada pelo aparecimento de (6, 6), ou
seja, 6 3
12 1 =p
Como os eventos apresentados são mutuamente exclusivos, ter-se-á:
%6,6 161
6 36
6 31
6 32
6 33
===++=p
GABARITO
88
Questão 10
Resposta: Considerando as probabilidades de retirada de cada bola, de cada urna, você deverá obter:
94p
41
82p
31
93p
C
B
A
=
==
==
94p
41
82p
31
93p
C
B
A
=
==
==
94p
41
82p
31
93p
C
B
A
=
==
==
Sendo os eventos independentes e simultâneos, você deverá fazer:
7 21
94*
41*
31
==p
GABARITO
seções
Tema 05Análise de Regressão e Correlação
SeçõesSeções
Tema 05Análise de Regressão e Correlação
93
CONTEÚDOSEHABILIDADES
Conteúdo
Nessa aula você estudará:
• O conceito de regressão matemática.
• O conceito de correlação.
• Como efetuar a análise de regressão (regressão linear).
• Como efetuar correlação entre duas variáveis.
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
94
CONTEÚDOSEHABILIDADES
Análise de Regressão
O objetivo da análise de regressão é determinar a relação existente entre uma característica qualquer de interesse experimental, dependente, e outra característica independente, tomadas juntas.
Para entender o que é dependência, veja os exemplos:
1. O médico pediatra tem interesse em definir uma relação funcional entre o peso e a altura de bebês (curva de crescimento).
2. O economista busca estabelecer uma função que explique o comportamento das vendas, em unidades de um produto, considerando o preço pelo qual o produto é vendido.
A matemática, de forma geral, oferece a ferramenta ideal para resolver esse tipo de problema: a “teoria das funções”. Dela, você utilizará dois conceitos fundamentais:
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é e para que serve o conceito de análise de regressão?
• Como se dá a construção do gráfico – regressão?
• O que é e para que serve estabelecer correlação entre variáveis?
• O que é e para que serve um gráfico de correlação?
LEITURAOBRIGATÓRIA
95
LEITURAOBRIGATÓRIAy = variável que interessa estudar e cujo comportamento futuro se pretende prever. Trata-se da variável dependente que existe no modelo (porque o seu valor depende do valor de x).
x = variável que influencia no comportamento de y e define o seu valor.
A estatística oferece meios aos estudiosos de se chegar à relação entre as variáveis y e x: um processo denominado “análise de regressão”.
Diagrama de Dispersão
Uma maneira prática para determinar a relação1 entre as variáveis dependentes e independentes é a construção do gráfico denominado de “diagrama de dispersão”, que pode fornecer uma forma aproximada da regressão. Quando se obtém uma dispersão desordenada de pontos assinalados no gráfico, conclui-se que é difícil determinar a relação entre as características em estudo.
Diagrama de dispersão – sua confecção consiste na plotagem dos pontos obtidos por cálculo ou levantamento, em um sistema de coordenadas cartesianas, que permite uma visualização dos seus posicionamentos, propiciando uma interpretação aproximada do comportamento das variáveis em estudo. Veja o exemplo:
Observe que, no gráfico anterior, os pontos foram distribuídos ao longo de um segmento de reta. A Estatística nos permite determinar que reta é essa.
1 Nesse caso, a expressão matemática que relacionas as variáveis.
96
Determinação da Equação da Reta
Do estudo da função do primeiro grau, sabe-se que a equação geral da reta (gráfico da função de primeiro grau) é y = a + bx.
Para escrever a equação da reta é necessário obter os valores de a e b de tal forma que a reta estabelecida esteja tão próxima quanto possível dos pontos assinalados no “diagrama de dispersão”. Assim, para diminuir as discrepâncias, há necessidade de se ajustar a reta por meio da análise de regressão.
Lembre-se de que a reta ficará determinada quando você conhecer os coeficientes a e b. Para conhecê-los (ou determiná-los), você adotará o método dos mínimos quadrados (MMQ).
Segundo esse método, pode-se avaliar os parâmetros a e b pela aplicação das seguintes fórmulas:
∑ ∑∑ ∑ ∑
−−
=
−=
22 )(* xxn
yxyxnb
exbya
e
∑ ∑∑ ∑ ∑
−−
=
−=
22 )(* xxn
yxyxnb
exbya
Em que n = tamanho da amostra.
Exemplo: Observa-se que um determinado produto tem o seu custo calculado com base na quantidade produzida, conforme a tabela a seguir:
Quantidade (x) 10 12 14 16 18 20
Custos em R$ (y) 100 112 119 130 139 142
Nessas condições, deve-se:
a) Construir o diagrama de dispersão e verificar se há uma relação entre as variáveis.
b) Ajustar uma reta aos dados.
c) Traçar a reta ajustada.
d) Determinar o custo para 22 unidades.
LEITURAOBRIGATÓRIA
97
Para resolver o problema proposto, será necessário esboçar o diagrama, como pede o item (a). Veja:
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25
Para calcular a equação da reta: y + a + bx, conforme solicitado em (b) ter-se-á, inicialmente, que calcular o valor de b, que é dado por:
∑ ∑∑ ∑ ∑
−
−= 22 )(
* xxn
yxyxnb
Em que: n = número de dados.
Σxy – Somatório da multiplicação dos valores de x e y.
Σx – Somatório da variável x.
Σy – Somatório da variável y.
Σx2 – Somatório de cada valor de x elevado ao quadrado.
(Σx)2 – Somatório dos valores de x elevado ao quadrado.
LEITURAOBRIGATÓRIA
98
Para facilitar o cálculo, construiu-se o quadro a seguir:
n x y xy x2
1 10 100 1000 1002 12 112 1344 1443 14 119 1666 1964 16 130 2080 2565 18 139 2502 3246 20 142 2840 400Σ 90 742 11432 1420
Analisando o quadro, você observará que:
n = 6; Σxy = 11.432; Σx = 90; Σy = 742; Σx2 = 1420
Então:
( )1 3,4
4201812
0 9420.1*6742*0 9432.1 1*6
.
2
22
≅=−
−=
−
−=
∑∑∑ ∑∑
b
xxn
yxyxnb
( )1 3,4
4201812
0 9420.1*6742*0 9432.1 1*6
.
2
22
≅=−
−=
−
−=
∑∑∑ ∑∑
b
xxn
yxyxnb
Para calcular o valor do coeficiente “a”:
2 0,9 55 1*1 3,47 6,123
5 160 9
7 6,1236
742
≅−=
===
≅==
−=
∑
∑
aa
nx
x
ny
y
xbya
2 0,9 55 1*1 3,47 6,123
5 160 9
7 6,1236
742
≅−=
===
≅==
−=
∑
∑
aa
nx
x
ny
y
xbya
2 0,9 55 1*1 3,47 6,123
5 160 9
7 6,1236
742
≅−=
===
≅==
−=
∑
∑
aa
nx
x
ny
y
xbya
2 0,9 55 1*1 3,47 6,123
5 160 9
7 6,1236
742
≅−=
===
≅==
−=
∑
∑
aa
nx
x
ny
y
xbya
2 0,9 55 1*1 3,47 6,123
5 160 9
7 6,1236
742
≅−=
===
≅==
−=
∑
∑
aa
nx
x
ny
y
xbya
A equação da reta será: y = 59,02 + 4,31 x.
Conhecendo a equação da reta, pode-se esboçar o gráfico ajustado (a seguir), conforme determina a orientação (c):
LEITURAOBRIGATÓRIA
99
0
20
40
60
80
100
120
140
160
1 2 3 4 5 6
Para finalizar, deve-se responder ao item (d):
y = 59,02 + 4,31 x
Se x = 22, então:
y = 59,02 + 4,31 x
y = 59,02 + 4,31*22
y = 59,02 + 94,82
y = 153,84
Correlação:
Estudar correlação consiste em medir o grau de variação existente entre duas variáveis aleatórias.
A diferença entre regressão e correlação é que na primeira há duas variáveis em que uma é considerada dependente e a outra independente, ao passo que na segunda, as duas variáveis apresentam relação mútua.
Veja, peso e altura de pessoas poderiam ser estudados em correlação – tanto o peso pode depender da altura como esta, do peso.
LEITURAOBRIGATÓRIA
100
Coeficiente de Correlação
Em alguns casos, existe o interesse em se determinar o grau de associação entre as duas variáveis. Essa associação é medida pelo coeficiente de correlação (r), que é determinado pela fórmula:
( ) ( )
−
−
−=
∑∑∑ ∑∑ ∑ ∑
2222 yy*n*xx*n
y*x)y*x(*nr
O valor de r pode variar de –1 a +1, significando, respectivamente, correlação negativa e correlação positiva entre as variáveis. O valor zero indica que não existe correlação. Outros valores intermediários propiciam inferências sobre o comportamento interativo entre as variáveis.
As figuras a seguir apresentam, de forma aproximada, o valor de r em função do comportamento (variação) simulado de duas variáveis distintas.
Veja como calcular o coeficiente de correlação:
Exemplo: observa-se que um determinado produto tem o seu custo calculado com base na quantidade produzida, conforme segue:
Quantidade (x) 10 12 14 16 18 20
Custos em R$ (y) 100 112 119 130 139 142
LEITURAOBRIGATÓRIA
101
Para resolver o problema, elabora-se uma tabela auxiliar para a fórmula:
( ) ( )
−
−
−=
∑∑∑ ∑∑ ∑ ∑
2222 yy*n*xx*n
y*x)y*x(*nr
Tabela Auxiliar:
n x y xy x2 y2
1 10 100 1.000 100 10.000
2 12 112 1.344 144 12.544
3 14 119 1.666 196 14.161
4 16 130 2.080 256 16.900
5 18 139 2.502 324 19.321
6 20 142 2.840 400 20.164
Σ 90 742 11.432 1.420 93.090
Substituindo os valores observados na linha de totalização, na fórmula, ter-se-á:
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
( )[ ] ( )[ ]
[ ] [ ]
[ ] [ ]
[ ] [ ]
9 9,08 2,1830
181233499201812
7976*4201812
550564558540*810085206678068592
)742(93090*6*)0 9(1420*6742*0 911432*6
***
*) (*
22
2222
=
==
=
−−−
=
−−
−=
−−
−=
∑∑∑ ∑∑ ∑ ∑
r
r
r
r
r
yynxxn
yxyxnr
Nessas condições, pode-se afirmar que a correlação entre as variáveis “preço” e “quantidade” é muito alta.
LEITURAOBRIGATÓRIA
102
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: faça exercícios a respeito de análise de regressão e correlação e veja a resolução comentada.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
103
LINKSIMPORTANTESAcesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
VídeosAssista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
AGORAÉASUAVEZ
104
Questão 3:Ao analisar o diagrama de dispersão entre duas variáveis aleatórias x e y, optou-se por utilizar uma forma de relação tal que y = a + bx para a previsão de y em função de x (os valores de a e b foram obtidos pelo método dos mínimos quadrados). Essas duas vari-áveis apresentam um coeficiente de corre-lação linear igual a r, tal que r > 0. Então, o
a) Valor de b poderá ser inferior a zero.
b) Coeficiente de correlação linear entre as variáveis (2x) e (5y) também é igual a r.
c) Valor de b é igual ao inverso do valor do coeficiente de correlação linear.
Questão 1:
Construa um diagrama de dispersão para a amostra formada pelos seguintes pontos: (1; 2), (5; 6), (2; 4), (2; 3), (3; 5) e (5;10).
Questão 2:(ESAF/2005 – Auditor Fiscal da Receita Federal – Área Tecnologia da Informação – Prova 1) Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os se-guintes salários mensais (em salários mínimos):
Identificação do casal 1 2 3 4 5 6 7 8 9 10Salário do marido (y) 30 25 18 15 20 20 21 20 25 27Salário da esposa (x) 20 25 12 10 10 20 18 15 18 23
Sabe-se que:
∑ ∑∑ ∑∑= == ==
=====0 1
1
0 1
1
20 1
1
0 1
1
20 1
13171;171;3940;5069;221
i iii
i iii
ii xxyxyy
i
Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres.
a) 0,72
b) 0,75
c) 0,68
d) 0,81
e) 0,78
AGORAÉASUAVEZ
105
d) Coeficiente de correlação linear entre as variáveis (0,5x) e (0,5y) é igual a 0,5r.
e) Valor de b é igual ao coeficiente de correlação linear, pois r > 0.
Questão 4:
Considerando o par de variáveis (x, y), em que x representa o custo médio por metro quadrado (em R$) e y representa os atribu-tos Sudeste, Norte, Sul, Centro-Oeste ou Nordeste, assinale a opção correta.
a) A correlação linear de Pearson entre x e y é positiva.
b) As variáveis x e y são qualitativas.
c) As variáveis x e y formam uma série geográfica.
d) O gráfico de x versus y é um histograma.
e) As variáveis x e y são quantitativas.
Questão 5:
Ao se estudar a relação entre as variáveis “consumo de energia elétrica” (x) e “volu-me de produção nas empresas industriais” (y), foi encontrada a equação de regres-são: y = 1,81x + 0,001 Nessas condições, é correto afirmar que:
a) Quanto maior o volume de produção, maior o consumo de energia elétrica.
b) Quanto menor o volume de produção, maior o consumo de energia elétrica.
c) O consumo de energia independe do volume de produção.
d) Independentemente da quantidade produzida pela indústria, não haverá alteração do custo da energia.
e) A indústria não pagaria nada se não produzisse nada.
Questão 6:
A despesa mensal estimada de uma famí-lia mediana (marido, esposa e dois filhos) é representada pela equação ŷ = (ŷ = des-pesa e x = renda mensal líquida expressa em salários mínimos). Nessas condições, calcule:
a) A despesa mensal de uma família com renda líquida mensal de 10 salários-mínimos.
b) A equação serviria para estimar a des-pesa mensal de uma família de 5 pessoas com renda líquida de 12 salários-mínimos? Justifique.
Questão 7:
Uma empresa verificou as despesas com matéria-prima observadas nos últimos cin-co pedidos de acordo com a quantidade a ser produzida.
AGORAÉASUAVEZ
106
Custo (y) Produção (x)80 1244 451 670 1161 8
Considerando a amostra descrita, determi-ne a equação de regressão linear que re-presenta a função custo de produção.
Questão 8:Estime a reta de regressão do custo de fa-bricação correspondente a uma amostra de 20 elementos em que a soma das quanti-dades produzidas (x) é igual a 200; a soma dos custos de produção (y) é igual a R$ 300,00; a soma do produto da quantidade produzida pelo custo de produção é igual a R$ 6.200,00 e a soma do quadrado das quantidades produzidas é igual a 3.600.
Questão 9:
Estime a reta de regressão de regressão que melhor represente o conjunto de dados apresentado na sequência:
X Y1 102 303 404 505 656 70
Estime a reta de regressão populacional;
Questão 10:
Ajuste os seguintes dados e calcule o co-eficiente de correlação entre a “renda” e o “consumo” apresentados:
Anos Rendas (y) Consumo (c)(unidades monetárias constantes)
1957 2,0 1,6
1958 2,1 1,7
1959 2,4 2,0
1960 2,4 2,1
1961 2,5 2,2
1962 2,8 2,5
1963 3,0 2,6
AGORAÉASUAVEZ
107
Neste tema, você conheceu as definições de análise de regressão e correlação e sua utilidade. Aprendeu, principalmente, que esses elementos ampliam sua percepção acerca de uma série de dados estatísticos.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.
FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
REFERÊNCIAS
FINALIZANDO
108
REFERÊNCIASMORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1: Probabilidade. 7. ed. São Pau-lo: Pearson Makron Books, 1999.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
Correlação: relação mútua.
Diagrama: gráfico, representação.
Parâmetro: valor de referência.
Regressão: volta a algum ponto; retorno a uma referência.
Variável: ente cujo valor se modifica ao longo do tempo.
GLOSSÁRIO
109
Questão 1
Resposta: Localizando os pontos no plano cartesiano, ter-se-á:
0
2
4
6
8
10
12
0 1 2 3 4 5 6
Questão 2
Resposta: Alternativa B.
Questão 3
Resposta: Alternativa B.
Questão 4
Resposta: Alternativa C.
Questão 5
Resposta: Alternativa A.
GABARITO
110
Questão 6
Resposta: As respostas são:
(a) 2,8.
(b) Não, houve mudança de parâmetros.
Questão 7
Resposta: y = 26,28 + 4,26x.
Questão 8
Resposta: Você deverá obter: y = 38,19 + 2,32x.
Questão 9
Resposta: y = 2,66 + 11,86x.
Questão 10
Resposta: O coeficiente de correlação será r = 0,987.
GABARITO
seções
Tema 06Distribuição de Probabilidade
SeçõesSeções
Tema 06Distribuição de Probabilidade
115
CONTEÚDOSEHABILIDADES
Conteúdo
Nessa aula você estudará:
• Distribuições de probabilidade.
• Distribuição binomial.
• Outras distribuições discretas de probabilidade.
• Introdução às distribuições normais de probabilidade.
• Distribuição normal padrão.
• Propriedades.
• Gráficos.
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
116
CONTEÚDOSEHABILIDADES
Distribuições de Probabilidade
Antes de ir direto ao assunto, é preciso rever conceitos:
Princípio Fundamental da Contagem
Se um evento pode ocorrer de m maneiras diferentes e um segundo evento de n maneiras, o número de maneiras que os dois eventos podem ocorrer é (m* n) maneiras.
Permutações
Uma aplicação importante do Princípio Fundamental da Contagem é a determinação do número de maneiras em que n objetos podem ser arranjados em ordem ou permutação.
Uma permutação é um arranjo ordenado de objetos.
O número de permutações de n objetos diferentes é:
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é e para que serve uma distribuição de probabilidade?
• O que é e para que serve uma função de distribuição de probabilidade (f.d.p.)?
• Por que e quando utilizar a distribuição normal?
• Por que e quando utilizar a distribuição de Poisson?
• Por que e quando utilizar a distribuição binomial?
LEITURAOBRIGATÓRIA
117
LEITURAOBRIGATÓRIAPn = n!
n! = n * (n - 1) * (n - 2) * (n - 3) * ... 3 * 2 * 1
Importante:
==
1!01!1
Arranjos
Correspondem ao número de combinações de p objetos selecionados em um grupo de n
objetos, cuja ordem fundamental é dada por: ! )(
!pn
nA pn −=
Combinações
O número de combinações de p objetos selecionados em um grupo de n objetos, sem
importar a ordem é dada por: ! )!*(
!pnp
nC pn −= .
Entrando no assunto:
Variável Aleatória
Variável aleatória é aquela que representa um valor numérico associado a cada um dos resultados de um experimento probabilístico. Uma variável aleatória pode ser:
• Discreta: dir-se-á que a variável é discreta quando houver um número finito ou contável de possíveis resultados a serem enumerados.
• Contínua: dir-se-á que a variável é contínua quando houver um número infinito ou incontável de possíveis resultados a serem enumerados. Nesse caso, os resultados são apresentados por um intervalo de números reais.
Uma distribuição discreta de probabilidade é aquela que enumera cada valor que a variável aleatória pode assumir ao lado de sua probabilidade. Uma distribuição de probabilidade deve satisfazer às seguintes condições:
∑ =
≤≤
1)x(P)2(
1)x(P0)1(
∑ =
≤≤
1)x(P)2(
1)x(P0)1(
118
A estatística e a probabilidade caminham de mãos dadas. Pode-se observar tal comportamento quando se deseja medir a tendência central de uma distribuição de probabilidades por meio de sua média e determinar a variabilidade por meio de sua variância e de seu desvio padrão.
A média de uma variável aleatória discreta é dada por ∑=µ )x(P*x que significa dizer “multiplique cada valor ‘x’ por sua probabilidade e some todos os resultados”.
Já a variância é definida por ∑ µ−=σ )x(P*)x( 22
O desvio padrão continua sendo dado pela raiz quadrada da variância.
O Valor esperado de uma variável aleatória discreta é igual à média da variável aleatória:
∑=µ= )x(P*x)x(E .
É necessário que você conheça essas definições para compreender o significado de distribuição de probabilidades. Aliás, uma distribuição de probabilidades mostra ao investigador a possibilidade de ocorrência de cada resultado provável numa pesquisa.
São vários os métodos para efetuar uma distribuição. Nesta aula, você fixará sua atenção em três deles: distribuição binomial, distribuição normal e distribuição de Poisson.
A Distribuição Binomial
Um experimento é dito binomial quando se trata de uma experiência probabilística que deve atender aos seguintes requisitos:
(1) O experimento deve ser repetido um número fixo de vezes, sendo cada uma destas independente das demais.
(2) Há somente dois resultados possíveis: sucesso ou fracasso.
(3) A probabilidade de um sucesso P(S) é a mesma em cada tentativa.
(4) A variável aleatória x conta o número de tentativas com sucesso.
Suponha que “n” experimentos independentes sejam executados; suponha ainda que n é um número fixo e que cada experimento resulta num “sucesso” com probabilidade p e em um “fracasso” com probabilidade 1 - p. O número total de sucessos, x, é uma variável aleatória cujos parâmetros são n e p.
LEITURAOBRIGATÓRIA
119
A probabilidade de obtermos x = k (probabilidade de algo acontecer: um sucesso ou um fracasso), denotada por P(k), pode ser encontrada através da expressão:
knk ppknk
nkPkxP −−−
=== )1(*! )(!
!)()( que também poderá ser escrita assim:
xnxxnxxn qp
xnxnqpCxP −−
−== **
! )!*(!**)( ,
Símbolo Significado
n Número de repetições de um experimento.
p = P(S) Probabilidade de ocorrer sucesso numa única tentativa.
q = (F) = 1 – p Probabilidade de ocorrer fracasso numa única tentativa.
x Representa a contagem do número de sucessos em n tentativas.
Veja: uma moeda é lançada 10 vezes e o número total de caras é contado (neste caso, “cara” seria um sucesso). A possibilidade de, em duas tentativas, acertar uma “cara” será dada por:
n = 10
x = 2
%4,404395,05,0*5 45,0*5,0*5 4)2(
5 420 9
!8*1*2!8*9*0 1
!8* !2!0 1
! )!*(!
0 182
2,0 1
≅===
====−
=
Pxnx
nC
%4,404395,05,0*5 45,0*5,0*5 4)2(
5 420 9
!8*1*2!8*9*0 1
!8* !2!0 1
! )!*(!
0 182
2,0 1
≅===
====−
=
Pxnx
nC
A média de uma variável aleatória binomial é (n * p) e a variância é n * p * (1 - p). Então:
5,2)0 5,01(*0 5,0*0 1)1(**
50 5,0*0 1)*(
2 =−=−=
===
ppn
pn
σ
µ
LEITURAOBRIGATÓRIA
120
A distribuição é chamada geométrica quando satisfaz aos seguintes requisitos:
• Uma tentativa é repetida até que um sucesso ocorra.
• As tentativas repetidas são independentes umas das outras.
• A probabilidade de sucesso p é constante para cada tentativa.
Nesse caso, a probabilidade de que o primeiro sucesso ocorra na tentativa x é dada por:
P(x) = p * qx-1, onde q = 1 - p
No exemplo da face “cara” da moeda, você teria:
P(2) = 0,5 * 0,52-1 = 0,5 = 0,25 = 25%
A Distribuição de Poisson
Outro exemplo de distribuição comum é a distribuição de Poisson, que é frequentemente utilizada para modelar dados de contagem.
É uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz as seguintes condições:
• O experimento consiste na contagem do número de vezes x que um evento ocorre em um determinado intervalo.
• A probabilidade de que um evento ocorra é a mesma para cada intervalo.
• A probabilidade de que haja exatamente “x” ocorrências em um intervalo é:
!xe)x(P
x µ−µ= em que “e” é o número de Euler.
• O número de ocorrências em um intervalo independe do número de ocorrências em outros intervalos.
A variância de uma distribuição de Poisson é igual a sua média.
LEITURAOBRIGATÓRIA
121
Distribuição Normal – Propriedades:
• A média, a mediana e a moda são iguais.
• A curva normal tem formato de sino e é simétrica em torno da média.
• A área total sob a curva normal é igual à 1.
• A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo.
• Entre μ – σ e μ + σ, o gráfico curva-se para baixo. À esquerda de μ – σ e à direita de μ + σ, o gráfico curva-se para cima.
Lembre-se do gráfico:
Distribuição normal padrão:
É uma distribuição normal com média 0 (zero) e desvio padrão de 1 (um).
LEITURAOBRIGATÓRIA
122
Propriedades:
• A área acumulada está próxima de zero para escores z próximos de z = -3,49.
• A área acumulada cresce à medida que o escore z também cresce.
• A área acumulada para z = 0 é 0,5.
• A área acumulada está próxima de 1 para escores z próximos de z = 3,49.
Probabilidade e distribuição normal:
Se uma variável aleatória x é distribuída normalmente, é possível obter a probabilidade de que x caia num determinado intervalo, calculando a área sob a curva normal para o intervalo dado.
Como, então, fazer isso?
• Convertendo os limites do intervalo para o escore z.
• Consultando a tabela normal padrão.
Para obter o escore “z”, basta fazer: σµ−
=xz – o escore “z” é dado pelo quociente do valor
da variável aleatória subtraído da média dividido pelo desvio padrão.
Veja um trecho da tabela normal:
No Livro-Texto você encontrará a tabela na íntegra.
Se você considerar uma amostra em vez de toda a população, pode-se dizer que terá uma distribuição amostral.
Distribuição amostral é a distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente colhidas de uma população.
LEITURAOBRIGATÓRIA
123
Se a estatística da amostra é sua média, teremos uma distribuição amostral de média das amostras.
Propriedades:
• A média das médias das amostras xµ é igual à média da população μ: µ=µx .
• O desvio padrão da média das amostras é igual ao desvio padrão populacional dividido
pela raiz quadrada de n: nxσ
=σ .
• O desvio padrão da distribuição amostral de médias das amostras é chamado de erro padrão da média.
Teorema do Limite Central
Descreve a relação entre as distribuições amostrais das médias das amostras e a população de onde foram tiradas as amostras.
Seamostrasdetamanhon,emquen≥30,foremtiradasdeumapopulaçãoqualquer,commédia μ e um desvio padrão σ, então a distribuição amostral de médias das amostras se aproximará de uma distribuição normal.
Se a própria população for normalmente distribuída, a distribuição amostral das médias das amostras será normalmente distribuída para qualquer tamanho de amostra n.
Em ambos os casos, a distribuição amostral das médias tem média igual à média da população, ou seja, μmédia = μ
E a distribuição amostral de médias das amostras tem uma variância igual a 1/n vezes a
variância da população, ou seja, n
)( 2
2média
σ=σ .
A fórmula para o erro padrão da média, dada no Teorema do Limite Central, baseia-se na hipótese de que a população tenha infinitos elementos. É o caso da amostragem com reposição.
A fórmula também é válida se o tamanho da amostra for pequeno quando comparado ao da população.
LEITURAOBRIGATÓRIA
124
A distribuição amostral de médias das amostras será normal com uma média igual à média da população, e o erro padrão da média será:
1NnN*
nx −−σ
=σ
Aproximação normal para uma distribuição binomial:
Se n * p ≥ 5, então a variável aleatória binomial “x” tem distribuição aproximadamentenormal, com média μ = n * p e desvio padrão dado por:
q*p*n=σ
Ao utilizar uma distribuição normal contínua para aproximar uma probabilidade binomial, é necessário mover 0,5 unidade para a esquerda e para a direita do ponto médio a fim de incluir todos os valores possíveis de “x” no intervalo; tem-se, nesse caso, uma correção pela continuidade.
Exemplo – Numa empresa, um consultor levanta a seguinte questão com relação à montagem de uma peça da linha de produção: sabendo que a montagem dessa dura, em média, 75 segundos com um desvio padrão de 6 segundos, qual a probabilidade de um trabalhador da fábrica ser escolhido ao acaso para montar uma peça entre 70 e 75 segundos?
Resolução: construindo o gráfico, ter-se-á:
Aplicando a fórmula: 3 8,06
5 70 7=⇒
−=⇒
−= zzxxz
σ .
Consultando a tabela normal padrão (transcrição do trecho da tabela):
LEITURAOBRIGATÓRIA
125
Com isso, você concluirá que a probabilidade solicitada é de 29,67%.
Não se esqueça: leia o Livro-Texto e os demais textos de apoio sugeridos.
LEITURAOBRIGATÓRIA
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: faça exercícios sobre distribuição de probabilidades e veja a resolução comentada.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
126
LINKSIMPORTANTESAcesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
Acesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Consulte também as seguintes bibliografias: Assista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
127
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
A probabilidade de se encontrar o sinal de trânsito aberto numa determinada esquina é de 0,20. Qual a probabilidade de que seja necessário passar pelo local 5 vezes, para encontrar o sinal aberto pela primeira vez?
Questão 2:
Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras (número aproximado)?
a) 50%
b) 40%
c) 25%
d) 12%
e) 1,25%
Questão 3:Numa estrada há 2 acidentes para cada 100 km. Qual a probabilidade (em números aproximados) de que em 300 km ocorram 5 acidentes?
a) 87,53%
b) 75,34%
c) 53,48%
d) 16,06%
e) 6,23%
AGORAÉASUAVEZ
128
Questão 4:
Sendo x: N(20, 4), o valor reduzido corres-pondente a x1 = 14 é:
a) z = -3.
b) z = -2.
c) z = -1.
d) z = 0.
e) z = 3.
Questão 5:Um fabricante de baterias sabe, por expe-riência passada, que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem distribuição próxima da nor-malidade. Oferece-se uma garantia de 312 dias, isto é, trocam-se as baterias que apresentarem falhas nesse período. Fa-bricam-se 10.000 baterias mensalmente. Quantas deverão ser trocadas pelo uso da garantia, mensalmente?
a) 10.
b) 12.
c) 15.
d) 18.
e) 20.
Questão 6:Qual a probabilidade de que um dado deva ser lançado 15 vezes para que na décima quinta vez ocorra a face 6 pela primeira vez?
Questão 7:Numa criação de coelhos, 40% são ma-chos. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos?
Questão 8:Calcule a média e a variância da variável ale-atória y = 3x + 2, sendo x : B (n = 20; p = 0,6).
Texto para as questões 9 e 10:
Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média de 150.000 km e desvio padrão 5.000 km.
Questão 9:Determine qual a probabilidade de que um carro, escolhido ao acaso entre os fabri-cados por essa firma, tenha um motor que dure menos de 170.000 km?
Questão 10:Determine qual a probabilidade de que um carro, escolhido ao acaso entre os fabri-cados por essa firma, tenha um motor que dure entre 140.000 e 165.000 km?
AGORAÉASUAVEZ
129
Depois dos diferentes temas já estudados, você percebe que a Estatística, aliada a algumas ferramentas de cálculo, proporciona ao investigador condições de resolver problemas que envolvam diferentes áreas do conhecimento humano. Uma dessas ferramentas é o cálculo das probabilidades de ocorrência de um determinado evento aliado ao conhecimento da média e do desvio padrão.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.
FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
REFERÊNCIAS
FINALIZANDO
130
REFERÊNCIASMATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
MORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1: Probabilidade. 7. ed. São Pau-lo: Pearson Makron Books, 1999.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
Aleatória: qualquer uma.
Arranjo: combinação cuja ordem dos termos é fundamental.
Combinação: arranjo segundo o qual a ordem dos termos não tem importância.
Permutação: um arranjo ordenado de objetos.
Variável aleatória: aquela variável que representa um valor numérico associado a cada um dos resultados de um experimento probabilístico.
GLOSSÁRIO
131
Questão 1
Resposta: Sendo:
x = número de vezes necessárias para encontrar o sinal aberto.
p = 0,20
q = 0,80
Ter-se-á: P(x = 5) = 0,804 * 0,20 = 0,08192 = 8,192%
Questão 2
Resposta: Alternativa C.
Questão 3
Resposta: Alternativa D.
Questão 4
Resposta: Alternativa A.
Questão 5
Resposta: Alternativa E.
GABARITO
132
Questão 6
Resposta: Sendo:
x = número de lançamentos necessários para o aparecimento da primeira face 6.
65q
61p
=
=
65q
61p
=
=
Ter-se-á: %298,101298,061*
65)5 1(
4 1
==
==xP
Questão 7
Resposta: Sendo:
x = número de coelhos machos.
p = 0,40
q = 0,60
Ter-se-á (utilize uma calculadora para auxiliar você):
%948,9 9)2(99948,0)00049,000003,0(1)2(
6,0*4,0*10 26,0*4,0*
00 21)2(
} )1()0({1)2()2(1)2(
9 110 20
=≥=+−=≥
+
−=≥
=+=−=≥<−=≥
xPxP
xP
xPxPxPxPxP
%948,9 9)2(99948,0)00049,000003,0(1)2(
6,0*4,0*10 26,0*4,0*
00 21)2(
} )1()0({1)2()2(1)2(
9 110 20
=≥=+−=≥
+
−=≥
=+=−=≥<−=≥
xPxP
xP
xPxPxPxPxP
%948,9 9)2(99948,0)00049,000003,0(1)2(
6,0*4,0*10 26,0*4,0*
00 21)2(
} )1()0({1)2()2(1)2(
9 110 20
=≥=+−=≥
+
−=≥
=+=−=≥<−=≥
xPxP
xP
xPxPxPxPxP
%948,9 9)2(99948,0)00049,000003,0(1)2(
6,0*4,0*10 26,0*4,0*
00 21)2(
} )1()0({1)2()2(1)2(
9 110 20
=≥=+−=≥
+
−=≥
=+=−=≥<−=≥
xPxP
xP
xPxPxPxPxP
%948,9 9)2(99948,0)00049,000003,0(1)2(
6,0*4,0*10 26,0*4,0*
00 21)2(
} )1()0({1)2()2(1)2(
9 110 20
=≥=+−=≥
+
−=≥
=+=−=≥<−=≥
xPxP
xP
xPxPxPxPxP
GABARITO
133
GABARITOQuestão 8
Resposta: A resolução é simples:
μ = n * p = 20 * 0,3 = 6
σ2 = n * p * q = 20 * 0,3 * 0,7 = 4,2
então:
μy = μ(3x + 2) = 3 * μ + 2 = 3 * 6 + 2 = 20
σ2y = σ2
(3x + 2) = 9 * σ2 = 9 * 4,2 = 37,8
Questão 9
Resposta: Resolução:
000.5000.150
000.5 000.150
:
−=
==
xz
mkmk
mkmemotorodduraçãoxσµ
000.5000.150
000.5 000.150
:
−=
==
xz
mkmk
mkmemotorodduraçãoxσµ
Então:
%9968,99499968,05,0)4z0(P5,0)4z(P)000.170x(P
4000.5
000.150000.170z
=+=≤≤+=≤=<
=−
=
P(x<170.000)=P(z≤4)=0,5+P(0≤z≤4)=0,5+0,499968=99,9968%
134
Questão 10
Resposta: Do exercício 9 tem-se que:
000.5000.150
000.5 000.150
:
−=
==
xz
mkmk
mkmemotorodduraçãoxσµ
000.5000.150
000.5 000.150
:
−=
==
xz
mkmk
mkmemotorodduraçãoxσµ
Então:
%59,97)000.165x000.140(P498650,0477250,0)000.165x000.140(P
)3z0(P)0z2(P)3z2(P)000.165x000.140(P
3000.5
000.150000.165z
2000.5
000.150000.140z
2
1
=<<+=<<
≤≤+≤≤=≤≤−=<<
=−
=
−=−
=
%59,97)000.165x000.140(P498650,0477250,0)000.165x000.140(P
)3z0(P)0z2(P)3z2(P)000.165x000.140(P
3000.5
000.150000.165z
2000.5
000.150000.140z
2
1
=<<+=<<
≤≤+≤≤=≤≤−=<<
=−
=
−=−
=
P(140<x<165.000)=P(-2≤z≤3)=P(2≤z≤0)+P(0≤z≤3)
P (140.000 < x < 165.000) = 0,477250 + 0,498650
P (140.000 < x < 165.000) = 97,59%
GABARITO
seções
Tema 07Intervalos de Confiança
SeçõesSeções
Tema 07Intervalos de Confiança
139
CONTEÚDOSEHABILIDADES
Conteúdo
Nessa aula você estudará:
• Uma visão geral a respeito de intervalos de confiança.
• Definições importantes tais como as de estimador, estimativa e estimação.
• Pontos comuns e diferenças na avaliação de amostras e populações.
• A importância da média e do desvio padrão.
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
140
CONTEÚDOSEHABILIDADES
Intervalos de Confiança
Para este estudo, será necessário que você retome o conceito fundamental de amostra (subconjunto de uma população).
Outros conceitos fundamentais:
Todos os elementos apresentados em seguida correspondem a definições e foram, em geral, parafraseados do material Estatística – Curso 1, organizado pela professora doutora Corina da Costa Freitas, cuja bibliográfica encontra-se disponível no final deste capítulo e a quem reportamos nosso respeito e admiração profissional.
Estimativa amostral é a avaliação de um parâmetro da população com utilização dos dados de uma amostra. Ela pode ser classificada como intervalar ou pontual.
• A estimativa pontual acontece quando se faz uma única estimativa para um determinado parâmetro populacional.
• Já a estimativa intervalar acontecerá quando for feita uma estimativa de um intervalo de valores possíveis, no qual se admite que esteja o parâmetro populacional. Aqui,
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que são e para que servem a estimação, a estimativa e o estimador?
• Como obter a análise inferencial de um conjunto de dados?
• O que são e para que servem os intervalos de confiança?
• Em que e para que se aplicam os intervalos de confiança?
LEITURAOBRIGATÓRIA
141
LEITURAOBRIGATÓRIAobtém-se um intervalo de valores (em torno do parâmetro amostral) no qual se julga (com um risco conhecido de erro) que esteja o parâmetro da população. A esse intervalo chamamos intervalo de confiança.
Estimador corresponde ao modelo matemático utilizado para se fazer uma estimativa. Segundo Morettin (2000, p. 41), as qualidades de um bom estimador são: consistência, ausência de vício, eficiência e suficiência.
Estimação é o processo que consiste no uso de dados da amostra para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções, entre outros.
Inferência corresponde à metodologia pela qual se possibilita avaliar característica(s) de uma população com base nos dados de uma amostra.
Estimador não tendencioso corresponde a todo estimador em que o modelo matemático no qual o valor esperado na amostra é igual ao valor real de uma população.
Estude com atenção o raciocínio demonstrado em seguida, ele permitirá que você entenda os estimadores importantes em uma pesquisa.
Considere uma variável aleatória x (por exemplo, a altura de um grupo de indivíduos de uma região da cidade) associada à população-alvo cuja média populacional seja μ e a variância populacional seja σ2, da qual seja extraída uma amostra de tamanho n representada pelos elementos x1, x2, x3, ..., xn.
Considerando as condições expostas, os estimadores serão:
Média Amostral: x)x(E = (E denota o valor esperado da média).
Variância Amostral:
==σ ∑
nx
V)x(V i2
x (V designa a variância de cada componente).
Proporção Amostral: nx
p iA∑=
(os valores que xi assume são:
AeventoosatisfaznãoesAeventoosatisfazes
0 1
.)
142
Veja bem, quando um pesquisador sai a campo, ele pode deparar-se com grande abrangência de variáveis de pesquisa.
Entenda o que a estatística quer dizer com isso: se Ivonete (professora) deseja conhecer bem o seu grupo de alunos, ela precisa buscar diversas informações que determinem o perfil do alunado; entre essas informações, pode-se citar: idade, perfil socioeconômico, sexo, tempo disponível para estudo, distância entre o local de residência e o polo, entre outras.
Dessa vastidão de variáveis, destaca-se, em especial, um caso muito importante:
• A variável aleatória x possuir distribuição normal1.
Quando isso ocorre, diz-se que: ),(Nx 2σµ≈ . Então, segundo Morettin (2000, p. 41), a média amostral µ=)x(E será um estimador não tendencioso da média da população.
Observando a variância2, o investigador obterá, no caso de a amostra ser independente:
)n
,(Nxentão),(Nxn
)x(V2
2
2
x σµσµ
σ
≈≈⇒=
Essa propriedade afirma a você que a variância da média amostral é um estimador não tendencioso da variância da população, bastando para isso fazer a multiplicação pelo tamanho da amostra, desde que essa amostra seja coletada de forma independente.
Simplificando o raciocínio, se uma variável aleatória possui distribuição normal na população, a média amostral também possuirá distribuição normal.
Alguns outros conceitos são fundamentais para a compreensão do significado e da importância dos intervalos de confiança. São eles: proporção e graus de liberdade.
1 Segundo Morettin (1999, p.140 ), a variável possui distribuição normal quando o ponto máximo da função é dado por: a curva é simétrica em relação à media e os pontos de inflexão são (média ± desvio padrão).
2 Lembre-se de que a variância nada mais é do que a soma dos quadrados dos desvios dividida pelo número de elementos da população em estudo, ou o número de elementos menos um, no caso da amostra.
LEITURAOBRIGATÓRIA
143
Proporção
De maneira geral, você sabe que uma proporção é uma igualdade entre duas ou mais razões. Para a estatística, uma proporção tem o mesmo significado que tem uma frequência simples.
Quando p é a proporção de um evento na população, tem-se: E(pA) = p
Quando a amostra for independente, tem-se: n)p̂1(*p̂)p(V A
A−
=
Graus de Liberdade
Levando-se em conta que já tenha estudado graus de liberdade, você, portanto, sabe que essa medida informa o número de informações independentes de uma amostra (n) subtraído do número (k) de parâmetros da população a serem estimados (além do próprio parâmetro de estudo). Contudo, é importante relembrar o conceito e reforçar que cada tipo de análise requer um grau de liberdade diferente do outro.
Intervalo de Confiança
Ao avaliar o valor de um parâmetro da população, com base em valores de uma amostra, o que o pesquisador tem é uma estimativa, com a qual ele poderá avaliar o resultado obtido como correto ou não.
Na tentativa de eliminar possíveis erros, o intervalo de confiança estabelece essa estimativa, criando um intervalo matemático capaz de medir a validade dos valores obtidos na amostra da população em estudo.
Segundo Morettin (2000, p. 43):
A estimação por pontos de um parâmetro não possui uma medida do possível erro cometido na estimação.
Uma maneira de expressar a precisão é estabelecer limites, que com certa probabilidade incluam o verdadeiro valor do parâmetro da população.
Esses limites são chamados “limites de confiança”: determinam um Intervalo de Confiança, no qual deverá estar o verdadeiro valor do parâmetro.
Logo, a estimação por intervalo consiste na fixação de dois valores tais que )1( α− seja a probabilidade de que o intervalo, por eles determinado, contenha
o verdadeiro valor do parâmetro.
α : nível de incerteza ou grau de desconfiança.
)1( α− : coeficiente de confiança ou nível de confiabilidade.
LEITURAOBRIGATÓRIA
144
A notação utilizada é: ],[)%)1(,( 21 µµαµ =−CI
• Nível de confiabilidade ou nível de confiança: corresponde à probabilidade de que o intervalo encontrado contenha o valor real do parâmetro procurado. O nível de confiança será dado por )1( α− .
• Nível incerteza, grau de desconfiança ou nível de significância: corresponde à probabilidade de que o intervalo encontrado não contenha o valor real do parâmetro procurado, isto é, a probabilidade de que o valor do parâmetro em estudo tenha, realmente, um valor fora do intervalo construído. O nível de significância é chamado de α .
De acordo com padrões internacionais: (a) a estatística preferencialmente citará o nível de significância no relatório de uma pesquisa; e (b) o nível de significância (que deverá ser estipulado pelo pesquisador) será em torno de α = 0,05. isto é, um risco de 5,0% (no máximo).
As fórmulas apresentadas em seguida são muito importantes para a obtenção de Intervalos de Confiança (IC). Preste bastante atenção nelas; acompanhe a explanação do professor durante a aula; veja também os exemplos propostos no seu Livro-Texto e assista aos vídeos propostos mais à frente neste texto: a simbologia é muito carregada, embora os procedimentos sejam simples de ser executados.
Não esmoreça! Vamos ao trabalho!
Intervalo de Confiança para a Média
Será necessário observar se as seguintes condições iniciais foram respeitadas:
x seja a variável em análise
x tenha distribuição normal:
≈xedetindependenaleatóriaamostraumasejaxxxx
Nxnormaloãdistribuiçtenhaxanálisemeiávelasejax
n ,...,,,,),(:
var
321
2σµ
x1, x2, x3, ..., xn, seja uma amostra aleatória independente de x
≈xedetindependenaleatóriaamostraumasejaxxxx
Nxnormaloãdistribuiçtenhaxanálisemeiávelasejax
n ,...,,,,),(:
var
321
2σµ
LEITURAOBRIGATÓRIA
145
Intervalo de Confiança da Média3
Se as condições iniciais foram respeitadas e levando-se em conta as propriedades de estimadores,
tem-se que )n
,(Nx2σ
µ≈ ; e, aplicando-se as propriedades da normal, chega-se a: )1,0(N
n
xz ≈−
=σµ
,
então, ao utilizar os modelos matemáticos da distribuição normal, chega-se a:
ασµ
−=
<−
<−=<<− 1z
n
xzP)zZz(P 0000
Fazendo-se as devidas simplificações, ter-se-á o intervalo:
nzxa
nzxed σσ ** 00 +−
nzxa
nzxed σσ ** 00 +− que é chamado de Intervalo de Confiança da média ao nível de
significância α .
Erro Padrão de Estimativa
Considerando tudo o que foi estudado até aqui, você é capaz de concluir que quem determina
o erro padrão ou o desvio padrão da média populacional é o quociente desvio padrão pela raiz
quadrada do tamanho da população, isto é, nσ
. Contudo, nem sempre é possível trabalhar
com a população toda. Nesse caso, é necessário optar por uma amostra, para que, então, o
pesquisador possa cometer o chamado erro padrão de estimativa que é dado por n
*z0σ
e também conhecido como margem de erro, sendo simbolizado pela letra e.
No decorrer deste texto, para calcular o Intervalo de Confiança para a média populacional era necessário conhecer o valor da variância populacional.
Ao trabalhar com uma amostra, pode acontecer que a variância seja desconhecida. Nesse caso, sendo a amostra pequena, para encontrar o intervalo de confiança deve-se partir do teorema:
Se ),(Nx 2σµ≈ com ),(Nx 2σµ≈ desconhecida, então,
ns
xt µ−= (distribuição
t-Student com (n-1) graus de liberdade.
3 Demonstração original na íntegra em Morettin, 2000, p. 45-52.
LEITURAOBRIGATÓRIA
146
Propriedades da Distribuição t-Student
1. O teorema afirma que se a variância populacional for desconhecida, para construir o intervalo de confiança da média usa-se a distribuição t e não a “normal”.
2. A curva do gráfico é simétrica e semelhante à curva da distribuição N (0, 1), porém um pouco mais longa.
3. Quando o número de graus de liberdade é um valor suficientemente grande, a distribuição t-Student se aproxima da Normal Padrão.
4. Se o número de graus de liberdade for acima de 35, quando utilizar tabelas, usa-se a distribuição N(0, 1) para encontrar os valores de t.
Intervalo de Confiança da média com variância desconhecida
Pelas características estudadas, você chegará a:
ns*tx
ns*tx 00 +<<− µ
com distribuição t-Student com (n-1) graus de liberdade (FREITAS, 2003, p. 279).
Exemplo4: tempo estimado de duração de cirurgias cardíacas.
Quanto ao tempo de cirurgia, os valores encontrados para indivíduos do sexo feminino foram (em minutos):
Quanto ao tempo de cirurgia, os valores encontrados para indivíduos do sexo feminino foram (em minutos):
200 265 345 210 240 230 250270 205 265 210 325 230 220255 285 295 260 220 250 130230 240 280 310 225 250 255260 200 270 235 195 230
Considerando os dados apresentados, construa o intervalo de confiança para o tempo médio de duração deste tipo de cirurgia, para indivíduos do sexo feminino, ao nível de 5,0% de significância.
4 TEODORO, 2005, p. 43.
LEITURAOBRIGATÓRIA
147
Solução:
Estimativas pontuais:
Média: 3,2454 3
230...265200≅
+++=x
Variância: 5 1,674.114 3
)3,245230(...)3,245200( 222 =
−−++−
=s .
Desvio Padrão: 2 9,0 45 1,654.1 ≅=s .
Variância desconhecida com a utilização de t-Student
Graus de Liberdade: 34 – 1 = 33;
Na tabela, ao nível de 5,0%: t = 2,0345
O Intervalo será:
7 5,2592 0,2314 32 9,0 4*0345,23,245
4 32 9,0 4*0345,23,245
<<
+<<−
µ
µ
7 5,2592 0,2314 32 9,0 4*0345,23,245
4 32 9,0 4*0345,23,245
<<
+<<−
µ
µ
Intervalo de Confiança para a Proporção p
Lembre-se de que proporção (ou frequência) é a razão entre o total de resultados em conformidade com uma condição preestabelecida e o total de resultados existentes.
Para que uma proporção possa ser avaliada é preciso que se crie um intervalo de confiança de p utilizando-se diretamente a distribuição normal; então, das fórmulas que já são conhecidas, pode-se escrever:
n)p̂1(*p̂*zp̂p
n)p̂1(*p̂*zp̂ AA
0AAA
0A−
+<<−
−
Aqui, o erro padrão é dado por: n
)p̂1(*p̂ AA − e o erro padrão da estimativa por:
n)p̂1(*p̂*ze AA
0−
=
LEITURAOBRIGATÓRIA
148
Exemplo5: fatores que contribuem com o peso da criança ao nascer.
Numa pesquisa, foram observadas 19.189 crianças que nasceram em 2002 em Goiânia (GO). Destas, 1.124 nasceram com peso abaixo de 2.500g, sendo classificadas como desnutridas.
Considerando as informações do texto, vamos construir, ao nível de 5,0% de significância, o intervalo de confiança da proporção de crianças que nascem desnutridas.
Resolvendo:
Seja p a proporção, na população de todas as crianças, daquelas que, ao nascer, que sejam desnutridas.
Sabe-se que
==
124.1)(189.9 1
ann
Portanto:
Na tabela Normal Padrão, ao nível de 5%, tem-se que o valor crítico de z é z0 = 1,96
Nessas condições, o erro padrão de estimativa é:
0033,0189.9 1
)0586,01(*0586,0*6 9,1 ≅−
=e
O intervalo de confiança será dado por:
0,0586 - 0,0033 < p < 0,0586 + 0,0033
0,0553 < p < 0,0619
5 GIGLIO et al, 2005, p. 131.
LEITURAOBRIGATÓRIA
149
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos ao fazer exercícios sobre estatística e veja a resolução comentada. Amplie sua visão a respeito da estatística lendo e estudando o material disponível nos sites indicados em seguida.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 7 jan. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
Acesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 7 jan. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 7 jan 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
150
LINKSIMPORTANTESAcesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 7 jan. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
VídeosAssista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 14 jan. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
AGORAÉASUAVEZ
151
Questão 1:
De uma população qualquer, retira-se uma amostra de 100 elementos, e nela en-contram-se 20 sucessos. Ao nível de 1%, construa um intervalo de confiança para a proporção real de sucessos na população.
Questão 2:
(BACEN-2005 – adaptada) Os preços de um produto têm uma distribuição normal com desvio padrão populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra aleatória de tamanho n = 100, com um determinado nível de confian-ça, apurou-se para a média desses preços um IC (intervalo de confiança) dado por [R$ 61,08; R$ 68,92]. A mesma média amostral foi obtida quadruplicando-se o tamanho da amostra anterior e utilizando-se o mesmo nível de confiança. Nos dois casos consi-derou-se infinito o tamanho da população. O novo intervalo de confiança foi:
a) [R$ 61,20; R$ 68,80].
b) [R$ 61,33; R$ 68,67].
c) [R$ 61,57; R$ 68,43].
d) [R$ 62,06; R$ 67,94].
e) [R$ 63,04; R$ 66,96].
Questão 3:
(BACEN-2005 – adaptada) A distribuição dos valores de aluguéis dos imóveis em cer-ta localidade é bem representada por uma curva normal com desvio padrão populacio-nal de R$ 200,00. Uma amostra aleatória de 100 imóveis deste local determinou um IC para a média destes valores, com determi-nado nível de confiança, como [R$ 540,00; R$ 660,00]. A mesma média amostral foi obtida com outro tamanho de amostra, com mesmo nível de confiança anterior, sendo o novo intervalo [R$ 560,00; R$ 640,00]. Nos dois casos, considerou-se a população com tamanho infinito. O tamanho da amostra considerado no segundo caso foi de:
a) 225.
b) 256.
c) 324.
d) 400.
e) 625.
Questão 4:
A massa corporal de recém-nascidos do sexo feminino em determinada comunida-de tem distribuição normal com média P e desvio padrão desconhecido. Uma amostra de 16 crianças indicou uma massa média de 3,0 kg e desvio padrão amostral igual a 0,8 kg. O intervalo de confiança para P, com co-eficiente de confiança de 96% é dado por:
AGORAÉASUAVEZ
152
a) 3,0 ± 0,37.
b) 3,0 ± 0,41.
c) 3,0 ± 0,45.
d) 3,0 ± 0,68.
e) 3,0 ± 0,73.
Questão 5:Um encarregado de controle de qualidade deseja estimar a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho suficientemente gran-de. Sabe-se que p deve estar próxima de 0,5 (de acordo com registros anteriores). Que ta-manho deve ter a amostra se o encarregado desejar que o erro de estimação seja no má-ximo de 2%, com confiança de 90%?
a) 800.
b) 1.082.
c) 1.241.
d) 1.530.
e) 1.681.
Questão 6:
De uma população normal X, com 92 =σ , tira-
-se uma amostra de 25 observações, obten-
do-se ∑=
=5 2
1152
iix . Determine um IC de limi-
tes de 90% para µ.
Questão 7:
De uma população de 1.000 elementos com distribuição aproximadamente normal, com variância 92 =σ = 400, tira-se uma amos-tra de 25 elementos, obtendo-se 150x = . Estabeleça um IC para µ, ao nível de 5%.
Texto para as questões 8, 9 e 10:
De uma população normal com desvio pa-drão 92 =σ = 5, retira-se uma amostra de 50 elementos e se obtém 150x = = 42.
Questão 8:
Estabeleça um IC para a média ao nível de 5%.
Questão 9:
Calcule o erro de estimação ao nível de 5%.
Questão 10:
Paraqueoerroseja≤1,comprobabilidadede acerto de 95%, qual deverá ser o tama-nho da amostra?
AGORAÉASUAVEZ
153
Neste tema, você não só conheceu as definições a respeito de intervalos de confiança e sua utilidade, mas também aprendeu como obtê-los tanto para a população quanto para uma amostra dela. Resolva, portanto, os exercícios para praticar os conceitos aprendidos. Busque (e compreenda) outros pontos de vista, consultando a bibliografia utilizada como base para este trabalho.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16., Porto Alegre, 1997.
FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS, Corina da Costa et al. Estatística: Curso I. São José dos Campos: INPE, 2003.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
GIGLIO, Margareth Rocha Peixoto et al. Baixo peso ao nascer em coorte de recém-nasci-dos em Goiania-Brasil no ano de 2000. Revista Bras. Ginecol. Obstet., v. 27, n. 3, p.130-136, mar. 2005.
REFERÊNCIAS
FINALIZANDO
154
REFERÊNCIASKOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e Con-trole. São Paulo: Atlas, 1996.
LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
MORETTIN, Luiz Gonzaga. Estatística Básica – Volume 1 – Probabilidade. 7. ed. São Paulo: Pearson Makron Books, 1999.
________. Estatística Básica – Volume 2 – Inferência. São Paulo: Pearson Education do Brasil, 2000.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
TEODORO. Roberta Rubiane Vaz Teodoro. Estudo Epidemiológico de pacientes subme-tidos à revascularização do miocárdio em hospital escola do Centro - Oeste (Trabalho de Conclusão de Curso). Goiás: PUC, 2005.
155
Amostra: corresponde a um conjunto de informações obtido em uma pesquisa que, graças à impossibilidade de se fazer o censo, é utilizado para tirar conclusões sobre parâmetros e/ou características de uma população.
Estimação: é o procedimento que consiste no uso de dados da amostra para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções, entre outros.
Estimador: corresponde ao modelo matemático utilizado para se fazer uma estimativa.
Estimativa amostral: avaliação de um parâmetro da população com utilização dos dados de uma amostra, podendo ser classificada como intervalar ou pontual.
Inferência: metodologia pela qual se permite avaliar característica(s) de uma população com base nos dados de uma amostra.
GLOSSÁRIO
156
Questão 1
Resposta: Considerando n = 100; x = 20 (número de sucessos na amostra); %1=α .
] %8 2,0 3, %2 7,9[) %9 9,(
9 9,0) %8 2,0 3%2 7,9(
9 9,0)3028,00972,0(
9 9,0)4 0,0*7 5,22,04 0,0*7 5,22,0(
7 5,2
4 0,0100
8,0*2,0
8,02,01ˆ1ˆ
2,0100
0 2ˆ
5,9 4
00
0
=
=≤≤
=≤≤
=+≤≤−
==
==
=−=−=
===
pCI
pP
pP
pP
zz
pq
nxp
α
σ
Questão 2
Resposta: Alternativa E.
Questão 3
Resposta: Alternativa A.
GABARITO
157
Questão 4
Resposta: Alternativa C.
Questão 5
Resposta: Alternativa E.
Questão 6
Resposta:
%0 1=α
)064,7;096,5() %0 9,(
0 9,0)064,7096,5(
0 9,0)6,0*4 6,18 0,66,0*4 6,18 0,6(
4 6,1
6,053
5 29
8 0,65 2
152
%5 4
2
=
=<<
=+<<−
==
====
==
µ
µ
µ
σσ
α
CI
P
P
zz
n
x
x
Questão 7
Resposta:
%5;130x25;n 400; 1.000; N 2 ===== ασ
)5 7,157;5 2,142() %5 9,(
5 9,0)5 7,1575 2,142(
5 9,0)5 9,3*6 9,11505 9,3*6 9,1150(
6 9,1
5 9,3110005 21000*
50 2
1*
%5,7 4
2
=
=<<
=+<<−
==
≅−−
=−−
=
µ
µ
µ
σσ
α
CI
P
P
zz
NnN
nx
GABARITO
158
)5 7,157;5 2,142() %5 9,(
5 9,0)5 7,1575 2,142(
5 9,0)5 9,3*6 9,11505 9,3*6 9,1150(
6 9,1
5 9,3110005 21000*
50 2
1*
%5,7 4
2
=
=<<
=+<<−
==
≅−−
=−−
=
µ
µ
µ
σσ
α
CI
P
P
zz
NnN
nx
Questão 8
Resposta:
%5;2 4x; 0 5n ;5 ==== ασ
)9 3,3 4;1 6,0 4() %5 9,(
5 9,0)9 3,3 41 6,0 4(
5 9,0)1 7,0*6 9,12 41 7,0*6 9,12 4(
6 9,1
1 7,00 5
5
%5,7 4
2
=
=<<
=−<<−
==
≅==
µ
µ
µ
σσ
α
CI
P
P
zz
nx
Questão 9
Resposta:
Veja )x(e µ−= e x
xzσ
µα
−= então e*z x =σα
Nessas condições: 9 3,11 7,0*6 9,1* ===x
ze σα
GABARITO
159
Questão 10
Resposta: Se 5 9,0)1( =≤eP então n = ?
elementosn
n
n
n
n
zz
6 9
4 0,6 9
8,9
5*6 9,1
1*6 9,1
6 9,1
2
%5,7 4
≥
≥
≥
≥
≤
==
σ
α
GABARITO
seções
Tema 08Testes de Hipóteses
SeçõesSeções
Tema 08Testes de Hipóteses
163
CONTEÚDOSEHABILIDADES
Conteúdo
Nessa aula você estudará:
• O que é hipótese e o que é tese.
• O que é hipótese nula e o que é hipótese alternativa.
• Em que situações se aplicam testes estatísticos.
• O teste t, o teste z, o Qui-quadrado.
Introdução ao Estudo da Disciplina
Caro(a) aluno(a).
Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136.
Roteiro de Estudo:
Ivonete Melo de CarvalhoEstatística Aplicada
164
CONTEÚDOSEHABILIDADES
Testes de Hipóteses
Testes Estatísticos
Testes estatísticos são ferramentas utilizadas para validar o trabalho do pesquisador. Para entender seu significado e sua abrangência, além de conceituá-los, deve-se aplicá-los sobre uma mesma situação-problema.
Exemplo: dois gerentes de uma unidade de uma grande empresa de prestação de serviços discutem, entre si, para saber qual deles possui clientes mais satisfeitos em suas respectivas carteiras, na tentativa de melhorar os serviços prestados. Para medir o grau de satisfação, aplicam um questionário com questões intervalares de 5 pontos. A tabela apresenta os resultados obtidos:
Gerente 11 2 3 2 4 3 3 3 4 4 Total
573 4 3 2 1 3 4 2 4 2
Gerente 22 4 5 3 3 4 2 5 4 5 Total
693 3 4 5 3 2 1 3 4 2
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Para que serve um teste estatístico?
• Onde e por que utilizar o teste t?
• Onde e por que utilizar o teste z?
• Onde e por que utilizar o Qui-quadrado?
LEITURAOBRIGATÓRIA
165
LEITURAOBRIGATÓRIATestes de hipóteses:
Dá-se o nome de testes de hipóteses àqueles com os quais se supõe (ou não) verdadeira uma situação inicial; eles podem ser de dois diferentes tipos: teste t e teste z. A diferença entre os dois está no tamanho da amostra e no fato de a variância ser (ou não) conhecida.
Para realizá-los, considera-se:
• Teste T: amostra menor que 30 e variância desconhecida.
• Teste Z: amostra maior ou igual a 30 e variância conhecida ou não.
Definições importantes:
Teste de hipótese é uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com base em elementos amostrais.
Hipótese é a teoria que se deseja comprovar como correta. Existirão sempre duas hipóteses, H0 que é a hipótese nula (ou probanda) e H1: hipótese alternativa. Geralmente a hipótese alternativa H1 representa a suposição que o pesquisador quer provar, sendo a hipótese nula H0 formulada com o expresso propósito de ser rejeitada.
Conseguindo-se rejeitar H0, a hipótese alternativa (H1) terá de ser aceita, conseguindo, então, o pesquisador provar o que queria.
Erro é uma falha na avaliação de uma hipótese e podem ser de dois tipos:
• Erro Tipo I (α): A hipótese nula é verdadeira e o pesquisador a rejeita.
• Erro Tipo II (β): A hipótese nula é falsa e o pesquisador a aceita.
A probabilidade de cometer Erros do Tipo I chama-se Nível de Significância do Teste, dado por α. Já a probabilidade de β não pode ser calculada, a menos que se especifique um valor alternativo para µ.Opoderoupotênciadotesteédadopor(1−β).
166
Resumindo:
Se H0 é:
Verdadeira Falsa
PesquisadorAceita H0 Decisão Correta Erro tipo II
Rejeita H0 Erro tipo I Decisão Correta
Teste Bicaudal ou Bilateral
00 :H µµ = e 01 :H µµ ≠ em que é a média populacional e 0µ é o valor suposto para a média populacional.
Representação Gráfica:
RA é a região de aceitação da hipótese nula e RC é a região crítica ou região de rejeição. A fronteira entre essas regiões será dada por um valor tabelado (Tabela de Distribuição Normal ou da Tabela da Distribuição t-Student).
Figura 8.1: Teste Unicaudal ou Unilateral à Direita
0100 :He :H µµµµ >=
Fonte: Elaboração da autora.
LEITURAOBRIGATÓRIA
167
Figura 8.2: Teste Unicaudal ou Unilateral à Esquerda
0100 :He :H µµµµ <=
Fonte: Elaboração da autora.
As figuras 8.1 e 8.2 anteriores são representações de curvas normais. Para amostras pequenas utiliza-se a tabela t-Student, de acordo com o seguinte parâmetro:
TamanhoVariância
PopulacionalTipo de
Distribuição
Grande n 30≥Conhecida Normal
Desconhecida Normal
Pequeno n 30<Conhecida Normal
Desconhecida t-Student
O teste T ou Distribuição t-Student só será utilizado quando a amostra for pequena, n < 30, e a variância populacional for desconhecida.
Se a amostra for grande, a partir de 30 elementos, sendo, ou não, conhecida a variância populacional, usa-se a Tabela da Distribuição Normal para arbitrar o valor ZTAB, ou seja, aplica-se o teste Z.
Teste T
Uma de suas finalidades é determinar (ou não) a igualdade entre duas médias, supondo independência e normalidade das observações. Para aplicá-lo, é necessária a presença de pelo menos dois grupos cujas variâncias podem, ou não, ser iguais, pois há alternativas de teste para ambas as situações.
LEITURAOBRIGATÓRIA
168
Considere somente variâncias iguais entre si.
Teste T para duas amostras não relacionadas: o teste é largamente utilizado para verificar se a diferença entre as médias aritméticas entre duas amostras pode, ou não, ser considerada grande para ser significativa.
No problema apresentado, o primeiro gerente obteve média 2,85 e o segundo, 3,45, o que sugeriria que o segundo gerente foi mais eficiente.
Nesse caso, o teste t visa comprovar se a diferença entre as médias é (ou não) significativa e, também, explicar se tal diferença não se deve a erro amostral.
É importante destacar que, em amostras pequenas, existe uma tendência para que as médias das amostras sejam diferentes mesmo que oriundas da mesma população. Assim, o teste t busca determinar se o grau de diferença entre os grupos observados não se deve a outros fatores e não a erro de amostragem.
Os passos lógicos para execução do teste são:
1. Determinar H0, não havendo diferenças entre as médias.
2. Determinar H1, para a existência de diferença entre as médias.
3. Estabelecer um nível de significância.
4. Calcular t, sendo os graus de liberdade, φ = n1 + n2 – 2
xsxt µ−
=
Sendo: nsSx = e 2
n
1i
2 )xx(1n
1S ∑ −−
=
Ou:
+
−++
+=
212
21
21
11*2
1 nnnn
QSQS
xxt em que SQ é a soma dos quadrados e x e x 21 são as
médias de cada grupo.
LEITURAOBRIGATÓRIA
169
No problema: % 5; 5 3,1 :H3,15 :H 10 =≠= αµµ e
Tabelando os elementos apresentados e realizando todos os cálculos necessários (utilize a planilha Excel) ter-se-á:
2G 2G 11 m-G 22 m-G 211 )m-G( 2
22 )m-G(
1 2 -1,85 -1,45 3,4225 2,1025
2 4 -0,85 0,55 0,7225 0,3025
3 5 0,15 1,55 0,0225 2,4025
2 3 -0,85 -0,45 0,7225 0,2025
4 3 1,15 -0,45 1,3225 0,2025
3 4 0,15 0,55 0,0225 0,3025
3 4 0,15 0,55 0,0225 0,3025
3 5 0,15 1,55 0,0225 2,4025
4 4 1,15 0,55 1,3225 0,3025
4 5 1,15 1,55 1,3225 2,4025
3 3 0,15 -0,45 0,0225 0,2025
4 3 1,15 -0,45 1,3225 0,2025
3 4 0,15 0,55 0,0225 0,3025
2 5 -0,85 1,55 0,7225 2,4025
1 3 -1,85 -0,45 3,4225 0,2025
3 2 0,15 -1,45 0,0225 2,1025
4 1 1,15 -2,45 1,3225 6,0025
2 3 -0,85 -0,45 0,7225 0,2025
4 4 1,15 0,55 1,3225 0,3025
2 2 -0,85 -1,45 0,7225 2,1025
total 57 69 18,55 24,95
média 2,85 3,45
LEITURAOBRIGATÓRIA
170
Efetuando a substituição:
| 2,85 3,45 | 0,60 0,60t6,4 1 0,64|18,55 24,95 | 1 1 **38 10 3820 20 2 20 20
t 1,7733 1,77
−= = =
+ + + − ≅ ≅
| 2,85 3,45 | 0,60 0,60t6,4 1 0,64|18,55 24,95 | 1 1 **38 10 3820 20 2 20 20
t 1,7733 1,77
−= = =
+ + + − ≅ ≅
Sendo t = 1,77 e t tabelado igual a 2,02 com 38 graus de liberdade, rejeita-se a hipótese nula em prol da hipótese verdadeira.
Conclui-se, portanto, que os dois grupos de clientes estão satisfeitos e que provavelmente as diferenças entre as médias sejam em razão do erro de amostragem.
Teste Z
Aliviados por não precisar competir entre si, os gerentes resolveram juntar os 40 questionários e testar suas respostas regionalmente; o tamanho da amostra passa a ser considerado grande, e o teste a ser utilizado é o teste z que terá por objetivo verificar a igualdade entre uma média conhecida (numa dada população) e outra calculada pelo pesquisador (numa amostra).
O procedimento é, basicamente, o mesmo que no teste t: (1) Determinar H0; (2) Determinar H1; (3) Estabelecer um nível de significância; e (4) Calcular
1 2
1 2
1 2 1 2
x xz
ó ó 1 1*n n 2 n n
+=
++ + −
ou
Considerando os dados do exemplo, ter-se-á:
x 3,15
ó 43,5 6,59
=
= ≅x 3,15
ó 43,5 6,59
=
= ≅
LEITURAOBRIGATÓRIA
171
Aplicando o teste:
H0: µ = 3,15; H1 = µ = 3,15; e α = 5%
Zcalc = 0 é menor que Ztab = 1,65, então aceite H0 como hipótese verdadeira.
Teste do Qui-quadrado para independência (duas amostras)
Verifica se as distribuições de duas ou mais amostras não relacionadas diferem significativamente em relação a determinada variável.
Condições para a execução do teste
1. Exclusivamente para variáveis nominais e ordinais.
2. Preferencialmente para amostras grandes.
3. Observações independentes.
4. Não se aplica se 20% das observações forem inferiores a 5.
5. Não pode haver frequências inferiores a 1.
6. Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo outro critério específico.
7. Qualquer que seja o teste, sempre os procedimentos são iniciados pela determinação das hipóteses:
8. H0: as variáveis são independentes ou não estão relacionadas; aqui se assume que não há diferenças nas proporções das populações – amostras – estudadas, ou seja: H0: p1 = p2 . H1 contradiz H0.
9. Estabelecer o nível de significância.
10. Determinar a região de rejeição de H0.
LEITURAOBRIGATÓRIA
172
11. Determinar o valor dos graus de liberdade: )1C(*)1L( −−=φ , em que L é o número de linhas da tabela a ser estudada e C, o número de colunas.
12. Encontrar o valor de ∑ −=
célulassatodas
e
fff
2
202 )(χ em que fo é a frequência observável e fe é a
frequência normal esperada.
Para calcular a proporção, basta fazer: 1 2
1 2
x x xpn n n
+= =
+ , em que x representa os sucessos
obtidos e n, o número de elementos da amostra.
Sendo o Qui-Quadrado calculado maior do que o tabelado, rejeita-se H0 em prol de H1.
No exemplo, suponha que a pesquisa aplicada pelos gerentes girasse em torno do item “conhecimentos específicos dos produtos oferecidos pela empresa”.
Gerentes
1 2
Possíveis notas
Frequência
Observada
Frequência
Esperada
Frequência
Observada
Frequência
EsperadaTotais
1 2 1,5 1 1,5 3,0
2 5 4,5 4 4,5 9,0
3 7 6,5 6 6,5 13,0
4 6 5,5 5 5,5 11,0
5 0 2,0 4 2,0 4,0
total 20 20 20 20 40
Aplicando o teste:
φ = (2 - 1) * (2 - 1) = 1
grau de liberdade
0 1 2 1 1 2H : p p ; H : p p= ≠
LEITURAOBRIGATÓRIA
173
fo feo e(f f )− 2
o e(f f )−2
o e
2
(f f )f−
2 1,5 -0,5 0,25 0,167
1 1,5 0,5 0,25 0,167
5 4,5 -0,5 0,25 0,056
4 4,5 0,5 0,25 0,056
7 6,5 -0,5 0,25 0,038
6 6,5 0,5 0,25 0,038
6 5,5 -0,5 0,25 0,045
5 5,5 0,5 0,25 0,045
0 2,0 2 4 2,000
4 2,0 -2 4 2,000
∑ 4,612
Para %5=α e grau de liberdade 1, a tabela nos informa uma leitura de 3,841, ou seja, 841,3612,4 2
tab2calc =>= χχ , portanto, H0 deve ser aceita como verdadeira.
Distribuição F
A distribuição F de Fisher-Snedecor é uma distribuição de probabilidade contínua que surge frequentemente como a distribuição nula de uma estatística de teste, particularmente na análise da variância. Também conhecida como distribuição F de Fisher (Ronald Fisher) ou distribuição F de Snedecor (George W. Snedecor), mede a razão entre duas qui-quadrado independentes.
A distribuição F de Snedecor depende de dois graus de liberdade. O primeiro (m) é o grau de liberdade do numerador e o segundo (n) do denominador.
Cada parâmetro é associado ao tamanho amostral menos um. Uma das possíveis representações da função densidade de probabilidade F, em termos da função Gama, é dada por:
LEITURAOBRIGATÓRIA
174
),0[,3,2,1,) (*
2*
2
***2
2
222 1*
, ∞∈=+
Γ
Γ
+
Γ=
+
−
xnmnxmnm
xnmnm
Fnm
mnm
nm
Propriedades da distribuição F (de Snedecor)
(1) Média, expectância ou valor esperado 2m
m)x(E−
==µ , em que m é o grau de liberdade do numerado;
(2) )4n(*)2m(*m
)2nm(*m2)x(V2
2
−−−+
=σ=
LINKSIMPORTANTES
Quer saber mais sobre o assunto? Então:
SitesTeste os seus conhecimentos: faça exercícios a respeito de testes de hipóteses e veja a resolução comentada. Amplie sua visão a respeito da estatística lendo e estudando o material disponível nos sites indicados em seguida.
Acesse o site “Exercícios – Brasil Escola”.
Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
LEITURAOBRIGATÓRIA
175
LINKSIMPORTANTESAcesse o site “Portal Action”.
Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada.
Acesse o site “Exercícios – Professor Cardy”.
Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada.
Acesse o site “Matematiquês”.
Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014.
Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada.
VídeosAssista aos vídeos com exercícios comentados.
Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 14 jan. 2014.
Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio).
176
Instruções:
Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema.
Questão 1:
De uma população normal com variância 36, toma-se uma amostra causal de ta-manho 16, obtendo-se 3 4=x . Ao nível de 10%, teste as hipóteses:
≠=
5 4:5 4:
1
0
µµ
HH
Questão 2:
Seja ).5 2,(: µNx . Para o teste da média 5 1=µ contra 2 1=µ , retirou-se uma amos-
tra aleatória de 16 elementos de x, tendo-se observado para a média amostral o valor 13. Determine o nível descritivo do teste.
a) 0,065
b) 0,060
c) 0,055
d) 0,010
e) 0,005
Questão 3:
Sabe-se, por experiência, que 5% da pro-dução de um determinado artigo é defeitu-osa. Um novo empregado é contratado. Ele produz 600 peças do artigo com 82 defeitu-osas. Ao nível de 15%, verifique se o novo empregado produz peças com maior índice de defeitos que o existente.
AGORAÉASUAVEZ
177
a) Sim, rejeita-se H0.
b) Sim, rejeita-se H1.
c) Não, aceita-se H0.
d) Não, aceita-se H1.
e) Os dados são insuficientes para se obter a análise adequada.
Questão 4:
Uma fábrica de automóveis anuncia que seus carros consomem, em média, onze litros por 100 quilômetros, com desvio pa-drão de 0,8 litro. Uma revista decide testar essa afirmação e analisa 35 carros des-sa marca, obtendo 11,4 litros por 100 km, como consumo médio. Admitindo que o consumo tenha distribuição normal, ao ní-vel de 10%, o que a revista concluirá sobre o anúncio da revista?
a) O anúncio não é verdadeiro, rejeita-se H0.
b) O anúncio não é verdadeiro, rejeita-se H1.
c) O anúncio é verdadeiro, rejeita-se H0.
d) O anúncio é verdadeiro, rejeita-se H1.
e) Os dados são insuficientes para se obter a análise adequada.
Questão 5:
Leia com atenção o problema descrito a seguir e responda: qual valor de zcalc para os dados propostos?
A altura dos adultos de uma cidade tem distribuição normal com média de 164cm e desvio padrão de 5,82cm. Deseja-se saber se as condições sociais desfavorá-veis vigentes na parte pobre dessa cidade causam um retardamento do crescimento dessa população. Para isso, levantou-se uma amostra de 144 adultos dessa parte da cidade, obtendo-se a média de 162cm. Pode esse resultado indicar que os adul-tos residentes na área são em média mais baixos que demais habitantes da cidade ao nível de 5%?
a) -4,124
b) -1,64
c) 0,485
d) 1,64
e) 5,82
Questão 6:
Para os dados do problema do exercício número 5, a hipótese levantada deve, ou não, ser rejeitada?
AGORAÉASUAVEZ
178
Questão 7:
Em uma experiência sobre percepção ex-trassensorial, um indivíduo “A”, em uma sala isolada, é solicitado a declarar a cor vermelha ou preta (em números iguais) de cartas tiradas ao acaso de um baralho de 50 cartas, por outro indivíduo “B”, co-posicionado em outra sala. Se “A” identifi-ca corretamente 32 cartas, esse resultado é significativo ao nível de 5% para indicar que “A” tem PES?
Questão 8:
Um candidato a deputado estadual afir-ma que terá 60% dos votos dos eleitores de uma cidade. Um instituto de pesquisas colhe uma amostra de 300 eleitores des-sa cidade, encontrando 160 que votarão no candidato. Esse resultado mostra que a afirmação do candidato é verdadeira, ao nível de 5%?
Questão 9:
A vida média de uma amostra de 100 lâm-padas produzidas por uma fábrica foi cal-culada em 1.570 horas, com desvio padrão de 120 horas. Sabe-se que a duração das lâmpadas dessa fábrica tem distribuição normal com média de 1600 horas. Ao nível de 1%, teste se houve alteração na dura-ção média das lâmpadas.
Questão 10:
Teste
>=
0 5:0 5:
1
0
µµ
HH , dados:
2 5;100; %5;42 ==== xnασ
AGORAÉASUAVEZ
179
Neste tema, você conheceu as definições a respeito de testes de hipóteses e sua utilidade. Aprendeu como obtê-los tanto para a população quanto para uma amostra dela. Resolva, portanto, os exercícios para praticar os conceitos aprendidos. Busque (e compreenda) outros pontos de vista, consultando a bibliografia utilizada como base para este trabalho.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos!
BELLO, Pedro. Estatística FCC. Rio de Janeiro: Ferreira, 2008.
CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009.
CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997.
FONSECA, J. S; MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996.
FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.
KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con-trole. São Paulo: Atlas, 1996.
REFERÊNCIAS
FINALIZANDO
180
REFERÊNCIASLABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.
LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136.
MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.
MORETTIN, Luiz Gonzaga. Estatística Básica: volume 2 – Inferência. São Paulo: Pearson Education do Brasil, 2000.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro-posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p. 124.
SLACK, N. Administração da produção. São Paulo: Atlas, 1997.
Erro: é uma falha na avaliação de uma hipótese.
Expectância: o mesmo que média ou valor esperado.
Hipótese: é a teoria que se deseja comprovar como correta.
Testes de hipóteses: são aqueles com os quais se supõe (ou não) verdadeira uma situação inicial.
Testes estatísticos: são ferramentas utilizadas para validar o trabalho do pesquisador.
GLOSSÁRIO
181
Questão 1
Resposta: O teste é bilateral e α = 10%. Nesse caso, a RNR (região de não rejeição) será P (|z| < z0) = 1- α.
zα = z5% = 1,64 → P (|z| < 1,64) = 0,90
.HrejeitasenãoRNR43xcomo
)46,4754,42(P
)5,1*64,1455,1*64,145(P
)*z*z(P:RNR
5,146
90,0)64,1|z(|P64,1zz
0
H
H
HxHx
x
%5
0
0
00
∈=
<<
+<<−
<+<<−
==
=<⇒==
µ
µ
µσµµσµ
σ
αα
α
.HrejeitasenãoRNR43xcomo
)46,4754,42(P
)5,1*64,1455,1*64,145(P
)*z*z(P:RNR
5,146
90,0)64,1|z(|P64,1zz
0
H
H
HxHx
x
%5
0
0
00
∈=
<<
+<<−
<+<<−
==
=<⇒==
µ
µ
µσµµσµ
σ
αα
α
P (45 - 164 * 1,5 < μH0 < 45 + 1,64 * 1,5)
P (42,54 < μH0 < 47,46)
como . 3 4
)46,4754,42(
)5,1*64,1455,1*64,145(
)**(:
5,146
90,0)64,1|(|64,1
0
%5
0
0
00
HrejeitaesnãoRNRxcomo
P
P
zzPRNR
zPzz
H
H
HxHx
x
∈=
<<
+<<−
<+<<−
==
=<⇒==
µ
µ
µσµµσµ
σ
αα
α
Questão 2
Resposta: Alternativa C.
Questão 3
Resposta: Alternativa A.
Questão 4
Resposta: Alternativa A.
Questão 5
Resposta: Alternativa A.
GABARITO
182
Questão 6
Resposta: Não, a hipótese levantada não deve ser rejeitada, pois a média CRx 162∈= ; portanto, rejeita-se H0.
Questão 7
Resposta: Analisando-se os dados apresentados e construindo-se o IC, pode-se concluir que “A” tem PES.
Questão 8
Resposta: Considerando que CRzcalc ∈ , deve-se considerar que a afirmação do candidato é falsa, a 5% de risco.
Questão 9
Resposta: Considerando que RNRzcalc ∈ , não é significativa a alteração da vida média das lâmpadas a 1%.
Questão 10
Resposta: Considerando que zcalc = 10,0, deve-se rejeitar a hipótese probanda.
GABARITO