matemática integrada_unidade i(1)
TRANSCRIPT
-
8/18/2019 Matemática Integrada_Unidade I(1)
1/80
Autor: Profa. Marisa Rezende Bernardes
Colaboradoras: Profa. Valéria de Carvalho
Profa. Mirtes Mariano
Profa. Ana Carolina Bruno Borges
Matemática Integrada
-
8/18/2019 Matemática Integrada_Unidade I(1)
2/80
Professora conteudista: Marisa Rezende Bernardes
Possui graduação em engenharia civil pela Universidade Estadual de Maringá (1980), é licenciada em matemáticapela Universidade Estadual de Maringá (1988), cumpriu mestrado e doutorado pelo programa de pós-graduação daFaculdade de Ciências da Universidade Estadual Paulista Júlio de Mesquita Filho, concluídos respectivamente em 2003
e 2009, e é vinculada ao Grupo de pesquisa em História Oral e Educação Matemática (GHOEM). Como parte do corpodocente, ingressou na Universidade Paulista, campus Bauru em 2003. Atualmente é professora titular e coordenadorageral do curso de licenciatura em matemática da Universidade Paulista.
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ouquaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Dados Internacionais de Catalogação na Publicação (CIP)
B517m Bernardes, Marisa Rezende
Matemática Integrada / Marisa Rezende Bernardes- São Paulo:Editora Sol, 2014.
188 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e
Pesquisas da UNIP, Série Didática, ano XVII, n. 2-021/14 , ISSN 1517-9230.
1. Matemática integrada. 2. Parâmetros. 3. Hipóteses. I.Título.
CDU 51
-
8/18/2019 Matemática Integrada_Unidade I(1)
3/80
Prof. Dr. João Carlos Di GenioReitor
Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias
Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy
Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
Material Didático – EaD
Comissão editorial:Dra. Angélica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Dra. Valéria de Carvalho (UNIP)
Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico: Prof. Alexandre Ponzetto
Revisão: Andréia Andrade Virgínia Billato
-
8/18/2019 Matemática Integrada_Unidade I(1)
4/80
-
8/18/2019 Matemática Integrada_Unidade I(1)
5/80
Sumário
Matemática IntegradaAPRESENTAÇÃO ......................................................................................................................................................7
Unidade I
1 AMOSTRAGEM .....................................................................................................................................................91.1 Introdução ..................................................................................................................................................91.2 Tipos de amostragem .......................................................................................................................... 10
1.2.1 Amostragem probabilística .................................................................................................................101.3 Técnicas de amostragem probabilística ......................................................................................121.4 Dados de uma amostra ......................................................................................................................13
2 CORRELAÇÃO ................................................................................................................................................... 172.1 Introdução ...............................................................................................................................................172.2 Correlação linear................................................................................................................................... 17
2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson ........................ .... 192.2.2 Cálculo do coeficiente de correlação r...........................................................................................202.2.3 Correlação positiva .................................................................................................................................202.2.4 Correlação negativa ...............................................................................................................................20
2.3 Diagramas de dispersões ................................................................................................................... 213 REGRESSÃO LINEAR .......................................................................................................................................33
3.1 Introdução ............................................................................................................................................... 333.2 Diagrama de dispersão .......................................................................................................................333.3 Conceito de regressão linear ........................................................................................................... 34
4 ESTIMATIVA DE PARÂMETROS ...................................................................................................................454.1 Introdução ............................................................................................................................................... 454.2 Parâmetro e estatística da amostra .............................................................................................. 46
4.2.1 Obtenção dos principais parâmetros estatísticos .......................... ........................... ................. 46
4.3 Distribuição amostral ..........................................................................................................................474.4 Teorema do Limite Central ............................................................................................................... 474.5 Intervalo de confiança para a média populacional ................................................................554.6 Intervalo de confiança para a variância e o desvio padrão ................................................62
Unidade II
5 TESTES DE HIPÓTESES .................................................................................................................................... 815.1 Hipóteses nulas e alternativas ........................................................................................................ 81
5.2 Teste de hipótese para a média de uma população, amostra grande e pequena ...... 83
-
8/18/2019 Matemática Integrada_Unidade I(1)
6/80
5.3 Teste de hipóteses para a média de duas populações .......................................................107
6 TESTES NÃO PARAMÉTRICOS .................................................................................................................. 1176.1 Teste de qui-quadrado .....................................................................................................................1176.2 Teste de adequação de ajustamento ..........................................................................................118
7 TESTE QUI-QUADRADO DE ADERÊNCIA ............................................................................................1227.1 Teste para a normalidade ................................................................................................................122
8 TESTE DE QUI-QUADRADO PARA INDEPENDÊNCIA .......................................................................128
-
8/18/2019 Matemática Integrada_Unidade I(1)
7/80
7
APRESENTAÇÃO
Assim como já foi alertado em livros-textos anteriores, este é um texto elaborado para um curso deeducação a distância. Portanto, nunca é demais lembrar que esse é um posicionamento importante, umavez que estabelece um ambiente de aprendizagem diferente daquele utilizado pelo ensino presenciale, portanto, tem exigências diferenciadas. Essa modalidade de educação caracteriza-se por ser umaprática educativa que exige do estudante, mais do que em outra modalidade, construir conhecimentose participar efetivamente de seu próprio crescimento. Esse modelo implica, obviamente, um processo deensino próprio, uma vez que modifica, ou mesmo suprime o físico e o estrutural do ensino presencial.Assim, a função docente sofre um deslocamento, seu papel é descentralizado, e a forma de atenção aoaluno está mais próxima do que se entende por pesquisa em meios acadêmicos. É um novo formatode ensino-aprendizagem na graduação, no qual os estudantes, assim como aqueles que se iniciam empesquisas acadêmicas, devem aprender a estudar sozinhos, a buscar informações com base em indicaçõesdo docente responsável pelo curso (orientador) e ser capazes de fazer inferências na produção do seu
conhecimento.
Os objetivos listados no plano de ensino da disciplina visam desenvolver, com o educando:
• as condições atuais e tendências nos diversos ambientes de ensino e aprendizagem, de forma ainstrumentá-lo para exercer sua função em diversos níveis de possíveis atuações;
• a compreensão do papel que a disciplina Matemática desempenha nos âmbitos da sociedade e daciência;
• as possibilidades de mediação nos ensinos fundamental e médio a partir dos tópicos listados.
Esses objetivos visam à aplicabilidade do conteúdo desenvolvido nas disciplinas Estatística (nivelamento) e Probabilidades e Estatística. Nessas disciplinas, o leitor foi introduzido nessa seara,a estatística, que apresenta um arsenal teórico para o embasamento de procedimentos importantesno encaminhamento de muitos processos avaliativos, no âmbito da Ciência, dos processos industriais,comerciais e até mesmo em situações cotidianas. Nesse texto, serão aplicados conhecimentosdesenvolvidos anteriormente, como organização de dados, medidas de posição e dispersão etc. naobtenção de informações para projetos de pesquisa ou informações úteis nas decisões necessárias àsmais diversas empresas e situações cotidianas. O objetivo é que o estudante avalie como as habilidades
desenvolvidas no curso de Matemática podem ser estendidas às outras atividades, como pesquisasacadêmicas (cursos de mestrado e doutorado), industrial (em avaliações de investimentos, em produçãoe qualidade), no comércio (público alvo), marketing (tipos de propagandas) e ciências aplicadas(farmacêutica, avaliações de aplicabilidade de instrumentos em medicina, em engenharia, odontologiaetc., e avaliações em administração de empresas).
Observação
Nos mais diversos procedimentos cotidianos, bases estatísticasinterferem em decisões sem que as pessoas tenham efetivo conhecimento
-
8/18/2019 Matemática Integrada_Unidade I(1)
8/80
8
disso. Por exemplo, ao atravessar uma rua, as pessoas fazem avaliaçõesmentais baseadas em conhecimentos adquiridos em ocasiões anteriores.Ou seja, a decisão de atravessar ou não é pautada em “amostras”, quesão situações anteriormente vivenciadas pelo indivíduo em um conjuntoformado por carros, pessoas e variáveis que as inter-relacionam (velocidadedos automóveis, largura da rua, pessoas que impedem uma travessia emmenor tempo, presença de semáforos para pedestres etc.)
-
8/18/2019 Matemática Integrada_Unidade I(1)
9/80
9
MATEMÁTICA INTEGRADA
Unidade I
1 AMOSTRAGEM
1.1 Introdução
A escolha do método a ser utilizado na amostragem deve garantir uma amostra representativada população em relação ao interesse que se tem sobre ela, tanto em gênero como em número. Naverdade, a amostra é a parte mais importante de uma pesquisa, que depende de pressupostos obtidosa partir dela, porque permite inferências em relação à população de origem. Uma analogia seria
comparar uma amostra, que supomos representativa de uma população, a uma maquete de um edifícioa ser construído. A amostra, da mesma forma que a maquete, será melhor ou pior, segundo o grau derepresentatividade que ofereça. Ou seja, a maquete, se bem feita, permitirá uma visão antecipada doque se pretende construir. Assim, a amostra, se bem selecionada, dará condições de inferir resultadossobre a população de interesse sem que tenha conhecimento total sobre ela. A utilização de amostrasna realização de pesquisas é justificada pelo fato de que as populações (universo) nem sempre sãototalmente acessíveis. Quando abrangentes, a utilização de toda a população oneraria muito umapesquisa (sem considerar que talvez não seja nem possível encampá-la em sua totalidade) e de formadesnecessária, pois uma amostra bem selecionada pode ser suficiente para o que se deseja investigar,com razoável confiabilidade.
Lembrete
Mas veja bem, é preciso um cuidado extremo na escolha dos métodosde obtenção das amostras.
Analise a matéria a seguir, publicada em 23 de agosto de 2005, pelo Instituto Brasileiro de Defesado Consumidor (IDEC):
Idec pede esclarecimentos à Aneel – 30/8/2005.
No último (sic) dia 22, a Agência Nacional de Energia Elétrica (Aneel) admitiu errona pesquisa de satisfação do consumidor de 2004 e decidiu descartar o seu resultadono cálculo do reajuste tarifário das distribuidoras nesse ano (veja notícia). A diretoria daagência aprovou naquele dia a troca do Índice Aneel de Satisfação do Consumidor (Iasc), de2004, pelo resultado de 2003 no cálculo do “fator x”. O resultado da pesquisa de satisfaçãoé utilizado como um dos parâmetros para o cálculo do índice de produtividade (fator x) dasempresas, que influencia o reajuste anual das contas de luz.
-
8/18/2019 Matemática Integrada_Unidade I(1)
10/80
10
Unidade I
Segundo matéria publicada no caderno ‘Dinheiro’, do jornal Folha de São Paulo(fl. B 7), de 23 de agosto de 2005, a agência teria decidido “não usar os resultados daúltima pesquisa de qualidade dos serviços prestados pelas distribuidoras de energiano cálculo dos reajustes de tarifa deste ano”.
Ainda segundo a matéria, a decisão foi tomada à vista da constatação de erros namedição em um município do Rio de Janeiro, e a sua consequência direta seria a aplicaçãode reajustes maiores que os devidos.
Fonte: Instituto Brasileiro de Defesa do Consumidor. IDEC em ação . 30 out. 2005.Disponível em: . Acesso em: 24 jun. 2011.
Esse episódio acarretou comentários de economistas, tais como o a seguir:
Talvez a principal lição desta história seja a de que se o modelo regulatório possuium índice de reajuste que varia diretamente com um índice de satisfação doconsumidor obtido via amostragem, então o cuidado com esta deve ser, sempre,redobrado. Afinal, como ficamos agora? Com um reajuste que reflete a realidade de2003? (SHIKIDA, 2005).
Caro aluno, percebeu como apenas um exemplo já nos revela a extrema importância de uma escolhacorreta da amostra com que se irá realizar a pesquisa? Portanto, todo cuidado é pouco!
A seguir, veremos os tipos de amostragem que você poderá utilizar e as diferentes técnicas a serem
utilizadas.
1.2 Tipos de amostragem
1.2.1 Amostragem probabilística
Você deve estar se perguntando: o que significa o termo probabilística? Qual a relação com o quefoi estudado anteriormente?
Uma amostra é denominada dessa forma quando cada elemento da população, a partir da qual elafoi selecionada, tem probabilidade conhecida e diferente de zero de pertencer à ela.
Uma amostragem não probabilística acontece quando é feita uma escolha deliberada dos elementosque irão compô-la. Assim, não podemos generalizar os resultados das pesquisas obtidos a partir dessaamostra para a população, uma vez que essa técnica de amostragem (não probabilística) não garante arepresentatividade da população. A escolha da amostra foi feita de forma deliberada e não ao acaso, oque diminui a confiabilidade (a amostra pode estar viciada).
O uso da amostragem probabilística é recomendável, já que essa permite uma análise minuciosa dos
dados coletados. Porém, o custo de uma amostragem probabilística é sempre maior que de uma não
-
8/18/2019 Matemática Integrada_Unidade I(1)
11/80
11
MATEMÁTICA INTEGRADA
probabilística. Mas, de qualquer forma, o gasto a mais é justificado pelas possíveis consequências de umadecisão equivocada, baseada em resultados errados. Quando se trata das amostragens probabilísticas, aqualidade da pesquisa pode ser avaliada, uma vez que seus erros de amostragem podem ser calculados. Aamostragem probabilística é a única forma que permite planos de amostra representativa, ao possibilitarinferir até que ponto os resultados baseados em uma amostra tendem a diferir dos que seriam encontradosa partir do estudo da população. Além disso, se a amostragem é probabilística, é possível especificar-se otamanho da amostra por meio de certo grau de certeza de que seus resultados não vão diferir, por mais deum valor especificado, dos que seriam obtidos num estudo da população total.
Figura 1 – Dispositivos relacionados a jogos, que quando não sofrem algum tipo de interferência indevida, proporcionam condiçõesaleatórias
Lembrete
Condições aleatórias ocorrem quando cada evento tem igualpossibilidade de ser incluído na amostra. Exemplo: lançamento de um dado
não viciado.
Lembrete
Está lembrado do conceito de população utilizado na estatísticadescritiva? Se não, é importante recordar! Vamos fazer isso?
População (ou universo) pode ser definida como um conjunto constituído de indivíduos, objetos,acontecimentos ou outras informações, em que o pesquisador deseja descrever ou pretende generalizaros seus resultados encontrados ou conclusões obtidas a partir da amostra selecionada dela.
-
8/18/2019 Matemática Integrada_Unidade I(1)
12/80
12
Unidade I
1.3 Técnicas de amostragem probabilística
E você deve estar se perguntando: mas será que só existe uma técnica para se fazer essa amostragem?
Não! A amostragem probabilística pode ser realizada por diversas técnicas, dependendo daconveniência, como veremos a seguir. Por isso, não podemos generalizar uma técnica apenas para todasas situações de pesquisa.
• Amostragem aleatória simples: todos os elementos da população têm a mesma probabilidadede pertencer à amostra. Exemplo: tabela de números aleatórios e sorteios.
Seja N o número de elementos da população Ω, e n o número de elementos de uma amostraA = {a
1,a
2,...a
n}. Cada elemento da população tem probabilidade n/N de pertencer à amostra.
p a n
Nn( )=
Observação
Por definição, 0 < p(A) < 1.
Pense a respeito. Como “dica”, lembre-se de que p(Ω) = 1. E, novamente,pense na razão dessa “dica” ser verdadeira.
• Amostragem aleatória estratificada: é utilizada quando a população em questão éheterogênea. Ela se divide em subpopulações homogêneas ou estratos. A variável em estudo podeter comportamentos diferentes de um estrato para o outro, porém apresentar comportamentohomogêneo dentro de cada estrato. Por exemplo, uma população de estudantes pode apresentarvários estratos. Um estrato pode apresentar alunos com médias muito baixas, o outro com notasregulares, o próximo com notas médias e, por último, um estrato formado por alunos com notasaltas. Dentro de cada estrato, o comportamento é homogêneo, mas de uma maneira geral apopulação formada por esses estratos é heterogênea. A amostragem consistirá em fazer-seuma seleção aleatória de cada estrato, sendo o número de elementos selecionados de cada um
proporcional ao seu tamanho.
Exemplo 1: selecionar uma amostra com números de alunos proporcionais aos números de alunosexistentes nos estratos “médias muito baixas”, “notas regulares”, “notas médias” e “notas altas”, napopulação constituída por meus alunos da UNIP, campus de Bauru.
Exemplo 2: selecionar uma amostra com números de homens e mulheres proporcionais aos númerosde homens e mulheres existentes na população, por classe social.
• Amostragem por conglomerados: e xistem alguns casos de populações em que a identificaçãodos seus elementos é impraticável ou extremamente difícil. Mas pode ser muito fácil a identificação
-
8/18/2019 Matemática Integrada_Unidade I(1)
13/80
13
MATEMÁTICA INTEGRADA
de alguns subgrupos (conglomerados) dessa população. Pode ser realizada nessa situação, umaamostra aleatória simples desses conglomerados, e no caso do conglomerado sorteado deveser feita uma contagem completa. Exemplos comuns de conglomerados são turmas de escolas,quarteirões de bairros etc.
Exemplo relacionado com meus alunos: desejo entrevistar uma amostra de estudantes, mas,como sou professora de educação a distância, tenho alunos espalhados por todo o país. Portanto, éimpraticável selecionar essa amostra de estudantes, em que a população não é definida exatamente, a nãoser pela técnica de conglomerados. Posso então, para solucionar o problema, selecionar aleatoriamenteestudantes de duas ou três disciplinas pelas quais sou responsável, tomando o cuidado para garantirque não existam vícios.
• Amostragem sistemática: quando os elementos da população se apresentam ordenadosde acordo com algum critério. Um exemplo seria a retirada de elementos de uma amostra,
periodicamente, a partir de listas telefônicas.
• Amostragem em múltiplas etapas : é uma técnica utilizada para produzir uma amostrarepresentativa de uma população muito espalhada. É similar à técnica por conglomerados,mas nesse caso o processo só é finalizado quando há seleção de unidades individuais deamostragem.
Exemplo: considere que a direção da UNIP deseja uma pesquisa nacional sobre a capacidadeeconômica de seus alunos, de forma a idealizar um plano estratégico que evite a evasão escolarem educação a distância.
— Etapa 1 (unidades amostrais primárias): dividir o país em número de regiões (norte, sul, nordesteetc.) e, então, selecionar aleatoriamente um pequeno número de alunos dessas regiões.
— Etapa 2 (unidades amostrais secundárias): utilizando as amostras de cada região, retirar umaamostra aleatória de sub-regiões (cada estado da federação constituinte de cada região, porexemplo).
— Etapa 3 (unidades amostrais terciárias): a partir das amostras anteriores, estudantes poderiam
ser selecionados para a entrevista por meio de uma amostragem sistemática utilizando oregistro acadêmico.
1.4 Dados de uma amostra
Os exemplos a seguir, retirados de Pinheiro et al (2009), revelam como os dados de uma amostrapodem se tratados de formas diferentes e levar a resultados e conclusões bastante úteis para diferentesprofissionais.
Diego e Walter trabalhavam, havia muitos anos, na fábrica de camisas masculinasColarinho Branco. Um dia, o gerente de produção pediu demissão para ir trabalhar
-
8/18/2019 Matemática Integrada_Unidade I(1)
14/80
14
Unidade I
numa empresa multinacional do ramo. O dono da empresa, Sr. Paulo, chamouentão seus dois experientes empregados para comunicar-lhes que um deles seriao novo gerente de produção. Contudo, disse-lhes que essa escolha dependeria deum pequeno teste ao qual ambos seriam submetidos. Ele pediu a cada um dosdois que:
• selecionasse amostras de 200 homens adultos;
• medisse a circunferência do pescoço de cada indivíduo dessasamostras;
• apresentasse por escrito um relatório com as suas conclusões.
Logo no segundo dia após ter começado as medições, Walter compareceu
sorridente perante Sr. Paulo para apresentar o seu trabalho. Ele não tinhamais dúvidas de que seria escolhido. Passaram-se mais um, dois, três dias, esomente quatro dias depois Diego entregou o seu trabalho. No quinto dia, odono da empresa anunciou: Diego será o novo gerente de produção. Walternão conseguia entender o porquê da escolha, que ele considerava injusta, e foiinterpelar o Sr. Paulo. Expôs os seus motivos e lembrou que tinha entregado oseu trabalho quatro dias antes de Diego. O Sr. Paulo, calmamente, mostrou-lhesos dois trabalhos. O relatório de Walter estava caprichado sim, com as pessoasordenadas alfabeticamente e seus respectivos tamanhos de colarinho. “Bonitoseu trabalho”, falou o Sr. Paulo, “só que de nada me serve”. A seguir, mostrouo relatório que Diego tinha apresentado. As pessoas não estavam ordenadasalfabeticamente, mas por tamanho de colarinho. “Você vê”, falou o dono,”agora eu sei quais são os tamanhos extremos, o menor e o maior. “Além disso”,e mostrou-lhe uma tabela de frequências apresentada por Diego, “posso verimediatamente qual o tamanho do colarinho que tenho que fabricar em maiorquantidade e as proporções correspondentes aos outros tamanhos”. A seguir,mostrou um histograma em que claramente podia ser vista a distribuição dosdiversos tamanhos de colarinho. E ainda tinha mais. No seu trabalho, Diegotinha calculado o tamanho médio dos colarinhos, o seu desvio-padrão e tinha
feito um gráfico de caixas (box-plot ), no qual sobressaiam nitidamente osquartis inferior e superior e a mediana para o tamanho dos colarinhos. Walterficou admirado com o trabalho de Diego. Percebeu que todas as informaçõesapresentadas por ele eram de fato relevantes para a produção de camisas. Diantede tantas evidências, ele aceitou as explicações do Sr. Paulo e foi cumprimentaro colega recém-promovido. No dia seguinte, inscreveu-se em um treinamentoem métodos estatísticos, oferecido por uma conceituada universidade. No casorelatado, Diego apresentou um trabalho muito mais completo que o de Walter,graças ao seu conhecimento das técnicas de análise exploratória de dados(Adaptado de: PINHEIRO et al , 2009, p. 1-2).
-
8/18/2019 Matemática Integrada_Unidade I(1)
15/80
-
8/18/2019 Matemática Integrada_Unidade I(1)
16/80
16
Unidade I
dados para que possamos resumir as informações obtidas a partir deles, de forma que nos “respondam”a respeito do tema que estamos investigando.
Lembrete
Você se lembra do que foi estudado anteriormente sobre os tipos e aorganização de dados coletados? É interessante revisar!
Exemplo de aplicação
Até o momento, você poderá planejar um projeto de pesquisa considerando os seguintes itens:
• as metas da pesquisa;
• definir a população;
• identificar o sistema de amostragem;
• definir o método de coleta de dados;
• ordenar as informações.
Dados
Qualitativos Quantitativos
Nominais ContínuosOrdinais Discretos
Figura 2
Saiba mais
Em Smailes & McGrane (2002), capítulo 1, há importantes informaçõessobre projetos de questionários e tipos de entrevistas.
-
8/18/2019 Matemática Integrada_Unidade I(1)
17/80
17
MATEMÁTICA INTEGRADA
2 CORRELAÇÃO
2.1 Introdução
Em nossos estudos de estatística até o momento, estávamos limitados em descrever a forma dadistribuição dos valores de apenas uma variável. Por exemplo: quando descrevíamos as estaturas deuma amostra de pessoas, esses dados se restringiam a mostrar apenas a frequência de pessoas quese encaixavam naqueles valores. A variável em questão era, portanto, a estatura dessas pessoas.No entanto, na correlação de variáveis, podemos relacionar diferentes estaturas com diferentesidades. Nesse caso, teremos duas variáveis, a estatura e a idade. Logo, ao trabalharmos com duasvariáveis, é possível avaliar e medir as relações entre elas, o que é chamado de correlação devariáveis.
Se houver uma correlação entre elas, poderemos ter uma função matemática que caracteriza
essa relação com a regressão e seremos, dessa forma, capazes de determinar os parâmetros dessafunção.
Neste capítulo, iremos portanto estudar a correlação entre variáveis e a possibilidade daaplicação da regressão linear. O estudo da correlação linear de variáveis é importante para termosa certeza de que poderemos aplicar a regressão linear a partir desses dados já conhecidos ecorrelacionados. Veremos, nesse caso, como uma variável independente qualquer (arbitrariamentedenominada x ou por qualquer outra forma) se comporta de acordo com a mudança da variáveldependente (também arbitrariamente denominada y ou por qualquer outra forma) que estácorrelacionada.
Em pesquisas, é frequente a investigação da existência de relação entre variáveis, isto é,saber se as modificações sofridas por uma das variáveis são acompanhadas por modificaçõesnas outras, como consumo e renda, estatura e idade de indivíduos, entre outras. Veja que, numapesquisa de campo, por exemplo, você poderá chegar a várias conclusões sobre porcentagensde pessoas do gênero feminino e masculino, como preferência eleitoral, nível de escolaridadeetc. Mas, será que essas variáveis apresentam alguma relação entre si? Será que a preferênciaeleitoral está associada ao gênero, feminino ou masculino? Portanto, prezado aluno, essa émais uma forma de você aprofundar os seus estudos e conclusões a respeito dos seus dados
estatísticos.
2.2 Correlação linear
O significado do termo correlação é a existência da relação em dois sentidos (co +relação), usado em estatística para demonstrar a força da relação entre dois conjuntos dedados. Verificar a possível existência e o grau de relação entre as variáveis é o objeto deestudo da correlação.
Se confirmada essa relação, procura-se descrevê-la sob forma matemática, por meio de umafunção. A realização da estimação dos parâmetros dessa função matemática é o objeto da regressão
-
8/18/2019 Matemática Integrada_Unidade I(1)
18/80
18
Unidade I
linear. Nesse caso, os pares de valores das duas variáveis podem ser colocados num diagramacartesiano chamado diagrama de dispersão .
Pai... Vamos estabelecer uma
correlação linear forte entre seusalário e minha mesada?
Figura 3 – Conversas entre pai e filha (adaptação da autora)
Lembrete
É importante se certificar de que existe uma correlação linearentre as variáveis, para que se possa fazer uso da equação da reta,também chamada de reta de regressão, que permite estimar valorespara a variável dependente a partir de um dado valor da variável
independente. Ou seja, só é viável utilizar a regressão linear para seprever novas estimativas, quando já se tem algumas informaçõesprévias sobre determinado tema, quando há certeza de uma fortecorrelação entre as variáveis.
Situação prática da aplicação da correlação de variáveis e regressão linear:
Talvez você não fosse nascido quando o que será relatado a seguir aconteceu em nosso país. Nessecaso, pergunte a respeito aos seus pais, ou tios, ou seus avôs. Leia a respeito. É muito importante sabersobre os métodos estatísticos, mas é igualmente importante conhecer a história. Ambos os instrumentosserão seus aliados em decisões, independente do seu ramo de atividade.
-
8/18/2019 Matemática Integrada_Unidade I(1)
19/80
19
MATEMÁTICA INTEGRADA
Pois bem. Um exemplo típico da utilização da regressão linear foi sua constante utilização em umperíodo em que a economia do país estava bastante desequilibrada, para estimativas futuras de taxasde inflação a partir das taxas atuais.
Verificar se existe relação entre variáveis é um dos propósitos de maior interesse nas pesquisas.Isso é justificado pelo fato de que, como já foi enfatizado, existindo associação entre elas, as análises econclusões sobre os resultados obtidos na pesquisa serão mais confiáveis.
2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson
O coeficiente de correlação, ou coeficiente de Pearson, nos indica se existe correlação entre asvariáveis analisadas. Existirá correlação se esse coeficiente estiver entre -1 e + 1, o que em porcentagemrepresenta entre -100% e + 100%.
Esse coeficiente mostrará também o grau de intensidade existente na correlação entre as variáveisem estudo, como está resumido na tabela a seguir.
Tabela 1 - Classificação do tipo de correlação,segundo o coeficiente de correlação r
Coeficiente de correlação r Tipo de correlação
r = 1 Perfeita positiva
0,8 ≤ r < 1 Forte positiva
0,5 ≤ r < 0,8 Moderada positiva
0,1 ≤ r < 0,5 Fraca positiva
0 < r < 0,1 Ínfima positiva
0 Nula
-0,1 < r < 0 Ínfima negativa
-0,5 < r ≤ -0,1 Fraca negativa
-0,8 < r ≤ -0,5 Moderada negativa
-1 < r ≤ -0,8 Forte negativa
r = -1 Perfeita negativa
Você percebeu que quanto mais o coeficiente de correlação r se aproxima de +1 ou de -1, melhor éa correlação entre as variáveis? Por exemplo, se o coeficiente r de correlação estiver próximo do +1, háuma correlação forte positiva, caso esteja próximo do -1, há uma correlação forte negativa. Por outrolado, quanto mais esse coeficiente se distancia de +1 ou de -1, pior a correlação. Logo, menos confiáveisserão as estimativas feitas a partir desses dados, porque denota um comportamento pouco linear entreos dados.
-
8/18/2019 Matemática Integrada_Unidade I(1)
20/80
20
Unidade I
2.2.2 Cálculo do coeficiente de correlação r
r
xyx y
n
xx
ny
y
n
=−
− ( )
− ( )
∑∑∑
∑ ∑ ∑ ∑
.
.2
2
2
2
Onde:
r = coeficiente de correlação;
x = variável independente;
y = variável dependente;
n = número de possíveis correlações entre as variáveis x e y.
Lembrete
As variáveis independentes e dependentes são arbitrariamente
denominadas de x e y . No entanto, elas podem ter outras denominações,conforme o seu problema de pesquisa. Mas cuidado ao estabelecer qual é avariável dependente e qual é a independente!
2.2.3 Correlação positiva
Dizemos que existe uma correlação positiva entre duas variáveis quando o aumento da variávelindependente resulta no aumento da variável dependente.
Observe uma situação que pode ser um exemplo de forte correlação positiva: um professor quisverificar a existência de correlação entre as notas finais de matemática financeira e estatística de umgrupo de estudantes. Uma vez que as duas disciplinas são da mesma área (exatas), acredita-se em umaforte correlação entre elas. E, mais precisamente, positiva.
2.2.4 Correlação negativa
Dizemos que existe uma correlação negativa entre duas variáveis quando o aumento da variávelindependente resulta no decréscimo da variável dependente.
-
8/18/2019 Matemática Integrada_Unidade I(1)
21/80
21
MATEMÁTICA INTEGRADA
Veja agora uma situação que pode ser um exemplo típico de correlação negativa: na época dacolheita de grãos, verifica-se uma queda nos preços dos produtos agrícolas. Isso mostra que oferta epreços, se estiverem correlacionados, será de forma negativa, uma vez que o aumento da oferta doproduto no mercado irá resultar numa queda dos preços.
Observação
Mas não se esqueça: o fato das duas variáveis estarem aumentandoou diminuindo simultaneamente não significa que exista um efeito diretode uma sobre a outra. É necessário que se investigue o coeficiente decorrelação r para verificar qual posição ele ocupa no intervalo de -1 a +1 e,a partir disso, descobrir qual o grau de correlação entre as variáveis.
Para você pensar: retorne à figura 3 e instrua a garotinha a pedir corretamente (para ela, claro) acorrelação entre o salário do pai e sua mesada. Qual correção você faria na fala dela?
Observação
Quando o coeficiente de correlação r for exatamente igual a +1, existeuma correlação positiva perfeita entre as variáveis consideradas. Da mesmaforma, se esse coeficiente r for exatamente igual a -1, diz–se que existeuma correlação negativa perfeita entre as variáveis.
O que você deverá aprender sobre correlação de variáveis:
• quando existe correlação entre as variáveis;
• em caso afirmativo, que tipo de correlação existe entre elas (se é positiva ou negativa);
• existindo a correlação, se é forte (próxima de +1 e de -1) ou fraca (próxima de zero);
• ao ser confirmada a correlação entre as variáveis, será possível a aplicação da regressão linearpara se fazer novas estimativas a partir de dados já conhecidos;
• quanto mais forte essa correlação, mais confiáveis serão essas estimativas.
2.3 Diagramas de dispersões
Os diagramas de dispersões a seguir mostram o comportamento da relação entre variáveis emdecorrência do coeficiente de correlação linear. Os exemplos estão representados segundo o sistemacartesiano genérico, em que x indicará a variável independente e y a variável dependente. Para se obter
esses gráficos, foi utilizado o winplot (software free ).
-
8/18/2019 Matemática Integrada_Unidade I(1)
22/80
22
Unidade I
Caso 1:
- 2 - 1 1 2 3 4 5 6 7 8
y
x
6
5
4
3
2
1
-1
Figura 4 - Gráfico de uma correlação positiva perfeita
Observe que, nesse caso, o aumento da variável independente x está originando um aumento davariável dependente y . O gráfico apresenta um caso de correlação positiva perfeita. Observe que não hánenhum ponto fora da reta.
Caso 2:
x
y
- 3 - 2 - 1 1 2 3 4 5 6
8
7
6
5
4
3
2
1
-1
Figura 5 - Gráfico de uma correlação positiva imperfeita
Veja que, nesse caso, temos também o aumento da variável independente x originando um aumentoda variável dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracterizauma correlação positiva imperfeita.
Caso 3:
Observe que, nesse caso, o aumento da variável independente x origina um decréscimo da variáveldependente y . O gráfico apresenta uma correlação negativa perfeita, pois não há nenhum ponto fora da reta.
-
8/18/2019 Matemática Integrada_Unidade I(1)
23/80
23
MATEMÁTICA INTEGRADA
- 3 - 2 - 1 1 2 3 4 5 6
5
4
3
2
1
-1
y
x
Figura 6 - Gráfico de uma correlação negativa perfeita
Caso 4
- 3 - 2 - 1 1 2 3 4 5 6
5
4
3
2
1
-1
y
x
Figura 7 - Gráfico de uma correlação negativa imperfeita
Observe que, nesse caso, o aumento da variável independente x origina um decréscimo da variável
dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracteriza umacorrelação negativa imperfeita, uma vez que não temos uma reta perfeita.
Caso 5
- 3 - 2 - 1 1 2 3 4 5 6
54
3
2
1
-1
y
x
Figura 8 - Gráfico que representa ausência de correlação (r = 0)
-
8/18/2019 Matemática Integrada_Unidade I(1)
24/80
24
Unidade I
Perceba que, nesse caso não é possível traçar uma reta, uma vez que os pontos estão totalmentedispersos, o que caracteriza uma ausência de comportamento linear entre eles. Por mais que se tentetraçar uma reta de forma que abranja a maioria dos pontos, vários ficarão fora.
Observação
Você percebeu como podemos determinar, de modo qualitativo, o quão bem uma reta representa a relação entre as variáveis,observando diretamente os diagramas de dispersão apresentadosanteriormente?
Vejamos agora alguns exemplos resolvidos de aplicações do cálculo de correlação de variáveis quepossibilitará uma melhor visualização de como a correlação entre as varáveis podem acontecer e como
podem não acontecer.
Observação
Nos casos em que a correlação é perfeita, seja positiva ou negativa,a equação linear é conveniente. Isto se deve ao fato de que quantomenos dispersão existir em torno da reta, melhor a relação entre asvariáveis. Não é o caso de correlações que foram classificadas comoimperfeitas.
Exemplo de aplicação
Exemplo de correlação positiva
1. A tabela a seguir mostra as despesas com investimentos em treinamento de pessoal e aprodutividade (toneladas) investigada durante certo período de certa empresa.
Pede-se:
a) Verificar se existe correlação entre as variáveis.
b) Em caso afirmativo, que tipo de correlação, positiva ou negativa? Fraca, forte ou moderada?Justifique.
-
8/18/2019 Matemática Integrada_Unidade I(1)
25/80
25
MATEMÁTICA INTEGRADA
Tabela 2 - Despesas com investimentos (em milhares de R$)em treinamento de pessoal e a produtividade (toneladas)
investigadas durante certo período
Investimentos Produtividade
3 12
4 17
5 24
6 18
8 25
8 27
9 30
11 29
12 35
14 38
Solução
Inicialmente, é necessário estabelecer quem é a variável independente (x ) e quem é a variáveldependente (y ).
Lembrete
Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiverdependendo será obviamente a variável dependente y .
Nesse caso, os investimentos dependem da produtividade ou a produtividade depende dosinvestimentos?
Como o investimento em treinamento de pessoal está sendo feito com o objetivo de se aumentar aprodutividade, então concluimos que a produtividade será a variável dependente (y ), e o investimentoem treinamento será a variável independente (x ).
O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória dex.y (∑xy), a somatória de x 2 (∑x²) e somatória de y 2 (∑y²), para que possamos calcular o coeficientede correlação r.
-
8/18/2019 Matemática Integrada_Unidade I(1)
26/80
26
Unidade I
Tabela 3
Investimentos (x) Produtividade (y) x2 y2 x.y
3 12 9 144 36
4 17 16 289 68
5 24 25 576 1206 18 36 324 108
8 25 64 625 200
8 27 64 729 216
9 30 81 900 270
11 29 121 841 319
12 35 144 1225 420
14 38 196 1444 532
∑x = 80 ∑y = 255 ∑x² = 756 ∑y² = 7097 ∑x . y = 2289
Cálculo do coeficiente de correlação r:
r
xyx y
n
xx
ny
y
n
r
=−
− ( )
− ( )
=−
∑∑∑
∑ ∑ ∑ ∑
.
.2
2
2
2
2289 80..
.
255
10
756 80
107097
255
10
2289 20400
10
756
2 2
−
−
=−
−
r66400
107097
65025
10
2289 2040
756 640 7097
−
=
−
−( ) −
.
.r
66502 5,( )
r
r
r
r
=
( ) ( )
=
=
=
249
116 594 5
249
68962
249
262 61
0 95
. ,
,
,
-
8/18/2019 Matemática Integrada_Unidade I(1)
27/80
27
MATEMÁTICA INTEGRADA
Resposta:
a) Existe correlação entre as variáveis.
b) A correlação é forte e positiva, uma vez que o coeficiente r se encontra dentro do intervalo0,8 ≤ r < 1, que é o intervalo de correlação forte positiva, como já visto no início do capítulo, natabela de classificação do coeficiente de correlação.
Pode-se concluir:
O investimento em treinamento de pessoal está dando resultado, ou seja, conforme aumento doinvestimento em treinamento, aumenta a produtividade.
Exemplo de correlação negativa
2. Os dados a seguir referem-se ao número de acidentes e a idade do motorista avaliado por umperíodo de dois meses por uma empresa de trânsito.
Tabela 4 - Idade do motorista e número correspondente de acidentes
Idade do motorista Número de acidentes
18 15
20 12
22 9
27 8
29 6
32 4
35 2
Pede-se:
a) Verificar se existe correlação entre as variaveis.
b) Havendo correlação classificá-la em positiva ou negativa, fraca, forte ou moderada, justificandosua resposta.
Solução
Primeiro, como no exemplo anterior, precisamos descobrir quem é a variável independente (x) equem é a variável dependente (y).
Lembra-se da dica dada no exemplo anterior para descobrir quem é a variável independente x equem é a variável dependente y ?
-
8/18/2019 Matemática Integrada_Unidade I(1)
28/80
28
Unidade I
Nesse caso, a idade depende do número de acidentes ou o número de acidentes depende daidade?
Obviamente, o número de acidentes depende da idade do motorista, uma vez que quanto maisexperiente o motorista, menos deverá se envolver em acidentes. Então, concluimos que o número deacidentes será a variável dependente (y ) e a idade do motorista a variável independente (x ).
O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy), asomatória de x 2 (∑x²) e somatória de y 2 (∑y²), para que possamos calcular o coeficiente de correlação r.
Tabela 5
Idade domotorista (x )
Número deacidentes (y )
x2 y2 x.y
18 15 324 225 27020 12 400 144 240
22 9 484 81 198
27 8 729 64 216
29 6 841 36 174
32 4 1024 16 128
35 2 1225 4 70
∑x = 183 ∑Y = 56 ∑x² = 5027 ∑y² = 570 ∑x . y = 1296
Cálculo do coeficiente de correlação r:
r
xyx y
n
xx
ny
y
n
r
=−
− ( )
− ( )
=
−
∑∑∑
∑ ∑ ∑ ∑
.
.2
2
2
2
1296 1833 56
7
5027 183
7570
56
7
1296 10248
7
5027 334
2 2
.
.−
−
=−
−
r889
7570
3136
7
1296 1464
5027 4784 14 570 44
−
= −
−( ) −
.
, .
r
88( )
-
8/18/2019 Matemática Integrada_Unidade I(1)
29/80
29
MATEMÁTICA INTEGRADA
168
242 86 122
168
29628 92168
172 13
0 98
= −
( ) ( )
= −
= −
= −
r
r
r
r
, .
,
,
,
Resposta:
Existe uma forte correlação negativa entre as variáveis, uma vez que o coeficiente r de correlação seencontra dentro do intervalo -1 < r ≤ -0,8.
Como r está próximo de -1, temos uma correlação negativa quase perfeita, o que significa que àmedida que aumenta a idade do motorista, diminuem o número de acidentes.
Exemplo de correlação fraca
A tabela a seguir mostra as notas escolares obtidas por seis alunos e seus rendimentos individuaiscorrespondentes em salários mínimos.
Tabela 6 - Rendimentos (salários mínimos) e respectivas
notas escolares (pontos) referentes a seis alunos
Rendimentos Notas
5 50
10 25
10 80
15 5
25 80
27 50
Determine:
a) Se existe correlação entre as variaveis.
b) Havendo correlação, classificá-la, justificando sua resposta.
Solução
O primeiro passo é sempre descobrir quem é a variável independente (x ) e quem é a variável
dependente (y ), usando a dica de estudo dada no exemplo 1.
-
8/18/2019 Matemática Integrada_Unidade I(1)
30/80
30
Unidade I
Nesse caso, as notas dependem dos rendimentos em salários mínimos ou o rendimento depende dasnotas?
Certamente, se houver correlação entre as variáveis, a variável dependente (y ) serão as notasescolares. Mas, para nos certificarmos de que essa correlação existe, é necessário fazermos o cálculo docoeficiente de correlação r .
Para isso, devemos encontrar a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy),a somatória de x 2 (²) e a somatória de y 2 (∑y²) como nos dois exemplos anteriores.
Tabela 7
Rendimentos (x) Notas escolares (y) x2 y2 x.y
5 50 25 2500 250
10 25 100 625 25010 80 100 6400 800
15 5 225 25 75
25 80 625 6400 2000
27 50 729 625 1350
∑x = 92 ∑y = 290 ∑x² = 1804 ∑y² = 16575 ∑x.y = 4725
Cálculo do coeficiente de correlação r
r
xy x y
n
xx
ny
y
n
r
=−
− ( )
− ( )
=−
∑∑∑
∑ ∑ ∑ ∑
.
.2
2
2
2
4725 92..
.
290
6
1804 92
616575
290
6
4725 26680
6
1804 8
2 2
−
−
=−
−
r4464
616575
84100
6
4725 4446 67
1804 1410 67
−
= −
−( )
.
,
,r
.. ,16575 14016 67−( )
-
8/18/2019 Matemática Integrada_Unidade I(1)
31/80
31
MATEMÁTICA INTEGRADA
,
, . ,
,
278 33
393 33 2558 33
278 33
100626
=( ) ( )
=
r
r
77 94278 33
1003 13
0 28
,,
,
,
r
r
=
=
Como r = 0,28, temos nesse caso uma correlação fraca positiva, pois r está dentro do intervalo0,1 ≤ r < 0,5, que corresponde ao intervalo de correlação fraca positiva.
Resposta:
Conclui-se, portanto, que os rendimentos financeiros não têm influência nas notas escolares ou, setêm, é muito baixa.
Exemplo de correlação moderada
Os gastos com manutenção e o número de lotes produzidos de determinado componente dasFábricas LX Ltda. estão demonstrados na tabela a seguir:
Tabela 8
Número de lotes Gasto com manutenção $
8 12
7 16
6 25
4 19
5 20
3 40
Pede-se:a) Existe uma correlação entre as variáveis?
b) Justifique.
Solução
O primeiro passo, como sempre, é descobrir quem é a variável independente (x ) e quem é a variáveldependente (y ), usando a dica de estudo dada no 1o exemplo.
-
8/18/2019 Matemática Integrada_Unidade I(1)
32/80
32
Unidade I
Então vamos lá:
Nesse caso, o número de lotes produzidos dependem dos gastos com manutenção ou os gastos commanutenção dependem do número de lotes produzidos?
Como os gastos com manutenção devem aumentar de acordo com o aumento da proução, avariável dependente (y ) serão os gastos com manutenção, ao passo que a variável independente(x ) será o número de peças produzidas. Mas, para nos certificarmos de que essa correlação existe,é necessário fazermos o cálculo do coeficiente de correlação r , como nos outros casos.
Para isso, devemos encontrar a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy),a somatória de x 2 (∑x²) e a somatória de y 2 (∑y²), assim como nos exemplos anteriores.
Tabela 9
x y x.y X2 Y 2
8 12 96 64 144
7 16 112 49 256
6 25 150 36 625
4 19 76 16 361
5 20 100 25 400
3 60 180 9 3600
∑x = 33 ∑y = 152 ∑xy = 714 ∑x² = 199 ∑y² = 5386
Cálculo do coeficiente de correlação r
r
xyx y
n
xx
ny
y
n
r
=−
− ( )
− ( )
= −
∑∑∑
∑ ∑ ∑ ∑
.
.
.
2
2
2
2
714 33 1152
6
199 33
65386
152
6
714 836
199 181 5 5
2 2
−
−
= −
−( )
.
, .r
3386 3850 67
122
17 5 1535 33
−( )
= −
( ) ( )
,
, . ,r
-
8/18/2019 Matemática Integrada_Unidade I(1)
33/80
33
MATEMÁTICA INTEGRADA
122
26868 28
122
16
= −
= −
,r
r33 92
0 7
,
,r = −
Como r = -0,7, temos nesse caso uma correlação moderada.
Espero que vocês já estejam “craques” em correlação de variáveis. Se você ainda sente dificuldadesnesse assunto, a receita é retomar!
3 REGRESSÃO LINEAR
3.1 Introdução
Como já havia sido comentado no tópico anterior (correlação linear), até o momento o que foiapresentado como procedimentos estatísticos se limitou a descrições e inferências com apenas umavariável. Por exemplo, se tínhamos uma amostra de pessoas, estudávamos uma variável de cada vez, comoa estatura. Porém, se temos uma amostra de pessoas, existem várias variáveis que podem ser observadas:massa corporal, idade, renda etc. Nesse caso, cada uma delas pode ou não, estar associada a várias outrasvariáveis. Vamos considerar agora o caso de duas variáveis. O uso da análise de regressão tem como
prioridade fazer previsões, estimativas ou projeções. O objetivo é desenvolver um modelo estatístico queserá usado para estimar valores de uma variável dependente y em função de uma variável independente x .
O que você deverá aprender:
• como obter, baseado em uma amostra que apresenta forte correlação entre duas variáveis, aequação de uma reta de regressão linear que melhor se ajuste a aos dados da amostra;
• como estimar valores de y utilizando essa equação de regressão linear;
• como obter o gráfico bidimensional denominado diagrama de dispersão.
3.2 Diagrama de dispersão
Veja o exemplo a seguir:
Realcionando experiência e produtividade a partir do diagrama de dispersão
Um instituto de pesquisa administra o desenvolvimento de seus pesquisadores de acordo
com o número de entrevistas realizadas por eles e com os respectivos tempos de experiência.
-
8/18/2019 Matemática Integrada_Unidade I(1)
34/80
34
Unidade I
Sendo assim, esse instituto de pesquisa deseja desenvolver um modelo para prever o númerode entrevistas em um dado dia. Acredita-se que a experiência do entrevistador (medida emsemanas trabalhadas) é determinante em relação ao número de entrevistas realizadas. Umaamostra de 10 entrevistadores revelou os seguintes dados:
Tabela 10
Semanas de experiência 15 41 58 18 37 52 28 24 45 33
No de entrevistas realizadas 4 9 12 6 8 10 6 5 10 7
Denominando Y = número de entrevistas realizadas, e X = semanas de experiência,podemos construir o diagrama de dispersão.
14
12
10
8
6
4
2
00 10 20 30 40 50 60 70
Semanas de experiência
N ú m e r o d e e n t r e v i s t a s r e a l i z a d a
s
Figura 9 - Diagrama de dispersão dos dados tabela
O exame do gráfico indica uma relação entre as variáveis. Quando o número de semanastrabalhadas aumenta (aumentando a experiência do entrevistador), o número de entrevistasrealizadas também aumenta.
Adaptado de: Martins et al , 2005, p. 310.
3.3 Conceito de regressão linear
A regressão linear é um método para se estimar valores da variável y , dados outros valores das
variáveis x , ou seja, trata-se de uma técnica estatística em que se deseja estimar um valor condicionalesperado.
Você deve estar se perguntando: mas por que a classificação regressão linear?
O modelo de regressão linear é chamado linear, porque levamos em consideração que a relação daresposta às variáveis é uma função linear de alguns parâmetros.
Muito bem. Precisamos, então, determinar a equação de regressão linear que possa melhor se ajustaraos dados amostrais em questão. Ou seja, devemos encontrar os coeficientes lineares e angulares da
equação da reta.
-
8/18/2019 Matemática Integrada_Unidade I(1)
35/80
35
MATEMÁTICA INTEGRADA
Determinação da equação de regressão linear simples
y = a + bx
Onde:
y = é o valor previsto para um valor dado de x;
b = inclinação da reta;
x = valor dado.
a = y - bx
sendo:
yy
n
xx
n
i
i
_
=
=
∑
∑
Onde n = número de possíveis correlações entre x e y.
bxy x y
n
xx
n
=−
− ( )
∑∑∑
∑ ∑
.
2
2
Economize tempo!
Observe que as somatórias para a determinação de b são as mesmas que as utilizadas no cálculo docoeficiente r . Portanto, você pode aproveitar os resultados dessas somatórias na realização do cálculo
de b .
Para complementar a compreensão de regressão linear, veja alguns exemplos de aplicação.
Exemplo de aplicação
1. Na seção anterior, calculamos o coeficiente de correlação entre as despesas com investimentosem treinamento de pessoal e a produtividade (toneladas) investigada durante certo período de certaempresa. Obter a equação da reta para o investimento em treinamento de pessoal e a produtividade daempresa.
-
8/18/2019 Matemática Integrada_Unidade I(1)
36/80
36
Unidade I
Tabela 11 - Despesas com investimentos (R$) em treinamentode pessoal e a produtividade (toneladas)
investigada durante certo período
Investimentos Produtividade3 12
4 17
5 24
6 18
8 25
8 27
9 30
11 29
12 35
14 38
Solução
Nesse exemplo, você obteve vários dados que poderão ser aproveitados aqui, entre eles:
n = 10;
∑x = 80;
∑x² = 756;
∑y = 255;
∑y² = 7097;
∑x.y = 2289.
A equação da reta de regressão, quando temos uma variável independente x e uma variáveldependente y, é dada por:
Equação da reta de regressão:
y = a + bx
Sendo y o valor estimado para um dado valor x .
-
8/18/2019 Matemática Integrada_Unidade I(1)
37/80
37
MATEMÁTICA INTEGRADA
A inclinação b é calculada por:
b
xyx y
n
xx
n
=
−
− ( )
∑∑∑
∑ ∑
.
2
2
Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:
b
b
b
=
−
−
=
−
−
=
−
2289 80 255
10
756 80
10
2289 20400
10
756 6400
10
2289 204
2
.
00
756 640
249
116
2 15
−
=
=
b
b ,
a = y - bx
onde:
yy
n
i_
=∑
y
y
_
_
,
=
=
25510
25 5
e
-
8/18/2019 Matemática Integrada_Unidade I(1)
38/80
38
Unidade I
xx
n
x
x
i=
=
=
∑
80
10
8
Logo:
a y bx
a
a
a
= −
= −
= −
=
25 5 2 15 8
25 5 17 2
8 3
, , .
, ,
,
Substituindo-se esses dados na equação da reta de regressão,
y = a + bx
teremos:
y = 8,3 + 2,15x
2. Um pesquisador está estudando o comportamento de Staphilococcus aureus em hambúrguer de
frango, submetido a condições de congelamento doméstico (-18oC) durante certo tempo (dias).
Tabela 12 - Comportamento de Staphilococcus aureus em hambúrguer de frango,submetido a condições de congelamento doméstico (-18oC)
Tempo População
0 3,50
7 3,37
10 3,20
14 2,85
17 2,75
21 2,67
28 2,57
Pede-se:
a) Indicar a variável independente e a variável dependente.
b) Calcular e interpretar o coeficiente de correlação encontrado.
c) Obter a equação da reta para a população de Staphilococcus aureus e o tempo de congelamento.
-
8/18/2019 Matemática Integrada_Unidade I(1)
39/80
39
MATEMÁTICA INTEGRADA
Solução
Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).
Lembra-se da dica? Para facilitar essa descoberta, devemos sempre fazer a seguinte pergunta:quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, a variáveldependente y .
Nesse caso, a população de Staphilococcus aureus depende do tempo de armazenamento ouo tempo de armazenamento é que depende da população de Staphilococcus aureus ? É claro que apopulção de Staphilococcus aureus é que depende do tempo de armazenamento, portanto, será avariável dependente (y ), ao passo que o tempo de armazenamento será a variável independente (x ).
O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y), a
somatória de x² (∑x²) e somatória de y (∑y²), para que possamos calcular o coeficiente de correlação r .
Tabela 13
Tempo(x) x²Populaçao de
Staphilococcusaureus (y)
y² x.y
0 0 3,50 12,25 0
7 49 3,37 11,36 23,59
10 100 3,20 10,24 32,0
14 196 2,85 8,12 39,9017 289 2,75 7,56 46,75
21 441 2,67 7,13 56,07
28 784 2,57 6,60 71,96
∑x = 97 ∑x² = 1859 ∑y = 20,91 ∑y² = 63,26 ∑x.y =270,27
Cálculo do coeficiente de correlação r:
r
xyx y
n
xx
ny
y
n
r
=
−
− ( )
− ( )
=−
∑∑∑
∑ ∑ ∑ ∑
.
.
,
2
2
2
2
270 27 997 20 91
7
1859 97
763 26
20 91
7
2 2
. ,
. , ,
−
−
-
8/18/2019 Matemática Integrada_Unidade I(1)
40/80
40
Unidade I
270 27 289, ,=
−r
775
1859 1344 14 63 26 62 46
19 48
514 86 0 819
−( ) −( )
= −
( ) ( )=
−
, . , ,
,
, . ,
r
r ,,
,
,
,
,
48
41189
19 48
20 30
0 9596
r
r
= −
= −
Resposta
Como, r = -0,9596, a correlação é forte e negativa, quase perfeita, pois r está dentro dointervalo -1 < r ≤ -0,8 que corresponde ao intervalo de correlação forte negativa pois estápróximo de r = -1.
Conclui-se dessa maneira, que o congelamento interfere na redução das colônias com o tempo.
Aplicação da regressão linear
É preciso então encontrar os coeficientes a e b da reta.
A inclinação b é calculada por:
b
xyx y
n
xx
n
=
−
− ( )
∑∑∑
∑ ∑
.
2
2
Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:
b
b
a y bx
=
−
= −
= −
19 48
514 86
0 04
,
,
,
-
8/18/2019 Matemática Integrada_Unidade I(1)
41/80
41
MATEMÁTICA INTEGRADA
onde:
yy
n
y
y
i_
_
_
,
,
=
=
=
∑
20 91
7
2 99
E:
x
x
=
=
97
7
13 86,
Logo:
a y bx
a
a
a
= −
= +
= +
=
2 99 0 04 13 86
2 99 0 55
3 54
, , . ,
, ,
,
Substituindo-se esses dados na equação da reta de regressão,
y = a + bx
teremos:
y = 3,54 - 0,04x
Você conseguiu perceber bem a diferença entre correlação e regressão? Correlação e regressão são técnicas
estatísticas baseadas nos conceitos de amostragem vistos anteriormente, que permitem saber se duas ou maisvariáveis estatísticas de uma mesma população estão ou não relacionadas umas com as outras e, caso estejam,de que forma. De maneira geral, essas técnicas têm as seguintes finalidades: a correlação mede o grau darelação entre essas variáveis; a regressão fornece as equações que relacionam as variáveis consideradas. Comessas equações, é possível estabelecer projeções sobre o comportamento futuro do fenômeno em questão.
Os diversos exemplos de regressão citados são importantes para a compreensão dessa ferramentade estudo estatístico, uma vez que permite tirar conclusões e tomar decisões com base em dadosque se dispõem. Deve-se, no entanto, estar atento para o fato de que as diversas situações podemser influenciadas por outros fatores, o que faz da função encontrada apenas o primeiro passo parafundamentar uma decisão.
-
8/18/2019 Matemática Integrada_Unidade I(1)
42/80
42
Unidade I
Os conceitos trabalhados até o momento são muito importantes. Espero que você tenha conseguidoassimilá-los bem.
Na sequência, alguns exemplos para exercitar sua capacidade de análise e empregabilidade doarsenal teórico um pouco mais. Bom estudo!
Exemplo de aplicação
1. Os dados a seguir referem-se ao número de cheques devolvidos de acordo com a taxa de inflação.
Tabela 14 - Número de cheques devolvidos daempresa x durante um período determinado
Taxa de inflaçãoNúmero de cheques
devolvidos
2 5
4 10
5 10
7 12
9 15
10 17
11 18
Pede-se:
a) Verificar se existe correlação entre as variáveis, justificando sua resposta.
b) Em caso afirmativo, encontrar a equação da reta que possibilite a estimativa do número decheques devolvidos para diferentes taxas de inflação.
Solução
Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).
Vamos usar a nossa dica de sempre. Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, avariável dependente y .
Nesse caso, o número de cheques devolvidos depende da taxa de inflação ou a taxa de inflação dependedo número de cheques devolvidos? Quando começa haver aumento da inflação, ouvimos nos noticiáriosas reclamações dos comerciantes sobre o aumento do número de inadimplentes, ou seja, aumentou onúmero de cheques devolvidos. Portanto, o número de cheques devolvidos depende da taxa de inflação.
O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y),a somatória de x² (∑x) e somatória de y (∑y), para que possamos calcular o coeficiente de correlação r .
-
8/18/2019 Matemática Integrada_Unidade I(1)
43/80
43
MATEMÁTICA INTEGRADA
Tabela 15
Taxa (x) deinflação
x2Número de
cheques devolvidos yy2 x.y
2 4 5 25 10
4 16 10 100 405 25 10 100 50
7 49 12 144 84
9 81 15 225 135
10 100 17 289 170
11 121 18 324 198
∑x = 48 ∑x2 =396 ∑y = 87 ∑y2 = 1207 ∑x.y = 687
Cálculo do coeficiente de correlação r:
r
xyx y
n
xx
ny
y
n
r
=−
− ( )
− ( )
=−
∑∑∑
∑ ∑ ∑ ∑
.
.
.
2
2
2
2
687 48 887
7
396
48
7 1207
87
7
687 596 57
396 329 14
2 2
−
−
= −
−( )
.
,
,r
.. ,
,
, . ,
,
,
,
1207 108129
90 43
66 86 125 71
90 43
8404 97
90
−( )
=( ) ( )
=
=
r
r
r 443
9168
0 99
,
,r =
Resposta:
Como, r = 0,9, temos nesse caso uma correlação forte positiva, quase perfeita, pois r está dentro dointervalo 0,8 ≤ r < 1, que corresponde ao intervalo de correlação positiva e está próximo de r = + 1, que
seria uma correlação positiva perfeita.
-
8/18/2019 Matemática Integrada_Unidade I(1)
44/80
44
Unidade I
Conclusão:
Verificamos, dessa maneira, que a taxa de inflação interfere na inadimplência, ou seja, o aumento dainflação provoca um aumento no número de cheques devolvidos.
Aplicação da regressão linear
Precisamos encontrar os coeficientes a e b da reta.
A inclinação b é calculada por:
b
xyx y
n
xx
n
=
−
− ( )
∑∑∑
∑ ∑
.
2
2
Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituirmos:
b
b
a y bx
=
=
= −
90 43
66 86
1 35
,
,
,
onde:
yy
n
y
y
i_
_
_
,
=
=
=
∑
87
7
12 43
E:
x
x
=
=
48
7
6 86,
Logo:
a y bx
a
a
a
= −
= −
= −
=
12 43 135 6 86
12 43 9 26
3 17
, , . ,
, ,
,
-
8/18/2019 Matemática Integrada_Unidade I(1)
45/80
45
MATEMÁTICA INTEGRADA
Substituindo-se esses dados na equação da reta de regressão,
y = a + bx
teremos:
y = 3,17 + 1,35x
Resposta:
A equação da reta que permite fazer a estimativa do número de cheques devolvidos para as diferentestaxas de inflação é, portanto:
y = 3,17 + 1,35x
4 ESTIMATIVA DE PARÂMETROS
4.1 Introdução
O método de “estimação de parâmetros” é utilizado para se obter estimadores em casos específicos, porexemplo, quando fazemos alguma hipótese sobre algum parâmetro relativo à distribuição da população.Esse processo utiliza dados da amostra para fazer a estimativa de valores de parâmetros populacionais.
Observação
Estimativa é o valor numérico assumido pelo estimador, ou seja, valoraproximado do parâmetro, calculado com base na amostra.
Veja a situação a seguir que exemplifica bem o que vem a ser esses conceitos e suas aplicações:
Um candidato está pensando na possibilidade de se candidatar a prefeito na sua cidade. Ele
acredita ter uma popularidade suficientemente grande, uma vez que seu pai foi vereador por muitosanos na região. Porém, não tem ideia de como quantificar essa popularidade que acredita ter egostaria de conhecer suas reais chances numa eleição, antes de lançar sua candidatura. Essa é umasituação bastante comum, se tratando de política. Muito bem, sendo assim, foi aconselhado então aconsultar um estatístico para que se informe melhor sobre como funcionam as pesquisas eleitorais.O estatístico então lhe informa que é impossível, a partir de uma amostra apenas de eleitores,prever com exatidão qual será o resultado de uma eleição. O que poderá ser feito, diz ele, é tentarminimizar o erro que possa estar envolvido nessa estimativa. Porém, para que o erro de estimativadiminua, o tamanho da amostra deverá aumentar e, dessa forma, o custo também aumentaráproporcionalmente. Alerta também que será preciso informar o grau de confiança no resultado
encontrado, uma vez que sempre existe a probabilidade do erro ser maior do que esperávamos.
-
8/18/2019 Matemática Integrada_Unidade I(1)
46/80
46
Unidade I
Podemos, porém, fazer também com que essa probabilidade seja a menor possível. Depois de todaessa a explanação feita, o candidato se conscientizou de que o estatístico tem um papel fundamentalna realização de uma pesquisa eleitoral, seja na determinação do seu custo, seja no cálculo do erroda estimativa. Dessa forma, o candidato pode se informar melhor do que esperar de uma pesquisaeleitoral, inclusive o grau de confiança que ele poderia ter no resultado obtido com a pesquisa.
Percebeu, caro aluno, como a estatística está sempre nos auxiliando e socorrendo nas diversascircunstâncias que enfrentamos? Isso pode estender-se a uma pesquisa de mercado, à publicidade etc.
4.2 Parâmetro e estatística da amostra
Entre os estimadores mais comuns, estão:
• média amostral x;
• desvio padrão amostral S.
Parâmetros:
• média populacional µ;
• desvio padrão populacional σ.
Lembrete
Observe que a média amostral e o desvio padrão amostral sãoestimadores da média populacional e do desvio padrão populacional.
Em geral, encontramos na bibliografia as seguintes denominações para as estimativas:
• a estimativa é dita pontual quando a estatística amostral (x ou S) dá origem a uma únicaestimativa do parâmetro da população (µ ou σ);
• a estimativa é dita intervalar quando, a partir da estatística amostral (x ou S), obtém-se umintervalo de valores possíveis no qual se admite, com certa probabilidade, estar contido oparâmetro populacional (µ ou σ).
4.2.1 Obtenção dos principais parâmetros estatísticos
Estimadores:
• x: média amostral;
• S: desvio padrão amostral.
-
8/18/2019 Matemática Integrada_Unidade I(1)
47/80
47
MATEMÁTICA INTEGRADA
Parâmetros:
• σ = Desvio padrão da população;
• µ = média da população.
4.3 Distribuição amostral
Considere todas as amostras possíveis de tamanho n que podem ser retiradas de uma população detamanho N (com ou sem reposição).
Para cada amostra é possível calcular uma grandeza estatística, como a média, mediana, variância,desvio padrão etc.; que irá sofrer uma variação de uma amostra para outra.
Assim, obtém-se uma distribuição da grandeza calculada de cada amostra possível de ser extraída,denominada distribuição amostral .
Lembrete
As grandezas estatísticas mencionadas, bem como noçõesde distribuição amostral e probabilidades, foram estudadasanteriormente. Você não está seguro do quanto se recorda a respeitodo que foi estudado? Revise! Isso facilitará muito seu estudo na
disciplina atual.
Observação
Se, por exemplo, a grandeza estatística em questão for a média amostral(x), a distribuição será denominada Distribuição amostral de médias. Paracada distribuição amostral, é possível calcular a média, a mediana, avariância, o desvio padrão etc.
4.4 Teorema do Limite Central
Para entender o Teorema do limite central é preciso ter claro o que é uma distribuição amostral e oque é uma distribuição amostral de médias das amostras .
Assim:
• Distribuição amostral pode ser definida como a distribuição de probabilidade de uma estatística qualquerda amostra, formada a partir de repetidas amostras de tamanho n coletadas de uma população.
-
8/18/2019 Matemática Integrada_Unidade I(1)
48/80
48
Unidade I
• Distribuição amostral de médias das amostras é quando a estatística da amostra é sua média.
Propriedades das distribuições amostrais de médias das amostras
• a média das médias das amostras µx é considerada igual à média populacional µ;
• o desvio padrão das médias das amostras σx é igual à razão do desvio padrão populacional σ pela
raiz quadrada de N.
σσ
xN
=
Observação
O desvio padrão da distribuição amostral de médias das amostras échamado de erro padrão da média.
Vale a pena retomar:
Padronização da variável aleatória: se a média é diferente de zero ou o desvio padrão é diferente de1 (ou ambas as situações), é necessário converter os valores para os valores padronizados na distribuiçãonormal padrão.
z x=−( )µ
σ
µ x 0 z
Figura 10 - Diagrama da curva normal
-
8/18/2019 Matemática Integrada_Unidade I(1)
49/80
49
MATEMÁTICA INTEGRADA
Exemplo de aplicação
1. Imagine que um consultor esteja investigando o tempo que os trabalhadores de uma fábricalevam para montar determinada peça A. Suponha também que análises da linha de produção tenhamcalculado um tempo médio de 75 segundos e desvio padrão de 6 segundos. Considere agora, que oconsultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundospara montar uma peça, ou seja, P(75 ≤ X ≤ 81).
Como já vimos na distribuição normal de probabilidades, devemos padronizar as variáveis x, paraque possamos utilizar a tabela de áreas para a curva normal padronizada. Ou seja, transformar asvariáveis aleatórias x em variáveis normais padronizadas z, como será feito a seguir:
Solução:
Dados:• µ = 75 segundos;
• σ = 6 segundos;
• zx
=− µ
σ;
• z175 75
6=
−
;
• z10
6=
;
• z1
0= ;
• z281 75
6=
−
;
• z26
6= ;
• z2 1= .
Logo, temos a probabilidade P(0 ≤ Z ≤ 1), que é ilustrada a seguir e cujo valor é determinadoconsultando a tabela de distribuição normal padronizada Z :
-
8/18/2019 Matemática Integrada_Unidade I(1)
50/80
50
Unidade I
Tabela 16 – Distribuição normal padronizada
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
Pela tabela, encontramos o valor da área indicada, que significa a probabilidade:
P(75 ≤ X ≤ 81) = P(0 ≤ Z ≤ 1) = 0, 3413 x100 = 34,13%
0 z = 1
A = 0,3413
Figura 11 - Diagrama da curva normal para o exercício 1
Logo, 34,13% dos trabalhadores levarão um tempo dentro do intervalo de 75 e 81 segundos.
Conforme o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma
distribuição normal, independente do tipo de distribuição da população. Nesse caso, a média das médiasdas amostras poderá ser considerada como a média da população. Porém, o desvio padrão será:
σσ
x N_ =
Observação
Para amostras de tamanho N > 30, a distribuição das médias amostraispode ser aproximada por uma distribuição normal.
-
8/18/2019 Matemática Integrada_Unidade I(1)
51/80
51
MATEMÁTICA INTEGRADA
A aproximação torna-se mais confiável conforme aumenta o tamanho da amostra N . Se apopulação tem distribuição normal, as médias amostrais terão distribuição normal para qualquertamanho amostral N.
2. A média das contas telefônicas dos moradores de Cincinnati é US$64 e seu desvio padrão é US$9.Amostras aleatórias de 36 contas telefônicas são retiradas dessa população e a média de cada uma delasé determinada. Obtenha a média e o erro padrão da média da distribuição amostral (LARSON & FARBER,2007, p. 189).
Solução:
Como a amostra possui 36 elementos (maior do que 30, vide observação anterior) , a média dadistribuição amostral é igual à média da população, enquanto o erro padrão da média é igual ao desviopadrão populacional dividido por N . Assim:
µ
x
_ = µ = 64
E:
σσ
σ
x
x
N_
_ ,
=
=15
3. As alturas das árvores de Ipê Roxo são normalmente distribuídas e possuem uma média de90 pés e um desvio padrão de 3,5 pés. Amostras de tamanho 4 são retiradas aleatoriamente dessapopulação de ipês e a média de cada uma delas. Obtenha a média e o erro padrão da média dadistribuição amostral.
Solução:
A média da distribuição amostral é igual à média da população, enquanto o erro padrão da média é
igual ao desvio padrão populacional dividido por n . Assim:
µ µ
x
_ = = 90 pés
σσ
σ
σ
x
x
x
N=
=
=
3 5
4
1 75
,
, pés.
-
8/18/2019 Matemática Integrada_Unidade I(1)
52/80
52
Unidade I
Estimativa Intervalar
Intervalo de confiança para a média populacional.
α α
α2 2
+ =
Onde:
a = nível de significância.
0 + zc- zc
1 - aα
2
α
2
Figura 12 - Diagrama de simetria da curva normal
Onde:
• - Zc e + Zc são valores críticos obtidos à partir da tabela de distribuição normal padronizada Z(Tabela 15);
• 1 - a = nível de confiança do intervalo;
• P(- Zc < Z < + Zc ) = (1 - a).
Sendo:
• (1 - a) = probabilidade de que o intervalo contenha o parâmetro populacional estimado;
• a = probabilidade de que o intervalo não contenha o parâmetro populacional estimado.
Observação
Os valores mais utilizados para a (nível de significância) são 5% e1%. No entanto, isso não é regra, esses valores podem variar conforme anecessidade da pesquisa.
-
8/18/2019 Matemática Integrada_Unidade I(1)
53/80
53
MATEMÁTICA INTEGRADA
• Para nível de significância a = 5%
0- zc =1,96 + zc =1,96
1
2
95
247 5 0 475
−= = =
α, % ,
1
2
95
247 5 0 475
−= = =
α, % ,1 95− =α %
Figura 13 - Diagrama de simetria da curva normal, para nível de significância de 5%
Tabela 17
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.45451.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
-
8/18/2019 Matemática Integrada_Unidade I(1)
54/80
54
Unidade I
Lembrete
Procure no corpo da tabela o valor 0, 4750, siga a linha e a coluna
correspondente e obterá zc = 1,96.
P(- 1,96 < Z < + 1,96) = 95% c = 1 - a = 95% (nível de confiança do intervalo).