matemática integrada_unidade i(1)

Upload: avzmino

Post on 07-Jul-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    1/80

    Autor: Profa. Marisa Rezende Bernardes

    Colaboradoras: Profa. Valéria de Carvalho

    Profa. Mirtes Mariano

    Profa. Ana Carolina Bruno Borges

    Matemática Integrada

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    2/80

    Professora conteudista: Marisa Rezende Bernardes

    Possui graduação em engenharia civil pela Universidade Estadual de Maringá (1980), é licenciada em matemáticapela Universidade Estadual de Maringá (1988), cumpriu mestrado e doutorado pelo programa de pós-graduação daFaculdade de Ciências da Universidade Estadual Paulista Júlio de Mesquita Filho, concluídos respectivamente em 2003

    e 2009, e é vinculada ao Grupo de pesquisa em História Oral e Educação Matemática (GHOEM). Como parte do corpodocente, ingressou na Universidade Paulista, campus Bauru em 2003. Atualmente é professora titular e coordenadorageral do curso de licenciatura em matemática da Universidade Paulista.

    © Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ouquaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem

    permissão escrita da Universidade Paulista.

    Dados Internacionais de Catalogação na Publicação (CIP)

    B517m Bernardes, Marisa Rezende

    Matemática Integrada / Marisa Rezende Bernardes- São Paulo:Editora Sol, 2014.

    188 p., il.

    Nota: este volume está publicado nos Cadernos de Estudos e

    Pesquisas da UNIP, Série Didática, ano XVII, n. 2-021/14 , ISSN 1517-9230.

    1. Matemática integrada. 2. Parâmetros. 3. Hipóteses. I.Título.

    CDU 51

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    3/80

    Prof. Dr. João Carlos Di GenioReitor

    Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças

    Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias

    Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa

    Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação

    Unip Interativa – EaD

    Profa. Elisabete Brihy

    Prof. Marcelo Souza

    Prof. Dr. Luiz Felipe Scabar

    Prof. Ivan Daliberto Frugoli

      Material Didático – EaD

      Comissão editorial:Dra. Angélica L. Carlini (UNIP)

      Dra. Divane Alves da Silva (UNIP)  Dr. Ivan Dias da Motta (CESUMAR)  Dra. Kátia Mosorov Alonso (UFMT)  Dra. Valéria de Carvalho (UNIP)

      Apoio:  Profa. Cláudia Regina Baptista – EaD  Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos

      Projeto gráfico:  Prof. Alexandre Ponzetto

      Revisão:  Andréia Andrade  Virgínia Billato

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    4/80

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    5/80

    Sumário

    Matemática IntegradaAPRESENTAÇÃO ......................................................................................................................................................7

    Unidade I

    1 AMOSTRAGEM .....................................................................................................................................................91.1 Introdução ..................................................................................................................................................91.2 Tipos de amostragem .......................................................................................................................... 10

    1.2.1 Amostragem probabilística .................................................................................................................101.3 Técnicas de amostragem probabilística ......................................................................................121.4 Dados de uma amostra ......................................................................................................................13

    2 CORRELAÇÃO ................................................................................................................................................... 172.1 Introdução ...............................................................................................................................................172.2 Correlação linear................................................................................................................................... 17

    2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson ........................ .... 192.2.2 Cálculo do coeficiente de correlação r...........................................................................................202.2.3 Correlação positiva .................................................................................................................................202.2.4 Correlação negativa ...............................................................................................................................20

    2.3 Diagramas de dispersões ................................................................................................................... 213 REGRESSÃO LINEAR .......................................................................................................................................33

    3.1 Introdução ............................................................................................................................................... 333.2 Diagrama de dispersão .......................................................................................................................333.3 Conceito de regressão linear ........................................................................................................... 34

    4 ESTIMATIVA DE PARÂMETROS ...................................................................................................................454.1 Introdução ............................................................................................................................................... 454.2 Parâmetro e estatística da amostra .............................................................................................. 46

    4.2.1 Obtenção dos principais parâmetros estatísticos .......................... ........................... ................. 46

    4.3 Distribuição amostral ..........................................................................................................................474.4 Teorema do Limite Central ............................................................................................................... 474.5 Intervalo de confiança para a média populacional ................................................................554.6 Intervalo de confiança para a variância e o desvio padrão ................................................62

    Unidade II

    5 TESTES DE HIPÓTESES .................................................................................................................................... 815.1 Hipóteses nulas e alternativas ........................................................................................................ 81

    5.2 Teste de hipótese para a média de uma população, amostra grande e pequena ...... 83

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    6/80

    5.3 Teste de hipóteses para a média de duas populações .......................................................107

    6 TESTES NÃO PARAMÉTRICOS .................................................................................................................. 1176.1 Teste de qui-quadrado .....................................................................................................................1176.2 Teste de adequação de ajustamento ..........................................................................................118

    7 TESTE QUI-QUADRADO DE ADERÊNCIA ............................................................................................1227.1 Teste para a normalidade ................................................................................................................122

    8 TESTE DE QUI-QUADRADO PARA INDEPENDÊNCIA .......................................................................128

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    7/80

    7

     APRESENTAÇÃO

    Assim como já foi alertado em livros-textos anteriores, este é um texto elaborado para um curso deeducação a distância. Portanto, nunca é demais lembrar que esse é um posicionamento importante, umavez que estabelece um ambiente de aprendizagem diferente daquele utilizado pelo ensino presenciale, portanto, tem exigências diferenciadas. Essa modalidade de educação caracteriza-se por ser umaprática educativa que exige do estudante, mais do que em outra modalidade, construir conhecimentose participar efetivamente de seu próprio crescimento. Esse modelo implica, obviamente, um processo deensino próprio, uma vez que modifica, ou mesmo suprime o físico e o estrutural do ensino presencial.Assim, a função docente sofre um deslocamento, seu papel é descentralizado, e a forma de atenção aoaluno está mais próxima do que se entende por pesquisa em meios acadêmicos. É um novo formatode ensino-aprendizagem na graduação, no qual os estudantes, assim como aqueles que se iniciam empesquisas acadêmicas, devem aprender a estudar sozinhos, a buscar informações com base em indicaçõesdo docente responsável pelo curso (orientador) e ser capazes de fazer inferências na produção do seu

    conhecimento.

    Os objetivos listados no plano de ensino da disciplina visam desenvolver, com o educando:

    • as condições atuais e tendências nos diversos ambientes de ensino e aprendizagem, de forma ainstrumentá-lo para exercer sua função em diversos níveis de possíveis atuações;

    • a compreensão do papel que a disciplina Matemática desempenha nos âmbitos da sociedade e daciência;

    • as possibilidades de mediação nos ensinos fundamental e médio a partir dos tópicos listados.

    Esses objetivos visam à aplicabilidade do conteúdo desenvolvido nas disciplinas Estatística (nivelamento) e Probabilidades e Estatística. Nessas disciplinas, o leitor foi introduzido nessa seara,a estatística, que apresenta um arsenal teórico para o embasamento de procedimentos importantesno encaminhamento de muitos processos avaliativos, no âmbito da Ciência, dos processos industriais,comerciais e até mesmo em situações cotidianas. Nesse texto, serão aplicados conhecimentosdesenvolvidos anteriormente, como organização de dados, medidas de posição e dispersão etc. naobtenção de informações para projetos de pesquisa ou informações úteis nas decisões necessárias àsmais diversas empresas e situações cotidianas. O objetivo é que o estudante avalie como as habilidades

    desenvolvidas no curso de Matemática  podem ser estendidas às outras atividades, como pesquisasacadêmicas (cursos de mestrado e doutorado), industrial (em avaliações de investimentos, em produçãoe qualidade), no comércio (público alvo), marketing   (tipos de propagandas) e ciências aplicadas(farmacêutica, avaliações de aplicabilidade de instrumentos em medicina, em engenharia, odontologiaetc., e avaliações em administração de empresas).

     Observação

    Nos mais diversos procedimentos cotidianos, bases estatísticasinterferem em decisões sem que as pessoas tenham efetivo conhecimento

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    8/80

    8

    disso. Por exemplo, ao atravessar uma rua, as pessoas fazem avaliaçõesmentais baseadas em conhecimentos adquiridos em ocasiões anteriores.Ou seja, a decisão de atravessar ou não é pautada em “amostras”, quesão situações anteriormente vivenciadas pelo indivíduo em um conjuntoformado por carros, pessoas e variáveis que as inter-relacionam (velocidadedos automóveis, largura da rua, pessoas que impedem uma travessia emmenor tempo, presença de semáforos para pedestres etc.)

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    9/80

    9

    MATEMÁTICA INTEGRADA

    Unidade I

    1 AMOSTRAGEM

    1.1 Introdução

    A escolha do método a ser utilizado na amostragem deve garantir uma amostra representativada população em relação ao interesse que se tem sobre ela, tanto em gênero como em número. Naverdade, a amostra é a parte mais importante de uma pesquisa, que depende de pressupostos obtidosa partir dela, porque permite inferências em relação à população de origem. Uma analogia seria

    comparar uma amostra, que supomos representativa de uma população, a uma maquete de um edifícioa ser construído. A amostra, da mesma forma que a maquete, será melhor ou pior, segundo o grau derepresentatividade que ofereça. Ou seja, a maquete, se bem feita, permitirá uma visão antecipada doque se pretende construir. Assim, a amostra, se bem selecionada, dará condições de inferir resultadossobre a população de interesse sem que tenha conhecimento total sobre ela. A utilização de amostrasna realização de pesquisas é justificada pelo fato de que as populações (universo) nem sempre sãototalmente acessíveis. Quando abrangentes, a utilização de toda a população oneraria muito umapesquisa (sem considerar que talvez não seja nem possível encampá-la em sua totalidade) e de formadesnecessária, pois uma amostra bem selecionada pode ser suficiente para o que se deseja investigar,com razoável confiabilidade.

     Lembrete

    Mas veja bem, é preciso um cuidado extremo na escolha dos métodosde obtenção das amostras.

    Analise a matéria a seguir, publicada em 23 de agosto de 2005, pelo Instituto Brasileiro de Defesado Consumidor (IDEC):

    Idec pede esclarecimentos à Aneel – 30/8/2005.

    No último (sic) dia 22, a Agência Nacional de Energia Elétrica (Aneel) admitiu errona pesquisa de satisfação do consumidor de 2004 e decidiu descartar o seu resultadono cálculo do reajuste tarifário das distribuidoras nesse ano (veja notícia). A diretoria daagência aprovou naquele dia a troca do Índice Aneel de Satisfação do Consumidor (Iasc), de2004, pelo resultado de 2003 no cálculo do “fator x”. O resultado da pesquisa de satisfaçãoé utilizado como um dos parâmetros para o cálculo do índice de produtividade (fator x) dasempresas, que influencia o reajuste anual das contas de luz.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    10/80

    10

    Unidade I

    Segundo matéria publicada no caderno ‘Dinheiro’, do jornal Folha de São Paulo(fl. B 7), de 23 de agosto de 2005, a agência teria decidido “não usar os resultados daúltima pesquisa de qualidade dos serviços prestados pelas distribuidoras de energiano cálculo dos reajustes de tarifa deste ano”.

    Ainda segundo a matéria, a decisão foi tomada à vista da constatação de erros namedição em um município do Rio de Janeiro, e a sua consequência direta seria a aplicaçãode reajustes maiores que os devidos.

    Fonte: Instituto Brasileiro de Defesa do Consumidor. IDEC em ação . 30 out. 2005.Disponível em: . Acesso em: 24 jun. 2011.

    Esse episódio acarretou comentários de economistas, tais como o a seguir:

    Talvez a principal lição desta história seja a de que se o modelo regulatório possuium índice de reajuste que varia diretamente com um índice de satisfação doconsumidor obtido via amostragem, então o cuidado com esta deve ser, sempre,redobrado. Afinal, como ficamos agora? Com um reajuste que reflete a realidade de2003? (SHIKIDA, 2005).

    Caro aluno, percebeu como apenas um exemplo já nos revela a extrema importância de uma escolhacorreta da amostra com que se irá realizar a pesquisa? Portanto, todo cuidado é pouco!

    A seguir, veremos os tipos de amostragem que você poderá utilizar e as diferentes técnicas a serem

    utilizadas.

    1.2 Tipos de amostragem

    1.2.1 Amostragem probabilística

     Você deve estar se perguntando: o que significa o termo probabilística? Qual a relação com o quefoi estudado anteriormente?

    Uma amostra é denominada dessa forma quando cada elemento da população, a partir da qual elafoi selecionada, tem probabilidade conhecida e diferente de zero de pertencer à ela.

    Uma amostragem não probabilística acontece quando é feita uma escolha deliberada dos elementosque irão compô-la. Assim, não podemos generalizar os resultados das pesquisas obtidos a partir dessaamostra para a população, uma vez que essa técnica de amostragem (não probabilística) não garante arepresentatividade da população. A escolha da amostra foi feita de forma deliberada e não ao acaso, oque diminui a confiabilidade (a amostra pode estar viciada).

    O uso da amostragem probabilística é recomendável, já que essa permite uma análise minuciosa dos

    dados coletados. Porém, o custo de uma amostragem probabilística é sempre maior que de uma não

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    11/80

    11

    MATEMÁTICA INTEGRADA

    probabilística. Mas, de qualquer forma, o gasto a mais é justificado pelas possíveis consequências de umadecisão equivocada, baseada em resultados errados. Quando se trata das amostragens probabilísticas, aqualidade da pesquisa pode ser avaliada, uma vez que seus erros de amostragem podem ser calculados. Aamostragem probabilística é a única forma que permite planos de amostra representativa, ao possibilitarinferir até que ponto os resultados baseados em uma amostra tendem a diferir dos que seriam encontradosa partir do estudo da população. Além disso, se a amostragem é probabilística, é possível especificar-se otamanho da amostra por meio de certo grau de certeza de que seus resultados não vão diferir, por mais deum valor especificado, dos que seriam obtidos num estudo da população total.

    Figura 1 – Dispositivos relacionados a jogos, que quando não sofrem algum tipo de interferência indevida, proporcionam condiçõesaleatórias

     Lembrete

    Condições aleatórias ocorrem quando cada evento tem igualpossibilidade de ser incluído na amostra. Exemplo: lançamento de um dado

    não viciado. 

    Lembrete

    Está lembrado do conceito de população utilizado na estatísticadescritiva? Se não, é importante recordar! Vamos fazer isso?

    População (ou universo) pode ser definida como um conjunto constituído de indivíduos, objetos,acontecimentos ou outras informações, em que o pesquisador deseja descrever ou pretende generalizaros seus resultados encontrados ou conclusões obtidas a partir da amostra selecionada dela.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    12/80

    12

    Unidade I

    1.3 Técnicas de amostragem probabilística

    E você deve estar se perguntando: mas será que só existe uma técnica para se fazer essa amostragem?

    Não! A amostragem probabilística pode ser realizada por diversas técnicas, dependendo daconveniência, como veremos a seguir. Por isso, não podemos generalizar uma técnica apenas para todasas situações de pesquisa.

    • Amostragem aleatória simples:  todos os elementos da população têm a mesma probabilidadede pertencer à amostra. Exemplo: tabela de números aleatórios e sorteios.

    Seja N   o número de elementos da população Ω,  e n  o número de elementos de uma amostraA = {a

    1,a

    2,...a

    n}. Cada elemento da população tem probabilidade n/N  de pertencer à amostra.

    p a  n

    Nn( )=

     Observação

     Por definição, 0 < p(A) < 1.

    Pense a respeito. Como “dica”, lembre-se de que p(Ω) = 1. E, novamente,pense na razão dessa “dica” ser verdadeira.

    • Amostragem aleatória estratificada:   é  utilizada  quando a população  em  questão éheterogênea. Ela se divide em subpopulações homogêneas ou estratos. A variável em estudo podeter comportamentos diferentes de um estrato para o outro, porém apresentar comportamentohomogêneo dentro de cada estrato. Por exemplo, uma população de estudantes pode apresentarvários estratos. Um estrato pode apresentar alunos com médias muito baixas, o outro com notasregulares, o próximo com notas médias e, por último, um estrato formado por alunos com notasaltas. Dentro de cada estrato, o comportamento é homogêneo, mas de uma maneira geral apopulação formada por esses estratos é heterogênea. A amostragem consistirá em fazer-seuma seleção aleatória de cada estrato, sendo o número de elementos selecionados de cada um

    proporcional ao seu tamanho.

    Exemplo 1: selecionar uma amostra com números de alunos proporcionais aos números de alunosexistentes nos estratos “médias muito baixas”, “notas regulares”, “notas médias” e “notas altas”, napopulação constituída por meus alunos da UNIP, campus  de Bauru.

    Exemplo 2: selecionar uma amostra com números de homens e mulheres proporcionais aos númerosde homens e mulheres existentes na população, por classe social.

    • Amostragem por conglomerados: e xistem alguns casos de populações em que a identificaçãodos seus elementos é impraticável ou extremamente difícil. Mas pode ser muito fácil a identificação

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    13/80

    13

    MATEMÁTICA INTEGRADA

    de alguns subgrupos (conglomerados) dessa população. Pode ser realizada nessa situação, umaamostra aleatória simples desses conglomerados, e no caso do conglomerado sorteado deveser feita uma contagem completa. Exemplos comuns de conglomerados são turmas de escolas,quarteirões de bairros etc.

    Exemplo relacionado com meus alunos:  desejo entrevistar uma amostra de estudantes, mas,como sou professora de educação a distância, tenho alunos espalhados por todo o país. Portanto, éimpraticável selecionar essa amostra de estudantes, em que a população não é definida exatamente, a nãoser pela técnica de conglomerados. Posso então, para solucionar o problema, selecionar aleatoriamenteestudantes de duas ou três disciplinas pelas quais sou responsável, tomando o cuidado para garantirque não existam vícios.

    • Amostragem sistemática:  quando os elementos da população se apresentam ordenadosde acordo com algum critério. Um exemplo seria a retirada de elementos de uma amostra,

    periodicamente, a partir de listas telefônicas.

    • Amostragem em múltiplas etapas : é uma técnica utilizada para produzir uma amostrarepresentativa de uma população muito espalhada. É similar à técnica por conglomerados,mas nesse caso o processo só é finalizado quando há seleção de unidades individuais deamostragem.

    Exemplo:  considere que a direção da UNIP deseja uma pesquisa nacional sobre a capacidadeeconômica de seus alunos, de forma a idealizar um plano estratégico que evite a evasão escolarem educação a distância.

    — Etapa 1 (unidades amostrais primárias): dividir o país em número de regiões (norte, sul, nordesteetc.) e, então, selecionar aleatoriamente um pequeno número de alunos dessas regiões.

    — Etapa 2 (unidades amostrais secundárias): utilizando as amostras de cada região, retirar umaamostra aleatória de sub-regiões (cada estado da federação constituinte de cada região, porexemplo).

    — Etapa 3 (unidades amostrais terciárias): a partir das amostras anteriores, estudantes poderiam

    ser selecionados para a entrevista por meio de uma amostragem sistemática utilizando oregistro acadêmico.

    1.4 Dados de uma amostra

    Os exemplos a seguir, retirados de Pinheiro et al   (2009),  revelam como os dados de uma amostrapodem se tratados de formas diferentes e levar a resultados e conclusões bastante úteis para diferentesprofissionais.

    Diego e Walter trabalhavam, havia muitos anos, na fábrica de camisas masculinasColarinho Branco. Um dia, o gerente de produção pediu demissão para ir trabalhar

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    14/80

    14

    Unidade I

    numa empresa multinacional do ramo. O dono da empresa, Sr. Paulo, chamouentão seus dois experientes empregados para comunicar-lhes que um deles seriao novo gerente de produção. Contudo, disse-lhes que essa escolha dependeria deum pequeno teste ao qual ambos seriam submetidos. Ele pediu a cada um dosdois que:

    • selecionasse amostras de 200 homens adultos;

    • medisse a circunferência do pescoço de cada indivíduo dessasamostras;

    • apresentasse por escrito um relatório com as suas conclusões.

    Logo no segundo dia após ter começado as medições, Walter compareceu

    sorridente perante Sr. Paulo para apresentar o seu trabalho. Ele não tinhamais dúvidas de que seria escolhido. Passaram-se mais um, dois, três dias, esomente quatro dias depois Diego entregou o seu trabalho. No quinto dia, odono da empresa anunciou: Diego será o novo gerente de produção. Walternão conseguia entender o porquê da escolha, que ele considerava injusta, e foiinterpelar o Sr. Paulo. Expôs os seus motivos e lembrou que tinha entregado oseu trabalho quatro dias antes de Diego. O Sr. Paulo, calmamente, mostrou-lhesos dois trabalhos. O relatório de Walter estava caprichado sim, com as pessoasordenadas alfabeticamente e seus respectivos tamanhos de colarinho. “Bonitoseu trabalho”, falou o Sr. Paulo, “só que de nada me serve”. A seguir, mostrouo relatório que Diego tinha apresentado. As pessoas não estavam ordenadasalfabeticamente, mas por tamanho de colarinho. “Você vê”, falou o dono,”agora eu sei quais são os tamanhos extremos, o menor e o maior. “Além disso”,e mostrou-lhe uma tabela de frequências apresentada por Diego, “posso verimediatamente qual o tamanho do colarinho que tenho que fabricar em maiorquantidade e as proporções correspondentes aos outros tamanhos”. A seguir,mostrou um histograma em que claramente podia ser vista a distribuição dosdiversos tamanhos de colarinho. E ainda tinha mais. No seu trabalho, Diegotinha calculado o tamanho médio dos colarinhos, o seu desvio-padrão e tinha

    feito um gráfico de caixas (box-plot ), no qual sobressaiam nitidamente osquartis inferior e superior e a mediana para o tamanho dos colarinhos. Walterficou admirado com o trabalho de Diego. Percebeu que todas as informaçõesapresentadas por ele eram de fato relevantes para a produção de camisas. Diantede tantas evidências, ele aceitou as explicações do Sr. Paulo e foi cumprimentaro colega recém-promovido. No dia seguinte, inscreveu-se em um treinamentoem métodos estatísticos, oferecido por uma conceituada universidade. No casorelatado, Diego apresentou um trabalho muito mais completo que o de Walter,graças ao seu conhecimento das técnicas de análise exploratória de dados(Adaptado de: PINHEIRO et al , 2009, p. 1-2).

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    15/80

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    16/80

    16

    Unidade I

    dados para que possamos resumir as informações obtidas a partir deles, de forma que nos “respondam”a respeito do tema que estamos investigando.

     Lembrete

     Você se lembra do que foi estudado anteriormente sobre os tipos e aorganização de dados coletados? É interessante revisar!

    Exemplo de aplicação

    Até o momento, você poderá planejar um projeto de pesquisa considerando os seguintes itens:

    • as metas da pesquisa;

    • definir a população;

    • identificar o sistema de amostragem;

    • definir o método de coleta de dados;

    • ordenar as informações.

    Dados

    Qualitativos Quantitativos

    Nominais ContínuosOrdinais Discretos

    Figura 2

    Saiba mais

    Em Smailes & McGrane (2002), capítulo 1, há importantes informaçõessobre projetos de questionários e tipos de entrevistas.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    17/80

    17

    MATEMÁTICA INTEGRADA

    2 CORRELAÇÃO

    2.1 Introdução

    Em nossos estudos de estatística até o momento, estávamos limitados em descrever a forma dadistribuição dos valores de apenas uma variável. Por exemplo: quando descrevíamos as estaturas deuma amostra de pessoas, esses dados se restringiam a mostrar apenas a frequência de pessoas quese encaixavam naqueles valores. A variável em questão era, portanto, a estatura dessas pessoas.No entanto, na correlação de variáveis, podemos relacionar diferentes estaturas com diferentesidades. Nesse caso, teremos duas variáveis, a estatura e a idade. Logo, ao trabalharmos com duasvariáveis, é possível avaliar e medir as relações entre elas, o que é chamado de correlação devariáveis.

    Se houver uma correlação entre elas, poderemos ter uma função matemática que caracteriza

    essa relação com a regressão e seremos, dessa forma, capazes de determinar os parâmetros dessafunção.

    Neste capítulo, iremos portanto estudar a correlação entre variáveis e a possibilidade daaplicação da regressão linear. O estudo da correlação linear de variáveis é importante para termosa certeza de que poderemos aplicar a regressão linear a partir desses dados já conhecidos ecorrelacionados. Veremos, nesse caso, como uma variável independente qualquer (arbitrariamentedenominada x ou por qualquer outra forma) se comporta de acordo com a mudança da variáveldependente (também arbitrariamente denominada y   ou por qualquer outra forma) que estácorrelacionada.

    Em pesquisas, é frequente a investigação da existência de relação entre variáveis, isto é,saber se as modificações sofridas por uma das variáveis são acompanhadas por modificaçõesnas outras, como consumo e renda, estatura e idade de indivíduos, entre outras. Veja que, numapesquisa de campo, por exemplo, você poderá chegar a várias conclusões sobre porcentagensde pessoas do gênero feminino e masculino, como preferência eleitoral, nível de escolaridadeetc. Mas, será que essas variáveis apresentam alguma relação entre si? Será que a preferênciaeleitoral está associada ao gênero, feminino ou masculino? Portanto, prezado aluno, essa émais uma forma de você aprofundar os seus estudos e conclusões a respeito dos seus dados

    estatísticos.

    2.2 Correlação linear

    O significado do termo correlação é a existência da relação em dois sentidos (co +relação), usado em estatística para demonstrar a força da relação entre dois conjuntos dedados. Verificar a possível existência e o grau de relação entre as variáveis é o objeto deestudo da correlação.

    Se confirmada essa relação, procura-se descrevê-la sob forma matemática, por meio de umafunção. A realização da estimação dos parâmetros dessa função matemática é o objeto da regressão

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    18/80

    18

    Unidade I

    linear. Nesse caso, os pares de valores das duas variáveis podem ser colocados num diagramacartesiano chamado diagrama de dispersão .

    Pai... Vamos estabelecer uma

    correlação linear forte entre seusalário e minha mesada?

    Figura 3 – Conversas entre pai e filha (adaptação da autora)

     Lembrete

    É importante se certificar de que existe uma correlação linearentre as variáveis, para que se possa fazer uso da equação da reta,também chamada de reta de regressão, que permite estimar valorespara a variável dependente a partir de um dado valor da variável

    independente. Ou seja, só é viável utilizar a regressão linear para seprever novas estimativas, quando já se tem algumas informaçõesprévias sobre determinado tema, quando há certeza de uma fortecorrelação entre as variáveis.

    Situação prática da aplicação da correlação de variáveis e regressão linear:

    Talvez você não fosse nascido quando o que será relatado a seguir aconteceu em nosso país. Nessecaso, pergunte a respeito aos seus pais, ou tios, ou seus avôs. Leia a respeito. É muito importante sabersobre os métodos estatísticos, mas é igualmente importante conhecer a história. Ambos os instrumentosserão seus aliados em decisões, independente do seu ramo de atividade.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    19/80

    19

    MATEMÁTICA INTEGRADA

    Pois bem. Um exemplo típico da utilização da regressão linear foi sua constante utilização em umperíodo em que a economia do país estava bastante desequilibrada, para estimativas futuras de taxasde inflação a partir das taxas atuais.

     Verificar se existe relação entre variáveis é um dos propósitos de maior interesse nas pesquisas.Isso é justificado pelo fato de que, como já foi enfatizado, existindo associação entre elas, as análises econclusões sobre os resultados obtidos na pesquisa serão mais confiáveis.

    2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson

    O coeficiente de correlação, ou coeficiente de Pearson,  nos indica se existe correlação entre asvariáveis analisadas. Existirá correlação se esse coeficiente estiver entre -1 e + 1, o que em porcentagemrepresenta entre -100% e + 100%.

    Esse coeficiente mostrará também o grau de intensidade existente na correlação entre as variáveisem estudo, como está resumido na tabela a seguir.

    Tabela 1 - Classificação do tipo de correlação,segundo o coeficiente de correlação r 

    Coeficiente de correlação r Tipo de correlação

    r = 1 Perfeita positiva

    0,8 ≤ r < 1 Forte positiva

    0,5 ≤ r < 0,8 Moderada positiva

    0,1 ≤ r < 0,5 Fraca positiva

    0 < r < 0,1 Ínfima positiva

    0 Nula

    -0,1 < r < 0 Ínfima negativa

    -0,5 < r ≤ -0,1 Fraca negativa

    -0,8 < r ≤ -0,5 Moderada negativa

    -1 < r ≤ -0,8 Forte negativa

    r = -1 Perfeita negativa

    Você percebeu que quanto mais o coeficiente de correlação r se aproxima de +1 ou de -1, melhor éa correlação entre as variáveis? Por exemplo, se o coeficiente r de correlação estiver próximo do +1, háuma correlação forte positiva, caso esteja próximo do -1, há uma correlação forte negativa. Por outrolado, quanto mais esse coeficiente se distancia de +1 ou de -1, pior a correlação. Logo, menos confiáveisserão as estimativas feitas a partir desses dados, porque denota um comportamento pouco linear entreos dados.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    20/80

    20

    Unidade I

    2.2.2 Cálculo do coeficiente de correlação r

    r

    xyx y

    n

    xx

    ny

    y

    n

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .2

    2

    2

    2

    Onde:

    r  = coeficiente de correlação;

    x  = variável independente;

    y  = variável dependente;

    n = número de possíveis  correlações entre as variáveis x  e y.

     Lembrete

    As variáveis independentes e dependentes são arbitrariamente

    denominadas de x  e y . No entanto, elas podem ter outras denominações,conforme o seu problema de pesquisa. Mas cuidado ao estabelecer qual é avariável dependente e qual é a independente!

    2.2.3 Correlação positiva

    Dizemos que existe uma correlação positiva entre duas variáveis quando o aumento da variávelindependente resulta no aumento da variável dependente. 

    Observe uma situação que pode ser um exemplo de forte correlação positiva: um professor quisverificar a existência de correlação entre as notas finais de matemática financeira e estatística de umgrupo de estudantes. Uma vez que as duas disciplinas são da mesma área (exatas), acredita-se em umaforte correlação entre elas. E, mais precisamente, positiva.

    2.2.4 Correlação negativa

    Dizemos que existe uma correlação negativa entre duas variáveis quando o aumento da variávelindependente resulta no decréscimo da variável dependente.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    21/80

    21

    MATEMÁTICA INTEGRADA

     Veja agora uma situação que pode ser um exemplo típico de correlação negativa: na época dacolheita de grãos, verifica-se uma queda nos preços dos produtos agrícolas. Isso mostra que oferta epreços, se estiverem correlacionados, será de forma negativa, uma vez que o aumento da oferta doproduto no mercado irá resultar numa queda dos preços.

     Observação

     Mas não se esqueça: o fato das duas variáveis estarem aumentandoou diminuindo simultaneamente não significa que exista um efeito diretode uma sobre a outra. É necessário que se investigue o coeficiente decorrelação r  para verificar qual posição ele ocupa no intervalo de -1 a +1 e,a partir disso, descobrir qual o grau de correlação entre as variáveis.

    Para você pensar: retorne à figura 3 e instrua a garotinha a pedir corretamente (para ela, claro) acorrelação entre o salário do pai e sua mesada. Qual correção você faria na fala dela?

     Observação

    Quando o coeficiente de correlação r  for exatamente igual a +1, existeuma correlação positiva perfeita entre as variáveis consideradas. Da mesmaforma, se esse coeficiente r   for exatamente igual a -1, diz–se que existeuma correlação negativa perfeita entre as variáveis.

    O que você deverá aprender sobre correlação de variáveis:

    • quando existe correlação entre as variáveis;

    • em caso afirmativo, que tipo de correlação existe entre elas (se é positiva ou negativa);

    • existindo a correlação, se é forte (próxima de +1 e de -1) ou fraca (próxima de zero);

    • ao ser confirmada a correlação entre as variáveis, será possível a aplicação da regressão linearpara se fazer novas estimativas a partir de dados já conhecidos;

    • quanto mais forte essa correlação, mais confiáveis serão essas estimativas.

    2.3 Diagramas de dispersões

    Os diagramas de dispersões a seguir mostram o comportamento da relação entre variáveis emdecorrência do coeficiente de correlação linear. Os exemplos estão representados segundo o sistemacartesiano genérico, em que x  indicará a variável independente e y  a variável dependente. Para se obter

    esses gráficos, foi utilizado o winplot  (software free ).

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    22/80

    22

    Unidade I

    Caso 1:

    - 2 - 1 1 2 3 4 5 6 7 8

    y

    x

    6

    5

    4

    3

    2

    1

    -1

    Figura 4 - Gráfico de uma correlação positiva perfeita

    Observe que, nesse caso, o aumento da variável independente x  está originando um aumento davariável dependente y . O gráfico apresenta um caso de correlação positiva perfeita. Observe que não hánenhum ponto fora da reta.

    Caso 2:

    x

    y

    - 3 - 2 - 1 1 2 3 4 5 6

    8

    7

    6

    5

    4

    3

    2

    1

    -1

    Figura 5 - Gráfico de uma correlação positiva imperfeita

     Veja que, nesse caso, temos também o aumento da variável independente x  originando um aumentoda variável dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracterizauma correlação positiva imperfeita.

    Caso 3:

    Observe que, nesse caso, o aumento da variável independente x   origina um decréscimo da variáveldependente y . O gráfico apresenta uma correlação negativa perfeita, pois não há nenhum ponto fora da reta.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    23/80

    23

    MATEMÁTICA INTEGRADA

    - 3 - 2 - 1 1 2 3 4 5 6

    5

    4

    3

    2

    1

    -1

    y

    x

    Figura 6 - Gráfico de uma correlação negativa perfeita

    Caso 4

    - 3 - 2 - 1 1 2 3 4 5 6

    5

    4

    3

    2

    1

    -1

    y

    x

    Figura 7 - Gráfico de uma correlação negativa imperfeita

     Observe que, nesse caso, o aumento da variável independente x  origina um decréscimo da variável

    dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracteriza umacorrelação negativa imperfeita, uma vez que não temos uma reta perfeita.

    Caso 5

    - 3 - 2 - 1 1 2 3 4 5 6

    54

    3

    2

    1

    -1

    y

    x

    Figura 8 - Gráfico que representa ausência de correlação (r = 0)

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    24/80

    24

    Unidade I

    Perceba que, nesse caso não é possível traçar uma reta, uma vez que os pontos estão totalmentedispersos, o que caracteriza uma ausência de comportamento linear entre eles. Por mais que se tentetraçar uma reta de forma que abranja a maioria dos pontos, vários ficarão fora.

     Observação

     Você percebeu como podemos determinar, de modo qualitativo, o quão bem uma reta representa a relação entre as variáveis,observando diretamente os diagramas de dispersão apresentadosanteriormente?

     Vejamos agora alguns exemplos resolvidos de aplicações do cálculo de correlação de variáveis quepossibilitará uma melhor visualização de como a correlação entre as varáveis podem acontecer e como

    podem não acontecer.

     Observação

     Nos casos em que a correlação é perfeita, seja positiva ou negativa,a equação linear é conveniente. Isto se deve ao fato de que quantomenos dispersão existir em torno da reta, melhor a relação entre asvariáveis. Não é o caso de correlações que foram classificadas comoimperfeitas.

    Exemplo de aplicação

    Exemplo de correlação positiva

    1.  A tabela a seguir mostra as despesas com investimentos em treinamento de pessoal e aprodutividade (toneladas) investigada durante certo período de certa empresa.

    Pede-se:

    a) Verificar se existe correlação entre as variáveis.

    b) Em caso afirmativo, que tipo de correlação, positiva ou negativa? Fraca, forte ou moderada?Justifique.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    25/80

    25

    MATEMÁTICA INTEGRADA

    Tabela 2 - Despesas com investimentos (em milhares de R$)em treinamento de pessoal e a produtividade (toneladas)

    investigadas durante certo período

    Investimentos Produtividade

    3 12

    4 17

    5 24

    6 18

    8 25

    8 27

    9 30

    11 29

    12 35

    14 38

    Solução

    Inicialmente, é necessário estabelecer quem é a variável independente (x ) e quem é a variáveldependente (y ).

    Lembrete

    Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiverdependendo será obviamente a variável dependente y .

    Nesse caso, os investimentos dependem da produtividade ou a produtividade depende dosinvestimentos?

    Como o investimento em treinamento de pessoal está sendo feito com o objetivo de se aumentar aprodutividade, então concluimos que a produtividade será a variável dependente (y ), e o investimentoem treinamento será a variável independente (x ).

    O próximo passo será obter a somatória de x   (∑x), a somatória de y   (∑y), a somatória dex.y  (∑xy), a somatória de x 2 (∑x²) e somatória de y 2 (∑y²), para que possamos calcular o coeficientede correlação r.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    26/80

    26

    Unidade I

    Tabela 3

    Investimentos (x) Produtividade (y) x2 y2 x.y

    3 12 9 144 36

    4 17 16 289 68

    5 24 25 576 1206 18 36 324 108

    8 25 64 625 200

    8 27 64 729 216

    9 30 81 900 270

    11 29 121 841 319

    12 35 144 1225 420

    14 38 196 1444 532

    ∑x = 80   ∑y = 255   ∑x² = 756   ∑y² = 7097   ∑x . y = 2289

    Cálculo do coeficiente de correlação r: 

    r

    xyx y

    n

    xx

    ny

    y

    n

    r

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    =−

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .2

    2

    2

    2

    2289  80..

    .

    255

    10

    756  80

    107097

      255

    10

    2289  20400

    10

    756

    2 2

    − 

      

        −

     

      

      

    =−

    r66400

    107097

      65025

    10

    2289 2040

    756 640 7097

      

         

      −  

         

    =

      −

    −( )   −

    .

    .r

    66502 5,( )

    r

    r

    r

    r

    =

    ( ) ( )

    =

    =

    =

    249

    116 594 5

    249

    68962

    249

    262 61

    0 95

    . ,

    ,

    ,

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    27/80

    27

    MATEMÁTICA INTEGRADA

    Resposta:

    a) Existe correlação entre as variáveis.

    b) A correlação é forte e positiva, uma vez que o coeficiente r   se encontra dentro do intervalo0,8 ≤ r  < 1, que é o intervalo de correlação forte positiva, como já visto no início do capítulo, natabela de classificação do coeficiente de correlação.

    Pode-se concluir:

    O investimento em treinamento de pessoal está dando resultado, ou seja, conforme aumento doinvestimento em treinamento, aumenta a produtividade.

    Exemplo de correlação negativa

    2. Os dados a seguir referem-se ao número de acidentes e a idade do motorista avaliado por umperíodo de dois meses por uma empresa de trânsito.

    Tabela 4 - Idade do motorista e número correspondente de acidentes

    Idade do motorista Número de acidentes

    18 15

    20 12

    22 9

    27 8

    29 6

    32 4

    35 2

    Pede-se:

    a) Verificar se existe correlação entre as variaveis.

    b) Havendo correlação classificá-la em positiva ou negativa, fraca, forte ou moderada, justificandosua resposta.

    Solução

    Primeiro, como no exemplo anterior, precisamos descobrir quem é a variável independente (x) equem é a variável dependente (y).

    Lembra-se da dica dada no exemplo anterior para descobrir quem é a variável independente x  equem é a variável dependente y ?

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    28/80

    28

    Unidade I

    Nesse caso, a idade depende do número de acidentes ou o número de acidentes depende daidade?

    Obviamente, o número de acidentes depende da idade do motorista, uma vez que quanto maisexperiente o motorista, menos deverá se envolver em acidentes. Então, concluimos que o número deacidentes será a variável dependente (y ) e a idade do motorista a variável independente (x ).

    O próximo passo será obter a somatória de x  (∑x), a somatória de y  (∑y), a somatória de x.y  (∑xy), asomatória de x 2  (∑x²) e somatória de y 2  (∑y²), para que possamos calcular o coeficiente de correlação r.

    Tabela 5

    Idade domotorista (x )

    Número deacidentes (y )

    x2 y2 x.y

    18 15 324 225 27020 12 400 144 240

    22 9 484 81 198

    27 8 729 64 216

    29 6 841 36 174

    32 4 1024 16 128

    35 2 1225 4 70

    ∑x = 183   ∑Y = 56   ∑x² = 5027   ∑y² = 570   ∑x . y = 1296

    Cálculo do coeficiente de correlação r: 

    r

    xyx y

    n

    xx

    ny

    y

    n

    r

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    =

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .2

    2

    2

    2

    1296  1833 56

    7

    5027  183

    7570

      56

    7

    1296  10248

    7

    5027  334

    2 2

    .

    .− 

      

        −

     

      

      

    =−

    r889

    7570

      3136

    7

    1296 1464

    5027 4784 14 570 44

      

         

      −  

         

    =  −

    −( )   −

    .

    , .

    r

    88( )

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    29/80

    29

    MATEMÁTICA INTEGRADA

    168

    242 86 122

    168

    29628 92168

    172 13

    0 98

    =  −

    ( ) ( )

    =  −

    =  −

    = −

    r

    r

    r

    r

    , .

    ,

    ,

    ,

    Resposta:

    Existe uma forte correlação negativa entre as variáveis, uma vez que o coeficiente r  de correlação seencontra dentro do intervalo -1 < r ≤ -0,8.

    Como r está próximo de -1, temos uma correlação negativa quase perfeita, o que significa que àmedida que aumenta a idade do motorista, diminuem o número de acidentes.

    Exemplo de correlação fraca

    A tabela a seguir mostra as notas escolares obtidas por seis alunos e seus rendimentos individuaiscorrespondentes em salários mínimos.

    Tabela 6 - Rendimentos (salários mínimos) e respectivas

    notas escolares (pontos) referentes a seis alunos

    Rendimentos Notas

    5 50

    10 25

    10 80

    15 5

    25 80

    27 50

    Determine:

    a) Se existe correlação entre as variaveis.

    b) Havendo correlação, classificá-la, justificando sua resposta.

    Solução

    O primeiro passo é sempre descobrir quem é a variável independente (x ) e quem é a variável

    dependente (y ), usando a dica de estudo dada no exemplo 1.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    30/80

    30

    Unidade I

    Nesse caso, as notas dependem dos rendimentos em salários mínimos ou o rendimento depende dasnotas?

    Certamente, se houver correlação entre as variáveis, a variável dependente (y ) serão as notasescolares. Mas, para nos certificarmos de que essa correlação existe, é necessário fazermos o cálculo docoeficiente de correlação r .

    Para isso, devemos encontrar a somatória de x  (∑x), a somatória de y (∑y), a somatória de x.y  (∑xy),a somatória de x 2 (²) e a somatória de y 2 (∑y²) como nos dois exemplos anteriores.

    Tabela 7

    Rendimentos (x) Notas escolares (y) x2 y2 x.y

    5 50 25 2500 250

    10 25 100 625 25010 80 100 6400 800

    15 5 225 25 75

    25 80 625 6400 2000

    27 50 729 625 1350

    ∑x = 92   ∑y = 290   ∑x² = 1804   ∑y² = 16575   ∑x.y = 4725

    Cálculo do coeficiente de correlação r 

    r

    xy x y

    n

    xx

    ny

    y

    n

    r

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    =−

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .2

    2

    2

    2

    4725  92..

    .

    290

    6

    1804  92

    616575

      290

    6

    4725  26680

    6

    1804  8

    2 2

     

     

     

         −

     

     

     

      

    =−

    r4464

    616575

      84100

    6

    4725 4446 67

    1804 1410 67

      

         

      −  

         

    =  −

    −( )

    .

    ,

    ,r

    .. ,16575 14016 67−( )

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    31/80

    31

    MATEMÁTICA INTEGRADA

    ,

    , . ,

    ,

    278 33

    393 33 2558 33

    278 33

    100626

    =( ) ( )

    =

    r

    r

    77 94278 33

    1003 13

    0 28

    ,,

    ,

    ,

    r

    r

    =

    =

    Como r = 0,28, temos nesse caso uma correlação fraca positiva, pois r  está dentro do intervalo0,1 ≤ r < 0,5, que corresponde ao intervalo de correlação fraca positiva.

    Resposta:

    Conclui-se, portanto, que os rendimentos financeiros não têm influência nas notas escolares ou, setêm, é muito baixa.

    Exemplo de correlação moderada

    Os gastos com manutenção e o número de lotes produzidos de determinado componente dasFábricas LX Ltda. estão demonstrados na tabela a seguir:

    Tabela 8

    Número de lotes Gasto com manutenção $

    8 12

    7 16

    6 25

    4 19

    5 20

    3 40

    Pede-se:a) Existe uma correlação entre as variáveis?

    b) Justifique.

    Solução

    O primeiro passo, como sempre, é descobrir quem é a variável independente (x ) e quem é a variáveldependente (y ), usando a dica de estudo dada no 1o exemplo.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    32/80

    32

    Unidade I

    Então vamos lá:

    Nesse caso, o número de lotes produzidos dependem dos gastos com manutenção ou os gastos commanutenção dependem do número de lotes produzidos?

    Como os gastos com manutenção devem aumentar de acordo com o aumento da proução, avariável dependente (y ) serão os gastos com manutenção, ao passo que a variável independente(x ) será o número de peças produzidas. Mas, para nos certificarmos de que essa correlação existe,é necessário fazermos o cálculo do coeficiente de correlação r , como nos outros casos.

    Para isso, devemos encontrar a somatória de x  (∑x), a somatória de y (∑y), a somatória de x.y  (∑xy),a somatória de x 2  (∑x²) e a somatória de y 2  (∑y²), assim como nos exemplos anteriores.

    Tabela 9

    x y x.y X2  Y 2

    8 12 96 64 144

    7 16 112 49 256

    6 25 150 36 625

    4 19 76 16 361

    5 20 100 25 400

    3 60 180 9 3600

    ∑x = 33   ∑y = 152   ∑xy = 714   ∑x² = 199   ∑y² = 5386

    Cálculo do coeficiente de correlação r 

    r

    xyx y

    n

    xx

    ny

    y

    n

    r

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    = −

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .

    .

    2

    2

    2

    2

    714  33 1152

    6

    199  33

    65386

      152

    6

    714 836

    199 181 5 5

    2 2

    − 

      

        −

     

      

      

    =  −

    −( )

    .

    , .r

    3386 3850 67

    122

    17 5 1535 33

    −( )

    =  −

    ( ) ( )

    ,

    , . ,r

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    33/80

    33

    MATEMÁTICA INTEGRADA

    122

    26868 28

    122

    16

    =  −

    =  −

    ,r

    r33 92

    0 7

    ,

    ,r = −

    Como r = -0,7, temos nesse caso uma correlação moderada.

    Espero que vocês já estejam “craques” em correlação de variáveis. Se você ainda sente dificuldadesnesse assunto, a receita é retomar!

    3 REGRESSÃO LINEAR 

    3.1 Introdução

    Como já havia sido comentado no tópico anterior (correlação linear), até o momento o que foiapresentado como procedimentos estatísticos se limitou a descrições e inferências com apenas umavariável. Por exemplo, se tínhamos uma amostra de pessoas, estudávamos uma variável de cada vez, comoa estatura. Porém, se temos uma amostra de pessoas, existem várias variáveis que podem ser observadas:massa corporal, idade, renda etc. Nesse caso, cada uma delas pode ou não, estar associada a várias outrasvariáveis. Vamos considerar agora o caso de duas variáveis. O uso da análise de regressão tem como

    prioridade fazer previsões, estimativas ou projeções. O objetivo é desenvolver um modelo estatístico queserá usado para estimar valores de uma variável dependente y  em função de uma variável independente x .

    O que você deverá aprender:

    • como obter, baseado em uma amostra que apresenta forte correlação entre duas variáveis, aequação de uma reta de regressão linear que melhor se ajuste a aos dados da amostra;

    • como estimar valores de y  utilizando essa equação de regressão linear;

    • como obter o gráfico bidimensional denominado diagrama de dispersão.

    3.2 Diagrama de dispersão

     Veja o exemplo a seguir:

    Realcionando experiência e produtividade a partir do diagrama de dispersão

    Um instituto de pesquisa administra o desenvolvimento de seus pesquisadores de acordo

    com o número de entrevistas realizadas por eles e com os respectivos tempos de experiência.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    34/80

    34

    Unidade I

    Sendo assim, esse instituto de pesquisa deseja desenvolver um modelo para prever o númerode entrevistas em um dado dia. Acredita-se que a experiência do entrevistador (medida emsemanas trabalhadas) é determinante em relação ao número de entrevistas realizadas. Umaamostra de 10 entrevistadores revelou os seguintes dados:

    Tabela 10

    Semanas de experiência 15 41 58 18 37 52 28 24 45 33

    No de entrevistas realizadas 4 9 12 6 8 10 6 5 10 7

    Denominando Y = número de entrevistas realizadas, e X = semanas de experiência,podemos construir o diagrama de dispersão.

    14

    12

    10

    8

    6

    4

    2

    00 10 20 30 40 50 60 70

    Semanas de experiência

       N   ú   m   e   r   o   d   e   e   n   t   r   e   v   i   s   t   a   s   r   e   a   l   i   z   a   d   a

       s

    Figura 9 - Diagrama de dispersão dos dados tabela

    O exame do gráfico indica uma relação entre as variáveis. Quando o número de semanastrabalhadas aumenta (aumentando a experiência do entrevistador), o número de entrevistasrealizadas também aumenta.

    Adaptado de: Martins et al , 2005, p. 310.

    3.3 Conceito de regressão linear

    A regressão linear é um método para se estimar valores da variável y , dados outros valores das

    variáveis x , ou seja, trata-se de uma técnica estatística em que se deseja estimar um valor condicionalesperado.

     Você deve estar se perguntando: mas por que a classificação regressão linear?

    O modelo de regressão linear é chamado linear, porque levamos em consideração que a relação daresposta às variáveis é uma função linear de alguns parâmetros.

    Muito bem. Precisamos, então, determinar a equação de regressão linear que possa melhor se ajustaraos dados amostrais em questão. Ou seja, devemos encontrar os coeficientes lineares e angulares da

    equação da reta.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    35/80

    35

    MATEMÁTICA INTEGRADA

    Determinação da equação de regressão linear simples

    y = a + bx

    Onde:

    y = é o valor previsto para um valor dado de x; 

    b = inclinação da reta;

    x = valor dado.

    a = y - bx

    sendo:

    yy

    n

    xx

    n

    i

    i

    _

    =

    =

    Onde n = número de possíveis correlações entre x e y.

    bxy x y

    n

    xx

    n

    =−

    − ( )

    ∑∑∑

    ∑  ∑

    .

    2

    2

    Economize tempo!

    Observe que as somatórias para a determinação de b  são as mesmas que as utilizadas no cálculo docoeficiente r . Portanto, você pode aproveitar os resultados dessas somatórias na realização do cálculo

    de b .

    Para complementar a compreensão de regressão linear, veja alguns exemplos de aplicação.

    Exemplo de aplicação

    1. Na seção anterior, calculamos o coeficiente de correlação entre as despesas com investimentosem treinamento de pessoal e a produtividade (toneladas) investigada durante certo período de certaempresa. Obter a equação da reta para o investimento em treinamento de pessoal e a produtividade daempresa.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    36/80

    36

    Unidade I

    Tabela 11 - Despesas com investimentos (R$) em treinamentode pessoal e a produtividade (toneladas)

    investigada durante certo período

    Investimentos Produtividade3 12

    4 17

    5 24

    6 18

    8 25

    8 27

    9 30

    11 29

    12 35

    14 38

    Solução

    Nesse exemplo, você obteve vários dados que poderão ser aproveitados aqui, entre eles:

    n = 10;

    ∑x = 80;

    ∑x² = 756;

    ∑y = 255;

    ∑y² = 7097;

    ∑x.y = 2289.

    A equação da reta de regressão, quando temos uma variável independente x e uma variáveldependente y, é dada por:

    Equação da reta de regressão:

    y = a + bx

    Sendo y  o valor estimado para um dado valor x .

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    37/80

    37

    MATEMÁTICA INTEGRADA

    A inclinação b é calculada por:

    b

    xyx y

    n

    xx

    n

    =

    − ( )

    ∑∑∑

    ∑   ∑

    .

    2

    2

    Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:

    b

    b

    b

    =

    =

    =

    2289  80 255

    10

    756  80

    10

    2289  20400

    10

    756  6400

    10

    2289 204

    2

    .

    00

    756 640

    249

    116

    2 15

    =

    =

    b

    b ,

    a = y - bx

    onde:

    yy

    n

    i_

    =∑

    y

    y

    _

    _

    ,

    =

    =

    25510

    25 5

    e

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    38/80

    38

    Unidade I

    xx

    n

    x

    x

    i=

    =

    =

    80

    10

    8

    Logo:

    a y bx

    a

    a

    a

    = −

    = −

    = −

    =

    25 5 2 15 8

    25 5 17 2

    8 3

    , , .

    , ,

    ,

    Substituindo-se esses dados na equação da reta de regressão,

    y = a + bx

    teremos:

    y = 8,3 + 2,15x

    2. Um pesquisador está estudando o comportamento de Staphilococcus aureus  em hambúrguer de

    frango, submetido a condições de congelamento doméstico (-18oC) durante certo tempo (dias).

    Tabela 12 - Comportamento de Staphilococcus aureus  em hambúrguer de frango,submetido a condições de congelamento doméstico (-18oC)

    Tempo População

    0 3,50

    7 3,37

    10 3,20

    14 2,85

    17 2,75

    21 2,67

    28 2,57

    Pede-se:

    a) Indicar a variável independente e a variável dependente.

    b) Calcular e interpretar o coeficiente de correlação encontrado.

    c) Obter a equação da reta para a população de Staphilococcus aureus e o tempo de congelamento.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    39/80

    39

    MATEMÁTICA INTEGRADA

    Solução

    Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).

    Lembra-se da dica? Para facilitar essa descoberta, devemos sempre fazer a seguinte pergunta:quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, a variáveldependente y .

    Nesse caso,  a população de  Staphilococcus aureus   depende do tempo de armazenamento ouo tempo de armazenamento é que depende da população de Staphilococcus aureus ? É claro que apopulção de Staphilococcus aureus é que depende do tempo de armazenamento, portanto, será avariável dependente (y ), ao passo que o tempo de armazenamento será a variável independente (x ).

    O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y), a

    somatória de x² (∑x²) e somatória de y (∑y²), para que possamos calcular o coeficiente de correlação r .

    Tabela 13

    Tempo(x) x²Populaçao de

    Staphilococcusaureus  (y)

      y²  x.y

    0 0 3,50 12,25 0

    7 49 3,37 11,36 23,59

    10 100 3,20 10,24 32,0

    14 196 2,85 8,12 39,9017 289 2,75 7,56 46,75

    21 441 2,67 7,13 56,07

    28 784 2,57 6,60 71,96

      ∑x = 97 ∑x² = 1859   ∑y = 20,91 ∑y² = 63,26 ∑x.y =270,27

    Cálculo do coeficiente de correlação r: 

    r

    xyx y

    n

    xx

    ny

    y

    n

    r

    =

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    =−

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .

    ,

    2

    2

    2

    2

    270 27  997 20 91

    7

    1859  97

    763 26

      20 91

    7

    2 2

    . ,

    . ,  ,

    − 

      

        −

     

      

      

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    40/80

    40

    Unidade I

    270 27 289, ,=

      −r

      775

    1859 1344 14 63 26 62 46

    19 48

    514 86 0 819

    −( )   −( )

    =  −

    ( ) ( )=

      −

    , . , ,

    ,

    , . ,

    r

    r  ,,

    ,

    ,

    ,

    ,

    48

    41189

    19 48

    20 30

    0 9596

    r

    r

    = −

    = −

    Resposta

    Como, r = -0,9596, a correlação é forte e negativa, quase perfeita, pois r   está dentro dointervalo -1 < r ≤  -0,8 que corresponde ao intervalo de correlação forte  negativa pois estápróximo de r = -1.

    Conclui-se dessa maneira, que o congelamento interfere na redução das colônias com o tempo.

    Aplicação da regressão linear

    É preciso então encontrar os coeficientes a e b  da reta.

    A inclinação b é calculada por:

    b

    xyx y

    n

    xx

    n

    =

    − ( )

    ∑∑∑

    ∑  ∑

    .

    2

    2

    Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:

    b

    b

    a y bx

    =

    = −

    = −

    19 48

    514 86

    0 04

    ,

    ,

    ,

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    41/80

    41

    MATEMÁTICA INTEGRADA

    onde:

    yy

    n

    y

    y

    i_

    _

    _

    ,

    ,

    =

    =

    =

    20 91

    7

    2 99

    E:

    x

    x

    =

    =

    97

    7

    13 86,

    Logo:

    a y bx

    a

    a

    a

    = −

    = +

    = +

    =

    2 99 0 04 13 86

    2 99 0 55

    3 54

    , , . ,

    , ,

    ,

    Substituindo-se esses dados na equação da reta de regressão,

    y = a + bx

    teremos:

    y = 3,54 - 0,04x

     Você conseguiu perceber bem a diferença entre correlação e regressão? Correlação e regressão são técnicas

    estatísticas baseadas nos conceitos de amostragem vistos anteriormente, que permitem saber se duas ou maisvariáveis estatísticas de uma mesma população estão ou não relacionadas umas com as outras e, caso estejam,de que forma. De maneira geral, essas técnicas têm as seguintes finalidades: a correlação  mede o grau darelação entre essas variáveis; a regressão fornece as equações que relacionam as variáveis consideradas. Comessas equações, é possível estabelecer projeções sobre o comportamento futuro do fenômeno em questão.

    Os diversos exemplos de regressão citados são importantes para a compreensão dessa ferramentade estudo estatístico, uma vez que permite tirar conclusões e tomar decisões com base em dadosque se dispõem. Deve-se, no entanto, estar atento para o fato de que as diversas situações podemser influenciadas por outros fatores, o que faz da função encontrada apenas o primeiro passo parafundamentar uma decisão.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    42/80

    42

    Unidade I

    Os conceitos trabalhados até o momento são muito importantes. Espero que você tenha conseguidoassimilá-los bem.

    Na sequência, alguns exemplos para exercitar sua capacidade de análise e empregabilidade doarsenal teórico um pouco mais. Bom estudo!

    Exemplo de aplicação

    1. Os dados a seguir referem-se ao número de cheques devolvidos de acordo com a taxa de inflação.

    Tabela 14 - Número de cheques devolvidos daempresa x durante um período determinado

    Taxa de inflaçãoNúmero de cheques

    devolvidos

    2 5

    4 10

    5 10

    7 12

    9 15

    10 17

    11 18

    Pede-se:

    a) Verificar se existe correlação entre as variáveis, justificando sua resposta.

    b) Em caso afirmativo, encontrar a equação da reta que possibilite a estimativa do número decheques devolvidos para diferentes taxas de inflação.

    Solução

    Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).

     Vamos usar a nossa dica de sempre. Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, avariável dependente y  .

    Nesse caso, o número de cheques devolvidos depende da taxa de inflação ou a taxa de inflação dependedo número de cheques devolvidos? Quando começa haver aumento da inflação, ouvimos nos noticiáriosas reclamações dos comerciantes sobre o aumento do número de inadimplentes, ou seja, aumentou onúmero de cheques devolvidos. Portanto, o número de cheques devolvidos depende da taxa de inflação.

    O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y),a somatória de x² (∑x) e somatória de y (∑y), para que possamos calcular o coeficiente de correlação r .

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    43/80

    43

    MATEMÁTICA INTEGRADA

    Tabela 15

    Taxa (x) deinflação

    x2Número de

    cheques devolvidos yy2 x.y

    2 4 5 25 10

    4 16 10 100 405 25 10 100 50

    7 49 12 144 84

    9 81 15 225 135

    10 100 17 289 170

    11 121 18 324 198

    ∑x = 48   ∑x2 =396   ∑y = 87   ∑y2 = 1207   ∑x.y = 687

    Cálculo do coeficiente de correlação r: 

    r

    xyx y

    n

    xx

    ny

    y

    n

    r

    =−

    − ( ) 

     

     

       

      − ( ) 

     

     

       

    =−

    ∑∑∑

    ∑   ∑ ∑   ∑

    .

    .

    .

    2

    2

    2

    2

    687  48 887

    7

    396

      48

    7 1207

      87

    7

    687 596 57

    396 329 14

    2 2

     

     

     

         −

     

     

     

      

    =  −

    −( )

    .

    ,

    ,r

    .. ,

    ,

    , . ,

    ,

    ,

    ,

    1207 108129

    90 43

    66 86 125 71

    90 43

    8404 97

    90

    −( )

    =( ) ( )

    =

    =

    r

    r

    r  443

    9168

    0 99

    ,

    ,r =

    Resposta:

    Como, r = 0,9, temos nesse caso uma correlação forte positiva, quase perfeita, pois r  está dentro dointervalo 0,8 ≤ r < 1, que corresponde ao intervalo de correlação positiva e está próximo de r = + 1, que

    seria uma correlação positiva perfeita.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    44/80

    44

    Unidade I

    Conclusão:

     Verificamos, dessa maneira, que a taxa de inflação interfere na inadimplência, ou seja, o aumento dainflação provoca um aumento no número de cheques devolvidos.

    Aplicação da regressão linear

    Precisamos encontrar os coeficientes a e b  da reta.

    A inclinação b é calculada por:

    b

    xyx y

    n

    xx

    n

    =

    − ( )

    ∑∑∑

    ∑  ∑

    .

    2

    2

    Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituirmos:

    b

    b

    a y bx

    =

    =

    = −

    90 43

    66 86

    1 35

    ,

    ,

    ,

    onde:

    yy

    n

    y

    y

    i_

    _

    _

    ,

    =

    =

    =

    87

    7

    12 43

    E:

    x

    x

    =

    =

    48

    7

    6 86,

    Logo:

    a y bx

    a

    a

    a

    = −

    = −

    = −

    =

    12 43 135 6 86

    12 43 9 26

    3 17

    , , . ,

    , ,

    ,

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    45/80

    45

    MATEMÁTICA INTEGRADA

    Substituindo-se esses dados na equação da reta de regressão,

    y = a + bx

    teremos:

    y = 3,17 + 1,35x

    Resposta: 

    A equação da reta que permite fazer a estimativa do número de cheques devolvidos para as diferentestaxas de inflação é, portanto:

    y = 3,17 + 1,35x

    4 ESTIMATIVA DE PARÂMETROS

    4.1 Introdução

    O método de “estimação de parâmetros” é utilizado para se obter estimadores em casos específicos, porexemplo, quando fazemos alguma hipótese sobre algum parâmetro relativo à distribuição da população.Esse processo utiliza dados da amostra para fazer a estimativa de valores de parâmetros populacionais.

    Observação

    Estimativa é o valor numérico assumido pelo estimador, ou seja, valoraproximado do parâmetro, calculado com base na amostra.

     Veja a situação a seguir que exemplifica bem o que vem a ser esses conceitos e suas aplicações:

    Um candidato está pensando na possibilidade de se candidatar a prefeito na sua cidade. Ele

    acredita ter uma popularidade suficientemente grande, uma vez que seu pai foi vereador por muitosanos na região. Porém, não tem ideia de como quantificar essa popularidade que acredita ter egostaria de conhecer suas reais chances numa eleição, antes de lançar sua candidatura. Essa é umasituação bastante comum, se tratando de política. Muito bem, sendo assim, foi aconselhado então aconsultar um estatístico para que se informe melhor sobre como funcionam as pesquisas eleitorais.O estatístico então lhe informa que é impossível, a partir de uma amostra apenas de eleitores,prever com exatidão qual será o resultado de uma eleição. O que poderá ser feito, diz ele, é tentarminimizar o erro que possa estar envolvido nessa estimativa. Porém, para que o erro de estimativadiminua, o tamanho da amostra deverá aumentar e, dessa forma, o custo também aumentaráproporcionalmente. Alerta também que será preciso informar o grau de confiança no resultado

    encontrado, uma vez que sempre existe a probabilidade do erro ser maior do que esperávamos.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    46/80

    46

    Unidade I

    Podemos, porém, fazer também com que essa probabilidade seja a menor possível. Depois de todaessa a explanação feita, o candidato se conscientizou de que o estatístico tem um papel fundamentalna realização de uma pesquisa eleitoral, seja na determinação do seu custo, seja no cálculo do erroda estimativa. Dessa forma, o candidato pode se informar melhor do que esperar de uma pesquisaeleitoral, inclusive o grau de confiança que ele poderia ter no resultado obtido com a pesquisa.

    Percebeu, caro aluno, como a estatística está sempre nos auxiliando e socorrendo nas diversascircunstâncias que enfrentamos? Isso pode estender-se a uma pesquisa de mercado, à publicidade etc.

    4.2 Parâmetro e estatística da amostra

    Entre os estimadores mais comuns, estão:

    • média amostral x;

    • desvio padrão amostral S.

    Parâmetros:

    • média populacional µ;

    • desvio padrão populacional σ.

     Lembrete

    Observe que a média amostral e o desvio padrão amostral sãoestimadores da média populacional e do desvio padrão populacional.

    Em geral, encontramos na bibliografia as seguintes denominações para as estimativas:

    • a estimativa é dita pontual quando a estatística amostral (x ou S) dá origem a uma únicaestimativa do parâmetro da população (µ ou σ);

    • a estimativa é dita intervalar quando, a partir da estatística amostral (x ou S), obtém-se umintervalo de valores  possíveis no qual se admite, com certa probabilidade, estar contido oparâmetro populacional (µ ou σ).

    4.2.1 Obtenção dos principais parâmetros estatísticos

    Estimadores:

    • x: média amostral;

    • S: desvio padrão amostral.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    47/80

    47

    MATEMÁTICA INTEGRADA

    Parâmetros:

    • σ = Desvio padrão da população;

    • µ = média da população.

    4.3 Distribuição amostral

    Considere todas as amostras possíveis de tamanho n que podem ser retiradas de uma população detamanho N  (com ou sem reposição).

    Para cada amostra é possível calcular uma grandeza estatística, como a média, mediana, variância,desvio padrão etc.; que irá sofrer uma variação de uma amostra para outra.

    Assim, obtém-se uma distribuição da grandeza calculada de cada amostra possível de ser extraída,denominada distribuição amostral .

     Lembrete

    As grandezas estatísticas mencionadas, bem como noçõesde distribuição amostral e probabilidades, foram estudadasanteriormente. Você não está seguro do quanto se recorda a respeitodo que foi estudado? Revise! Isso facilitará muito seu estudo na

    disciplina atual.

     Observação

    Se, por exemplo, a grandeza estatística em questão for a média amostral(x), a distribuição será denominada Distribuição amostral de médias. Paracada distribuição amostral, é possível calcular a média, a mediana, avariância, o desvio padrão etc.

    4.4 Teorema do Limite Central

    Para entender o Teorema do limite central  é preciso ter claro o que é uma distribuição amostral  e oque é uma distribuição amostral  de médias das amostras .

    Assim:

    • Distribuição amostral  pode ser definida como a distribuição de probabilidade de uma estatística qualquerda amostra, formada a partir de repetidas amostras de tamanho n coletadas de uma população.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    48/80

    48

    Unidade I

    • Distribuição amostral  de médias das amostras  é quando a estatística da amostra é sua média.

    Propriedades das distribuições amostrais de médias das amostras

    • a média das médias das amostras µx é considerada igual à média populacional µ;

    • o desvio padrão das médias das amostras σx é igual à razão do desvio padrão populacional σ pela

    raiz quadrada de N.

    σσ

    xN

    =

     Observação

    O desvio padrão da distribuição amostral de médias das amostras échamado de erro padrão da média.

     Vale a pena retomar:

    Padronização da variável aleatória: se a média é diferente de zero ou o desvio padrão é diferente de1 (ou ambas as situações), é necessário converter os valores para os valores padronizados na distribuiçãonormal padrão.

    z   x=−( )µ

    σ

      µ x 0 z

    Figura 10 - Diagrama da curva normal

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    49/80

    49

    MATEMÁTICA INTEGRADA

    Exemplo de aplicação

    1. Imagine que um consultor esteja investigando o tempo que os trabalhadores de uma fábricalevam para montar determinada peça A. Suponha também que análises da linha de produção tenhamcalculado um tempo médio de 75 segundos e desvio padrão de 6 segundos. Considere agora, que oconsultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundospara montar uma peça, ou seja, P(75 ≤ X ≤ 81). 

    Como já vimos na distribuição normal de probabilidades, devemos padronizar as variáveis x, paraque possamos utilizar a tabela de áreas para a curva normal padronizada. Ou seja, transformar asvariáveis aleatórias x em variáveis normais padronizadas z, como será feito a seguir:

    Solução:

    Dados:• µ = 75 segundos;

    • σ = 6 segundos;

    • zx

    =− µ

    σ;

    • z175 75

    6=

    ;

    • z10

    6=

    ;

    • z1

      0= ;

    • z281 75

    6=

    ;

    • z26

    6= ;

    • z2   1= .

    Logo, temos a probabilidade P(0 ≤  Z ≤  1),  que é ilustrada a seguir e cujo valor é determinadoconsultando a tabela de distribuição normal padronizada Z :

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    50/80

    50

    Unidade I

    Tabela 16 – Distribuição normal padronizada

    z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

    0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

    0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

    0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

    0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

    0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

    0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

    0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

    0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

    0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

    0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

    1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

    Pela tabela, encontramos o valor da área indicada, que significa a probabilidade:

    P(75 ≤ X ≤ 81) = P(0 ≤ Z ≤ 1) = 0, 3413 x100 = 34,13%

      0 z = 1

    A = 0,3413

    Figura 11 - Diagrama da curva normal para o exercício 1

    Logo, 34,13% dos trabalhadores levarão um tempo dentro do intervalo de 75 e 81 segundos.

    Conforme o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma

    distribuição normal, independente do tipo de distribuição da população. Nesse caso, a média das médiasdas amostras poderá ser considerada como a média da população. Porém, o desvio padrão será:

    σσ

    x   N_   =

     Observação

    Para amostras de tamanho N > 30, a distribuição das médias amostraispode ser aproximada por uma distribuição normal.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    51/80

    51

    MATEMÁTICA INTEGRADA

    A aproximação torna-se mais confiável conforme aumenta o tamanho da amostra N . Se apopulação tem distribuição normal, as médias amostrais terão distribuição normal para qualquertamanho amostral N.

    2. A média das contas telefônicas dos moradores de Cincinnati é US$64 e seu desvio padrão é US$9.Amostras aleatórias de 36 contas telefônicas são retiradas dessa população e a média de cada uma delasé determinada. Obtenha a média e o erro padrão da média da distribuição amostral (LARSON & FARBER,2007, p. 189).

    Solução:

    Como a amostra possui 36 elementos (maior do que 30, vide observação anterior) , a média dadistribuição amostral é igual à média da população, enquanto o erro padrão da média é igual ao desviopadrão populacional dividido por N . Assim:

    µ

    x

    _  = µ = 64

    E:

    σσ

    σ

    x

    x

    N_

    _   ,

    =

    =15

    3. As alturas das árvores de Ipê Roxo são normalmente distribuídas e possuem uma média de90 pés e um desvio padrão de 3,5 pés. Amostras de tamanho 4 são retiradas aleatoriamente dessapopulação de ipês e a média de cada uma delas. Obtenha a média e o erro padrão da média dadistribuição amostral.

    Solução:

    A média da distribuição amostral é igual à média da população, enquanto o erro padrão da média é

    igual ao desvio padrão populacional dividido por n . Assim:

    µ µ

    x

    _   = = 90  pés

    σσ

    σ

    σ

    x

    x

    x

    N=

    =

    =

    3 5

    4

    1 75

    ,

    ,  pés.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    52/80

    52

    Unidade I

    Estimativa Intervalar

    Intervalo de confiança para a média populacional.

    α α

    α2 2

    + =

    Onde:

    a = nível de significância.

      0 + zc- zc

    1 - aα

    2

    α

    2

    Figura 12 - Diagrama de simetria da curva normal

    Onde:

    • - Zc e + Zc são valores críticos obtidos à partir da tabela de distribuição normal padronizada Z(Tabela 15); 

    • 1 - a = nível de confiança do intervalo;

    • P(- Zc < Z < + Zc ) = (1 - a).

    Sendo:

    • (1 - a) = probabilidade de que o intervalo contenha o parâmetro populacional estimado;

    • a = probabilidade de que o intervalo não contenha o parâmetro populacional estimado.

     Observação

    Os valores mais utilizados para a  (nível de significância) são 5% e1%. No entanto, isso não é regra, esses valores podem variar conforme anecessidade da pesquisa.

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    53/80

    53

    MATEMÁTICA INTEGRADA

    • Para nível de significância a = 5%

    0- zc =1,96 + zc =1,96

    1

    2

    95

    247 5 0 475

    −= = =

    α, % ,

      1

    2

    95

    247 5 0 475

    −= = =

    α, % ,1 95− =α   %

     Figura 13 - Diagrama de simetria da curva normal, para nível de significância de 5%

    Tabela 17

    z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

    0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

    0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

    0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

    0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

    0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

    0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

    0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

    0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

    0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

    0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

    1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

    1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

    1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

    1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

    1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

    1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

    1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.45451.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

    1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

    1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

    2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

    2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

    2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

  • 8/18/2019 Matemática Integrada_Unidade I(1)

    54/80

    54

    Unidade I

     Lembrete

    Procure no corpo da tabela o valor 0, 4750, siga a linha e a coluna

    correspondente e obterá zc = 1,96.

    P(- 1,96 < Z < + 1,96) = 95% c = 1 - a = 95% (nível de confiança do intervalo).