matemática integrada_unidade i(1)

8/18/2019 Matemática Integrada_Unidade I(1)

1/80

Autor: Profa. Marisa Rezende Bernardes

Colaboradoras: Profa. Valéria de Carvalho

Profa. Mirtes Mariano

Profa. Ana Carolina Bruno Borges

Matemática Integrada


2/80

Professora conteudista: Marisa Rezende Bernardes

Possui graduação em engenharia civil pela Universidade Estadual de Maringá (1980), é licenciada em matemáticapela Universidade Estadual de Maringá (1988), cumpriu mestrado e doutorado pelo programa de pós-graduação daFaculdade de Ciências da Universidade Estadual Paulista Júlio de Mesquita Filho, concluídos respectivamente em 2003

e 2009, e é vinculada ao Grupo de pesquisa em História Oral e Educação Matemática (GHOEM). Como parte do corpodocente, ingressou na Universidade Paulista, campus Bauru em 2003. Atualmente é professora titular e coordenadorageral do curso de licenciatura em matemática da Universidade Paulista.

© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ouquaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem

permissão escrita da Universidade Paulista.

Dados Internacionais de Catalogação na Publicação (CIP)

B517m Bernardes, Marisa Rezende

Matemática Integrada / Marisa Rezende Bernardes- São Paulo:Editora Sol, 2014.

188 p., il.

Nota: este volume está publicado nos Cadernos de Estudos e

Pesquisas da UNIP, Série Didática, ano XVII, n. 2-021/14 , ISSN 1517-9230.

1. Matemática integrada. 2. Parâmetros. 3. Hipóteses. I.Título.

CDU 51


3/80

Prof. Dr. João Carlos Di GenioReitor

Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças

Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias

Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa

Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação

Unip Interativa – EaD

Profa. Elisabete Brihy

Prof. Marcelo Souza

Prof. Dr. Luiz Felipe Scabar

Prof. Ivan Daliberto Frugoli

Material Didático – EaD

Comissão editorial:Dra. Angélica L. Carlini (UNIP)

Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Dra. Valéria de Carvalho (UNIP)

Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos

Projeto gráfico: Prof. Alexandre Ponzetto

Revisão: Andréia Andrade Virgínia Billato


4/80


5/80

Sumário

Matemática IntegradaAPRESENTAÇÃO ......................................................................................................................................................7

Unidade I

1 AMOSTRAGEM .....................................................................................................................................................91.1 Introdução ..................................................................................................................................................91.2 Tipos de amostragem .......................................................................................................................... 10

1.2.1 Amostragem probabilística .................................................................................................................101.3 Técnicas de amostragem probabilística ......................................................................................121.4 Dados de uma amostra ......................................................................................................................13

2 CORRELAÇÃO ................................................................................................................................................... 172.1 Introdução ...............................................................................................................................................172.2 Correlação linear................................................................................................................................... 17

2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson ........................ .... 192.2.2 Cálculo do coeficiente de correlação r...........................................................................................202.2.3 Correlação positiva .................................................................................................................................202.2.4 Correlação negativa ...............................................................................................................................20

2.3 Diagramas de dispersões ................................................................................................................... 213 REGRESSÃO LINEAR .......................................................................................................................................33

3.1 Introdução ............................................................................................................................................... 333.2 Diagrama de dispersão .......................................................................................................................333.3 Conceito de regressão linear ........................................................................................................... 34

4 ESTIMATIVA DE PARÂMETROS ...................................................................................................................454.1 Introdução ............................................................................................................................................... 454.2 Parâmetro e estatística da amostra .............................................................................................. 46

4.2.1 Obtenção dos principais parâmetros estatísticos .......................... ........................... ................. 46

4.3 Distribuição amostral ..........................................................................................................................474.4 Teorema do Limite Central ............................................................................................................... 474.5 Intervalo de confiança para a média populacional ................................................................554.6 Intervalo de confiança para a variância e o desvio padrão ................................................62

Unidade II

5 TESTES DE HIPÓTESES .................................................................................................................................... 815.1 Hipóteses nulas e alternativas ........................................................................................................ 81

5.2 Teste de hipótese para a média de uma população, amostra grande e pequena ...... 83


6/80

5.3 Teste de hipóteses para a média de duas populações .......................................................107

6 TESTES NÃO PARAMÉTRICOS .................................................................................................................. 1176.1 Teste de qui-quadrado .....................................................................................................................1176.2 Teste de adequação de ajustamento ..........................................................................................118

7 TESTE QUI-QUADRADO DE ADERÊNCIA ............................................................................................1227.1 Teste para a normalidade ................................................................................................................122

8 TESTE DE QUI-QUADRADO PARA INDEPENDÊNCIA .......................................................................128


7/80

7

APRESENTAÇÃO

Assim como já foi alertado em livros-textos anteriores, este é um texto elaborado para um curso deeducação a distância. Portanto, nunca é demais lembrar que esse é um posicionamento importante, umavez que estabelece um ambiente de aprendizagem diferente daquele utilizado pelo ensino presenciale, portanto, tem exigências diferenciadas. Essa modalidade de educação caracteriza-se por ser umaprática educativa que exige do estudante, mais do que em outra modalidade, construir conhecimentose participar efetivamente de seu próprio crescimento. Esse modelo implica, obviamente, um processo deensino próprio, uma vez que modifica, ou mesmo suprime o físico e o estrutural do ensino presencial.Assim, a função docente sofre um deslocamento, seu papel é descentralizado, e a forma de atenção aoaluno está mais próxima do que se entende por pesquisa em meios acadêmicos. É um novo formatode ensino-aprendizagem na graduação, no qual os estudantes, assim como aqueles que se iniciam empesquisas acadêmicas, devem aprender a estudar sozinhos, a buscar informações com base em indicaçõesdo docente responsável pelo curso (orientador) e ser capazes de fazer inferências na produção do seu

conhecimento.

Os objetivos listados no plano de ensino da disciplina visam desenvolver, com o educando:

• as condições atuais e tendências nos diversos ambientes de ensino e aprendizagem, de forma ainstrumentá-lo para exercer sua função em diversos níveis de possíveis atuações;

• a compreensão do papel que a disciplina Matemática desempenha nos âmbitos da sociedade e daciência;

• as possibilidades de mediação nos ensinos fundamental e médio a partir dos tópicos listados.

Esses objetivos visam à aplicabilidade do conteúdo desenvolvido nas disciplinas Estatística (nivelamento) e Probabilidades e Estatística. Nessas disciplinas, o leitor foi introduzido nessa seara,a estatística, que apresenta um arsenal teórico para o embasamento de procedimentos importantesno encaminhamento de muitos processos avaliativos, no âmbito da Ciência, dos processos industriais,comerciais e até mesmo em situações cotidianas. Nesse texto, serão aplicados conhecimentosdesenvolvidos anteriormente, como organização de dados, medidas de posição e dispersão etc. naobtenção de informações para projetos de pesquisa ou informações úteis nas decisões necessárias àsmais diversas empresas e situações cotidianas. O objetivo é que o estudante avalie como as habilidades

desenvolvidas no curso de Matemática podem ser estendidas às outras atividades, como pesquisasacadêmicas (cursos de mestrado e doutorado), industrial (em avaliações de investimentos, em produçãoe qualidade), no comércio (público alvo), marketing (tipos de propagandas) e ciências aplicadas(farmacêutica, avaliações de aplicabilidade de instrumentos em medicina, em engenharia, odontologiaetc., e avaliações em administração de empresas).

Observação

Nos mais diversos procedimentos cotidianos, bases estatísticasinterferem em decisões sem que as pessoas tenham efetivo conhecimento


8/80

8

disso. Por exemplo, ao atravessar uma rua, as pessoas fazem avaliaçõesmentais baseadas em conhecimentos adquiridos em ocasiões anteriores.Ou seja, a decisão de atravessar ou não é pautada em “amostras”, quesão situações anteriormente vivenciadas pelo indivíduo em um conjuntoformado por carros, pessoas e variáveis que as inter-relacionam (velocidadedos automóveis, largura da rua, pessoas que impedem uma travessia emmenor tempo, presença de semáforos para pedestres etc.)


9/80

9

MATEMÁTICA INTEGRADA

Unidade I

1 AMOSTRAGEM

1.1 Introdução

A escolha do método a ser utilizado na amostragem deve garantir uma amostra representativada população em relação ao interesse que se tem sobre ela, tanto em gênero como em número. Naverdade, a amostra é a parte mais importante de uma pesquisa, que depende de pressupostos obtidosa partir dela, porque permite inferências em relação à população de origem. Uma analogia seria

comparar uma amostra, que supomos representativa de uma população, a uma maquete de um edifícioa ser construído. A amostra, da mesma forma que a maquete, será melhor ou pior, segundo o grau derepresentatividade que ofereça. Ou seja, a maquete, se bem feita, permitirá uma visão antecipada doque se pretende construir. Assim, a amostra, se bem selecionada, dará condições de inferir resultadossobre a população de interesse sem que tenha conhecimento total sobre ela. A utilização de amostrasna realização de pesquisas é justificada pelo fato de que as populações (universo) nem sempre sãototalmente acessíveis. Quando abrangentes, a utilização de toda a população oneraria muito umapesquisa (sem considerar que talvez não seja nem possível encampá-la em sua totalidade) e de formadesnecessária, pois uma amostra bem selecionada pode ser suficiente para o que se deseja investigar,com razoável confiabilidade.

Lembrete

Mas veja bem, é preciso um cuidado extremo na escolha dos métodosde obtenção das amostras.

Analise a matéria a seguir, publicada em 23 de agosto de 2005, pelo Instituto Brasileiro de Defesado Consumidor (IDEC):

Idec pede esclarecimentos à Aneel – 30/8/2005.

No último (sic) dia 22, a Agência Nacional de Energia Elétrica (Aneel) admitiu errona pesquisa de satisfação do consumidor de 2004 e decidiu descartar o seu resultadono cálculo do reajuste tarifário das distribuidoras nesse ano (veja notícia). A diretoria daagência aprovou naquele dia a troca do Índice Aneel de Satisfação do Consumidor (Iasc), de2004, pelo resultado de 2003 no cálculo do “fator x”. O resultado da pesquisa de satisfaçãoé utilizado como um dos parâmetros para o cálculo do índice de produtividade (fator x) dasempresas, que influencia o reajuste anual das contas de luz.


10/80

10

Unidade I

Segundo matéria publicada no caderno ‘Dinheiro’, do jornal Folha de São Paulo(fl. B 7), de 23 de agosto de 2005, a agência teria decidido “não usar os resultados daúltima pesquisa de qualidade dos serviços prestados pelas distribuidoras de energiano cálculo dos reajustes de tarifa deste ano”.

Ainda segundo a matéria, a decisão foi tomada à vista da constatação de erros namedição em um município do Rio de Janeiro, e a sua consequência direta seria a aplicaçãode reajustes maiores que os devidos.

Fonte: Instituto Brasileiro de Defesa do Consumidor. IDEC em ação . 30 out. 2005.Disponível em: . Acesso em: 24 jun. 2011.

Esse episódio acarretou comentários de economistas, tais como o a seguir:

Talvez a principal lição desta história seja a de que se o modelo regulatório possuium índice de reajuste que varia diretamente com um índice de satisfação doconsumidor obtido via amostragem, então o cuidado com esta deve ser, sempre,redobrado. Afinal, como ficamos agora? Com um reajuste que reflete a realidade de2003? (SHIKIDA, 2005).

Caro aluno, percebeu como apenas um exemplo já nos revela a extrema importância de uma escolhacorreta da amostra com que se irá realizar a pesquisa? Portanto, todo cuidado é pouco!

A seguir, veremos os tipos de amostragem que você poderá utilizar e as diferentes técnicas a serem

utilizadas.

1.2 Tipos de amostragem

1.2.1 Amostragem probabilística

Você deve estar se perguntando: o que significa o termo probabilística? Qual a relação com o quefoi estudado anteriormente?

Uma amostra é denominada dessa forma quando cada elemento da população, a partir da qual elafoi selecionada, tem probabilidade conhecida e diferente de zero de pertencer à ela.

Uma amostragem não probabilística acontece quando é feita uma escolha deliberada dos elementosque irão compô-la. Assim, não podemos generalizar os resultados das pesquisas obtidos a partir dessaamostra para a população, uma vez que essa técnica de amostragem (não probabilística) não garante arepresentatividade da população. A escolha da amostra foi feita de forma deliberada e não ao acaso, oque diminui a confiabilidade (a amostra pode estar viciada).

O uso da amostragem probabilística é recomendável, já que essa permite uma análise minuciosa dos

dados coletados. Porém, o custo de uma amostragem probabilística é sempre maior que de uma não


11/80

11


probabilística. Mas, de qualquer forma, o gasto a mais é justificado pelas possíveis consequências de umadecisão equivocada, baseada em resultados errados. Quando se trata das amostragens probabilísticas, aqualidade da pesquisa pode ser avaliada, uma vez que seus erros de amostragem podem ser calculados. Aamostragem probabilística é a única forma que permite planos de amostra representativa, ao possibilitarinferir até que ponto os resultados baseados em uma amostra tendem a diferir dos que seriam encontradosa partir do estudo da população. Além disso, se a amostragem é probabilística, é possível especificar-se otamanho da amostra por meio de certo grau de certeza de que seus resultados não vão diferir, por mais deum valor especificado, dos que seriam obtidos num estudo da população total.

Figura 1 – Dispositivos relacionados a jogos, que quando não sofrem algum tipo de interferência indevida, proporcionam condiçõesaleatórias

Lembrete

Condições aleatórias ocorrem quando cada evento tem igualpossibilidade de ser incluído na amostra. Exemplo: lançamento de um dado

não viciado.

Lembrete

Está lembrado do conceito de população utilizado na estatísticadescritiva? Se não, é importante recordar! Vamos fazer isso?

População (ou universo) pode ser definida como um conjunto constituído de indivíduos, objetos,acontecimentos ou outras informações, em que o pesquisador deseja descrever ou pretende generalizaros seus resultados encontrados ou conclusões obtidas a partir da amostra selecionada dela.


12/80

12

Unidade I

1.3 Técnicas de amostragem probabilística

E você deve estar se perguntando: mas será que só existe uma técnica para se fazer essa amostragem?

Não! A amostragem probabilística pode ser realizada por diversas técnicas, dependendo daconveniência, como veremos a seguir. Por isso, não podemos generalizar uma técnica apenas para todasas situações de pesquisa.

• Amostragem aleatória simples: todos os elementos da população têm a mesma probabilidadede pertencer à amostra. Exemplo: tabela de números aleatórios e sorteios.

Seja N o número de elementos da população Ω, e n o número de elementos de uma amostraA = {a

1,a

2,...a

n}. Cada elemento da população tem probabilidade n/N de pertencer à amostra.

p a n

Nn( )=

Observação

Por definição, 0 < p(A) < 1.

Pense a respeito. Como “dica”, lembre-se de que p(Ω) = 1. E, novamente,pense na razão dessa “dica” ser verdadeira.

• Amostragem aleatória estratificada: é utilizada quando a população em questão éheterogênea. Ela se divide em subpopulações homogêneas ou estratos. A variável em estudo podeter comportamentos diferentes de um estrato para o outro, porém apresentar comportamentohomogêneo dentro de cada estrato. Por exemplo, uma população de estudantes pode apresentarvários estratos. Um estrato pode apresentar alunos com médias muito baixas, o outro com notasregulares, o próximo com notas médias e, por último, um estrato formado por alunos com notasaltas. Dentro de cada estrato, o comportamento é homogêneo, mas de uma maneira geral apopulação formada por esses estratos é heterogênea. A amostragem consistirá em fazer-seuma seleção aleatória de cada estrato, sendo o número de elementos selecionados de cada um

proporcional ao seu tamanho.

Exemplo 1: selecionar uma amostra com números de alunos proporcionais aos números de alunosexistentes nos estratos “médias muito baixas”, “notas regulares”, “notas médias” e “notas altas”, napopulação constituída por meus alunos da UNIP, campus de Bauru.

Exemplo 2: selecionar uma amostra com números de homens e mulheres proporcionais aos númerosde homens e mulheres existentes na população, por classe social.

• Amostragem por conglomerados: e xistem alguns casos de populações em que a identificaçãodos seus elementos é impraticável ou extremamente difícil. Mas pode ser muito fácil a identificação


13/80

13


de alguns subgrupos (conglomerados) dessa população. Pode ser realizada nessa situação, umaamostra aleatória simples desses conglomerados, e no caso do conglomerado sorteado deveser feita uma contagem completa. Exemplos comuns de conglomerados são turmas de escolas,quarteirões de bairros etc.

Exemplo relacionado com meus alunos: desejo entrevistar uma amostra de estudantes, mas,como sou professora de educação a distância, tenho alunos espalhados por todo o país. Portanto, éimpraticável selecionar essa amostra de estudantes, em que a população não é definida exatamente, a nãoser pela técnica de conglomerados. Posso então, para solucionar o problema, selecionar aleatoriamenteestudantes de duas ou três disciplinas pelas quais sou responsável, tomando o cuidado para garantirque não existam vícios.

• Amostragem sistemática: quando os elementos da população se apresentam ordenadosde acordo com algum critério. Um exemplo seria a retirada de elementos de uma amostra,

periodicamente, a partir de listas telefônicas.

• Amostragem em múltiplas etapas : é uma técnica utilizada para produzir uma amostrarepresentativa de uma população muito espalhada. É similar à técnica por conglomerados,mas nesse caso o processo só é finalizado quando há seleção de unidades individuais deamostragem.

Exemplo: considere que a direção da UNIP deseja uma pesquisa nacional sobre a capacidadeeconômica de seus alunos, de forma a idealizar um plano estratégico que evite a evasão escolarem educação a distância.

— Etapa 1 (unidades amostrais primárias): dividir o país em número de regiões (norte, sul, nordesteetc.) e, então, selecionar aleatoriamente um pequeno número de alunos dessas regiões.

— Etapa 2 (unidades amostrais secundárias): utilizando as amostras de cada região, retirar umaamostra aleatória de sub-regiões (cada estado da federação constituinte de cada região, porexemplo).

— Etapa 3 (unidades amostrais terciárias): a partir das amostras anteriores, estudantes poderiam

ser selecionados para a entrevista por meio de uma amostragem sistemática utilizando oregistro acadêmico.

1.4 Dados de uma amostra

Os exemplos a seguir, retirados de Pinheiro et al (2009), revelam como os dados de uma amostrapodem se tratados de formas diferentes e levar a resultados e conclusões bastante úteis para diferentesprofissionais.

Diego e Walter trabalhavam, havia muitos anos, na fábrica de camisas masculinasColarinho Branco. Um dia, o gerente de produção pediu demissão para ir trabalhar


14/80

14

Unidade I

numa empresa multinacional do ramo. O dono da empresa, Sr. Paulo, chamouentão seus dois experientes empregados para comunicar-lhes que um deles seriao novo gerente de produção. Contudo, disse-lhes que essa escolha dependeria deum pequeno teste ao qual ambos seriam submetidos. Ele pediu a cada um dosdois que:

• selecionasse amostras de 200 homens adultos;

• medisse a circunferência do pescoço de cada indivíduo dessasamostras;

• apresentasse por escrito um relatório com as suas conclusões.

Logo no segundo dia após ter começado as medições, Walter compareceu

sorridente perante Sr. Paulo para apresentar o seu trabalho. Ele não tinhamais dúvidas de que seria escolhido. Passaram-se mais um, dois, três dias, esomente quatro dias depois Diego entregou o seu trabalho. No quinto dia, odono da empresa anunciou: Diego será o novo gerente de produção. Walternão conseguia entender o porquê da escolha, que ele considerava injusta, e foiinterpelar o Sr. Paulo. Expôs os seus motivos e lembrou que tinha entregado oseu trabalho quatro dias antes de Diego. O Sr. Paulo, calmamente, mostrou-lhesos dois trabalhos. O relatório de Walter estava caprichado sim, com as pessoasordenadas alfabeticamente e seus respectivos tamanhos de colarinho. “Bonitoseu trabalho”, falou o Sr. Paulo, “só que de nada me serve”. A seguir, mostrouo relatório que Diego tinha apresentado. As pessoas não estavam ordenadasalfabeticamente, mas por tamanho de colarinho. “Você vê”, falou o dono,”agora eu sei quais são os tamanhos extremos, o menor e o maior. “Além disso”,e mostrou-lhe uma tabela de frequências apresentada por Diego, “posso verimediatamente qual o tamanho do colarinho que tenho que fabricar em maiorquantidade e as proporções correspondentes aos outros tamanhos”. A seguir,mostrou um histograma em que claramente podia ser vista a distribuição dosdiversos tamanhos de colarinho. E ainda tinha mais. No seu trabalho, Diegotinha calculado o tamanho médio dos colarinhos, o seu desvio-padrão e tinha

feito um gráfico de caixas (box-plot ), no qual sobressaiam nitidamente osquartis inferior e superior e a mediana para o tamanho dos colarinhos. Walterficou admirado com o trabalho de Diego. Percebeu que todas as informaçõesapresentadas por ele eram de fato relevantes para a produção de camisas. Diantede tantas evidências, ele aceitou as explicações do Sr. Paulo e foi cumprimentaro colega recém-promovido. No dia seguinte, inscreveu-se em um treinamentoem métodos estatísticos, oferecido por uma conceituada universidade. No casorelatado, Diego apresentou um trabalho muito mais completo que o de Walter,graças ao seu conhecimento das técnicas de análise exploratória de dados(Adaptado de: PINHEIRO et al , 2009, p. 1-2).


15/80


16/80

16

Unidade I

dados para que possamos resumir as informações obtidas a partir deles, de forma que nos “respondam”a respeito do tema que estamos investigando.

Lembrete

Você se lembra do que foi estudado anteriormente sobre os tipos e aorganização de dados coletados? É interessante revisar!

Exemplo de aplicação

Até o momento, você poderá planejar um projeto de pesquisa considerando os seguintes itens:

• as metas da pesquisa;

• definir a população;

• identificar o sistema de amostragem;

• definir o método de coleta de dados;

• ordenar as informações.

Dados

Qualitativos Quantitativos

Nominais ContínuosOrdinais Discretos

Figura 2

Saiba mais

Em Smailes & McGrane (2002), capítulo 1, há importantes informaçõessobre projetos de questionários e tipos de entrevistas.


17/80

17


2 CORRELAÇÃO

2.1 Introdução

Em nossos estudos de estatística até o momento, estávamos limitados em descrever a forma dadistribuição dos valores de apenas uma variável. Por exemplo: quando descrevíamos as estaturas deuma amostra de pessoas, esses dados se restringiam a mostrar apenas a frequência de pessoas quese encaixavam naqueles valores. A variável em questão era, portanto, a estatura dessas pessoas.No entanto, na correlação de variáveis, podemos relacionar diferentes estaturas com diferentesidades. Nesse caso, teremos duas variáveis, a estatura e a idade. Logo, ao trabalharmos com duasvariáveis, é possível avaliar e medir as relações entre elas, o que é chamado de correlação devariáveis.

Se houver uma correlação entre elas, poderemos ter uma função matemática que caracteriza

essa relação com a regressão e seremos, dessa forma, capazes de determinar os parâmetros dessafunção.

Neste capítulo, iremos portanto estudar a correlação entre variáveis e a possibilidade daaplicação da regressão linear. O estudo da correlação linear de variáveis é importante para termosa certeza de que poderemos aplicar a regressão linear a partir desses dados já conhecidos ecorrelacionados. Veremos, nesse caso, como uma variável independente qualquer (arbitrariamentedenominada x ou por qualquer outra forma) se comporta de acordo com a mudança da variáveldependente (também arbitrariamente denominada y ou por qualquer outra forma) que estácorrelacionada.

Em pesquisas, é frequente a investigação da existência de relação entre variáveis, isto é,saber se as modificações sofridas por uma das variáveis são acompanhadas por modificaçõesnas outras, como consumo e renda, estatura e idade de indivíduos, entre outras. Veja que, numapesquisa de campo, por exemplo, você poderá chegar a várias conclusões sobre porcentagensde pessoas do gênero feminino e masculino, como preferência eleitoral, nível de escolaridadeetc. Mas, será que essas variáveis apresentam alguma relação entre si? Será que a preferênciaeleitoral está associada ao gênero, feminino ou masculino? Portanto, prezado aluno, essa émais uma forma de você aprofundar os seus estudos e conclusões a respeito dos seus dados

estatísticos.

2.2 Correlação linear

O significado do termo correlação é a existência da relação em dois sentidos (co +relação), usado em estatística para demonstrar a força da relação entre dois conjuntos dedados. Verificar a possível existência e o grau de relação entre as variáveis é o objeto deestudo da correlação.

Se confirmada essa relação, procura-se descrevê-la sob forma matemática, por meio de umafunção. A realização da estimação dos parâmetros dessa função matemática é o objeto da regressão


18/80

18

Unidade I

linear. Nesse caso, os pares de valores das duas variáveis podem ser colocados num diagramacartesiano chamado diagrama de dispersão .

Pai... Vamos estabelecer uma

correlação linear forte entre seusalário e minha mesada?

Figura 3 – Conversas entre pai e filha (adaptação da autora)

Lembrete

É importante se certificar de que existe uma correlação linearentre as variáveis, para que se possa fazer uso da equação da reta,também chamada de reta de regressão, que permite estimar valorespara a variável dependente a partir de um dado valor da variável

independente. Ou seja, só é viável utilizar a regressão linear para seprever novas estimativas, quando já se tem algumas informaçõesprévias sobre determinado tema, quando há certeza de uma fortecorrelação entre as variáveis.

Situação prática da aplicação da correlação de variáveis e regressão linear:

Talvez você não fosse nascido quando o que será relatado a seguir aconteceu em nosso país. Nessecaso, pergunte a respeito aos seus pais, ou tios, ou seus avôs. Leia a respeito. É muito importante sabersobre os métodos estatísticos, mas é igualmente importante conhecer a história. Ambos os instrumentosserão seus aliados em decisões, independente do seu ramo de atividade.


19/80

19


Pois bem. Um exemplo típico da utilização da regressão linear foi sua constante utilização em umperíodo em que a economia do país estava bastante desequilibrada, para estimativas futuras de taxasde inflação a partir das taxas atuais.

Verificar se existe relação entre variáveis é um dos propósitos de maior interesse nas pesquisas.Isso é justificado pelo fato de que, como já foi enfatizado, existindo associação entre elas, as análises econclusões sobre os resultados obtidos na pesquisa serão mais confiáveis.

2.2.1 Coeficiente de correlação de Pearson – correlação linear de Pearson

O coeficiente de correlação, ou coeficiente de Pearson, nos indica se existe correlação entre asvariáveis analisadas. Existirá correlação se esse coeficiente estiver entre -1 e + 1, o que em porcentagemrepresenta entre -100% e + 100%.

Esse coeficiente mostrará também o grau de intensidade existente na correlação entre as variáveisem estudo, como está resumido na tabela a seguir.

Tabela 1 - Classificação do tipo de correlação,segundo o coeficiente de correlação r

Coeficiente de correlação r Tipo de correlação

r = 1 Perfeita positiva

0,8 ≤ r < 1 Forte positiva

0,5 ≤ r < 0,8 Moderada positiva

0,1 ≤ r < 0,5 Fraca positiva

0 < r < 0,1 Ínfima positiva

0 Nula

-0,1 < r < 0 Ínfima negativa

-0,5 < r ≤ -0,1 Fraca negativa

-0,8 < r ≤ -0,5 Moderada negativa

-1 < r ≤ -0,8 Forte negativa

r = -1 Perfeita negativa

Você percebeu que quanto mais o coeficiente de correlação r se aproxima de +1 ou de -1, melhor éa correlação entre as variáveis? Por exemplo, se o coeficiente r de correlação estiver próximo do +1, háuma correlação forte positiva, caso esteja próximo do -1, há uma correlação forte negativa. Por outrolado, quanto mais esse coeficiente se distancia de +1 ou de -1, pior a correlação. Logo, menos confiáveisserão as estimativas feitas a partir desses dados, porque denota um comportamento pouco linear entreos dados.


20/80

20

Unidade I

2.2.2 Cálculo do coeficiente de correlação r

r

xyx y

n

xx

ny

y

n

=−

− ( )

− ( )

∑∑∑

∑ ∑ ∑ ∑

.

.2

2

2

2

Onde:

r = coeficiente de correlação;

x = variável independente;

y = variável dependente;

n = número de possíveis correlações entre as variáveis x e y.

Lembrete

As variáveis independentes e dependentes são arbitrariamente

denominadas de x e y . No entanto, elas podem ter outras denominações,conforme o seu problema de pesquisa. Mas cuidado ao estabelecer qual é avariável dependente e qual é a independente!

2.2.3 Correlação positiva

Dizemos que existe uma correlação positiva entre duas variáveis quando o aumento da variávelindependente resulta no aumento da variável dependente.

Observe uma situação que pode ser um exemplo de forte correlação positiva: um professor quisverificar a existência de correlação entre as notas finais de matemática financeira e estatística de umgrupo de estudantes. Uma vez que as duas disciplinas são da mesma área (exatas), acredita-se em umaforte correlação entre elas. E, mais precisamente, positiva.

2.2.4 Correlação negativa

Dizemos que existe uma correlação negativa entre duas variáveis quando o aumento da variávelindependente resulta no decréscimo da variável dependente.


21/80

21


Veja agora uma situação que pode ser um exemplo típico de correlação negativa: na época dacolheita de grãos, verifica-se uma queda nos preços dos produtos agrícolas. Isso mostra que oferta epreços, se estiverem correlacionados, será de forma negativa, uma vez que o aumento da oferta doproduto no mercado irá resultar numa queda dos preços.

Observação

Mas não se esqueça: o fato das duas variáveis estarem aumentandoou diminuindo simultaneamente não significa que exista um efeito diretode uma sobre a outra. É necessário que se investigue o coeficiente decorrelação r para verificar qual posição ele ocupa no intervalo de -1 a +1 e,a partir disso, descobrir qual o grau de correlação entre as variáveis.

Para você pensar: retorne à figura 3 e instrua a garotinha a pedir corretamente (para ela, claro) acorrelação entre o salário do pai e sua mesada. Qual correção você faria na fala dela?

Observação

Quando o coeficiente de correlação r for exatamente igual a +1, existeuma correlação positiva perfeita entre as variáveis consideradas. Da mesmaforma, se esse coeficiente r for exatamente igual a -1, diz–se que existeuma correlação negativa perfeita entre as variáveis.

O que você deverá aprender sobre correlação de variáveis:

• quando existe correlação entre as variáveis;

• em caso afirmativo, que tipo de correlação existe entre elas (se é positiva ou negativa);

• existindo a correlação, se é forte (próxima de +1 e de -1) ou fraca (próxima de zero);

• ao ser confirmada a correlação entre as variáveis, será possível a aplicação da regressão linearpara se fazer novas estimativas a partir de dados já conhecidos;

• quanto mais forte essa correlação, mais confiáveis serão essas estimativas.

2.3 Diagramas de dispersões

Os diagramas de dispersões a seguir mostram o comportamento da relação entre variáveis emdecorrência do coeficiente de correlação linear. Os exemplos estão representados segundo o sistemacartesiano genérico, em que x indicará a variável independente e y a variável dependente. Para se obter

esses gráficos, foi utilizado o winplot (software free ).


22/80

22

Unidade I

Caso 1:

- 2 - 1 1 2 3 4 5 6 7 8

y

x

6

5

4

3

2

1

-1

Figura 4 - Gráfico de uma correlação positiva perfeita

Observe que, nesse caso, o aumento da variável independente x está originando um aumento davariável dependente y . O gráfico apresenta um caso de correlação positiva perfeita. Observe que não hánenhum ponto fora da reta.

Caso 2:

x

y

- 3 - 2 - 1 1 2 3 4 5 6

8

7

6

5

4

3

2

1

-1

Figura 5 - Gráfico de uma correlação positiva imperfeita

Veja que, nesse caso, temos também o aumento da variável independente x originando um aumentoda variável dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracterizauma correlação positiva imperfeita.

Caso 3:

Observe que, nesse caso, o aumento da variável independente x origina um decréscimo da variáveldependente y . O gráfico apresenta uma correlação negativa perfeita, pois não há nenhum ponto fora da reta.


23/80

23


- 3 - 2 - 1 1 2 3 4 5 6

5

4

3

2

1

-1

y

x

Figura 6 - Gráfico de uma correlação negativa perfeita

Caso 4

- 3 - 2 - 1 1 2 3 4 5 6

5

4

3

2

1

-1

y

x

Figura 7 - Gráfico de uma correlação negativa imperfeita

Observe que, nesse caso, o aumento da variável independente x origina um decréscimo da variável

dependente y . Porém, não temos uma reta perfeita como no caso anterior, o que caracteriza umacorrelação negativa imperfeita, uma vez que não temos uma reta perfeita.

Caso 5

- 3 - 2 - 1 1 2 3 4 5 6

54

3

2

1

-1

y

x

Figura 8 - Gráfico que representa ausência de correlação (r = 0)


24/80

24

Unidade I

Perceba que, nesse caso não é possível traçar uma reta, uma vez que os pontos estão totalmentedispersos, o que caracteriza uma ausência de comportamento linear entre eles. Por mais que se tentetraçar uma reta de forma que abranja a maioria dos pontos, vários ficarão fora.

Observação

Você percebeu como podemos determinar, de modo qualitativo, o quão bem uma reta representa a relação entre as variáveis,observando diretamente os diagramas de dispersão apresentadosanteriormente?

Vejamos agora alguns exemplos resolvidos de aplicações do cálculo de correlação de variáveis quepossibilitará uma melhor visualização de como a correlação entre as varáveis podem acontecer e como

podem não acontecer.

Observação

Nos casos em que a correlação é perfeita, seja positiva ou negativa,a equação linear é conveniente. Isto se deve ao fato de que quantomenos dispersão existir em torno da reta, melhor a relação entre asvariáveis. Não é o caso de correlações que foram classificadas comoimperfeitas.


Exemplo de correlação positiva

1. A tabela a seguir mostra as despesas com investimentos em treinamento de pessoal e aprodutividade (toneladas) investigada durante certo período de certa empresa.

Pede-se:

a) Verificar se existe correlação entre as variáveis.

b) Em caso afirmativo, que tipo de correlação, positiva ou negativa? Fraca, forte ou moderada?Justifique.


25/80

25


Tabela 2 - Despesas com investimentos (em milhares de R$)em treinamento de pessoal e a produtividade (toneladas)

investigadas durante certo período

Investimentos Produtividade

3 12

4 17

5 24

6 18

8 25

8 27

9 30

11 29

12 35

14 38

Solução

Inicialmente, é necessário estabelecer quem é a variável independente (x ) e quem é a variáveldependente (y ).

Lembrete

Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiverdependendo será obviamente a variável dependente y .

Nesse caso, os investimentos dependem da produtividade ou a produtividade depende dosinvestimentos?

Como o investimento em treinamento de pessoal está sendo feito com o objetivo de se aumentar aprodutividade, então concluimos que a produtividade será a variável dependente (y ), e o investimentoem treinamento será a variável independente (x ).

O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória dex.y (∑xy), a somatória de x 2 (∑x²) e somatória de y 2 (∑y²), para que possamos calcular o coeficientede correlação r.


26/80

26

Unidade I

Tabela 3

Investimentos (x) Produtividade (y) x2 y2 x.y

3 12 9 144 36

4 17 16 289 68

5 24 25 576 1206 18 36 324 108

8 25 64 625 200

8 27 64 729 216

9 30 81 900 270

11 29 121 841 319

12 35 144 1225 420

14 38 196 1444 532

∑x = 80 ∑y = 255 ∑x² = 756 ∑y² = 7097 ∑x . y = 2289

Cálculo do coeficiente de correlação r:

r

xyx y

n

xx

ny

y

n

r

=−

− ( )

− ( )

=−

∑∑∑

∑ ∑ ∑ ∑

.

.2

2

2

2

2289 80..

.

255

10

756 80

107097

255

10

2289 20400

10

756

2 2

−

−

=−

−

r66400

107097

65025

10

2289 2040

756 640 7097

−

=

−

−( ) −

.

.r

66502 5,( )

r

r

r

r

=

( ) ( )

=

=

=

249

116 594 5

249

68962

249

262 61

0 95

. ,

,

,


27/80

27


Resposta:

a) Existe correlação entre as variáveis.

b) A correlação é forte e positiva, uma vez que o coeficiente r se encontra dentro do intervalo0,8 ≤ r < 1, que é o intervalo de correlação forte positiva, como já visto no início do capítulo, natabela de classificação do coeficiente de correlação.

Pode-se concluir:

O investimento em treinamento de pessoal está dando resultado, ou seja, conforme aumento doinvestimento em treinamento, aumenta a produtividade.

Exemplo de correlação negativa

2. Os dados a seguir referem-se ao número de acidentes e a idade do motorista avaliado por umperíodo de dois meses por uma empresa de trânsito.

Tabela 4 - Idade do motorista e número correspondente de acidentes

Idade do motorista Número de acidentes

18 15

20 12

22 9

27 8

29 6

32 4

35 2

Pede-se:

a) Verificar se existe correlação entre as variaveis.

b) Havendo correlação classificá-la em positiva ou negativa, fraca, forte ou moderada, justificandosua resposta.

Solução

Primeiro, como no exemplo anterior, precisamos descobrir quem é a variável independente (x) equem é a variável dependente (y).

Lembra-se da dica dada no exemplo anterior para descobrir quem é a variável independente x equem é a variável dependente y ?


28/80

28

Unidade I

Nesse caso, a idade depende do número de acidentes ou o número de acidentes depende daidade?

Obviamente, o número de acidentes depende da idade do motorista, uma vez que quanto maisexperiente o motorista, menos deverá se envolver em acidentes. Então, concluimos que o número deacidentes será a variável dependente (y ) e a idade do motorista a variável independente (x ).

O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy), asomatória de x 2 (∑x²) e somatória de y 2 (∑y²), para que possamos calcular o coeficiente de correlação r.

Tabela 5

Idade domotorista (x )

Número deacidentes (y )

x2 y2 x.y

18 15 324 225 27020 12 400 144 240

22 9 484 81 198

27 8 729 64 216

29 6 841 36 174

32 4 1024 16 128

35 2 1225 4 70

∑x = 183 ∑Y = 56 ∑x² = 5027 ∑y² = 570 ∑x . y = 1296


r

xyx y

n

xx

ny

y

n

r

=−

− ( )

− ( )

=

−

∑∑∑

∑ ∑ ∑ ∑

.

.2

2

2

2

1296 1833 56

7

5027 183

7570

56

7

1296 10248

7

5027 334

2 2

.

.−

−

=−

−

r889

7570

3136

7

1296 1464

5027 4784 14 570 44

−

= −

−( ) −

.

, .

r

88( )


29/80

29


168

242 86 122

168

29628 92168

172 13

0 98

= −

( ) ( )

= −

= −

= −

r

r

r

r

, .

,

,

,

Resposta:

Existe uma forte correlação negativa entre as variáveis, uma vez que o coeficiente r de correlação seencontra dentro do intervalo -1 < r ≤ -0,8.

Como r está próximo de -1, temos uma correlação negativa quase perfeita, o que significa que àmedida que aumenta a idade do motorista, diminuem o número de acidentes.

Exemplo de correlação fraca

A tabela a seguir mostra as notas escolares obtidas por seis alunos e seus rendimentos individuaiscorrespondentes em salários mínimos.

Tabela 6 - Rendimentos (salários mínimos) e respectivas

notas escolares (pontos) referentes a seis alunos

Rendimentos Notas

5 50

10 25

10 80

15 5

25 80

27 50

Determine:

a) Se existe correlação entre as variaveis.

b) Havendo correlação, classificá-la, justificando sua resposta.

Solução

O primeiro passo é sempre descobrir quem é a variável independente (x ) e quem é a variável

dependente (y ), usando a dica de estudo dada no exemplo 1.


30/80

30

Unidade I

Nesse caso, as notas dependem dos rendimentos em salários mínimos ou o rendimento depende dasnotas?

Certamente, se houver correlação entre as variáveis, a variável dependente (y ) serão as notasescolares. Mas, para nos certificarmos de que essa correlação existe, é necessário fazermos o cálculo docoeficiente de correlação r .

Para isso, devemos encontrar a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy),a somatória de x 2 (²) e a somatória de y 2 (∑y²) como nos dois exemplos anteriores.

Tabela 7

Rendimentos (x) Notas escolares (y) x2 y2 x.y

5 50 25 2500 250

10 25 100 625 25010 80 100 6400 800

15 5 225 25 75

25 80 625 6400 2000

27 50 729 625 1350

∑x = 92 ∑y = 290 ∑x² = 1804 ∑y² = 16575 ∑x.y = 4725

Cálculo do coeficiente de correlação r

r

xy x y

n

xx

ny

y

n

r

=−

− ( )

− ( )

=−

∑∑∑

∑ ∑ ∑ ∑

.

.2

2

2

2

4725 92..

.

290

6

1804 92

616575

290

6

4725 26680

6

1804 8

2 2

−

−

=−

−

r4464

616575

84100

6

4725 4446 67

1804 1410 67

−

= −

−( )

.

,

,r

.. ,16575 14016 67−( )


31/80

31


,

, . ,

,

278 33

393 33 2558 33

278 33

100626

=( ) ( )

=

r

r

77 94278 33

1003 13

0 28

,,

,

,

r

r

=

=

Como r = 0,28, temos nesse caso uma correlação fraca positiva, pois r está dentro do intervalo0,1 ≤ r < 0,5, que corresponde ao intervalo de correlação fraca positiva.

Resposta:

Conclui-se, portanto, que os rendimentos financeiros não têm influência nas notas escolares ou, setêm, é muito baixa.

Exemplo de correlação moderada

Os gastos com manutenção e o número de lotes produzidos de determinado componente dasFábricas LX Ltda. estão demonstrados na tabela a seguir:

Tabela 8

Número de lotes Gasto com manutenção $

8 12

7 16

6 25

4 19

5 20

3 40

Pede-se:a) Existe uma correlação entre as variáveis?

b) Justifique.

Solução

O primeiro passo, como sempre, é descobrir quem é a variável independente (x ) e quem é a variáveldependente (y ), usando a dica de estudo dada no 1o exemplo.


32/80

32

Unidade I

Então vamos lá:

Nesse caso, o número de lotes produzidos dependem dos gastos com manutenção ou os gastos commanutenção dependem do número de lotes produzidos?

Como os gastos com manutenção devem aumentar de acordo com o aumento da proução, avariável dependente (y ) serão os gastos com manutenção, ao passo que a variável independente(x ) será o número de peças produzidas. Mas, para nos certificarmos de que essa correlação existe,é necessário fazermos o cálculo do coeficiente de correlação r , como nos outros casos.

Para isso, devemos encontrar a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑xy),a somatória de x 2 (∑x²) e a somatória de y 2 (∑y²), assim como nos exemplos anteriores.

Tabela 9

x y x.y X2 Y 2

8 12 96 64 144

7 16 112 49 256

6 25 150 36 625

4 19 76 16 361

5 20 100 25 400

3 60 180 9 3600

∑x = 33 ∑y = 152 ∑xy = 714 ∑x² = 199 ∑y² = 5386

Cálculo do coeficiente de correlação r

r

xyx y

n

xx

ny

y

n

r

=−

− ( )

− ( )

= −

∑∑∑

∑ ∑ ∑ ∑

.

.

.

2

2

2

2

714 33 1152

6

199 33

65386

152

6

714 836

199 181 5 5

2 2

−

−

= −

−( )

.

, .r

3386 3850 67

122

17 5 1535 33

−( )

= −

( ) ( )

,

, . ,r


33/80

33


122

26868 28

122

16

= −

= −

,r

r33 92

0 7

,

,r = −

Como r = -0,7, temos nesse caso uma correlação moderada.

Espero que vocês já estejam “craques” em correlação de variáveis. Se você ainda sente dificuldadesnesse assunto, a receita é retomar!

3 REGRESSÃO LINEAR

3.1 Introdução

Como já havia sido comentado no tópico anterior (correlação linear), até o momento o que foiapresentado como procedimentos estatísticos se limitou a descrições e inferências com apenas umavariável. Por exemplo, se tínhamos uma amostra de pessoas, estudávamos uma variável de cada vez, comoa estatura. Porém, se temos uma amostra de pessoas, existem várias variáveis que podem ser observadas:massa corporal, idade, renda etc. Nesse caso, cada uma delas pode ou não, estar associada a várias outrasvariáveis. Vamos considerar agora o caso de duas variáveis. O uso da análise de regressão tem como

prioridade fazer previsões, estimativas ou projeções. O objetivo é desenvolver um modelo estatístico queserá usado para estimar valores de uma variável dependente y em função de uma variável independente x .

O que você deverá aprender:

• como obter, baseado em uma amostra que apresenta forte correlação entre duas variáveis, aequação de uma reta de regressão linear que melhor se ajuste a aos dados da amostra;

• como estimar valores de y utilizando essa equação de regressão linear;

• como obter o gráfico bidimensional denominado diagrama de dispersão.

3.2 Diagrama de dispersão

Veja o exemplo a seguir:

Realcionando experiência e produtividade a partir do diagrama de dispersão

Um instituto de pesquisa administra o desenvolvimento de seus pesquisadores de acordo

com o número de entrevistas realizadas por eles e com os respectivos tempos de experiência.


34/80

34

Unidade I

Sendo assim, esse instituto de pesquisa deseja desenvolver um modelo para prever o númerode entrevistas em um dado dia. Acredita-se que a experiência do entrevistador (medida emsemanas trabalhadas) é determinante em relação ao número de entrevistas realizadas. Umaamostra de 10 entrevistadores revelou os seguintes dados:

Tabela 10

Semanas de experiência 15 41 58 18 37 52 28 24 45 33

No de entrevistas realizadas 4 9 12 6 8 10 6 5 10 7

Denominando Y = número de entrevistas realizadas, e X = semanas de experiência,podemos construir o diagrama de dispersão.

14

12

10

8

6

4

2

00 10 20 30 40 50 60 70

Semanas de experiência

N ú m e r o d e e n t r e v i s t a s r e a l i z a d a

s

Figura 9 - Diagrama de dispersão dos dados tabela

O exame do gráfico indica uma relação entre as variáveis. Quando o número de semanastrabalhadas aumenta (aumentando a experiência do entrevistador), o número de entrevistasrealizadas também aumenta.

Adaptado de: Martins et al , 2005, p. 310.

3.3 Conceito de regressão linear

A regressão linear é um método para se estimar valores da variável y , dados outros valores das

variáveis x , ou seja, trata-se de uma técnica estatística em que se deseja estimar um valor condicionalesperado.

Você deve estar se perguntando: mas por que a classificação regressão linear?

O modelo de regressão linear é chamado linear, porque levamos em consideração que a relação daresposta às variáveis é uma função linear de alguns parâmetros.

Muito bem. Precisamos, então, determinar a equação de regressão linear que possa melhor se ajustaraos dados amostrais em questão. Ou seja, devemos encontrar os coeficientes lineares e angulares da

equação da reta.


35/80

35


Determinação da equação de regressão linear simples

y = a + bx

Onde:

y = é o valor previsto para um valor dado de x;

b = inclinação da reta;

x = valor dado.

a = y - bx

sendo:

yy

n

xx

n

i

i

_

=

=

∑

∑

Onde n = número de possíveis correlações entre x e y.

bxy x y

n

xx

n

=−

− ( )

∑∑∑

∑ ∑

.

2

2

Economize tempo!

Observe que as somatórias para a determinação de b são as mesmas que as utilizadas no cálculo docoeficiente r . Portanto, você pode aproveitar os resultados dessas somatórias na realização do cálculo

de b .

Para complementar a compreensão de regressão linear, veja alguns exemplos de aplicação.


1. Na seção anterior, calculamos o coeficiente de correlação entre as despesas com investimentosem treinamento de pessoal e a produtividade (toneladas) investigada durante certo período de certaempresa. Obter a equação da reta para o investimento em treinamento de pessoal e a produtividade daempresa.


36/80

36

Unidade I

Tabela 11 - Despesas com investimentos (R$) em treinamentode pessoal e a produtividade (toneladas)

investigada durante certo período

Investimentos Produtividade3 12

4 17

5 24

6 18

8 25

8 27

9 30

11 29

12 35

14 38

Solução

Nesse exemplo, você obteve vários dados que poderão ser aproveitados aqui, entre eles:

n = 10;

∑x = 80;

∑x² = 756;

∑y = 255;

∑y² = 7097;

∑x.y = 2289.

A equação da reta de regressão, quando temos uma variável independente x e uma variáveldependente y, é dada por:

Equação da reta de regressão:

y = a + bx

Sendo y o valor estimado para um dado valor x .


37/80

37


A inclinação b é calculada por:

b

xyx y

n

xx

n

=

−

− ( )

∑∑∑

∑ ∑

.

2

2

Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:

b

b

b

=

−

−

=

−

−

=

−

2289 80 255

10

756 80

10

2289 20400

10

756 6400

10

2289 204

2

.

00

756 640

249

116

2 15

−

=

=

b

b ,

a = y - bx

onde:

yy

n

i_

=∑

y

y

_

_

,

=

=

25510

25 5

e


38/80

38

Unidade I

xx

n

x

x

i=

=

=

∑

80

10

8

Logo:

a y bx

a

a

a

= −

= −

= −

=

25 5 2 15 8

25 5 17 2

8 3

, , .

, ,

,

Substituindo-se esses dados na equação da reta de regressão,

y = a + bx

teremos:

y = 8,3 + 2,15x

2. Um pesquisador está estudando o comportamento de Staphilococcus aureus em hambúrguer de

frango, submetido a condições de congelamento doméstico (-18oC) durante certo tempo (dias).

Tabela 12 - Comportamento de Staphilococcus aureus em hambúrguer de frango,submetido a condições de congelamento doméstico (-18oC)

Tempo População

0 3,50

7 3,37

10 3,20

14 2,85

17 2,75

21 2,67

28 2,57

Pede-se:

a) Indicar a variável independente e a variável dependente.

b) Calcular e interpretar o coeficiente de correlação encontrado.

c) Obter a equação da reta para a população de Staphilococcus aureus e o tempo de congelamento.


39/80

39


Solução

Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).

Lembra-se da dica? Para facilitar essa descoberta, devemos sempre fazer a seguinte pergunta:quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, a variáveldependente y .

Nesse caso, a população de Staphilococcus aureus depende do tempo de armazenamento ouo tempo de armazenamento é que depende da população de Staphilococcus aureus ? É claro que apopulção de Staphilococcus aureus é que depende do tempo de armazenamento, portanto, será avariável dependente (y ), ao passo que o tempo de armazenamento será a variável independente (x ).

O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y), a

somatória de x² (∑x²) e somatória de y (∑y²), para que possamos calcular o coeficiente de correlação r .

Tabela 13

Tempo(x) x²Populaçao de

Staphilococcusaureus (y)

y² x.y

0 0 3,50 12,25 0

7 49 3,37 11,36 23,59

10 100 3,20 10,24 32,0

14 196 2,85 8,12 39,9017 289 2,75 7,56 46,75

21 441 2,67 7,13 56,07

28 784 2,57 6,60 71,96

∑x = 97 ∑x² = 1859 ∑y = 20,91 ∑y² = 63,26 ∑x.y =270,27


r

xyx y

n

xx

ny

y

n

r

=

−

− ( )

− ( )

=−

∑∑∑

∑ ∑ ∑ ∑

.

.

,

2

2

2

2

270 27 997 20 91

7

1859 97

763 26

20 91

7

2 2

. ,

. , ,

−

−


40/80

40

Unidade I

270 27 289, ,=

−r

775

1859 1344 14 63 26 62 46

19 48

514 86 0 819

−( ) −( )

= −

( ) ( )=

−

, . , ,

,

, . ,

r

r ,,

,

,

,

,

48

41189

19 48

20 30

0 9596

r

r

= −

= −

Resposta

Como, r = -0,9596, a correlação é forte e negativa, quase perfeita, pois r está dentro dointervalo -1 < r ≤ -0,8 que corresponde ao intervalo de correlação forte negativa pois estápróximo de r = -1.

Conclui-se dessa maneira, que o congelamento interfere na redução das colônias com o tempo.

Aplicação da regressão linear

É preciso então encontrar os coeficientes a e b da reta.


b

xyx y

n

xx

n

=

−

− ( )

∑∑∑

∑ ∑

.

2

2

Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituir:

b

b

a y bx

=

−

= −

= −

19 48

514 86

0 04

,

,

,


41/80

41


onde:

yy

n

y

y

i_

_

_

,

,

=

=

=

∑

20 91

7

2 99

E:

x

x

=

=

97

7

13 86,

Logo:

a y bx

a

a

a

= −

= +

= +

=

2 99 0 04 13 86

2 99 0 55

3 54

, , . ,

, ,

,


y = a + bx

teremos:

y = 3,54 - 0,04x

Você conseguiu perceber bem a diferença entre correlação e regressão? Correlação e regressão são técnicas

estatísticas baseadas nos conceitos de amostragem vistos anteriormente, que permitem saber se duas ou maisvariáveis estatísticas de uma mesma população estão ou não relacionadas umas com as outras e, caso estejam,de que forma. De maneira geral, essas técnicas têm as seguintes finalidades: a correlação mede o grau darelação entre essas variáveis; a regressão fornece as equações que relacionam as variáveis consideradas. Comessas equações, é possível estabelecer projeções sobre o comportamento futuro do fenômeno em questão.

Os diversos exemplos de regressão citados são importantes para a compreensão dessa ferramentade estudo estatístico, uma vez que permite tirar conclusões e tomar decisões com base em dadosque se dispõem. Deve-se, no entanto, estar atento para o fato de que as diversas situações podemser influenciadas por outros fatores, o que faz da função encontrada apenas o primeiro passo parafundamentar uma decisão.


42/80

42

Unidade I

Os conceitos trabalhados até o momento são muito importantes. Espero que você tenha conseguidoassimilá-los bem.

Na sequência, alguns exemplos para exercitar sua capacidade de análise e empregabilidade doarsenal teórico um pouco mais. Bom estudo!


1. Os dados a seguir referem-se ao número de cheques devolvidos de acordo com a taxa de inflação.

Tabela 14 - Número de cheques devolvidos daempresa x durante um período determinado

Taxa de inflaçãoNúmero de cheques

devolvidos

2 5

4 10

5 10

7 12

9 15

10 17

11 18

Pede-se:

a) Verificar se existe correlação entre as variáveis, justificando sua resposta.

b) Em caso afirmativo, encontrar a equação da reta que possibilite a estimativa do número decheques devolvidos para diferentes taxas de inflação.

Solução

Inicialmente, é necessário estabelecer a variável independente (x ) e a variável dependente (y ).

Vamos usar a nossa dica de sempre. Para facilitar essa descoberta, devemos sempre fazer a seguintepergunta: quem está dependendo de quem para mudar? Quem estiver dependendo será, obviamente, avariável dependente y .

Nesse caso, o número de cheques devolvidos depende da taxa de inflação ou a taxa de inflação dependedo número de cheques devolvidos? Quando começa haver aumento da inflação, ouvimos nos noticiáriosas reclamações dos comerciantes sobre o aumento do número de inadimplentes, ou seja, aumentou onúmero de cheques devolvidos. Portanto, o número de cheques devolvidos depende da taxa de inflação.

O próximo passo será obter a somatória de x (∑x), a somatória de y (∑y), a somatória de x.y (∑x.y),a somatória de x² (∑x) e somatória de y (∑y), para que possamos calcular o coeficiente de correlação r .


43/80

43


Tabela 15

Taxa (x) deinflação

x2Número de

cheques devolvidos yy2 x.y

2 4 5 25 10

4 16 10 100 405 25 10 100 50

7 49 12 144 84

9 81 15 225 135

10 100 17 289 170

11 121 18 324 198

∑x = 48 ∑x2 =396 ∑y = 87 ∑y2 = 1207 ∑x.y = 687


r

xyx y

n

xx

ny

y

n

r

=−

− ( )

− ( )

=−

∑∑∑

∑ ∑ ∑ ∑

.

.

.

2

2

2

2

687 48 887

7

396

48

7 1207

87

7

687 596 57

396 329 14

2 2

−

−

= −

−( )

.

,

,r

.. ,

,

, . ,

,

,

,

1207 108129

90 43

66 86 125 71

90 43

8404 97

90

−( )

=( ) ( )

=

=

r

r

r 443

9168

0 99

,

,r =

Resposta:

Como, r = 0,9, temos nesse caso uma correlação forte positiva, quase perfeita, pois r está dentro dointervalo 0,8 ≤ r < 1, que corresponde ao intervalo de correlação positiva e está próximo de r = + 1, que

seria uma correlação positiva perfeita.


44/80

44

Unidade I

Conclusão:

Verificamos, dessa maneira, que a taxa de inflação interfere na inadimplência, ou seja, o aumento dainflação provoca um aumento no número de cheques devolvidos.

Aplicação da regressão linear

Precisamos encontrar os coeficientes a e b da reta.


b

xyx y

n

xx

n

=

−

− ( )

∑∑∑

∑ ∑

.

2

2

Como já temos todas essas somatórias do exemplo anterior de correlação, é só substituirmos:

b

b

a y bx

=

=

= −

90 43

66 86

1 35

,

,

,

onde:

yy

n

y

y

i_

_

_

,

=

=

=

∑

87

7

12 43

E:

x

x

=

=

48

7

6 86,

Logo:

a y bx

a

a

a

= −

= −

= −

=

12 43 135 6 86

12 43 9 26

3 17

, , . ,

, ,

,


45/80

45



y = a + bx

teremos:

y = 3,17 + 1,35x

Resposta:

A equação da reta que permite fazer a estimativa do número de cheques devolvidos para as diferentestaxas de inflação é, portanto:

y = 3,17 + 1,35x

4 ESTIMATIVA DE PARÂMETROS

4.1 Introdução

O método de “estimação de parâmetros” é utilizado para se obter estimadores em casos específicos, porexemplo, quando fazemos alguma hipótese sobre algum parâmetro relativo à distribuição da população.Esse processo utiliza dados da amostra para fazer a estimativa de valores de parâmetros populacionais.

Observação

Estimativa é o valor numérico assumido pelo estimador, ou seja, valoraproximado do parâmetro, calculado com base na amostra.

Veja a situação a seguir que exemplifica bem o que vem a ser esses conceitos e suas aplicações:

Um candidato está pensando na possibilidade de se candidatar a prefeito na sua cidade. Ele

acredita ter uma popularidade suficientemente grande, uma vez que seu pai foi vereador por muitosanos na região. Porém, não tem ideia de como quantificar essa popularidade que acredita ter egostaria de conhecer suas reais chances numa eleição, antes de lançar sua candidatura. Essa é umasituação bastante comum, se tratando de política. Muito bem, sendo assim, foi aconselhado então aconsultar um estatístico para que se informe melhor sobre como funcionam as pesquisas eleitorais.O estatístico então lhe informa que é impossível, a partir de uma amostra apenas de eleitores,prever com exatidão qual será o resultado de uma eleição. O que poderá ser feito, diz ele, é tentarminimizar o erro que possa estar envolvido nessa estimativa. Porém, para que o erro de estimativadiminua, o tamanho da amostra deverá aumentar e, dessa forma, o custo também aumentaráproporcionalmente. Alerta também que será preciso informar o grau de confiança no resultado

encontrado, uma vez que sempre existe a probabilidade do erro ser maior do que esperávamos.


46/80

46

Unidade I

Podemos, porém, fazer também com que essa probabilidade seja a menor possível. Depois de todaessa a explanação feita, o candidato se conscientizou de que o estatístico tem um papel fundamentalna realização de uma pesquisa eleitoral, seja na determinação do seu custo, seja no cálculo do erroda estimativa. Dessa forma, o candidato pode se informar melhor do que esperar de uma pesquisaeleitoral, inclusive o grau de confiança que ele poderia ter no resultado obtido com a pesquisa.

Percebeu, caro aluno, como a estatística está sempre nos auxiliando e socorrendo nas diversascircunstâncias que enfrentamos? Isso pode estender-se a uma pesquisa de mercado, à publicidade etc.

4.2 Parâmetro e estatística da amostra

Entre os estimadores mais comuns, estão:

• média amostral x;

• desvio padrão amostral S.

Parâmetros:

• média populacional µ;

• desvio padrão populacional σ.

Lembrete

Observe que a média amostral e o desvio padrão amostral sãoestimadores da média populacional e do desvio padrão populacional.

Em geral, encontramos na bibliografia as seguintes denominações para as estimativas:

• a estimativa é dita pontual quando a estatística amostral (x ou S) dá origem a uma únicaestimativa do parâmetro da população (µ ou σ);

• a estimativa é dita intervalar quando, a partir da estatística amostral (x ou S), obtém-se umintervalo de valores possíveis no qual se admite, com certa probabilidade, estar contido oparâmetro populacional (µ ou σ).

4.2.1 Obtenção dos principais parâmetros estatísticos

Estimadores:

• x: média amostral;

• S: desvio padrão amostral.


47/80

47


Parâmetros:

• σ = Desvio padrão da população;

• µ = média da população.

4.3 Distribuição amostral

Considere todas as amostras possíveis de tamanho n que podem ser retiradas de uma população detamanho N (com ou sem reposição).

Para cada amostra é possível calcular uma grandeza estatística, como a média, mediana, variância,desvio padrão etc.; que irá sofrer uma variação de uma amostra para outra.

Assim, obtém-se uma distribuição da grandeza calculada de cada amostra possível de ser extraída,denominada distribuição amostral .

Lembrete

As grandezas estatísticas mencionadas, bem como noçõesde distribuição amostral e probabilidades, foram estudadasanteriormente. Você não está seguro do quanto se recorda a respeitodo que foi estudado? Revise! Isso facilitará muito seu estudo na

disciplina atual.

Observação

Se, por exemplo, a grandeza estatística em questão for a média amostral(x), a distribuição será denominada Distribuição amostral de médias. Paracada distribuição amostral, é possível calcular a média, a mediana, avariância, o desvio padrão etc.

4.4 Teorema do Limite Central

Para entender o Teorema do limite central é preciso ter claro o que é uma distribuição amostral e oque é uma distribuição amostral de médias das amostras .

Assim:

• Distribuição amostral pode ser definida como a distribuição de probabilidade de uma estatística qualquerda amostra, formada a partir de repetidas amostras de tamanho n coletadas de uma população.


48/80

48

Unidade I

• Distribuição amostral de médias das amostras é quando a estatística da amostra é sua média.

Propriedades das distribuições amostrais de médias das amostras

• a média das médias das amostras µx é considerada igual à média populacional µ;

• o desvio padrão das médias das amostras σx é igual à razão do desvio padrão populacional σ pela

raiz quadrada de N.

σσ

xN

=

Observação

O desvio padrão da distribuição amostral de médias das amostras échamado de erro padrão da média.

Vale a pena retomar:

Padronização da variável aleatória: se a média é diferente de zero ou o desvio padrão é diferente de1 (ou ambas as situações), é necessário converter os valores para os valores padronizados na distribuiçãonormal padrão.

z x=−( )µ

σ

µ x 0 z

Figura 10 - Diagrama da curva normal


49/80

49



1. Imagine que um consultor esteja investigando o tempo que os trabalhadores de uma fábricalevam para montar determinada peça A. Suponha também que análises da linha de produção tenhamcalculado um tempo médio de 75 segundos e desvio padrão de 6 segundos. Considere agora, que oconsultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundospara montar uma peça, ou seja, P(75 ≤ X ≤ 81).

Como já vimos na distribuição normal de probabilidades, devemos padronizar as variáveis x, paraque possamos utilizar a tabela de áreas para a curva normal padronizada. Ou seja, transformar asvariáveis aleatórias x em variáveis normais padronizadas z, como será feito a seguir:

Solução:

Dados:• µ = 75 segundos;

• σ = 6 segundos;

• zx

=− µ

σ;

• z175 75

6=

−

;

• z10

6=

;

• z1

0= ;

• z281 75

6=

−

;

• z26

6= ;

• z2 1= .

Logo, temos a probabilidade P(0 ≤ Z ≤ 1), que é ilustrada a seguir e cujo valor é determinadoconsultando a tabela de distribuição normal padronizada Z :


50/80

50

Unidade I

Tabela 16 – Distribuição normal padronizada

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

Pela tabela, encontramos o valor da área indicada, que significa a probabilidade:

P(75 ≤ X ≤ 81) = P(0 ≤ Z ≤ 1) = 0, 3413 x100 = 34,13%

0 z = 1

A = 0,3413

Figura 11 - Diagrama da curva normal para o exercício 1

Logo, 34,13% dos trabalhadores levarão um tempo dentro do intervalo de 75 e 81 segundos.

Conforme o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma

distribuição normal, independente do tipo de distribuição da população. Nesse caso, a média das médiasdas amostras poderá ser considerada como a média da população. Porém, o desvio padrão será:

σσ

x N_ =

Observação

Para amostras de tamanho N > 30, a distribuição das médias amostraispode ser aproximada por uma distribuição normal.


51/80

51


A aproximação torna-se mais confiável conforme aumenta o tamanho da amostra N . Se apopulação tem distribuição normal, as médias amostrais terão distribuição normal para qualquertamanho amostral N.

2. A média das contas telefônicas dos moradores de Cincinnati é US$64 e seu desvio padrão é US$9.Amostras aleatórias de 36 contas telefônicas são retiradas dessa população e a média de cada uma delasé determinada. Obtenha a média e o erro padrão da média da distribuição amostral (LARSON & FARBER,2007, p. 189).

Solução:

Como a amostra possui 36 elementos (maior do que 30, vide observação anterior) , a média dadistribuição amostral é igual à média da população, enquanto o erro padrão da média é igual ao desviopadrão populacional dividido por N . Assim:

µ

x

_ = µ = 64

E:

σσ

σ

x

x

N_

_ ,

=

=15

3. As alturas das árvores de Ipê Roxo são normalmente distribuídas e possuem uma média de90 pés e um desvio padrão de 3,5 pés. Amostras de tamanho 4 são retiradas aleatoriamente dessapopulação de ipês e a média de cada uma delas. Obtenha a média e o erro padrão da média dadistribuição amostral.

Solução:

A média da distribuição amostral é igual à média da população, enquanto o erro padrão da média é

igual ao desvio padrão populacional dividido por n . Assim:

µ µ

x

_ = = 90 pés

σσ

σ

σ

x

x

x

N=

=

=

3 5

4

1 75

,

, pés.


52/80

52

Unidade I

Estimativa Intervalar

Intervalo de confiança para a média populacional.

α α

α2 2

+ =

Onde:

a = nível de significância.

0 + zc- zc

1 - aα

2

α

2

Figura 12 - Diagrama de simetria da curva normal

Onde:

• - Zc e + Zc são valores críticos obtidos à partir da tabela de distribuição normal padronizada Z(Tabela 15);

• 1 - a = nível de confiança do intervalo;

• P(- Zc < Z < + Zc ) = (1 - a).

Sendo:

• (1 - a) = probabilidade de que o intervalo contenha o parâmetro populacional estimado;

• a = probabilidade de que o intervalo não contenha o parâmetro populacional estimado.

Observação

Os valores mais utilizados para a (nível de significância) são 5% e1%. No entanto, isso não é regra, esses valores podem variar conforme anecessidade da pesquisa.


53/80

53


• Para nível de significância a = 5%

0- zc =1,96 + zc =1,96

1

2

95

247 5 0 475

−= = =

α, % ,

1

2

95

247 5 0 475

−= = =

α, % ,1 95− =α %

Figura 13 - Diagrama de simetria da curva normal, para nível de significância de 5%

Tabela 17

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.45451.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890


54/80

54

Unidade I

Lembrete

Procure no corpo da tabela o valor 0, 4750, siga a linha e a coluna

correspondente e obterá zc = 1,96.

P(- 1,96 < Z < + 1,96) = 95% c = 1 - a = 95% (nível de confiança do intervalo).

matemática integrada_unidade i(1)

Documents