apostila biosestatistica - juliane...

42
Bioestatística - Profa. Juliane Ganem Página 1 BIOESTATÍST BIOESTATÍST BIOESTATÍST BIOESTATÍSTICA CA CA CA Profa. Msc. Juliane Ganem NOME: RA: TURMA: 1. Os dados e a Estatística Definiremos de maneira simples e concisa alguns elementos que usaremos no decorrer do curso. Dados: é um (ou mais) conjunto de valores, numéricos ou não. Estatística: é um conjunto de técnicas desenvolvidas com a finalidade de auxiliar a responder, de forma objetiva e segura, as situações que envolvem uma grande quantidade de informações. Pode ser usada para analisar situações complexas ou não. Permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudo ou experimentos realizados em qualquer área do conhecimento. Podemos dividir a estatística em duas partes: Estatística Descritiva Estatística Indutiva 1.1. A Estatística na Prática Porque a estatística é importante? Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles nos capacitam a responder a um vasto número de questões, tais como as listadas abaixo: Como os cientistas avaliam a validade de novas teorias? Como os pesquisadores médicos testam a eficiência de novas drogas? Como os demógrafos preveem o tamanho da população do mundo em qualquer tempo futuro? Como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação de uma tendência secular ou simplesmente um desvio aleatório? Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de eleitores? Como os pesquisadores na educação testam a eficiência de um novo método de ensino? Estes são poucos exemplos nos quais a aplicação da estatística é necessária. Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram conclusões a partir destes. A Estatística, além de servir como apoio científico à quase todas as áreas do conhecimento (Engenharia, Economia, Agronomia, Medicina, Física, Ciências Humanas em geral, etc.), proporciona mecanismos para diagnosticar e aperfeiçoar a gestão e operação de diversos sistemas complexos, desde os sistemas humanos aos sistemas físicos, possibilitando criar modelos que descrevam o comportamento de algumas variáveis em função de outro conjunto de variáveis.

Upload: ledien

Post on 11-Nov-2018

235 views

Category:

Documents


1 download

TRANSCRIPT

Bioestatística - Profa. Juliane Ganem Página 1

BIOESTATÍSTBIOESTATÍSTBIOESTATÍSTBIOESTATÍSTIIIICACACACA

Profa. Msc. Juliane Ganem

NOME: RA: TURMA:

1. Os dados e a Estatística

Definiremos de maneira simples e concisa alguns elementos que usaremos no decorrer do curso.

• Dados: é um (ou mais) conjunto de valores, numéricos ou não.

• Estatística: é um conjunto de técnicas desenvolvidas com a finalidade de auxiliar a responder, de forma

objetiva e segura, as situações que envolvem uma grande quantidade de informações. Pode ser usada para

analisar situações complexas ou não. Permite, de forma sistemática, organizar, descrever, analisar e

interpretar dados oriundos de estudo ou experimentos realizados em qualquer área do conhecimento.

Podemos dividir a estatística em duas partes:

• Estatística Descritiva

• Estatística Indutiva

1.1. A Estatística na Prática

Porque a estatística é importante?

Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles nos

capacitam a responder a um vasto número de questões, tais como as listadas abaixo:

• Como os cientistas avaliam a validade de novas teorias?

• Como os pesquisadores médicos testam a eficiência de novas drogas?

• Como os demógrafos preveem o tamanho da população do mundo em qualquer tempo futuro?

• Como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação

de uma tendência secular ou simplesmente um desvio aleatório?

• Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de

eleitores?

• Como os pesquisadores na educação testam a eficiência de um novo método de ensino?

Estes são poucos exemplos nos quais a aplicação da estatística é necessária. Por isso, a estatística tornou-se

uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou

tiram conclusões a partir destes.

A Estatística, além de servir como apoio científico à quase todas as áreas do conhecimento (Engenharia,

Economia, Agronomia, Medicina, Física, Ciências Humanas em geral, etc.), proporciona mecanismos para diagnosticar

e aperfeiçoar a gestão e operação de diversos sistemas complexos, desde os sistemas humanos aos sistemas físicos,

possibilitando criar modelos que descrevam o comportamento de algumas variáveis em função de outro conjunto de

variáveis.

Bioestatística - Profa. Juliane Ganem Página 2

1.2. Os Dados

1.2.1. Coleta de Dados

Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela

qual os dados serão coletados; cronograma das atividades, custos envolvidos; exame das informações disponíveis;

delineamento da amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados

das variáveis, componentes do fenômeno a ser estudado.

A coleta de dados pode ser direta ou indireta.

Coleta direta:

Quando os dados são obtidos na fonte originária. Os valores assim compilados são chamados de dados primários,

como, por exemplo, nascimentos, casamentos e óbitos, todos registrados no Cartório de Registro Civil; opiniões

obtidas em pesquisas de opinião pública, ou ainda, quando os dados são coletados pelo próprio pesquisador.

A coleta direta pode ser classificada relativamente ao fator tempo em:

• Contínua – Quando feita continuamente, como por exemplo, nascimentos e óbitos, frequência dos alunos às

aulas;

• Periódica – Quando é feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos);

Ocasional – Quando é feita sem época preestabelecida.

Coleta indireta:

Quando os dados obtidos provêm da coleta direta. Os valores assim compilados são denominados de dados

secundários, como, por exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas demográficas

publicadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE constitui-se em uma coleta indireta.

Apresentação dos Dados

Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), para o melhor

entendimento do fenômeno que está sendo estudado.

Análise dos Resultados

Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos, através dos métodos da Estatística

Indutiva ou Inferência, e tiram-se as conclusões e previsões.

1.2.2. Tipos de Variáveis

Cada uma das características observadas ou mensuradas em um fenômeno é denominada de variável. Para o

fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;

Para a variável “número de filhos” há um número de resultados possíveis expressos através dos números

naturais: 0, 1, 2, 3, ..., n;

Para a variável “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito

de valores numéricos dentro de um determinado intervalo.

As variáveis podem ser:

• Variáveis Quantitativas :Referem-se às quantidades e podem ser medidas em uma escala numérica.

Exemplos: idade das pessoas, preço dos produtos, peso dos recém-nascidos. Elas subdividem-se em dois

grupos:

• Variáveis Quantitativas Discretas: são aquelas que assumem apenas determinados valores tais como 0, 1, 2,

3, 4, 5, 6 dando saltos de descontinuidade entre seus valores. Normalmente refere-se a contagens. Por

Bioestatística - Profa. Juliane Ganem Página 3

exemplo: número de vendas diárias em uma empresa, número de pessoas por família, quantidade de doentes

por hospital.

• Variáveis Quantitativas Contínuas: são aquelas cujos valores assumem uma faixa contínua e não apresentam

saltos de descontinuidade. Exemplos dessas variáveis são: Os pesos de pessoas, a renda familiar, o consumo

mensal de energia elétrica, o preço de um produto agrícola.

• Variáveis Qualitativas - Refere-se a dados não numéricos. Exemplos dessas variáveis são: O sexo das pessoas,

a cor, o grau de instrução. Elas subdividem-se também em dois grupos: Variáveis Qualitativas Ordinais: São

aquelas que definem um ordenamento ou uma hierarquia. Exemplos são: O grau de instrução, a classificação

de um estudante no curso de Estatística, as posições das 100 empresas mais lucrativas, etc. Variáveis

Qualitativas Nominais: Estas por sua vez, não definem qualquer ordenamento ou hierarquia. São exemplos

destas: A cor, o sexo, o local de nascimento, etc.

1.2.3. População:

É o conjunto de elementos a serem observados. Exemplo: Todas as imobiliárias em uma dada cidade; todos os imóveis

à venda em certo período em uma dada região, as empresas de engenharia de Manaus, todas as peças não conformes

em certo período na produção de um produto em uma determinada indústria, etc.

1.2.4. Amostra:

É uma pequena parte selecionada de uma população que se pretende estudar. Fazemos uma amostragem quando:

• O número de elementos da população é muito grande;

• Quando queremos economizar tempo e dinheiro;

• Não é possível acessar todos os elementos da população.

2. Estatística Descritiva

É a parte mais conhecida. Quem vê os noticiários na televisão ou nos jornais, sabe quão frequente é o uso de médias,

índices e gráficos nas notícias. É a parte da Estatística que coleta, descreve, organiza e apresenta os dados. É nesta

etapa que são tiradas conclusões.

Exemplos:

a) O INPC, Índice Nacional de Preços ao Consumidor, é um índice de maior importância em nossa sociedade. Sua

constituição envolve a sintetização, em um único número, dos aumentos dos produtos da cesta básica. No fundo é um

sucessivo cálculo de médias, da mesma forma o INCC, Índice Nacional de Construção Civil.

b) Anuário Estatístico Brasileiro. O Instituto Brasileiro de Geografia e Estatística - IBGE publica a cada ano este anuário

apresentando, em várias tabelas, os mais diversos dados sobre o Brasil: Educação, transporte, economia, cultura, etc.

Embora simples e fáceis de serem entendidas, as tabelas são o produto de um processo extremamente demorado de

coleta e apuração e dados.

2.1. Métodos Tabulares e Métodos Gráficos

As técnicas aqui estudadas permitem detectar e corrigir erros e inconsistências ocorridos durante um processo de

coleta de dados, determinar as principais características destes mesmos dados e propiciar familiaridade com eles.

Tabela é um quadro que resume um conjunto de observações.

Ela é composta de:

Bioestatística - Profa. Juliane Ganem Página 4

• Título: Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que? (referente

ao fato), Quando? (correspondente à época), Onde? (relativo ao lugar);

• Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em estudo;

• Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas;

• Rodapé: Reservado para as observações pertinentes, bem como a identificação da fonte dos dados.

Exemplos:

A representação gráfica dos dados tem por finalidade dar uma ideia, a mais imediata possível, dos resultados

obtidos, Nos permitindo chegar a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores

da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais

apropriado ficará a critério do analista.

Contudo, os elementos: Simplicidade, clareza e veracidade devem ser consideradas quanto à elaboração de um gráfico.

Bioestatística - Profa. Juliane Ganem Página 5

2.2 Sintetizando Dados Quantitativos /Qualitativos

Tabelas: O objetivo é apresentar os dados agrupados de forma que seu manuseio, visualização e compreensão sejam

simplificados. Esta apresentação pode ser feita de forma tabular ou gráfica.

As tabelas, dependendo do tipo de dados, podem ser:

• Simples

• Dupla entrada

• Distribuição de frequência

2.3 Distribuição de Frequências:

Um estudo completo das distribuições de frequências é imprescindível porque este é o tipo de tabela mais importante

para a Estatística Descritiva. A seguir são descritos os procedimentos usuais na construção dessas tabelas.

Primeiramente vamos ver alguns conceitos fundamentais:

a) Dados brutos:

É o conjunto dos dados numéricos obtidos após a crítica dos valores coletados. Os seguintes valores poderiam ser os

dados brutos: 24, 23, 22, 28, 35, 21, 23, 33.

b) Rol:

É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente. Os dados brutos anteriores ficariam

assim: 21, 22, 23, 23, 24, 28, 33, 35.

c) Amplitude Total ou "Range" (R):

É a diferença entre o maior e o menor valor observado. No exemplo, R = 35 - 21 = 14.

d) Classe:

É cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável.

e) Limite de Classe:

São os valores extremos do intervalo de classe.

Exemplo: No intervalo de classe 75|-----85, o limite inferior (LI) é representado pelo valor 75, inclusive, e o valor 85

representa o limite superior (LS), exclusive, do intervalo de classe.

f) Ponto Médio do Intervalo de Classe (xi):

É o valor que representa a classe para o cálculo de certas medidas. Na distribuição de frequência com dados agrupados

em intervalos de classe considera-se que os dados distribuem-se de maneira uniforme no intervalo. Sua fórmula é bem

simples, vejamos:

2.4 Tipos de Frequências

• Frequência Simples Absoluta (Fi ):É o número de vezes que o elemento aparece na amostra, ou o número

de elementos pertencentes a uma classe.

• Frequência Absoluta Acumulada (Fac ): É a soma da frequência absoluta da classe com a frequência absoluta

das classes anteriores.

Bioestatística - Profa. Juliane Ganem Página 6

• Frequência Simples Relativa (Fr ): A frequência relativa é o valor da frequência absoluta dividido pelo

número total de observações:

• Frequência Relativa Acumulada (Fra): A frequência acumulada relativa é o valor da frequência acumulada

dividido pelo número total de observações:

2.5 Distribuição de Frequências

Utilizamos esse tipo de distribuição quando estamos interessados em agrupar o conjunto de dados.

Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 26,26, 26, 28, 30. Construa uma distribuição com todas as frequências.

x Fi Fac fr (%) fra

21

22

23

24

25

26

28

30

=

2.6 Intervalos de Classes

Conjunto de observações apresentadas na forma contínua, sem superposição de intervalos, de tal modo que

cada valor do conjunto de observação possa ser alocado em um, e apenas um, dos intervalos.

O número k de intervalos para cada conjunto de observações com n valores pode ser calculado por diversas formas.

O método de Sturges é um dos métodos e estabelece que:

• Método de Sturges é um dos métodos e estabelece que:

( )nk 10log.322,31+=

Onde: k = número de classes n = número total de observações

Bioestatística - Profa. Juliane Ganem Página 7

Ex.: para um conjunto com 50 observações obtemos:

• Regra da Potência de 2 onde k = menor valor inteiro tal que nk

≥2 . Ex.: para um conjunto com 50 observações obtemos:

• Regra da raiz quadrada: nk =

Ex.: para um conjunto com 50 observações obtemos:

Exemplo:

1,78 1,88 1,75 1,69 1,84 1,73 1,75 1,72 1,80

1,82 1,74 1,60 1,75 1,75 1,76 1,82 1,75 1,73

a) Construa o ROL ROL: b) Determine a quantidade de intervalo pelo Método de Sturges. c) Determine a amplitude da classe.

Bioestatística - Profa. Juliane Ganem Página 8

d) Determine os limites das classes

Arredonde os Limites de Classe nos extremos: Distribua o excesso: e) Construa a tabela de frequência

x Fi Fac fr fra Ponto médio do intervalo

1,59 ----- 1,65

1,65 -----1,71

1,71 -----1,77

1,77 ------1,83

1,83 -----1,89

=

3. Gráficos Os gráficos são representações pictóricas dos dados, muito valiosas na visualização dos resultados. É importante saber representar os dados na forma gráfica corretamente, pois se forem representados de forma errada acarretam ao analista uma ideia falsa dos dados chegando até mesmo a confundi-lo. Os principais tipos de gráficos usados na representação estatística são: a) Histograma e Polígono de frequência (para dados agrupados em distribuições de frequências) 3.1 Histograma Histograma é uma representação gráfica de uma tabela de distribuição de frequências. Desenhamos um par de eixos cartesianos e no eixo horizontal (abscissa) colocamos os valores da variável em estudo e no eixo vertical (ordenadas) colocamos os valores das frequências. Construa o histograma do exemplo anterior.

Limite inferior Limite superior

Bioestatística - Profa. Juliane Ganem Página 9

Exemplo: O conjunto abaixo representa as notas do exame final de uma turma:

Bioestatística - Profa. Juliane Ganem Página 10

EXERCÍCIO DE FIXAÇÃO 1

1) Na tabela a seguir estão apresentados os índices de Massas Corporais (IMC) de uma amostra constituída por 30 pacientes de um endocrinologista.

29,1 28,3 26,0 32,0 27,8 30,5 27,8 23,9 27,6 30,0

30,4 31,0 25,3 25,8 28,8 24,5 24,6 28,3 26,5 30,9

32,4 29,5 31,7 32,8 28,7 27,6 28,1 30,4 25,6 32,3

Pedem-se: a) Construir uma tabela na qual constem: Classe de IMC, frequência, frequência relativo, frequência acumulada e pontos médios dos intervalos. b) Construir o histograma e o polígonos de frequência referentes a tabela do item a.

Para calcular a quantidade de classes necessárias, utilize o Método de Sturges ( )nk 10log.322,31+=

x Fi Fac fr fra Ponto médio do

intervalo

|------ |------ |------ |------ |------ |------

=

Bioestatística - Profa. Juliane Ganem Página 11

2) Na tabela a seguir estão apresentados os resultados de 20 medições da espessura de uma peça (mm), executadas com micrometro de precisão igual a 0,01 mm.

2,2 2,3 2,2 2,5 2,4 2,5 2,8 2,1 2,6 2,5

2,4 2,5 2,3 2,8 2,8 2,5 2,6 2,3 2,5 2,9

Pedem-se: c) Construir uma tabela na qual constem: Classe de espessuras (em mm), frequência, frequência relativo, frequência acumulada e pontos médios dos intervalos. d) Construir o histograma e o polígonos de frequência referentes a tabela do item a.

Para calcular a quantidade de classes necessárias, utilize o Método de Sturges ( )nk 10log.322,31+=

x Fi Fac fr fra Ponto médio do intervalo

|------ |------ |------ |------ |------

=

Bioestatística - Profa. Juliane Ganem Página 12

3.2 Gráfico em barras ou colunas (verticais e horizontais);

Esses tipos de gráficos têm como finalidade a comparação de grandezas e prestam-se em especial à representação

de dados relacionados a séries de tempo, como por exemplo:

Gráfico de barras representando a percentagem de recém-nascidos por hospital

3.3 Gráfico em linhas ou lineares;

São frequentemente usados para representar séries de tempo ou quando um dos fatores seja o tempo, pois uma vez

tratando-se de um grande período de tempo a representação em colunas acaba sendo inviável devido à alta

concentração de dados. Sua construção é de forma muito simples bastando marcar os pontos correspondentes aos

valores observados em cada período e ligá-los por meio de um traço.

Bioestatística - Profa. Juliane Ganem Página 13

3.4 Gráfico em setores

Construção de um gráfico de setores, dos acadêmicos por área – UFAM 2003.

4. Métodos Numéricos

4.1 Medidas de Posição, Locação ou Tendência Central

Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor frequência. São

utilizadas para sintetizar em um único número o conjunto de dados observados. Esta sintetização é necessária, por

exemplo, na construção do INPC (Índice Nacional de Preços ao Consumidor). Embora, em um dado mês, cada artigo

registre um aumento específico, é necessário sintetizar esses aumentos em um único número para ser usado nos

vários setores da economia.

Bioestatística - Profa. Juliane Ganem Página 14

4.2 Média Aritmética Simples

Podemos dizer que esta é a mais importante medida de locação e que é mais comumente usada para descrever um

conjunto de observações. A média aritmética simples de um conjunto de n observações é o quociente entre a soma

dos dados e a quantidade dessas observações. É denotada por .

Exemplo: Calcule a média da variável X: 3, 5, 8, 12, 7, 12, 15, 18, 20, 20.

Exemplo:

Determine a média dos números: 3, 13, 15, 12, 15, 22, 4, 28

Para isso basta somarmos todos os números e dividirmos pela quantidade de números, ou seja:

Diante da pergunta “Como interpretar a média?”, as respostas mais comuns são:

“Representa a posição da maioria” ou “É o valor que está no meio da amostra”.

Ambas estão erradas!

Quem representa a posição da(s) maioria(s) locais é a moda, e quem está no meio do rol é a mediana. A média é outra

coisa! O gráfico seguinte nos ajudará a responder a questão.

Bioestatística - Profa. Juliane Ganem Página 15

4.3 Média Aritmética Ponderada

Em algumas situações os números que queremos sintetizar têm graus de importância diferentes, usa-se então

a média aritmética ponderada. A média aritmética ponderada de um conjunto de n observações é o quociente da

divisão pela soma dos pesos da soma das observações multiplicadas por seu respectivo peso ou frequência.

4.4.4.4.4 4 4 4 CASO CASO CASO CASO 1111 Distribuição sem ClasseDistribuição sem ClasseDistribuição sem ClasseDistribuição sem Classe

Foram medidas, em milímetros, as espessuras de 30 chapas produzidas por uma máquina, obtendo-se a distribuição de frequências mostrada na tabela abaixo:

xxxxiiii ffffiiii

56 6

57 2

58 9

59 5

60 3

61 1

62 4

Vamos calcular a média aritmética para essa distribuição.

xxxxiiii xxxxiiii xxxxi . i . i . i . ffffiiii

56 6

57 2

58 9

59 5

60 3

61 1

62 4

TOTAL

4.5 4.5 4.5 4.5 CASO CASO CASO CASO 2222 ---- Distribuição com ClasseDistribuição com ClasseDistribuição com ClasseDistribuição com Classe

ClassesClassesClassesClasses FrequênciasFrequênciasFrequênciasFrequências

30 |------- 33 3

33 |------- 36 5

36 |------- 39 2

39 |------- 42 4

42 |------- 45 6

45 |------- 48 7

48 |------- 51 3

Total

Bioestatística - Profa. Juliane Ganem Página 16

Vamos calcular a média aritmética para essa distribuição.

ClassesClassesClassesClasses Frequências(Frequências(Frequências(Frequências( ffffi i i i )))) Ponto médio (Ponto médio (Ponto médio (Ponto médio (xxxxiiii)))) xxxxi . i . i . i . ffffiiii

30 |------- 33 3 33 |------- 36 5 36 |------- 39 2 39 |------- 42 4 42 |------- 45 6 45 |------- 48 7 48 |------- 51 3

Total 4.4.4.4.6666 MODAMODAMODAMODA (mo)(mo)(mo)(mo)

É a medida de tendência central que consiste no valor observado com mais frequência em um conjunto de dados. Por exemplo, digamos que o Palmeiras em determinado torneio de futebol fez, em dez partidas, a seguinte quantidade de gols:

55, 44, 22, 11, 33, 77, 11, 11, 22 e 11.

Para essa sequência de gols marcados, a moda é de 11 gol, pois é o número que aparece mais vezes. Logo dizemos que essa distribuição é UNIMODAL, pois temos uma única moda. 1. Outra situação comum seria se dentre 7 pessoas tomássemos suas idades, a saber:

15 anos, 20 anos, 32 anos, 13 anos, 55 anos, 43 anos e 90 anos.

Nesse caso, não há moda, pois nenhuma idade se repetiu mais vezes que a outra. Quando um conjunto de dados não apresenta moda, dizemos que esse conjunto é AMODAL.

2. Se a distribuição de peso de 15 pessoas for:

63; 67; 70; 69; 81; 57; 63; 73; 68; 63; 71; 71; 71 e 83.

Nesse caso possuem duas modas (63 e 71 Kg), logo a distribuição diz-se BIMODAL, serie 3.

3. Se a distribuição de peso de 11 pessoas for:

63; 67; 70; 81; 63; 73; 68; 71; 71 e 83, 83

Nesse caso possuem três modas (63, 71 e 83 Kg), logo a distribuição diz-se TRIMODAL, série 2.

4. Quando aparecem mais de três modas na distribuição, dizemos que a distribuição é MULTIMODAL se apresentar

várias modas.

5. Se a distribuição não apresentar nenhuma moda, dizemos AMODAL.

4.7 MEDIANA (md) É a medida de tendência central que indica exatamente o valor central de um conjunto de dados quando organizados em ordem crescente ou decrescente. Exemplo 1:

Bioestatística - Profa. Juliane Ganem Página 17

Vamos considerar que um aluno tirou as seguintes notas em cinco provas de uma determinada matéria:

5, 8, 7, 4 e 8.

Colocando as cinco notas em ordem crescente, por exemplo, obtemos:

4, 5, 7 , 8, 8.

A mediana é o valor que está no centro dessa sequência, ou seja, 7.

Exemplo 2: Por exemplo, digamos que as notas agora são:

5, 2 , 8, 7, 4 e 8

Colocando em ordem crescente, temos: 2, 4, 5, 7, 8, 8

Aqui, os dois termos centrais seriam 5 e 7. Portanto, a Mediana desse conjunto de dados é a Média Aritmética dos dois termos centrais, ou seja,

Resumindo o cálculo da Mediana:

• Coloque os valores do conjunto de dados em ordem crescente ou decrescente;

• Se a quantidade de valores do conjunto for ímpar, a mediana é o valor central;

• Se a quantidade de valores do conjunto for par, é preciso tirar a Média Aritmética dos valores centrais.

EXERCÍCIO DE FIXAÇÃO 2

Bioestatística - Profa. Juliane Ganem Página 18

Vamos agora ver uma situação bem cotidiana de aplicação do estudo dessas medidas. O Professor Paulo aplicou uma prova para vinte alunos de uma de suas turmas e agora quer analisar as medidas de tendência central dessas notas.

1) Calcule a média aritmética. 2) Calcule a Mediana. 3) Calcule a Moda, classifique.

5. Utilização das Medidas de Tendência Central

Na maioria das situações não necessitamos calcular as três medidas de tendência central, normalmente

precisamos de apenas uma das medidas para caracterizar o centro da série. A medida ideal em cada caso é aquela que

melhor representa a maioria dos dados da série.

Quando houver forte concentração de dados na área central da série, devemos optar pela média. Quando

houver forte concentração de dados no início e no final da série, devemos optar pela mediana.

A Moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento

típico, isto é, um valor cuja frequência é muito superior à frequência dos outros elementos da série.

Bioestatística - Profa. Juliane Ganem Página 19

5.1 Medidas de Variabilidade ou Dispersão

Raramente uma única medida é suficiente para descrever de modo satisfatório um conjunto de dados. Tomemos

como exemplo o caso da média aritmética, que é uma medida de locação largamente empregada, e consideremos

dois conjuntos de observações:

A: 25 28 31 34 37 B: 17 23 30 39 46

Ambos têm a mesma média, 31.

No entanto, percebe-se intuitivamente que o conjunto B acusa dispersão muito maior do que o conjunto A.

Torna-se então necessário estabelecer medidas que indiquem o grau de dispersão, ou variabilidade, em relação ao

valor central.

As medidas de dispersão são medidas que mostram o grau de concentração os dados em torno da média.

Considere o exemplo de duas linhas de produção de uma peça. A medida média do comprimento da peça é de 75cm e ambas as linhas estão produzindo peças com médias próximas desse valor. Podemos considerar que as peças produzidas por ambas as linhas são adequadas?

É claro que as peças produzidas pela primeira linha de produção são melhores que a segunda. Isso ocorre porque a dispersão dos elementos em torno da média é menor, ou seja, os elementos estão mais concentrados em torno da média na primeira linha de produção. Dispersão é sinônimo de variação ou variabilidade. Para medir a dispersão, duas medidas são usadas mais frequentemente: a amplitude, variância e o desvio padrão.

5.2 AMPLITUDE

A amplitude é definida como sendo a diferença entre o maior e o menor valor do conjunto de dados. Denotaremos a amplitude por R. Portanto, consideremos o conjunto de dados ordenado.

Exemplo 1 : Determinar a amplitude do conjunto de dados: 1, 2, 5, 7, 7, 4, 5, 9, e 3.

Exemplo 2 : Determinar a amplitude do conjunto de dados:

60 65 67 68 69 70 72 77

______ dispersão

______ dispersão

Amplitude:

Amplitude:

Bioestatística - Profa. Juliane Ganem Página 20

5.3 VARIÂNCIA POPULACIONAL E AMOSTRAL

A variância de uma população ou amostra de N elementos é a medida de dispersão definida como a média do quadrado dos desvios dos elementos em relação à média populacional μ.

Amostral Populacional

5.4 DESVIO PADRÃO POPULACIONAL E AMOSTRAL

O desvio padrão populacional ou amostral de um conjunto de dados é igual à raiz quadrada da variância populacional. Desta forma, o desvio padrão é dado por:

Amostral Populacional

Exemplo 1:_____________________________________________________________________________________ Calcule a variância e o desvio padrão para a distribuição de uma amostra a seguir:

2 4 7 9 11 15 1º passo: calcula a média da distribuição:

=→=

=

ii

i

xx

x

____________

_______________________________________

2º passo:

ix xxi − ( )2

xxi −

Total:

3º passo: Calcule da variância:

=→= 22 _________ ss

4º passo: Calcule do desvio padrão:

Raiz quadrada da variância:

=→= ss2

Bioestatística - Profa. Juliane Ganem Página 21

Exemplo 2:_____________________________________________________________________________________ Calcule a variância e o desvio padrão para a distribuição de uma amostra a seguir:

ix if

56 6

57 2

58 9

59 5

60 3

61 1

62 4

1º passo: calcula a média da distribuição:

ix if ii fx .

56 6

57 2

58 9

59 5

60 3

61 1

62 4

2º passo:

ix if xxi − ( )2

xxi − ( )ii fxx .

2

56 6 57 2 58 9 59 5 60 3 61 1 62 4

Total:

3º passo: Calcule da variância:

=→= 22 _________ ss

4º passo: Calcule do desvio padrão:

Raiz quadrada da variância:

=→= ss2

=

=

=

i

i

i

x

x

x

________________

_________________

Bioestatística - Profa. Juliane Ganem Página 22

6. COEFIECINTE DE VARIAÇÃO (CV)

Por vezes é conveniente exprimir a variabilidade em termos relativos, isto porque, por exemplo, um desvio

padrão de 10 pode ser insignificante se a observação típica é 10.000, mas altamente significativo para uma observação

típica de 100. Toma-se então uma medida relativa da variabilidade, comparando o desvio padrão com a média. Esta

medida é o Coeficiente de Variação.

É o quociente entre o desvio padrão e a média.

x

sCV = .100

A grande utilidade do coeficiente de variação é permitir a comparação da variabilidade de diferentes conjuntos de dados.

• Calculo de CV do exemplo 1:

• Calculo de CV do exemplo 2:

Bioestatística - Profa. Juliane Ganem Página 23

EXERCÍCIO DE FIXAÇÃO 3

1) Calcule o que se pede para os dados da distribuição de uma amostra dada a seguir:

Dados

65

72

70

72

60

67

69

68

a) Média

b) Variância

c) Desvio padrão

d) CV

Bioestatística - Profa. Juliane Ganem Página 24

2) Considere em que foram contabilizados o número de pessoas atendidas pela ortopedia durante os 30 dias de um mês. Os valores observados estão apresentados na tabela a seguir. Calcule o que se pede:

a) Média

b) Variância

c) Desvio padrão

d) CV

Bioestatística - Profa. Juliane Ganem Página 25

7. DISTRIBUIÇÃO NORMAL

A distribuição normal é uma distribuição em forma de sino que é usado muito extensivamente em aplicações

estatísticas em campos bem variados. Sua densidade de probabilidade (f.d.p.) é dada por

Notação:

QUAL A CARACTERÍSTICA DESSE TIPO DE

DISTRIBUIÇÃO?

• Os dados se distribuem normalmente em torno da média, em perfeita harmonia.

• Curva Gaussiana (formato de um sino).

• Unimodal.

• Simétrica em relação à media.

CONCLUSÃO

Bioestatística - Profa. Juliane Ganem Página 26

7.1 PARÂMETROS DA DISTRIBUIÇÃO DA NORMAL

Média Desvio padrão

Analise das médias:

Analise do desvio padrão:

Exercício sobre os parâmetros:

Como calcular a área debaixo da curva?

Analise os parâmetros media e desvio padrão, entre as curvas: 1) A e B 2) A e D 3) A e C 4) C e D

Bioestatística - Profa. Juliane Ganem Página 27

Para calcular as probabilidades associadas a distribuição normal, usamos o seguinte artifício: VARIÁVEL REDUZIDA Z

Z σ

µ−x

Em seguida consultamos a tabela para obtermos a probabilidade desejada.

Tabela 1. Área sob a curva normal padronizada compreendida entre os valores 0 e Z

Z 0 1 2 3 4 5 6 7 8 9

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993

3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995

3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997

3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998

3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998

3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 28

Construção da equação de regressão com base nos dados da amostra:

Onde: ( ) ( )( )

( ) ( )22

−=

ii

iiii

xxn

yxyxna xayb .−=

n

xx

n

yy

i

i

=

=

Exemplo:

Uma concessionária de veiculos quer verificar a eficácia de seus anuncios em determinado jornal na venda de carros novos. A tabela abaixo mostra o números de anúncios publicados, por mês, e correndente número de carris vendidos nos últimos 6 meses.

Nº de anúncios

publicados (x)

Nº de carros

vendidos (y)

28 140

20 110

22 100

14 75

10 60

7 52

Precisamos para calcular a reta de regressão alguns somatórios, vamos fazer uma tabela e preenche-la para organizarmos nossos dados:

Nº de

anúncios

publicados

(x)

Nº de

carros

vendidos

(y)

x . y x²

28 140

20 110

22 100

14 75

10 60

7 52

= = = =

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 29

Valor de a:

( ) ( )( )( ) ( )22

−=

ii

iiii

xxn

yxyxna

( ) ( )( )

( ) ( )2−

−=a

=

=

=

a

a

a

n

xx

i=

=

=

x

x

n

yy

i=

=

=

y

y

valor de b:

xayb .−=

−=b

=b

Agora que já calculamos a e b, vamos escrever nossa Reta regressão linear:

Reta regressão linear

bxay += .ˆ

+= xy

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 30

2ª passo:

Calcular os pontos da reta de regressão:

Nº de

anúncios

publicados

(x)

Nº de

carros

vendidos

(y)

y =

28 140

20 110

22 100

14 75

10 60

7 52

3º passo:

Marcar no plano cartesiano os pontos da reta de regressão e traçar a reta.

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 31

EXERCÍCIO DE FIXAÇÃO 4

Exercício 1:Exercício 1:Exercício 1:Exercício 1:

Encontre a equação da reta de regressão para os gastos com propagandas e dados sobre as vendas da empresa. O

dados seguem na dela abaixo:

Valor de a:

( ) ( )( )( ) ( )22

−=

ii

iiii

xxn

yxyxna

( ) ( )( )

( ) ( )2−

−=a

=

=

=

a

a

a

n

xx

i=

=

=

x

x

n

yy

i=

=

=

y

y

Valor de b:

xayb .−=

−=b

=b

Reta regressão linear

bxay += .ˆ

+= xy

Custo de Custo de Custo de Custo de

propaganda propaganda propaganda propaganda

(x)(x)(x)(x)

Vendas da Vendas da Vendas da Vendas da

empresaempresaempresaempresa

(y)(y)(y)(y)

xxxx....yyyy xxxx²²²²

2,4 225

1,6 184

2,0 220

2,6 240

1,4 180

1,6 184

2,0 186

2,2 215

= = = =

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 32

Custo de

propaganda

(x)

Vendas

da

empresa

(y)

y =

2,4 225

1,6 184

2,0 220

2,6 240

1,4 180

1,6 184

2,0 186

2,2 215

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 33

Exercício 2:

A tabela abaixo mostra os resultados de uma pesquisa que apreciou o peso de um veiculo (em ton) e o número médio

de peças defeituosas que tiveram de ser repostas no primeiro ano de uso do automóvel.

a) Coeficiente de correlação linear

b) Classificação da correlação

c) Diagrama de dispersão

d) Equação da regressão linear

e) Gráfico da equação de regressão linear

a) Coeficiente de correlação linear

b) Classificação da correlação

Peso de

veículo

(toneladas)

(x)

Número de

peças

defeituosas

(y)

x.y x² y²

1,00 2

1,25 5

1,50 5

1,75 7

2,00 10

2,25 11

2,50 15

= = = = =

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 34

c) Diagrama de dispersão

d) Equação da regressão linear

( ) ( )( )( ) ( )22

−=

ii

iiii

xxn

yxyxna

( ) ( )( )

( ) ( )2−

−=a

=

=

=

a

a

a

n

xx

i=

=

=

x

x

n

yy

i=

=

=

y

y

Valor de b:

xayb .−=

−=b

=b

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 35

e) Gráfico da equação de regressão linear

Reta regressão linear

bxay += .ˆ

+= xy

Peso de

veículo

(toneladas)

(x)

Número de

peças

defeituosas

(y)

y =

1,00 2

1,25 5

1,50 5

1,75 7

2,00 10

2,25 11

2,50 15

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 36

8.8.8.8. TeTeTeTestes de Hipótesestes de Hipótesestes de Hipótesestes de Hipótese Os testes de hipótese são uma das aplicações da estatística mais usada. Muitas vezes, em problemas práticos, o objetivo principal do pesquisador não é a estimação em si, mas sim, fazer afirmações a respeito do(s) parâmetro(s). 8888.1 .1 .1 .1 DefiniDefiniDefiniDefinição:ção:ção:ção:

Um teste de hipóteseteste de hipóteseteste de hipóteseteste de hipótese ((((ou teste estatísticoou teste estatísticoou teste estatísticoou teste estatístico)))) é um procedimento para se determinar se a evidência que uma amostra fornece é suficiente para concluirmos se o parâmetro populacional está num intervalo específico. 8888.2 .2 .2 .2 Componentes de um Teste de HipóteseComponentes de um Teste de HipóteseComponentes de um Teste de HipóteseComponentes de um Teste de Hipótese.... Para conduzir um teste de hipótese, vamos considerar duas afirmações a respeito do parâmetro as quais chamaremos de hipótese nulahipótese nulahipótese nulahipótese nula e hipótese alternativahipótese alternativahipótese alternativahipótese alternativa.

Via de regra, a hipótese nula é feita com base no comportamento passado do produto/processos/serviços, enquanto

a alternativa é formulada em função de alteração/inovações recentes.

Hipótese NulaHipótese NulaHipótese NulaHipótese Nula: : : : denotada por HHHH0000, é uma afirmação sobre o valor do parâmetro.

000000 ::: µµµµµµ ≤≥= HouHouH

Hipótese Alternativa:Hipótese Alternativa:Hipótese Alternativa:Hipótese Alternativa: denotada por HHHHaaaa, é a hipótese a ser considerada como uma alternativa à hipótese nula. É a

afirmação que deve ser verdadeira se a hipótese nula for falsa.

000 ::: µµµµµµ <>≠ aaa HouHouH

• No ambiente atual de melhoria contínua, é fácil entender a importância dos testes de hipótese: eles permitem confirmar a eficácia das medidas de melhoria adotadas. Ao testar a hipótese, toma-se uma amostra aleatória do sistema em estudo e se calcula o parâmetro desejado. Conforme o valor do parâmetro, a hipótese nula será aceita ou rejeitada, a partir de procedimentos estatísticos.

8888.3 Exemplos: .3 Exemplos: .3 Exemplos: .3 Exemplos: a) a) a) a) Pesquisadores afirmam que a temperatura média do corpo é 98.6F (37°C). Uma amostra de n = 106 indivíduos foi

escolhida aleatoriamente e foram observadas Fx 90.98= e s = 0.62F. Pergunta: A amostra constitui evidência

suficiente para rejeitar a crença de que F6.98=µ ?

Afirmação: Afirmação: Afirmação: Afirmação: temperatura média do corpo é 98.6F (37°C). AlternativaAlternativaAlternativaAlternativa: temperatura média do corpo é diferente 98.6F (37°C). Temos: Temos: Temos: Temos: Elaborar a hipótese:

H0:_________________________

Ha:_________________________

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 37

b) b) b) b) Um operador de uma máquina de empacotar cereais, monitora o peso das caixas pesando um determinado número de caixas periodicamente. A norma diz que a máquina deve continuar operando a menos que a amostra indique que a máquina não esteja funcionando normalmente. Neste caso, a máquina deve ser desligada e ajustada. A condição requerida para a máquina continuar funcionando é que g453=µ .

Nota: Nota: Nota: Nota: O operador, neste caso, não está interessado em estimar µ , mas sim determinar se há evidência suficiente na

amostra para concluir que g453≠µ .

Afirmação: Afirmação: Afirmação: Afirmação: máquina continuar funcionando quando g453=µ .

AlternativaAlternativaAlternativaAlternativa: máquina deve ser desligada e ajustada quando. g453≠µ

Temos: Elaborar a hipótese:

H0:_________________________

Ha:_________________________

8.4 Teste Unilaterais (>,<)

8.4.1 Teste Bilaterais (≠)

Se o valor da estatística do teste cair na região crítica, rejeita-se H0. Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa

no sentido de permitir a rejeição de H0.

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

Bioestatística - Profa. Juliane Ganem Página 38

8.5 Tabela: Distribuição T Student

8.6 Área dobre a curva padronizada em Z

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

39

8.7 Exemplos Exemplo 1) – Uma montadora de carros afirma que os veículos produzidos atingem 15 km com apenas 1 L de combustível. Em uma amostra aleatória de 100 veículos verificou-se para essa amostra uma média 14,2 kg com 1 litro. Sabendo que o desvio padrão para os veículos dessa montadora apresenta 0,6km/L. Teste a hipótese que a autonomia é menos do que aquela afirmada pela montadora. Considere o nível de 5 % de significância. Afirmação: Dados: 1º passo: Elaborar a hipótese: H0:_________________________

Ha:_________________________

2º passo: Nível de significância: α=_______ e n= _____________ (??? Qual tabela )

Olhar na Tabela αααα Z0,05=__________

3º passo: Estatística

n

xz

σ

µ−=

4º passo: Gráfico

5º passo: Conclusão:

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

40

Exemplo 2) – Uma panificadora afirma que o pão francês tem massa igual a 100 gramas. Uma amostra com 8 pães, mostrou os seguintes resultados: 100, 102, 99, 99, 103, 105, 101 e 96. Ao nível de 10 % de significância, testar a hipótese que a massa do pão seja diferente do valor informado pela padaria. Afirmação: Dados: Usando a calculadora, para achar Media e desvio padrão:

Para limpar a calculadora:

Entrar no modo estatístico: (aparecerá na tela SD)

Digitar os valores:

Resultado da média amostra:

Resultado do desvio padrão da amostra: 1º passo: Elaborar a hipótese: H0:_________________________

Ha:_________________________

2º passo: Nível de significância: α=__________ e n= _____________ (??? Qual tabela )

Olhar na tabela Distribuição t Student (Pág.50 da apostila): gl=__________ Bilateral 0,10 : ______

3º passo: Estatística

n

xt

σ

µ−=

4º passo: Gráfico

5º passo: Conclusão:

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

41

EXERCÍCIO DE FIXAÇÃO 5

Exercício 1) – O responsável pelo controle de qualidade de uma fábrica, que vende suco de laranja, supervisiona

periodicamente a linha de produção para verificar se as caixas de suco de laranja estão com a quantidade correta de

suco, isto é, verifica se não está ocorrendo sobre enchimento ou sub enchimento da caixinha. Em média, o volume

das caixas de suco é de 1,5 litros e o desvio padrão populacional é de 0,2 litro. Para testar a hipótese de que haja a

necessidade de recalibrar a máquina que enche as caixas, foi retirado uma amostra de 35 caixas de suco. A média

encontrada foi de 1,43 litros. Ao nível de significância de 5%, teste as hipóteses e diga sua conclusão.

Afirmação: Dados: 1º passo: Elaborar a hipótese: H0:_________________________

Ha:_________________________

2º passo: Nível de significância: α=_______ e n= _____________ (??? Qual tabela )

3º passo: Estatística 4º passo: Gráfico

5º passo: Conclusão:

Profa. Juliane Ganem Estatística Indutiva – Teste de Hipótese

42

Exercício 2) – A média histórica de notas para o curso de técnico em enfermagem em uma em uma determinada

escola é de 9,0. O diretor desta escola de ensino técnico em enfermagem acredita que está média esta caindo. Para

verificar sua suspeita, seleciona uma amostra de 29 estudantes do curso técnico em enfermagem. A média da amostra

foi de nota 8,3 e o desvio padrão encontrado foi de 1,5. Aplique um teste de hipótese ao nível de significância de 0,1

e verifique se a suspeita do diretor é verdadeira. Suponha população aproximadamente normal.

Afirmação: Dados: 1º passo: Elaborar a hipótese: H0:_________________________

Ha:_________________________

2º passo: Nível de significância: α=_______ e n= _____________ (??? Qual tabela )

3º passo: Estatística 4º passo: Gráfico

5º passo: Conclusão: