estatística e probabilidade conceitos introdutórios. distribuição de frequências em tabelas....

33
Estatística e Probabilidade Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade. Exercícios.

Upload: internet

Post on 18-Apr-2015

124 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

Estatística e ProbabilidadeEstatística e Probabilidade

• Conceitos introdutórios.• Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade.• Exercícios.

Page 2: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1. Introdução.

A estatística é a parte da Matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Tem como objetivos:

A análise de dados dos (gráficos, resumos numéricos, tabelas, etc).

A produção de dados (conceitos básicos de planejamento e amostragem).

A inferência estatísticas (formulação de conclusões consistentes)

Page 3: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• Introdução Estatística Descritiva.

Descreve os dados observados e na sua função dos dados, tem as seguintes atribuições.

- A obtenção ou coleta de dados – por questionários ou observações diretas de uma população ou amostra.

- A organização dos dados – consiste na ordenação e crítica quanto à correção dos valores observados.

- A representação dos dados – os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de tabelas e gráficos, que permite uma visualização instantânea de todos os dados.

Page 4: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• Introdução

Estatística Indutiva

Obtém e generaliza conclusões para a população a partir de uma amostra, através do cálculo de probabilidade.

A tais conclusões estão sempre associados a um grau de incerteza e consequentemente, a uma probabilidade de erro.

Page 5: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1. Introdução.

1.1 População e amostra.

Referem-se ao conjunto de entes cujas propriedades desejamos averiguar.

População estatística ou universo estatístico: coleção de todos os elementos cujas características (comuns) desejamos conhecer conhecer.

Amostra é um subconjunto finito da população cujas características serão medidas. A amostra será usada para descobrir características da população. Como todo a análise estatística será inferida a partir das características obtidas da amostra, é importante que a amostra seja representativa da população, isto é, que as características de uma parte (amostra) sejam em geral as mesmas que do todo (população).

Page 6: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1. Introdução.

Page 7: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1. Introdução.

Parâmetro - é uma característica numérica estabelecida para toda uma população.

Estimador - é uma característica numérica estabelecida para uma amostra.

Dados estatísticos – parâmetros ou estimadores, expressos em números reais, a partir de análise estatística.

Page 8: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.2 Tipo de amostragem.

Page 9: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.2 VARIÁVEIS

São quaisquer características atribuídas ao objeto observado (pessoa, objeto ou animal).

Enquadram ou categorizam os indivíduos, como na utilização das variáveis sexo, emprego, etc.

Distribuem-se em valores numéricos como como altura e renda, que terão derivações matemáticas.

Dividem-se em:

Page 10: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.2 VARIÁVEIS

Page 11: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.2 VARIÁVEIS

Variável qualitativa: quando seus valores são expressos por atributos.

Qualitativa ordinal: ocorre quando é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica. Exemplos: escolaridade ou grau de Instrução, classe social, etc.

Qualitativa nominal: quando não é possível fazer nenhuma classificação depois de atribuída a característica. Exemplos: profissão, procedência, sexo, cor da pele, etnia, padrão de bandas ou cores, etc.

Page 12: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.2 VARIÁVEIS

Variável quantitativa: quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, número de filhos, etc.).

Quantitativa contínua: pode assumir teoricamente qualquer valor entre dois limites de números reais. Exemplo: altura, peso, etc.

Quantitativa discreta: só pode assumir valores inteiros, enumeráveis. Exemplo: número de filhos, número de vitórias.

Page 13: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.3 Distribuição de frequências.

É necessária para a verificação da distribuição da variável na amostra e sua importância na população.

Para variáveis qualitativas, serão observadas números de ocorrências (a frequência simples) ou proporções dos eventos (a frequência relativa).

Para variáveis quantitativa discretas serão também usadas as frequências simples ou relativa, podendo ser usados intervalos de classe em alguns casos.

Para variáveis quantitativas contínuas serão observados os eventos em intervalos de classe destinados a simplificar a amostra. Deriva-se as frequências simples e relativas a partir dos intervalos de classe.

Page 14: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos.

• Gráficos são diagramas de expressão dos dados estatísticos tabulados. Geralmente são expressos em duas dimensões e num quadrante, onde a abcissa (linha horizontal) é o eixo X e a ordenada (linha vertical) é o eixo Y.

• Seu uso deve ser de acordo com as variáveis propostas para a amostra.

Page 15: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos.

• Para variáveis qualitativas ou contínuas discretas, as opções mais adequadas são gráficos de barra para a apresentação das frequências simples. A variável qualtitativa está representada na abcissa, ou no eixo X.

• Um tipo especial de gráfico de barra é o histograma. Neste caso as barras correspondem à ordenação dos dados. Pode ser usado para qualtitativas ordinais ou quantitativas discretas intervaladas. É a principal ferramenta para a apresentação de variáveis quantitativas contínuas intervaladas.

• Também são usados gráficos de área, ou em pizza, onde as proporções dos eventos são demonstradas.

Page 16: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos.

• Gráficos em linha são utilizados frequentemente como diagramas de acompanhamento. O tipo de tabulação neste caso é dito série temporal. No gráfico, a abcissa corresponde à evolução temporal e a ordenada à distribuição da variável. As variáveis são do tipo quantitativa discreta.

Page 17: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos.

• Para variáveis quantitativas contínuas, é utilizado principalmente o histograma.

• Este vai refletir o padrão de normalidade da amostra.

Frequência relativa (%)

Variável em Intervalos de classe

Page 18: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos: barras e pizzas.

Page 19: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 1.4 Gráficos: histogramas; padrão de normalidade.

Page 20: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 2. APRESENTAÇÃO DE DADOS ESTATÍSTICOS

APRESENTAÇÃO TABULAR

A apresentação tabular dos dados estatísticos consiste na reunião ou grupamento dos dados em tabelas com a finalidade de apresentá-los de modo ordenado e simples, de de fácil percepção.

Componentes Básicos

Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:

Page 21: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 3. APRESENTAÇÃO DE DADOS ESTATÍSTICOS Principais Elementos de uma Tabela

Título: Conjunto de informações, as mais completas possíveis,

localizado no topo da tabela, respondendo às perguntas: O quê? Onde? Quando?

Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.

Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.

Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas.

Casa ou Célula: Espaço destinado a um só número.

Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados.

Page 22: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 3.1 SÉRIES ESTATÍSTICAS

São apresentações tabulares de dados estatísticos em função de características específicas, geralmente:

– Época ou tempo;– Locais;– Padrões da espécie.

Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas:

Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e espécie.

Page 23: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 3.1. SÉRIES ESTATÍSTICAS

Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia permanecendo fixos o tempo e a espécie.

Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia permanecendo fixos o tempo e o local.

Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries estatísticas.

Exemplo: Geográfica – Temporal.

Page 24: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 3.1 SÉRIES ESTATÍSTICAS

Page 25: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4. Distribuição de frequências

São apresentações tabulares em que a distribuição da variável na amostra é apresentada em padrões de ocorrência, ou o número de dados que pertence a cada valor da variável. O valor da variável é codificado como x.

A distribuição da variável é demonstrada como frequência simples e relativa. Nos dois casos é também a apresentada a frequência acumulada.

Variáveis contínuas devem ser apresentadas em intervalos de classe, o que é chamado de freqüência intervalar.

Variáveis quantitativas discretas podem ser apresentadas na forma simples, por valor ou podem também ser apresentadas em intervalos de classe. Exemplos básicos a seguir.

Page 26: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4. Distribuição de frequências

Com base na tab. 1.1 do livro texto, elabore uma tabela de distribuição de frequências simples com os dados obtidos das conchas.

Escolha uma variável, CAC, LAC ou PC. Neste exercício considere como uma amostra, não dividida em séries verticais e horizontais.

Entregar no final da aula.

Page 27: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4. Distribuição de frequências com intervalos de classe(exemplo).

Page 28: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4. Distribuição de frequências com intervalos de classe.

4.1 Elementos Principais:

a) Classe – é cada um dos intervalos em que os dados são agrupados.

b) Limites de classes são os valores extremos de cada classe.

li = limite inferior de uma classe; Li = limite superior de uma classe.

c) Amplitude – é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. A amplitude total (At) é calculada pela seguinte expressão:

At = Max. (rol) – Min.(rol).

Page 29: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4. Distribuição de frequências.

4.1 Elementos Principais:

A amplitude do intervalo de classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a expressão a seguir:

Mais adiante veremos como calcular o número de classes (n).

Page 30: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4.1 Elementos principais.

d) Ponto médio de classe (xi) – importante para as medidas de tendência central e dispersão, é calculado pela seguinte expressão:

e) Freqüência absoluta ou simples (fi) - freqüência absoluta de uma classe de ordem i, é o número de dados que pertencem a essa classe.

f) Freqüência relativa (fri) - freqüência relativa de uma classe de ordem i, é o quociente da freqüência absoluta dessa classe (fi), pelo total, ou seja,

Obs: a soma de todas as freqüências absolutas é igual ao total e a soma das frequências relativas é igual a 100.

Page 31: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4.1 Elementos principais.

g) Freqüência acumulada (Fi) - freqüência acumulada de uma classe de ordem i, é a soma das freqüências até a classe de ordem i.

h) Freqüência acumulada relativa (Fri) - freqüência relativa acumulada de uma classe de ordem i, é a soma das freqüências relativas até a classe de ordem i.

Page 32: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4.2. A organização de uma distribuição de fequências em intervalos de classe.

• 1. Organização do rol: é colocar os dados em ordem crescente ou decrescente.

• 2. Cálculo do número conveniente de classes (n): o número de classe deve ser escolhido pelo pesquisador e geralmente situa-se entre 5 a 15 classes. Usa-se a fórmula

• 3. Cálculo da amplitude dos intervalos de classe convenientes (h). Deve ser o mesmo para todas as classes:

Page 33: Estatística e Probabilidade Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade

• 4.2. A organização de uma distribuição de fequências em intervalos de classe.

• 4. Obtenção dos limites das classes. Geralmente as classes são intervalos fechados à esquerda e abertos á direita. O limite inferior da 1a classe é igual ao mínimo do rol, isto é:

• l1 = Min.(rol)

• Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos limites da 1a classe.

• 5. Na tabela, colocar as fi (frequências absolutas) e calcular as fri (freqüências relativas).

• 7. Apresentar a distribuição em histograma.

• 8. Exercício: tabular desta forma os dados obtidos da conchas usados anteriormente e construir o histograma. Entregar no final.

if