estatÍstica carlos alessandro nunes [email protected]

32
ESTATÍSTICA ESTATÍSTICA Carlos Alessandro Nunes Carlos Alessandro Nunes Carlosalessandro.nunes@gma Carlosalessandro.nunes@gma il.com il.com

Upload: eric-bernardino

Post on 07-Apr-2016

224 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

ESTATÍSTICAESTATÍSTICA

Carlos Alessandro NunesCarlos Alessandro [email protected]@gmail.commail.com

Page 2: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Estatística: o que é?Estatística: o que é? O primeiro uso da palavra ESTATÍSTICA O primeiro uso da palavra ESTATÍSTICA

parece datar de 1589 (dc) e apareceu em parece datar de 1589 (dc) e apareceu em um trabalho do historiador Girolomo um trabalho do historiador Girolomo Ghilini, quando se referiu a uma “ciência Ghilini, quando se referiu a uma “ciência civil, política, estatística e militar”. civil, política, estatística e militar”. (Berquó, 1981)(Berquó, 1981)

As expressões “As expressões “statistics”, “statist” statistics”, “statist” ee “statistical”“statistical” parecem ter sido derivadas do parecem ter sido derivadas do latim latim statusstatus com duplo significado: com duplo significado:

estado político e situação das coisas.estado político e situação das coisas.

Page 3: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

DEFINIÇÃODEFINIÇÃO No Aurélio (primeira edição) No Aurélio (primeira edição)

apresentam-se as seguintes definições:apresentam-se as seguintes definições:(1)(1)Parte da matemática em que se Parte da matemática em que se

investigam os processos de obtenção, investigam os processos de obtenção, organização e análise de dados sobre organização e análise de dados sobre uma população ou uma coleção de uma população ou uma coleção de seres quaisquer, e os métodos de tirar seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições conclusões e fazer ilações ou predições com base nesses dados;com base nesses dados;

Page 4: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

DEFINIÇÃODEFINIÇÃO(1)(1) Qualquer Qualquer parâmetro parâmetro de uma de uma

amostra, como, por exemplo, a sua amostra, como, por exemplo, a sua média, o seu desvio-padrão, a sua média, o seu desvio-padrão, a sua variância.variância.

Page 5: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Cronologia de Alguns Conceitos e Cronologia de Alguns Conceitos e FatosFatos

Importantes da EstatísticaImportantes da EstatísticaAntes de Cristo:Antes de Cristo:

5000 - Registros egípcios de presos de guerra5000 - Registros egípcios de presos de guerra

3000 - Jogos de dados (Objetos de ossos)3000 - Jogos de dados (Objetos de ossos)

2000 - Censo Chinês2000 - Censo Chinês

1100 - Registros de dados em livros da Dinastia Chinesa1100 - Registros de dados em livros da Dinastia Chinesa

585 - Thales de Mileto usa a geometria dedutiva585 - Thales de Mileto usa a geometria dedutiva

540 - Pitágoras (Aritmética e Geometria)540 - Pitágoras (Aritmética e Geometria)

430 - Philolaus obtém dados de Astronomia e Hippocrates 430 - Philolaus obtém dados de Astronomia e Hippocrates estuda doenças a partir da coleta de dados estuda doenças a partir da coleta de dados

Page 6: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

400 - Estabelecido o Censo Romano - Descrição detalhada de 400 - Estabelecido o Censo Romano - Descrição detalhada de coleta de dados em livros de Constantinoplacoleta de dados em livros de Constantinopla

100 - Horácio usa um ábaco de fichas como instrumento de “cálculo 100 - Horácio usa um ábaco de fichas como instrumento de “cálculo portátil”portátil”

120 - Menelaus apresenta tabelas estatísticas cruzadas 120 - Menelaus apresenta tabelas estatísticas cruzadas

620 - Surge em Constantinopla um Primeiro Bureau de Estatística 620 - Surge em Constantinopla um Primeiro Bureau de Estatística

695 - Utilização da média ponderada pelos árabes na contagem de 695 - Utilização da média ponderada pelos árabes na contagem de moedasmoedas

826 - Os árabes usam cálculos estatísticos na tomada de Creta826 - Os árabes usam cálculos estatísticos na tomada de Creta

840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de 840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de dados de astronomiadados de astronomia

Page 7: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1303 - Origem dos números combinatórios (Shihchieh Chu)1303 - Origem dos números combinatórios (Shihchieh Chu)

1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de 1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de probabilidade com a fórmula do binômioprobabilidade com a fórmula do binômio

1447 - Surgem as primeiras tabelas de mortalidade construídas 1447 - Surgem as primeiras tabelas de mortalidade construídas pelos sábios do Islãpelos sábios do Islã

1530 - Lotto de Firenze – Primeira Loteria Pública1530 - Lotto de Firenze – Primeira Loteria Pública

1550 - Número Combinatório (Cardano)1550 - Número Combinatório (Cardano)

1654 - Pierre de Fermat e Blaise Pascal estabelecem os 1654 - Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das ProbabilidadesPrincípios do Cálculo das Probabilidades

Page 8: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1656 - Huygens publica o primeiro tratado de Probabilidade1656 - Huygens publica o primeiro tratado de Probabilidade

1660 - Fundação da Royal Society of London1660 - Fundação da Royal Society of London

1662 - Primeiros estudos demográficos (Graunt)1662 - Primeiros estudos demográficos (Graunt)

1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético 1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético e conceito de Valor Esperado (Pascal)e conceito de Valor Esperado (Pascal)

1693 - Edmund Halley publica tabelas de mortalidade e cria os 1693 - Edmund Halley publica tabelas de mortalidade e cria os fundamentos da Atuáriafundamentos da Atuária

1713 - Distribuição Binomial (Bernoulli)1713 - Distribuição Binomial (Bernoulli)

1718 – De Moivre publica Doutrina das Chances1718 – De Moivre publica Doutrina das Chances

1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling 1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling para n!para n!

Page 9: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1733 - Teorema Central do Limite (De Moivre) 1733 - Teorema Central do Limite (De Moivre)

1763 - Inferência Estatística (Reverendo Thomas Bayes) 1763 - Inferência Estatística (Reverendo Thomas Bayes)

1764 - Probabilidade Condicional e Teorema de Bayes1764 - Probabilidade Condicional e Teorema de Bayes 1775 - William Morgan se torna o primeiro atuário1775 - William Morgan se torna o primeiro atuário

1777 - Primeiro exemplo de uso da verossimilhança na 1777 - Primeiro exemplo de uso da verossimilhança na estimação de parâmetro (Daniel Bernoulli) estimação de parâmetro (Daniel Bernoulli)

1800 - A França estabelece o seu Bureau de Estatística1800 - A França estabelece o seu Bureau de Estatística

Page 10: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1800 - A França estabelece o seu Bureau de Estatística1800 - A França estabelece o seu Bureau de Estatística

1805 - Método dos Mínimos Quadrados (Legendre) 1805 - Método dos Mínimos Quadrados (Legendre)

1810 - Teorema Central do Limite (Laplace)1810 - Teorema Central do Limite (Laplace)

1812 - Théorie Analytique des Probabilités – sendo a base da 1812 - Théorie Analytique des Probabilités – sendo a base da Inferência (Laplace)Inferência (Laplace)

1820 - Várias sociedades de Estatística são criadas 1820 - Várias sociedades de Estatística são criadas

1834 - Primeiro Computador Analítico (Charles Babbage) e 1834 - Primeiro Computador Analítico (Charles Babbage) e Fundação do Journal of the Royal Statistical Society – BFundação do Journal of the Royal Statistical Society – B

1835 - Lei dos Grandes Números (Poisson)1835 - Lei dos Grandes Números (Poisson)

Page 11: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1836 - Distribuição Gama1836 - Distribuição Gama

1837 - Distribuição de Poisson1837 - Distribuição de Poisson

1839 - Fundação da American Statistical Association (ASA)1839 - Fundação da American Statistical Association (ASA)

1846 - Uso de Quantis (Quetelet) 1846 - Uso de Quantis (Quetelet)

1853 - Distribuição de Cauchy e Primeira Conferência 1853 - Distribuição de Cauchy e Primeira Conferência Internacional de Estatística em Bruxellas (Quetelet)Internacional de Estatística em Bruxellas (Quetelet)

1867 - Desigualdade de Chebyshev1867 - Desigualdade de Chebyshev

Page 12: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1885 – Fundação do ISI (International Statistical Institute)1885 – Fundação do ISI (International Statistical Institute)

1887 - Teoria de Regressão (Galton) e Índice de Marshall1887 - Teoria de Regressão (Galton) e Índice de Marshall

1892 - Coeficiente de Correlação (Edgeworth)1892 - Coeficiente de Correlação (Edgeworth)

1894 - Método dos Momentos e Uso pela primeira vez dos 1894 - Método dos Momentos e Uso pela primeira vez dos termos momento e desvio padrão (Karl Pearson) termos momento e desvio padrão (Karl Pearson)

1895 - Sistema de Distribuições e Coeficiente de Variação 1895 - Sistema de Distribuições e Coeficiente de Variação (Karl Pearson) (Karl Pearson)

1896 - Métodos de Captura e Recaptura (Petersen) 1896 - Métodos de Captura e Recaptura (Petersen)

1897 - Coeficiente de Correlação de Produto de Momentos 1897 - Coeficiente de Correlação de Produto de Momentos (Pearson e Sheppard) e Distribuição de Pareto(Pearson e Sheppard) e Distribuição de Pareto

Page 13: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e 1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e Coeficiente de Associação (Yule)Coeficiente de Associação (Yule)

1901 - Fundação da Biometrika (Pearson, Weldon e Galton)1901 - Fundação da Biometrika (Pearson, Weldon e Galton)

1904 - Análise Fatorial (Spearman), Coeficiente de Contingência 1904 - Análise Fatorial (Spearman), Coeficiente de Contingência (K. Pearson), Coeficiente de Spearman e Expansão de (K. Pearson), Coeficiente de Spearman e Expansão de Edgeworth Edgeworth

1908 - Distribuição nula do coeficiente de correlação e 1908 - Distribuição nula do coeficiente de correlação e distribuição t de Student (William Gosset) e Análise Fatorial distribuição t de Student (William Gosset) e Análise Fatorial (Spearman)(Spearman)

1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e 1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e Índice de Gini Índice de Gini

1922 - Definição de Verossimilhança, Consistência e Suficiência 1922 - Definição de Verossimilhança, Consistência e Suficiência (Fisher) e Prova Rigorosa do Teorema Central do Limite (Fisher) e Prova Rigorosa do Teorema Central do Limite (Lindeberg)(Lindeberg)

Page 14: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1923 - Tabela ANOVA (Fisher) e Processo de Wiener1923 - Tabela ANOVA (Fisher) e Processo de Wiener

1925 - Livro Clássico “Statistical Methods for Research 1925 - Livro Clássico “Statistical Methods for Research Workers”, Método Workers”, Método escore para parâmetros e definição de p-escore para parâmetros e definição de p-valor (Fisher)valor (Fisher)

1926 - Planejamento de Experimentos (Fisher) e Conceito de 1926 - Planejamento de Experimentos (Fisher) e Conceito de Hipótese Altermativa (Gosset)Hipótese Altermativa (Gosset)

1928 - Distribuições Não- Centrais (Fisher), Intervalos de 1928 - Distribuições Não- Centrais (Fisher), Intervalos de Confiança, Razão de Verossimilhanças e Poder dos Testes Confiança, Razão de Verossimilhanças e Poder dos Testes (Neyman e Pearson) e Distribuição de Wishart(Neyman e Pearson) e Distribuição de Wishart

1930 -Controle de Qualidade nas indústrias, Inferência Fiducial 1930 -Controle de Qualidade nas indústrias, Inferência Fiducial (Fisher) e Distância de Mahalanobis, Tempo Médio de Espera (Fisher) e Distância de Mahalanobis, Tempo Médio de Espera na Fila M/G/1 (Pollaczek) e Fundação da Econometricana Fila M/G/1 (Pollaczek) e Fundação da Econometrica

1931 - Noção de Espaco Amostral (von Mises), Cartas de 1931 - Noção de Espaco Amostral (von Mises), Cartas de Controle de Qualidade (Shewhart) e Teste de Fisher-YatesControle de Qualidade (Shewhart) e Teste de Fisher-Yates

Page 15: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1932 - Distribuição de Gumbel 1932 - Distribuição de Gumbel

1933 - Lema de Neyman & Pearson, Distância de Kolmogorov, 1933 - Lema de Neyman & Pearson, Distância de Kolmogorov, Componentes Principais (Hotteling), Fundamentos de Componentes Principais (Hotteling), Fundamentos de Probabilidade (Kolmogorov) e Permutabilidade (DeFinetti)Probabilidade (Kolmogorov) e Permutabilidade (DeFinetti)

1934 - Estatística Ancilar, Família Exponencial e Princípios da 1934 - Estatística Ancilar, Família Exponencial e Princípios da Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de Confluência (Frisch) e Teorema de CochranConfluência (Frisch) e Teorema de Cochran

1938 - Distribuição Assintótica da Razão de Verossimilhanças 1938 - Distribuição Assintótica da Razão de Verossimilhanças (Wilks)(Wilks)

1939 - Distribuição de Weibull e início dos Métodos 1939 - Distribuição de Weibull e início dos Métodos Bayesianos (Jeffreys)Bayesianos (Jeffreys)

1976 - Enfoque Bayesiano em Modelos de Espaço de Estados 1976 - Enfoque Bayesiano em Modelos de Espaço de Estados (Harrison e Stevens) (Harrison e Stevens)

Page 16: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise 1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise Exploratória de Dados (Tukey), Distribuições g e h (Tukey) e Exploratória de Dados (Tukey), Distribuições g e h (Tukey) e Performance dos estimadores de MV em pequenas amostras Performance dos estimadores de MV em pequenas amostras (Bowman e Shenton)(Bowman e Shenton)

1990 - Métodos MCMC no contexto Bayesiano (Gelfand e 1990 - Métodos MCMC no contexto Bayesiano (Gelfand e Smith) e Mineração de Dados (“Data Mining”), Momentos L Smith) e Mineração de Dados (“Data Mining”), Momentos L (Hosking) e Teoria da Perturbação Estocástica (Stewart)(Hosking) e Teoria da Perturbação Estocástica (Stewart)

Page 17: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Ao longo do século XX, os Ao longo do século XX, os métodos estatísticos foram métodos estatísticos foram desenvolvidos como uma desenvolvidos como uma mistura de ciência, mistura de ciência, tecnologia e lógica para a tecnologia e lógica para a solução e investigação de solução e investigação de problemas em várias áreas problemas em várias áreas do conhecimento humano. do conhecimento humano.

Page 18: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Estatística Estatística

Conjunto de técnicas e métodos Conjunto de técnicas e métodos de pesquisa que entre outros de pesquisa que entre outros tópicos envolve o planejamento tópicos envolve o planejamento do experimento a ser realizado, do experimento a ser realizado, a coleta qualificada dos dados, a coleta qualificada dos dados, a inferência, o processamento, a inferência, o processamento, a análise e a disseminação das a análise e a disseminação das informações.informações.

Page 19: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

EstatísticaEstatística

Ciência que tem por objetivo, Ciência que tem por objetivo, fornecer métodos e técnicas fornecer métodos e técnicas para lidarmos, para lidarmos, racionalmente, com situações racionalmente, com situações sujeitas a incertezas.sujeitas a incertezas.

Page 20: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

As aplicações da As aplicações da EstatísticaEstatística

Na prática, a Estatística pode ser empregada como ferramenta fundamental/multidisciplinar em várias outras ciências.

Na área médica, por exemplo, a Estatística fornece metodologia adequada que possibilita decidir sobre a eficiência de um novo tratamento no combate à determinada doença.

Page 21: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

As informações estatísticas são As informações estatísticas são concisas, específicas e eficazes, concisas, específicas e eficazes, fornecendo assim subsídios fornecendo assim subsídios imprescindíveis para as tomadas imprescindíveis para as tomadas racionais de decisão. Neste sentido, a racionais de decisão. Neste sentido, a Estatística fornece ferramentas Estatística fornece ferramentas importantes para que as empresas e importantes para que as empresas e instituições possam definir melhor suas instituições possam definir melhor suas metas, avaliar sua performance, metas, avaliar sua performance, identificar seus pontos fracos e atuar identificar seus pontos fracos e atuar na melhoria contínua de seus na melhoria contínua de seus processos. processos.

Page 22: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

A Estatística subdivide-se em A Estatística subdivide-se em três áreas:três áreas:

descritiva descritiva probabilística e probabilística e

inferencial.inferencial.

Page 23: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

A Estatística DescritivaA Estatística Descritiva Como o próprio nome já diz, se preocupa em Como o próprio nome já diz, se preocupa em

descrever os dados. A estatística inferencial, descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e se preocupa com a análise destes dados e sua interpretação.sua interpretação.

A estatística descritiva, cujo objetivo básico A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma mesma natureza, permitindo dessa forma que se tenha uma visão global da variação que se tenha uma visão global da variação desses valores, organiza e descreve os dados desses valores, organiza e descreve os dados de três maneiras: por meio de de três maneiras: por meio de tabelas, de tabelas, de gráficos e de medidas descritivas.gráficos e de medidas descritivas.

Page 24: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

CONCEITOS FUNDAMENTAIS E DEFINIÇÕES

Para se obter bons resultados numa análise estatística, além dos métodos aplicados, também é necessário ter clareza nos conceitos utilizados. A seguir são apresentados alguns desses conceitos.

Page 25: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

A estatística trabalha com dados, os quais podem ser obtidos por meio de uma população ou de uma amostra, definida como:

População: conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados.

Page 26: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. A estatística inferencial é a área que trata e apresenta a metodologia de amostragem.

Page 27: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Após a determinação dos elementos pergunta-se: o que fazer com estes? Pode-se medi-los, observá-los, contá-los surgindo um conjunto de respostas que receberá a denominação de variável.

Page 28: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento.

Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis:

Page 29: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Tipos de variáveis

Alguns conjuntos de dados consistem em números, enquanto outros são não numéricos. Utiliza-se a nomenclatura de dados (ou variáveis) qualitativos e quantitativos.

Variáveis

Quantitativas Qualitativas

Discretas Contínuas

Page 30: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Tipos de Variáveis As variáveis podem ser categóricas

(qualitativas) ou numéricas (quantitativas) Variáveis qualitativas:São características de

uma população que não pode ser medidas. Ordinais – Ex: Grau de gravidade de uma doença Nominais – Ex: Presença de um sintoma

Variáveis quantitativas: São características de uma população que pode ser quantificadas. Discretas – Ex: Número de cirurgias

Contínuas– Ex:Idade, Pressão Arterial

Page 31: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com
Page 32: ESTATÍSTICA Carlos Alessandro Nunes Carlosalessandro.nunes@gmail.com

Exercícios:Identifique cada número como discreto ou contínuo1. Cada cigarro Camel tem 16,13 mg de alcatrão

2. O altímetro de um avião da American Airlines indica uma altitude de 21.359 pés

3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinante de um serviço de informação on-line.

4. O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar passagem a pedestres é de 2367 segundos.

Apresente dois exemplos de dados discretos ou contínuos de sua empresa / pesquisa.