introdução à análise exploratória de dados · estatística básica renato dourado maia...

26
Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais Introdução à Análise Exploratória de Dados

Upload: lamkhanh

Post on 10-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Estatística Básica

Renato Dourado Maia

Instituto de Ciências Agrárias

Universidade Federal de Minas Gerais

Introdução à Análise Exploratória de Dados

Page 2: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Pergunta Inicial

O que é Estatística?

13/08/2014 2/26

Page 3: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto Moderno

Grande Quantidade de Informações

Quantificação em nossas

vidas

FERRAMENTAS COMPUTACIONAIS

Vantagens?

Perigos?

13/08/2014 3/26

Page 4: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Ferramentas Computacionais As ferramentas computacionais permitem que

grandes quantidades de informações sejam rápi-da e confortavelmente analisadas, contribuindo positivamente para a difusão e utilização de mé-todos estatísticos.

Todavia, a automação pode levar um indivíduo sem preparo específico a utilizar técnicas inade-quadas para analisar e/ou resolver um dado pro-blema.

13/08/2014 4/26

Page 5: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Conclusão Importante Ensino, Aprendizagem e a Vida Universitária: um Bate-Papo com os

Acadêmicos

13/08/2014 5/26

Page 6: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Conclusão Importante É necessária a compreensão dos conceitos bási-

cos de estatística, bem como das suposições bá-sicas necessárias para a sua utilização de forma criteriosa!

Uma base teórica sólida permite a criação e o entendimento de coisas práticas:só se consegue aplicar na prática a teoria que

realmente se entende!

Lamento de um Estudante:

– Se eu tivesse somente um dia de vida, gostaria de ficar numa aula de estatística. Assim o tempo passaria mais vagarosamente.

13/08/2014 6/26

Page 7: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Conclusão Importante

13/08/2014 7/26

Page 8: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Conclusão Importante Lei de Griffin na Estatística:

Estatísticas são a maneira mais lógica e precisa de falar uma meia-verdade sem exatidão.

Princípio de James:

Não há mentira maior do que uma verdade mal interpre-tada.

Torture os dados por um tempo suficiente, e eles contam tudo!

13/08/2014 8/26

Page 9: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Mas e a Primeira Pergunta? O que é Estatística?

Conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados ori-undos de estudos ou experimentos, realizados em qual-quer área do conhecimento.

Dados: um ou mais conjuntos de valores, numéricos ou não.

13/08/2014 9/26

Page 10: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Para que Estudar Estatística? A Estatística permite descrever e compreender

relações entre variáveis de forma imediata: a in-formação é apresentada de modo a possibilitar u-ma rápida interpretação e identificação das rela-ções mais importantes.

A Estatística permite também tomar melhores decisões, e de forma mais rápida: é possível con-trolar mais informações num espaço de tempo mais curto.

13/08/2014 10/26

Page 11: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Para que Estudar Estatística? A Estatística facilita a tomada de decisões: o co-

nhecimento de situações passadas e presentes, acompanhado por uma previsão fundamentada da evolução futura, é a base para as tomadas de decisões. ALGUÉM ACREDITA QUE O ESTUDO DA ESTATÍSTICA

NÃO É IMPORTANTE PARA A SUA FORMAÇÃO?

13/08/2014 11/26

Page 12: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração Tem-se afirmado que mais de 70% dos estudan-

tes de uma grande universidade particular são contrários a um plano de aumentar as taxas de alunos para permitir a construção de novos esta-cionamentos. Se 15 de 18 alunos selecionados ao acaso naquela universidade se opõem ao plano, teste a afirmação ao nível 0,05 de significância.

13/08/2014 12/26

Page 13: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração Tem-se afirmado que mais de 70% das laran-

jeiras num município paulista foram severamente danificadas por uma geada recente. Se 15 de 18 laranjeiras selecionadas ao acaso naquele municí-pio foram severamente danificadas por aquela geada, teste a afirmação ao nível 0,05 de signifi-cância.

13/08/2014 13/26

Page 14: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração Tem-se afirmado que mais de 70% de certos avi-

ões apresentam fissuras em seus lemes de dire-ção devidas à fadiga do metal. Se 15 de 18 des-ses aviões selecionados ao acaso apresentam fis-suras em seus lemes de direção devidas à fadiga do metal, teste a afirmação ao nível 0,05 de sig-nificância.

13/08/2014 14/26

Page 15: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração Tem-se afirmado que mais de 70% de todos mé-

dicos associados a planos de saúde estão insatis-feitos com seus honorários. Se 15 de 18 médicos escolhidos ao acaso dentre os associados a pla-nos de saúde estão insatisfeitos com seus hono-rários, teste a afirmação ao nível 0,05 de signifi-cância.

13/08/2014 15/26

Page 16: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração – Reflexão Os livros básicos que pretendem ensinar a jogar

xadrez são normalmente escritos na seguinte or-dem. Inicialmente, expõem-se o objetivo do jogo, os movimentos das peças e os xeque-mates ele-mentares. Assim, aprende-se logo a dar xeque-mate com dama e rei contra rei ou torre e rei contra rei. Em seguida, apresentam-se finais um pouco mais complexos, em que cada jogador possui algumas peças; por exemplo, torre, peão e rei contra torre e rei.

13/08/2014 16/26

Page 17: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração – Reflexão Agora, o jogador deve aprender a, partindo dessa

situação, cair num daqueles finais simples que já aprendeu a ganhar. No exemplo dado, o jogador com peão a mais pode vencer se ele conseguir promover o tal peão, transformando-o numa da-ma. Posteriormente, discutem-se posições mais complicadas, com mais peças. A idéia é sempre a mesma: mostrar ao jogador como simplificar a posição, de modo a cair num daqueles finais com poucas peças que ele já aprendeu a vencer.

13/08/2014 17/26

Page 18: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração – Reflexão Somente nas últimas páginas de um livro didático

sobre xadrez é que se apresentam as aberturas, ou seja, sugestões para os primeiros lances do jogo. A abertura é mais difícil de se entender. Seus conceitos são estratégicos; seus frutos só a-parecem depois de várias jogadas. Assim, apren-de-se a jogar xadrez pelo final, numa ordem con-trária àquela na qual o jogo se desenvolve. En-tretanto, DIDATICAMENTE, essa é a ordem mais lógica para se ensinar o jogo.

MONTEIRO, L. H. A. Sistemas Dinâmicos. 2. ed. São Paulo: Editora Livraria da Física, 2006. (Trecho do prefácio da primeira edição)

13/08/2014 18/26

Page 19: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Contexto e Abstração – Reflexão

13/08/2014 19/26

Page 20: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Divisão Simplificada da Estatística A Estatística pode ser dividida em três áreas prin-

cipais:

Estatística Descritiva.

Probabilidade.

Inferência Estatística.

13/08/2014 20/26

Page 21: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Divisão Simplificada da Estatística A Estatística Descritiva, que é em geral utilizada

na etapa inicial da análise, tem como objetivo de aplicar alguma técnica para resumir a informação daquele particular conjunto de valores, para que possam ser tiradas conclusões a respeito de ca-racterísticas de interesse.

A Probabilidade pode ser pensada como a teoria matemática utilizada para se estudar a incerteza de fenômenos de caráter aleatório.

13/08/2014 21/26

Page 22: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Divisão Simplificada da Estatística A Inferência Estatística é o estudo de técnicas

que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de valores, usu-almente de dimensão muito menor.

13/08/2014 22/26

Page 23: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Divisão Simplificada da Estatística

População

Amostra

Estatística Descritiva:

1 – Consistência dos Dados. 2 – Interpretações Iniciais.

Inferência Estatística:

1 – Estimação de Quantidades Desconhecidas. 2 – Extrapolação dos Resultados.

3 – Teste de Hipóteses.

COMO SELECIONAR A AMOSTRA?

13/08/2014 23/26

Page 24: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

População e Amostra Ao grande conjunto de dados que contém a ca-

racterística de interesse dá se o nome de Popula-ção.

Ao subconjunto da População, em geral com di-mensão sensivelmente menor, que será utilizado para as análises, dá-se o nome de amostra.

NA PRÓXIMA AULA, DISCUTIREMOS ALGUNS PROCEDIMENTOS QUE PODEM SER UTILIZADOS PARA ORGANIZAR E DESCREVER UM CONJUNTO DE DADOS, SEJA EM UMA POPULAÇÃO, SEJA EM

UMA AMOSTRA...

13/08/2014 24/26

Page 25: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Importante As explanações realizadas em sala nunca subs-

tituem uma boa leitura! Recomendo a todos de-senvolver o hábito de estudar por um material formal de referência, que apresente o conteúdo utilizando a linguagem apropriada para o domí-nio em questão.

Sempre que possível, além dos materiais de a-poio, disponibilizarei na página da disciplina links interessantes e materiais complementares!

13/08/2014 25/26

Page 26: Introdução à Análise Exploratória de Dados · Estatística Básica Renato Dourado Maia Instituto de Ciências Agrárias . Universidade Federal de Minas Gerais . Introdução

Renato Dourado Maia – Estatística Básica

Exercício 1. Classifique em verdadeiro ou falso:

a. Estatística é um conjunto de técnicas destinadas a organizar um conjunto de valores numéricos.

b. Sempre que estivermos trabalhando com números, devere-mos utilizar a Inferência Estatística

c. A Estatística Descritiva fornece uma maneira adequada de tratar um conjunto de valores, numéricos ou não, com a fina-lidade de conhecermos o fenômeno de interesse.

d. Qualquer amostra representa, de forma adequada, uma po-pulação.

e. As técnicas estatísticas não são adequadas para casos que envolvam experimentos destrutivos, como, por exemplo, queima de equipamentos, destruição de corpos de provas, etc.

13/08/2014 26/26