aula 2 resumo de dados

32
Resumo de Dados Aula 2 Prof a . Dr a . Juliana Garcia Cespedes Dep. de Matemática e Computação UNIFEI - Itajubá

Upload: ariel-renno-chaves

Post on 13-Jun-2015

12.634 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Aula 2   resumo de dados

Resumo de Dados

Aula 2

Profa. Dra. Juliana Garcia Cespedes

Dep. de Matemática e Computação

UNIFEI - Itajubá

Page 2: Aula 2   resumo de dados

ProblemaUm pesquisador está interessado em fazer um

levantamento sobre alguns aspectos socioeconômicosdos empregados da seção de orçamentos de umaempresa. Para isso, ele colheu seis informações sobreos 36 empregados:

1. Estado civil;1. Estado civil;

2. Grau de instrução;

3. Número de filhos;

4. Salário;

5. Idade;

6. Região de procedência.

Page 3: Aula 2   resumo de dados

Dados

Page 4: Aula 2   resumo de dados

Tipos de variáveis• Cada informação em estudo chama-se VARIÁVEL.

• Para representar cada uma das variáveis em estudo atribui-se uma letra maiúscula, por exemplo, a letra X, para identificá-las.

Variável RepresentaçãoVariável Representação

Estado civil X

Grau de instrução Y

Número de filhos Z

Salário S

Idade U

Região de procedência V

Page 5: Aula 2   resumo de dados

Tipos de variáveis• As VARIÁVEIS são classificadas de acordo com o seu

conteúdo e para cada tipo existe um tratamento estatístico diferente.

Nominal

QualitativaQualitativa

Ordinal

Variável

Discreta

Quantitativa

Contínua

Page 6: Aula 2   resumo de dados

Tipos de variáveis• VARIÁVEL QUALITATIVA:

– Apresentam como possíveis realizações uma qualidade (ouatributo) do indivíduo pesquisado, exemplo, sexo, educação,estado civil, etc.

• Nominal: não existe nenhuma ordenação nas possíveis realizações.

(sexo, estado civil)

• Ordinal: existe uma ordem nos seus resultados.• Ordinal: existe uma ordem nos seus resultados.(educação, classe social)

• VARIÁVEL QUANTITATIVA:– Apresentam como possíveis realizações números resultantes de

uma contagem ou mensuração, exemplo, número de filhos, salário,idade, etc.

• Discreta: os valores pertencem a um conjunto finito ou enumerável denúmeros. (número de filhos)

• Contínua: os valores pertencem a um intervalo de números reais.

(peso, altura)

Page 7: Aula 2   resumo de dados

Tipos de variáveis• Classifique as variáveis da pesquisa

socioeconômica:

1. Estado civil;

2. Grau de instrução;

3. Número de filhos;

4. Salário;

5. Idade;

6. Região de procedência.

Page 8: Aula 2   resumo de dados

Distribuição de frequências• Quando se estuda uma variável, o maior interesse

do pesquisador é conhecer o comportamentodessa variável, analisando a ocorrência de suaspossíveis realizações.

• É fácil analisar as variáveis, conhecer o seucomportamento, utilizando a Tabela 1?

Page 9: Aula 2   resumo de dados

Dados

Page 10: Aula 2   resumo de dados

Distribuição de frequências• Podemos resumir as informações contidas na

Tabela 1 construindo tabelas de frequências paracada uma das variáveis pesquisadas.

• Uma tabela de frequências possui informações• Uma tabela de frequências possui informaçõessobre o número de pesquisados, a porcentagem,a proporção e a proporção acumulada de cadaclasse da variável analisada.

Page 11: Aula 2   resumo de dados

Distribuição de frequências

• Tabela de frequências da variável grau de instrução:

Grau de instrução

Frequência

fi

Frequênciarelativa

fri

Frequênciaacumulada

fai

Porcentagem

100 frifi fri fai 100 fri

Fundamental 12 12/36 =0,333 0,333 33,3%

Médio 18 18/36 =0,500 0,833 50,0%

Superior 6 6/36 =0,167 1,000 16,7%

Total 36 36/36 =1,000 100%

Page 12: Aula 2   resumo de dados

Distribuição de frequências

• Observando os resultados da segunda coluna, vê-se que dos 36 empregados da companhia, 12 têm ensino fundamental, 18 ensino médio e 6 possuem curso superior.

• A frequência relativa e a porcentagem são • A frequência relativa e a porcentagem são bastante úteis quando decide-se comparar o resultado de pesquisas distintas, por exemplo, quando deseja-se pesquisar o total de empregados da companhia.

• A frequência acumulada é utilizada para verificar onde encontra-se a maior parte da população pesquisada.

Page 13: Aula 2   resumo de dados

Distribuição de frequências

• Construa a tabela de frequências para as variáveis estado civil, número de filhos e região de procedência :

Page 14: Aula 2   resumo de dados

Distribuição de frequências

• Quando a variável é contínua, a construção da tabela de frequências exige certo cuidado.

• Se indicarmos cada classe que aparece na variável salário em uma tabela de frequências, não salário em uma tabela de frequências, não resumiremos as 36 observações num grupo menor, pois não existem observações iguais.

• A solução é agrupar os dados por faixas de salário.

Page 15: Aula 2   resumo de dados

Distribuição de frequências

• Tabela de frequências dos salários dos empregados

Classe de salários

Frequência

fi

Frequênciarelativafri

Frequênciaacumuladafai

Porcentagem

100 fi

[4,00; 8,00) 10 10/36 =0,278 0,278 27,78%

[8,00; 12,00) 12 12/36 =0,333 0,611 33,33%

[12,00; 16,00) 8 8/36 =0,222 0,833 22,22%

[16,00; 20,00) 5 5/36 =0,139 0,972 13,89%

[20,00; 24,00) 1 1/36 =0,029 1,000 2,78%

Total 36 1 100%

Page 16: Aula 2   resumo de dados

Distribuição de frequências

• Procedendo deste modo, perde-se alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a não ser que investigamos a tabela original.

• Uma forma de interpretação é dizer que todos os oito salários são iguais ao ponto médio, 14.

• Sugere-se entre 5 a 15 classes da mesma amplitude.

Page 17: Aula 2   resumo de dados

Tabela de frequências conjunta

• É muito comum estarmos interessados no comportamento conjunto de várias variáveis.

• Por exemplo, uma pesquisa é feita entre alunos do primeiro ano da faculdade e perguntou-se do primeiro ano da faculdade e perguntou-se aos alunos se trabalhavam (variável X) e o número de vestibulares prestados (variável Y).

X não sim não não não sim sim não sim sim

Y 1 1 2 1 1 2 3 1 1 1

X não não sim não sim não não não sim não

Y 2 2 1 3 2 2 2 1 3 2

Page 18: Aula 2   resumo de dados

• Os dados são resumidos em tabelas de dupla entrada ( ou contingência).

• Cada elemento do corpo da tabela dá a • Cada elemento do corpo da tabela dá a frequência observada das realizações simultâneas das duas variáveis.

Page 19: Aula 2   resumo de dados

• A variável X apresente somente dois valores, sim e não, que representaremos por sim e não. a variável Y apresenta valores inteiros 1,2 ou 3.

• Podemos escrever a tabela de frequênciasconjunta de X e Y:

(X,Y) Frequência

(sim,1) 4

Tabela de frequência marginal de X

(sim,1) 4

(sim,2) 2

(sim,3) 2

(nao,1) 5

(nao,2) 6

(nao,3) 1

Total 20

X\Y 1 2 3 Total

sim 4 2 2 8

nao 5 6 1 12

Total 9 8 3 20

Tabela de frequência marginal de Y

Page 20: Aula 2   resumo de dados

• Tabelas de frequências marginal ou individual

X freq

sim 8

nao 12

Total 20

Y 1 2 3 Total

freq 9 8 3 20

Total 20

Page 21: Aula 2   resumo de dados

Exercício

• Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência.

Fundamental Médio Superior Total proc.Capital 4 5 2 11Interior 3 7 2 12Outra 5 6 2 13

Total grau 12 18 6 36

Page 22: Aula 2   resumo de dados

Gráficos para variáveisqualitativas

• Existem vários gráficos para representar variáveis qualitativas, os mais usados são: gráfico em barras e composição em setores, “pizza”.

GRÁFICO EM BARRASGRÁFICO EM BARRAS

Consiste em construir retângulos ou barras, em que uma dasdimensões é proporcional á magnitude a ser representada(frequência absoluta ou relativa) e a outra igual para todasas barras.

Page 23: Aula 2   resumo de dados

Gráficos para variáveisqualitativas

50%

60%

Superior

0%

10%

20%

30%

40%

Fundamental Médio Superior 0 5 10 15 20

Fundamental

Médio

Page 24: Aula 2   resumo de dados

Gráficos para variáveisqualitativas

COMPOSIÇÃO EM SETORES

Representa a composição, geralmente em porcentagem, departes de um todo. Consiste de um círculo de raioarbitrário, dividido em setores, que correspondem às partesde maneira proporcionalde maneira proporcional

12; 33,3%

18; 50%

6; 16,7%

Fundamental

Médio

Superior

Page 25: Aula 2   resumo de dados

Gráficos para variáveisquantitativas

Considera-se mais representações gráficas para variáveis quantitativas, tais como, gráfico de dispersão, ramo e folhas, histograma.

GRÁFICOS DE DISPERSÃO UNIDIMENSIONALGRÁFICOS DE DISPERSÃO UNIDIMENSIONAL

1) Valores representados por pontos ao longo da reta, valores repetidos são acompanhados de um número que indica as repetições;

2) Os pontos repetidos são empilhados um em cima do outro.

Page 26: Aula 2   resumo de dados

Gráficos para variáveisquantitativas

5

6

7

8

4 5 7 3

0 2 4 6

0

1

2

3

4

5

0 1 2 3 4 5 6

Page 27: Aula 2   resumo de dados

Gráficos para variáveisquantitativas

HISTOGRAMA

Gráfico de barras contínuas, com as bases proporcionais aos intervalos das classes e a área de cada retângulo proporcional à respectiva frequência.

Pode-se considerar tanto a freq. absoluta como a relativa.Pode-se considerar tanto a freq. absoluta como a relativa.

Para que a área do retângulo seja proporcional a fi, a sua altura deve ser proporcional a fi/i, em que i representa a amplitude do i-ésimo intervalo.

Page 28: Aula 2   resumo de dados

Gráficos para variáveisquantitativas

Page 29: Aula 2   resumo de dados

Ramo e folhas

• Tanto o histograma como os gráficos em barras dão uma idéia da forma da distribuição.

• Um procedimento alternativo para resumir • Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de obter uma idéia da forma de sua distribuição é o ramo e folhas. A vantagem é que não perde-se a informação sobre os dados.

Page 30: Aula 2   resumo de dados

• Não existe uma regra fixa para construir o gráfico, a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita. Para a variável salários as observações 4,00 e 4,56, o ramo é o 4 e 00 e 56 são as folhas.

Page 31: Aula 2   resumo de dados

4 00 565 25 736 26 66 867 39 44 598 12 46 74 959 13 35 77 80

10 53 7611 06 5912 00 7913 23 60 8514 69 7114 69 7115 9916 22 6117 2618 7519 4020212223 30

Page 32: Aula 2   resumo de dados

Exercício

• Construa a tabela de frequências para as variáveis e represente-as graficamente: Estado Civil, Região de Procedência, Salário e Idade.Salário e Idade.

• Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência e também para estado civil e número de filhos.