aula 2 resumo de dados

Post on 13-Jun-2015

12.635 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Resumo de Dados

Aula 2

Profa. Dra. Juliana Garcia Cespedes

Dep. de Matemática e Computação

UNIFEI - Itajubá

ProblemaUm pesquisador está interessado em fazer um

levantamento sobre alguns aspectos socioeconômicosdos empregados da seção de orçamentos de umaempresa. Para isso, ele colheu seis informações sobreos 36 empregados:

1. Estado civil;1. Estado civil;

2. Grau de instrução;

3. Número de filhos;

4. Salário;

5. Idade;

6. Região de procedência.

Dados

Tipos de variáveis• Cada informação em estudo chama-se VARIÁVEL.

• Para representar cada uma das variáveis em estudo atribui-se uma letra maiúscula, por exemplo, a letra X, para identificá-las.

Variável RepresentaçãoVariável Representação

Estado civil X

Grau de instrução Y

Número de filhos Z

Salário S

Idade U

Região de procedência V

Tipos de variáveis• As VARIÁVEIS são classificadas de acordo com o seu

conteúdo e para cada tipo existe um tratamento estatístico diferente.

Nominal

QualitativaQualitativa

Ordinal

Variável

Discreta

Quantitativa

Contínua

Tipos de variáveis• VARIÁVEL QUALITATIVA:

– Apresentam como possíveis realizações uma qualidade (ouatributo) do indivíduo pesquisado, exemplo, sexo, educação,estado civil, etc.

• Nominal: não existe nenhuma ordenação nas possíveis realizações.

(sexo, estado civil)

• Ordinal: existe uma ordem nos seus resultados.• Ordinal: existe uma ordem nos seus resultados.(educação, classe social)

• VARIÁVEL QUANTITATIVA:– Apresentam como possíveis realizações números resultantes de

uma contagem ou mensuração, exemplo, número de filhos, salário,idade, etc.

• Discreta: os valores pertencem a um conjunto finito ou enumerável denúmeros. (número de filhos)

• Contínua: os valores pertencem a um intervalo de números reais.

(peso, altura)

Tipos de variáveis• Classifique as variáveis da pesquisa

socioeconômica:

1. Estado civil;

2. Grau de instrução;

3. Número de filhos;

4. Salário;

5. Idade;

6. Região de procedência.

Distribuição de frequências• Quando se estuda uma variável, o maior interesse

do pesquisador é conhecer o comportamentodessa variável, analisando a ocorrência de suaspossíveis realizações.

• É fácil analisar as variáveis, conhecer o seucomportamento, utilizando a Tabela 1?

Dados

Distribuição de frequências• Podemos resumir as informações contidas na

Tabela 1 construindo tabelas de frequências paracada uma das variáveis pesquisadas.

• Uma tabela de frequências possui informações• Uma tabela de frequências possui informaçõessobre o número de pesquisados, a porcentagem,a proporção e a proporção acumulada de cadaclasse da variável analisada.

Distribuição de frequências

• Tabela de frequências da variável grau de instrução:

Grau de instrução

Frequência

fi

Frequênciarelativa

fri

Frequênciaacumulada

fai

Porcentagem

100 frifi fri fai 100 fri

Fundamental 12 12/36 =0,333 0,333 33,3%

Médio 18 18/36 =0,500 0,833 50,0%

Superior 6 6/36 =0,167 1,000 16,7%

Total 36 36/36 =1,000 100%

Distribuição de frequências

• Observando os resultados da segunda coluna, vê-se que dos 36 empregados da companhia, 12 têm ensino fundamental, 18 ensino médio e 6 possuem curso superior.

• A frequência relativa e a porcentagem são • A frequência relativa e a porcentagem são bastante úteis quando decide-se comparar o resultado de pesquisas distintas, por exemplo, quando deseja-se pesquisar o total de empregados da companhia.

• A frequência acumulada é utilizada para verificar onde encontra-se a maior parte da população pesquisada.

Distribuição de frequências

• Construa a tabela de frequências para as variáveis estado civil, número de filhos e região de procedência :

Distribuição de frequências

• Quando a variável é contínua, a construção da tabela de frequências exige certo cuidado.

• Se indicarmos cada classe que aparece na variável salário em uma tabela de frequências, não salário em uma tabela de frequências, não resumiremos as 36 observações num grupo menor, pois não existem observações iguais.

• A solução é agrupar os dados por faixas de salário.

Distribuição de frequências

• Tabela de frequências dos salários dos empregados

Classe de salários

Frequência

fi

Frequênciarelativafri

Frequênciaacumuladafai

Porcentagem

100 fi

[4,00; 8,00) 10 10/36 =0,278 0,278 27,78%

[8,00; 12,00) 12 12/36 =0,333 0,611 33,33%

[12,00; 16,00) 8 8/36 =0,222 0,833 22,22%

[16,00; 20,00) 5 5/36 =0,139 0,972 13,89%

[20,00; 24,00) 1 1/36 =0,029 1,000 2,78%

Total 36 1 100%

Distribuição de frequências

• Procedendo deste modo, perde-se alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a não ser que investigamos a tabela original.

• Uma forma de interpretação é dizer que todos os oito salários são iguais ao ponto médio, 14.

• Sugere-se entre 5 a 15 classes da mesma amplitude.

Tabela de frequências conjunta

• É muito comum estarmos interessados no comportamento conjunto de várias variáveis.

• Por exemplo, uma pesquisa é feita entre alunos do primeiro ano da faculdade e perguntou-se do primeiro ano da faculdade e perguntou-se aos alunos se trabalhavam (variável X) e o número de vestibulares prestados (variável Y).

X não sim não não não sim sim não sim sim

Y 1 1 2 1 1 2 3 1 1 1

X não não sim não sim não não não sim não

Y 2 2 1 3 2 2 2 1 3 2

• Os dados são resumidos em tabelas de dupla entrada ( ou contingência).

• Cada elemento do corpo da tabela dá a • Cada elemento do corpo da tabela dá a frequência observada das realizações simultâneas das duas variáveis.

• A variável X apresente somente dois valores, sim e não, que representaremos por sim e não. a variável Y apresenta valores inteiros 1,2 ou 3.

• Podemos escrever a tabela de frequênciasconjunta de X e Y:

(X,Y) Frequência

(sim,1) 4

Tabela de frequência marginal de X

(sim,1) 4

(sim,2) 2

(sim,3) 2

(nao,1) 5

(nao,2) 6

(nao,3) 1

Total 20

X\Y 1 2 3 Total

sim 4 2 2 8

nao 5 6 1 12

Total 9 8 3 20

Tabela de frequência marginal de Y

• Tabelas de frequências marginal ou individual

X freq

sim 8

nao 12

Total 20

Y 1 2 3 Total

freq 9 8 3 20

Total 20

Exercício

• Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência.

Fundamental Médio Superior Total proc.Capital 4 5 2 11Interior 3 7 2 12Outra 5 6 2 13

Total grau 12 18 6 36

Gráficos para variáveisqualitativas

• Existem vários gráficos para representar variáveis qualitativas, os mais usados são: gráfico em barras e composição em setores, “pizza”.

GRÁFICO EM BARRASGRÁFICO EM BARRAS

Consiste em construir retângulos ou barras, em que uma dasdimensões é proporcional á magnitude a ser representada(frequência absoluta ou relativa) e a outra igual para todasas barras.

Gráficos para variáveisqualitativas

50%

60%

Superior

0%

10%

20%

30%

40%

Fundamental Médio Superior 0 5 10 15 20

Fundamental

Médio

Gráficos para variáveisqualitativas

COMPOSIÇÃO EM SETORES

Representa a composição, geralmente em porcentagem, departes de um todo. Consiste de um círculo de raioarbitrário, dividido em setores, que correspondem às partesde maneira proporcionalde maneira proporcional

12; 33,3%

18; 50%

6; 16,7%

Fundamental

Médio

Superior

Gráficos para variáveisquantitativas

Considera-se mais representações gráficas para variáveis quantitativas, tais como, gráfico de dispersão, ramo e folhas, histograma.

GRÁFICOS DE DISPERSÃO UNIDIMENSIONALGRÁFICOS DE DISPERSÃO UNIDIMENSIONAL

1) Valores representados por pontos ao longo da reta, valores repetidos são acompanhados de um número que indica as repetições;

2) Os pontos repetidos são empilhados um em cima do outro.

Gráficos para variáveisquantitativas

5

6

7

8

4 5 7 3

0 2 4 6

0

1

2

3

4

5

0 1 2 3 4 5 6

Gráficos para variáveisquantitativas

HISTOGRAMA

Gráfico de barras contínuas, com as bases proporcionais aos intervalos das classes e a área de cada retângulo proporcional à respectiva frequência.

Pode-se considerar tanto a freq. absoluta como a relativa.Pode-se considerar tanto a freq. absoluta como a relativa.

Para que a área do retângulo seja proporcional a fi, a sua altura deve ser proporcional a fi/i, em que i representa a amplitude do i-ésimo intervalo.

Gráficos para variáveisquantitativas

Ramo e folhas

• Tanto o histograma como os gráficos em barras dão uma idéia da forma da distribuição.

• Um procedimento alternativo para resumir • Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de obter uma idéia da forma de sua distribuição é o ramo e folhas. A vantagem é que não perde-se a informação sobre os dados.

• Não existe uma regra fixa para construir o gráfico, a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita. Para a variável salários as observações 4,00 e 4,56, o ramo é o 4 e 00 e 56 são as folhas.

4 00 565 25 736 26 66 867 39 44 598 12 46 74 959 13 35 77 80

10 53 7611 06 5912 00 7913 23 60 8514 69 7114 69 7115 9916 22 6117 2618 7519 4020212223 30

Exercício

• Construa a tabela de frequências para as variáveis e represente-as graficamente: Estado Civil, Região de Procedência, Salário e Idade.Salário e Idade.

• Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência e também para estado civil e número de filhos.

top related