análise exploratória de dados

26
Análise Exploratória de Dados Aula LiG #12 – 10 de junho de 2006.

Upload: ornice

Post on 19-Mar-2016

66 views

Category:

Documents


0 download

DESCRIPTION

Análise Exploratória de Dados. Aula LiG #12 – 10 de junho de 2006. Objetivos da aula. Resolver exercícios do livro-texto com o auxílio do R. 1) Exercício 29. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Análise Exploratória de Dados

Análise Exploratória de Dados

Aula LiG #12 – 10 de junho de 2006.

Page 2: Análise Exploratória de Dados

Objetivos da aula

Resolver exercícios do livro-texto com o auxílio do R.

Page 3: Análise Exploratória de Dados

1) Exercício 29

Uma amostra de dez casais e seus respectivos salários anuais (em salários mínimos) foi colhida num certo bairro conforme a tabela a seguir

Mulher (X) 5 10 10 5 10 10 15 10 10 15Homem(Y) 10 10 10 15 15 15 15 20 20 20

Page 4: Análise Exploratória de Dados

1) Exercício 29

(a) Obtenha um sumário para os salários dos homens e das mulheres contendo, média, desvio-padrão, esquema dos cinco números.

(b) Construa o diagrama de dispersão dos salários das mulheres versus salários dos homens.

(c ) Calcule a correlação entre salários de mulheres e de homens.

Page 5: Análise Exploratória de Dados

1) Exercício 29

(d) Qual é o salário médio familiar? E a variância?

(e) Se o homem é descontado 8% e a mulher 6%, qual é o salário líquido anual médio familiar? E a variância?

Page 6: Análise Exploratória de Dados

2) Exercício 26

Muitas vezes a determinação da capacidade de produção instalada para certo tipo de indústria em certas regiões é um processo difícil e custoso. Como alternativa, pode-se estimar a capacidade de produção através da escolha de uma outra variável de medida mais fácil e que esteja linearmente relacionada com ela.

Page 7: Análise Exploratória de Dados

2) Exercício 26

Suponha que foram observados os valores para as variáveis: capacidade de produção instalada, potência instalada e área construída. Com base num critério estatístico, qual das variáveis você escolheria para estimar a capacidade de produção instalada? Por que?

Page 8: Análise Exploratória de Dados

2) Exercício 26

Dados:

capacidade (ton.) 4 5 4 5 8 9 10 11 12 12potência (1000kW) 1 1 2 3 3 5 5 6 6 6área (100m2) 6 7 10 10 11 9 12 10 11 14

Page 9: Análise Exploratória de Dados

3) Exercício 22

Uma pesquisa para verificar a tendência dos alunos a prosseguir os estudos, segundo a classe social do respondente, mostrou o seguinte quadro:

Pretende continuar? Alta Média Baixa Totalsim 200 220 380 800não 200 280 720 1200Total 400 500 1100 2000

Page 10: Análise Exploratória de Dados

3) Exercício 22

Pretende continuar? Alta Média Baixa Totalsim 200 220 380 800não 200 280 720 1200Total 400 500 1100 2000

a) Você diria que a distribuição de respostas afirmativas é similar à de respostas negativas? b) Existe dependência entre as duas variáveis: classe social e resposta a “pretende continuar os estudos”? Determine uma medida quantitativa da dependência.

c) Se dos 400 estudantes da classe alta, 160 escolhessem continuar os estudos e 240 não, você mudaria a suaconclusão? Justifique

Page 11: Análise Exploratória de Dados

4) Exercício 30 O departamento de vendas de certa companhia foi

formado há um ano com a admissão de 15 vendedores.

Nessa época foram observados para cada um dos vendedores os valores de três variáveis:

teste: resultado em um teste apropriado para vendedores;

exp: experiência de vendas; concger: conceito do gerente de venda, quanto ao

currículo do candidato;

Page 12: Análise Exploratória de Dados

4) Exercício 30 O diretor da companhia resolveu agora

ampliar o quadro de vendedores e pede sua colaboração para responder a algumas perguntas.

Para isso, ele lhe dá informações adicionais sobre duas variáveis:

vendas: volume médio mensal de vendas em salários mínimos;

zona: zona da capital para a qual o vendedor foi designado.

Page 13: Análise Exploratória de Dados

4) Exercício 30 Os dados estão armazenas no arquivo exerc30.txt

com os nomes das variáveis na primeira linha. Mais especificamente, o diretor pede que as

seguintes tarefas sejam realizadas: a) Histograma das vendas em classes de amplitude

10, tendo por limite inferior da primeira classe o valor 15.

Page 14: Análise Exploratória de Dados

4) Exercício 30 b) Média e variância das vendas. c) Suponha que um vendedor seja

considerado excepcional se sua venda está acima de dois desvios-padrões da média. Há vendedores excepcionais entre os 15 iniciais?

d) O diretor de vendas anunciou que transferirá para outra praça todos os vendedores cujas vendas foram inferior ao primeiro quartil da distribuição. Qual o mínimo de vendas para não ser transferido?

Page 15: Análise Exploratória de Dados

4) Exercício 30 e) Os vendedores argumentam com o diretor que

esse critério não é justo, pois há zonas de venda privilegiadas. A quem você daria razão? Justifique a sua resposta.

f) Qual das três variáveis iniciais é mais importante para julgar o futuro candidato ao emprego? Justifique.

Page 16: Análise Exploratória de Dados

4) Exercício 30 g) Qual é o grau de associação entre o conceito do

gerente e a zona a que o vendedor foi designado? Você tem alguma explicação para esse resultado?

h) Qual é o grau de associação entre o conceito do gerente e o resultado no teste? E entre zona e vendas?

Page 17: Análise Exploratória de Dados

5) Exercício 20

Na tabela a seguir, você concluiria que o tipo de atividade está relacionado ao fato de as embarcações serem de propriedade estatal ou particular? Encontre uma medida de dependência entre as variáveis.

propriedade ativ. costeira ativ. fluvial ativ. internacional totalestatal 5 141 51 197particular 92 231 48 371total 97 372 99 568

Page 18: Análise Exploratória de Dados

6) Exercício 11 (cap. 15) Deseja-se verificar o efeito do tipo de

impermeabilização (i,ii,iii ou iv) em lajes de concreto. As quantidades de água que passaram pela laje, em cada tipo, foram medidas durante um mês, obtendo-se a seguinte tabela:

i ii iii iv56 64 45 4255 61 46 3962 50 45 4559 55 39 4360 56 43 41

Page 19: Análise Exploratória de Dados

6) Exercício 11 (cap. 15)

Você diria que há alguma associação entre o tipo de impermeabilização e a quantidade de água que passa pela laje? Justifique a sua resposta.

Page 20: Análise Exploratória de Dados

7) Exercício 19 (cap. 16)

Os dados a seguir correspondem às variáveis renda familiar e gasto com alimentação numa amostra de dez famílias.

renda gasto3 1.55 2

10 620 1030 1550 2070 25

100 40150 60200 80

Page 21: Análise Exploratória de Dados

7) Exercício 19 (cap. 16) Construa o diagrama de dispersão de renda versus gasto com

alimentação e calcule a correlação amostral. Obtenha a reta de mínimos quadrados. Estime o gasto com alimentação para uma família de renda 170.

Page 22: Análise Exploratória de Dados

8) Novo medicamento

Num estágio do desenvolvimento de uma nova droga para uma alergia, um experimento foi conduzido para estudar o quanto diferentes dosagens do medicamento afeta a duração do alívio dos sintomas da alergia.

Dez pacientes foram incluídos no experimento. Cada paciente recebe uma dosagem específica do medicamento e é monitorado.

Page 23: Análise Exploratória de Dados

8) Novo medicamento

Os dados estão na tabela abaixo

DOSE DURAÇÃO3 93 54 125 96 146 167 228 188 249 22

Page 24: Análise Exploratória de Dados

8) Novo medicamento

Obtenha o diagrama de dispersão de dose versus duração do alívio.

Estime a duração do alívio para uma dose de 7,5.

Calcule a correlação.Obtenha a reta de mínimos quadrados.

Faça o diagrama de dispersão dos valores ajustados versus resíduos do modelo ajustado.

Page 25: Análise Exploratória de Dados

9) Receitas de pão Três receitas de pão vão ser comparadas

com respeito à densidade do pão. Cinco pães foram feitos segundo cada uma das receitas. Os resultados estão na tabela a seguir:

receita observações I 0.95 0.86 0.71 0.72 0.74II 0.71 0.85 0.62 0.72 0.64III 0.69 0.68 0.51 0.73 0.44

Page 26: Análise Exploratória de Dados

9) Receitas de pão Você diria que há alguma associação entre receita e

densidade?

Obtenha os boxplots das densidades segundos as receitas.

Calcule o R2.