3a lista exercicios - respostas

12
MÉTODOS EMPÍRICOS DE PESQUISA II Profa. Daniela Schettini 3ª. Lista de Exercícios Obs.: os cálculos da ANOVA devem ser mostrados passo a passo (como será exigido na prova). Utilizem o Excel somente se quiserem confirmar o resultado. 1) Uma organização mexicana coletou informações sobre episódios violentos em diversas cidades no mundo em 2011. A organização quer determinar se existe alguma diferença no número médio de episódios violentos nas 4 primeiras cidades dos primeiros países citados.. Para isso coletou uma amostra de registros durante seis dias. Usando um nível de significância de 5%, ela pode concluir que existe uma diferença no número médio de episódios? Defina as hipóteses (por média e por variância) e construa a ANOVA. Com relação às medias de episódios violentos em cada cidade, as hipóteses são: { H 0 : μ San Pedro Sula =μ CiudadJuarez =μ Maceió =μ Caracas =μ H 1 : aomenos uma das medias difere das demais que equivalem, respectivamente, às seguintes hipóteses em termos de episódios violentos cometidos em cada cidade: { H 0 : MQE=MQD ( ou variância entre =variância dentro ) H 1 : MQE>MQD ( ou variância entre > variância dentro ) onde MQE é a media dos quadrados entre cidade ou a estimativa da variância populacional entre cidades (grupos ou tratamentos) e MQD é a media dos quadrados dentro das cidades ou a estimativa da variância populacional dentro das cidades (grupos ou tratamentos). A tabela Anova tem o seguinte formato: ANOVA San Pedro Sula (Honduras) Ciudad Juarez (México) Maceió (Brasil) Caracas (Venezuela) 13 21 12 16 15 13 14 17 14 18 15 18 15 19 13 15 14 18 12 20 15 19 15 18

Upload: arthur-meibak

Post on 23-Sep-2015

238 views

Category:

Documents


1 download

DESCRIPTION

Xoxotaria do Cobrinha

TRANSCRIPT

MTODOS EMPRICOS DE PESQUISA IIProfa. Daniela Schettini3. Lista de ExercciosObs.: os clculos da ANOVA devem ser mostrados passo a passo (como ser exigido na prova). Utilizem o Excel somente se quiserem confirmar o resultado.

1) Uma organizao mexicana coletou informaes sobre episdios violentos em diversas cidades no mundo em 2011. A organizao quer determinar se existe alguma diferena no nmero mdio de episdios violentos nas 4 primeiras cidades dos primeiros pases citados.. Para isso coletou uma amostra de registros durante seis dias. Usando um nvel de significncia de 5%, ela pode concluir que existe uma diferena no nmero mdio de episdios? Defina as hipteses (por mdia e por varincia) e construa a ANOVA.

San Pedro Sula (Honduras)Ciudad Juarez (Mxico)Macei (Brasil)Caracas (Venezuela)

13211216

15131417

14181518

15191315

14181220

15191518

Com relao s medias de episdios violentos em cada cidade, as hipteses so:

que equivalem, respectivamente, s seguintes hipteses em termos de episdios violentos cometidos em cada cidade:

onde MQE a media dos quadrados entre cidade ou a estimativa da varincia populacional entre cidades (grupos ou tratamentos) e MQD a media dos quadrados dentro das cidades ou a estimativa da varincia populacional dentro das cidades (grupos ou tratamentos).

A tabela Anova tem o seguinte formato:ANOVA

Fonte da variaoSQglMQF

Entre gruposSQEk 1 MQEMQE/MQD

Dentro dos gruposSQDn kMQD

TotalSQTn 1

No problema, k o nmero de (fatores) cidades, ou seja, k = 4, enquanto n o nmero total de observaes, ou seja, n = 24 (pois h 6 observaes em cada uma das 4 amostras).

A soma de quadrados entre (cidades) dada por:

onde o tamanho da amostra da cidade i , a media amostral da cidade i , enquanto a media global (ou das medias) das amostras. Por sua vez,

onde o valor da observao j da amostra da cidade i.Quando as amostras tm o mesmo tamanho,

Para todas as amostras, e com os valores apresentados para cada amostra, temos que:

Assim, a mdia global :

A soma dos quadrados entre , portanto,

A soma de quadrados dentro (das cidades) dada por:

onde o valor da varincia da amostra da cidade i , que calculada por:

Para todas as amostras, e com os valores apresentados para cada amostra, temos que:

A soma dos quadrados dentro , portanto,

Como a soma de quadrados total (SQT) equivale soma dos quadrados entre (SQE) as cidades e dentro (SQD) das cidades, ento:

Os graus de liberdade entre cidades (grupos) igual k 1 = 3, enquanto dentro das cidades igual n k = 20. Logo, os graus de liberdade totais so dados por n 1 = 23.

A media dos quadrados entre cidades (MQE) dada por:

A media dos quadrados dentro das cidades (MQD) dada por:

Desta forma, o valor observado da estatstica F

sendo que F segue distribuio de Fischer-Snedecor com (3, 20) graus de liberdade.

Desta maneira, a tabela de anlise de varincia

ANOVA

Fonte da variaoSQGlMQF

Entre grupos87,79329,269,12

Dentro dos grupos64,17203,21

Total151,9623

Considerando-se um nvel de significncia de 0,05, da distribuio de Fischer-Snedecor com (3, 20) graus de liberdade, temos que a regio crtica definida pelo intervalo [3,098; +).

Como o valor observado da estatstica F pertence regio crtica, ento se rejeita a hiptese (nula) de que o nmero mdio de episdios violentos cometidos em cada cidade seja igual.

2. Com os dados disponveis da Anlise de Varincia abaixo, responda:a) Complete a tabela da Anova.b) Quantos grupos esto sendo testados? c) Defina as hipteses (por mdia e por varincia).d) Teste a hiptese com 5% de significncia.

ANOVA

Fonte da variaoSQglMQF

Entre grupos28,192,31

Dentro dos grupos124,06

Total15

a) No necessrio calcular, por exemplo, a SQ entre grupos, a SQ dentro dos grupos e a SQ Total. Com apenas dois deles, possvel chegar ao terceiro resultado, via adio ou subtrao. O mesmo vale para os Graus de Liberdade. Tambm se sabe que MQ dada pela expresso:Logo, possvel encontra o resultado por meio da diviso ou multiplicao.

ANOVA

Fonte da variaoSQglMQF

Entre grupos28,1939,392,31

Dentro dos grupos 48,72124,06

Total76,9115

b) O Grau de Liberdade entre os grupos igual: n 1 = 3

logo, calcula-se que o nmero de grupos que esto sendo testados igual a 4.

c) Com relao s medias, as hipteses so:

que equivalem, respectivamente, s seguintes hipteses em termos de varincia:

d) Considerando-se um nvel de significncia de 0,05, da distribuio de Fischer-Snedecor com (3, 12) graus de liberdade, temos que a regio crtica definida pelo intervalo [3,49; +).

Como o valor observado da estatstica F pertence regio crtica, ento se rejeita a hiptese (nula), mantendo, portanto, a hiptese alternativa de que ao menos uma mdia difere das demais.

3) Uma pesquisadora est interessada no efeito que o tipo de residncia tem sobre a felicidade pessoal de estudantes universitrios. Para isso, ela seleciona amostras de estudantes que moram em dormitrios do campus, em apartamentos fora do campus e em sua casa e pede a 12 entrevistados que classifiquem seu grau de felicidade em uma escala de 1 (no feliz) a 10 (feliz). Com os resultados a seguir, teste se a felicidade difere por tipo de residncia. Defina as hipteses (por mdia e por varincia) e teste com 5% de significncia.ANOVA

Fonte da variaoSQglMQF

Entre grupos69,50234,75

Dentro dos grupos6,7590,75

Total76,2511

Com relao s medias das felicidades pessoais de estudantes universitrios em cada tipo de residncia, as hipteses so:

que equivalem, respectivamente, s seguintes hipteses em termos de varincias:

onde MQE a media dos quadrados entre tipos de residncia ou a estimativa da varincia populacional entre tipos de residncia (grupos ou tratamentos) e MQD a media dos quadrados dentro dos tipos de residncia ou a estimativa da varincia populacional dentro dos tipos de residncia (grupos ou tratamentos).

Considerando-se um nvel de significncia de 0,05, da distribuio de Fischer-Snedecor com (2, 9) graus de liberdade, temos que a regio crtica definida pelo intervalo [4,256; +).

Da tabela, temos:

Como o valor observado da estatstica F pertence regio crtica, ento rejeita-se a hiptese (nula) de que as felicidades pessoais mdias de estudantes universitrios em cada tipo de residncia sejam iguais.

4) Procura-se investigar se a mdia da expectativa de vida dos pases difere de acordo com o nvel de qualidade de direitos polticos. Coletaram-se dados para as duas variveis no Banco Mundial e na Freedom House, respectivamente. Os pases foram agrupados em trs categorias: baixa qualidade de direitos polticos, mdia e alta qualidade. Aplicando a metodologia da Anova, obteve-se o resultado abaixo.

a) Defina as hipteses nula e alternativa em termos de mdia e varincia.b) Complete a tabela da Anova.c) O que possvel concluir? Analise pelo valor do F e pelo p-valor. Justifique.

ANOVA

Fonte da variaoSQglMQFvalor-PF crtico

Entre grupos2842.721421.360.0000

Dentro dos grupos16349.3517493.96

Total19192.08

a) Com relao s medias das variveis que representam a qualidade de direitos polticos, as hipteses so:

que equivalem, respectivamente, s seguintes hipteses em termos de varincias:

b) ANOVAFonte da variaoSQglMQFvalor-PF crtico

Entre grupos2842.722*1421.3615,127*0.00002,9957**

Dentro dos grupos16349.3517493.96

Total19192.08176

* Lembrando que:

c) Considerando-se um nvel de significncia de 0,05, da distribuio de Fischer-Snedecor com (2, 174) graus de liberdade, temos que a regio crtica definida pelo intervalo [2,9957; +)**.

Como o valor observado da estatstica F pertence regio crtica, ento se rejeita a hiptese (nula) de que o nvel de qualidade de direitos polticos igual.

Analisando pelo p-valor, sabe-se que se p-valor < nvel de significncia, rejeita-se a hiptese nula. Dado o p-valor de 0%, para um nvel de significncia de 5%, rejeita-se H0.

5) Uma consultoria busca identificar se alguns investidores estrangeiros tm preferncia por investir em determinados setores, ou a distribuio do investimento feita aleatoriamente entre as atividades. Para isso, quer testar se h diferena de investimento mdio estrangeiro entre os setores. Coletou uma amostra de 32 investimentos separados em 4 reas: financeira, infraestrutura, alimentos e energia.

a) Defina as hipteses nula e alternativa em termos de mdia e varincia.b) Complete a tabela da Anova.c) Como voc concluiria esse estudo? Analise pelo valor do F e pelo p-valor. Justifique.

ANOVA

Fonte da variaoSQglMQFvalor-PF crtico

Entre grupos63,25321,0830,986

Dentro dos grupos28

Total12361,50

a) Com relao s medias dos investimentos estrangeiros nos quatro setores, as hipteses so:

que equivalem, respectivamente, s seguintes hipteses em termos de varincias:

b) ANOVA

Fonte da variaoSQglMQFvalor-PF crtico

Entre grupos63,25321,0830,0480,9862,9467*

Dentro dos grupos12298,2528439,223

Total12361,5031

c) Considerando-se um nvel de significncia de 0,05, da distribuio de Fischer-Snedecor com (2, 28) graus de liberdade, temos que a regio crtica definida pelo intervalo [2,9467; +)*.

Como o valor observado da estatstica F no pertence regio crtica, ento no se rejeita a hiptese (nula) e conclui-se que os investidores no mostraram preferncia entre os setores de atividade.

Analisando pelo p-valor, sabe-se que se p-valor < nvel de significncia, rejeita-se a hiptese nula. Dado o p-valor de 98,6%, para um nvel de significncia de 5%, no se rejeita H0.

6) Um pesquisador coletou os seguintes dados sobre os anos de instruo (X) e o nmero de filhos (Y) para uma amostra de 10 adultos casados. YXConsiderando e :a) Escreva a regresso (modelo terico e modelo estimado)b) Construa a ANOVA. O que se pode concluir respeito do modelo (usar 5% de significncia)?c) Calcule e interprete o R2

212

114

017

310

58

39

412

214

018

216

a) Modelo terico: Modelo estimado:

b) Com os valores e podemos calcular os valores estimados da varivel explicada, que so dados por: .Tendo os valores estimados , a media amostral de Y , podemos calcular a soma de quadrados da regresso (SQReg) e a soma de quadrados dos resduos (SQRes) com as seguintes frmulas:

A tabela abaixo mostra os respectivos valores:

2122,610,17060,3758

1141,790,17140,6178

0170,552,73740,2976

3103,441,53760,1936

584,274,27250,5373

393,852,73410,7285

4122,610,17061,9238

2141,790,17140,0458

0180,134,27660,0174

2160,961,54011,0837

soma17,78225,8212

media2,20

Assim,

Com estes valores, podemos ento calcular:

que esto apresentados na tabela abaixo:ANOVA

glSQMQF

Regresso117,782217,782224,4380

Resduo85,82120,7277

Total923,6033

O teste F envolve as seguintes hipteses:, o que equivale a

Com nvel de significncia de 0,05 e considerando-se a de Fischer-Snedecor com (1, 8) graus de liberdade, temos que a regio crtica definida pelo intervalo [5,318; +).

Como o valor observado da estatstica F pertence regio crtica, ento se rejeita a hiptese (nula) de que o nvel de instruo da pessoa (X) no afeta o nmero de filhos que se espera que esta pessoa tenha (Y) ou que o modelo bom a 5%.

c) O valor do coeficiente de determinao R2

o que indica que cerca de 75% das variaes do nmero de filhos existentes entre adultos com diferentes nveis de instruo existem justamente por causa destas variaes no nvel de instruo.

7) Um consultor est tentando explicar as vendas que ocorrem em uma rede de lojas de eletrodomsticos. Para isso, coletou a amostra abaixo.

ANOVA

glSQMQF

Regresso3241.110,92880370,3092,858

Resduo4112.476,57328119,143

Total7353.537,067

a) Qual a modelo de regresso proposto pelo consultor?b) Com os resultados da Anova, verifique se o modelo do consultor bom a 5% de significncia. Calcule e interprete o R2.

a) Modelo terico:

b) Para calcular se o modelo construdo pelo consultor bom, devemos fazer o teste F:

O teste F envolve as seguintes hipteses:, o que equivale a

Com nvel de significncia de 0,05 e considerando-se a de Fischer-Snedecor com (3, 4) graus de liberdade, temos que a regio crtica definida pelo intervalo [6,591; +).

Como o valor observado da estatstica F no pertence regio crtica, ento no se rejeita a hiptese (nula) de que as variveis independentes (X) no afetem o valor das vendas mensais (Vendas) ou que o modelo no seja bom a 5%.

Para calcularmos e interpretarmos o R devemos encontrar o coeficiente de determinao R2 deste modelo de regresso, cujo valor :

o que indica que cerca de 68% das variaes do valor das vendas mensais (Vendas) so explicadas pelas variaes das variveis X.

8) Com os resultados da ANOVA construda para um modelo de regresso, responda:ANOVA

glSQMQF

Regresso50,2487790,04975684,78346

Resduo380,0223010,000587

Total430,27108

a) H quantas variveis independentes no modelo?b) Qual o tamanho da amostra?c) O que se pode concluir sobre a validade da regresso?d) Calcule e interprete o R2.

a) O grau de liberdade da regresso 5 e como ele igual a (k 1), onde k o nmero de variveis independentes no modelo, considerando o intercepto, ento h 5 variveis independentes no modelo.b) O grau de liberdade total 43 e como ele igual a (n 1), onde n o tamanho da amostra, ento h 44 observaes.c) O valor observado da estatstica de teste (Fobs) igual a 84,78. Considerando-se um nvel de 0,05 e o fato de que a estatstica de teste segue uma distribuio de Fischer-Snedecor com (5, 38) graus de liberdade, temos que a regio crtica definida pelo intervalo [2,463; +). Como o valor observado da estatstica F pertence regio crtica, ento se rejeita a hiptese (nula) de que a regresso no seja vlida.d) O valor do coeficiente de determinao R2

o que indica que quase 92% das variaes da varivel explicada causada pelas variaes das variveis explicativas includas no modelo.