lista de exercicios_estatistica_descritiva para ciências humanas

9
R7.1) O problema mais grave do estado do RJ Considere uma pesquisa por amostragem feita em 1986 junto à população do estado do Rio de Janeiro. Foram ouvidas 1.230 pessoas que, entre outras coisas, apontaram qual era, em sua opinião, o problema mais grave do estado naquele momento. Com base nos dados brutos, foi obtida a tabela a seguir. Frequências e percentuais dos 1.230 respondentes da Pesquisa junto à população do estado do RJ em 1986, segundo o problema mais grave do Estado Problema mais grave do Estado Frequências Percentuais Segurança / Violência 360 29,27 Educação 160 13,01 Saúde 152 12,36 Saneamento 118 9,59 Alimentação/Fome/Pobreza 73 5,93 Transporte 63 5,12 Outros 304 24,72 Total 1.230 100,00 Fonte: Pesquisa de Opinião sobre as Eleições do Rio de Janeiro 1986 Ibase / Serpro / IM-UFRJ Construa o gráco de barras e o gráco de setores (ou gráco “pizza”) com base nessa tabela de frequências.

Upload: fbnbastos

Post on 18-Dec-2015

7 views

Category:

Documents


1 download

DESCRIPTION

Lista de exercícios de Estatística descritiva para ciências humanas

TRANSCRIPT

  • P R O B A B I L I D A D E E E S TAT S T I C A ELSEVIER

    264

    O mtodo dos mnimos quadrados para determinar os coefi cientes a e b a partir dos dados, consiste em encontrar aqueles valores de a e b que minimizam:

    n2

    i ii 1

    (y (a bx )) !

    .

    As frmulas para calcular a e b a partir dos dados so:

    n ni ii 1 i 1n

    n i i i 1 xyi ii 12 2n 2n

    xii 1 ii 1n 2ii 1

    x yb

    x y x y sx y n

    sx x x x

    n

    ! !

    !!

    ! !

    !

    ! !

    !

    n ni ii 1 i 1 y b xy bxa

    n! !!

    !

    EXERCCIOS RESOLVIDOS

    R7.1) O problema mais grave do estado do RJ Considere uma pesquisa por amostragem feita em 1986 junto populao do estado do Rio de Janeiro.

    Foram ouvidas 1.230 pessoas que, entre outras coisas, apontaram qual era, em sua opinio, o problema mais grave do estado naquele momento. Com base nos dados brutos, foi obtida a tabela a seguir.

    Frequncias e percentuais dos 1.230 respondentes da Pesquisa junto populao do estado do RJ em 1986, segundo o problema mais grave do Estado

    Problema mais grave do Estado Frequncias PercentuaisSegurana / Violncia 360 29,27Educao 160 13,01Sade 152 12,36Saneamento 118 9,59Alimentao/Fome/Pobreza 73 5,93Transporte 63 5,12Outros 304 24,72

    Total 1.230 100,00

    Fonte: Pesquisa de Opinio sobre as Eleies do Rio de Janeiro 1986Ibase / Serpro / IM-UFRJ

    Construa o grfi co de barras e o grfi co de setores (ou grfi co pizza) com base nessa tabela de frequncias.

    book.indb 264book.indb 264 07/08/2012 09:54:2807/08/2012 09:54:28

  • C A P T U L O 7 ANLISE EXPLORATRIA DE DADOS AMOSTRAIS

    277

    EXERCCIOS PROPOSTOS

    P7.1) Um erro grosseiro, mas (infelizmente) bastante comumA partir dos dados 1 2 nx , x ,..., x , calcula-se a varincia da varivel X pela expresso

    =

    =

    =

    2n

    in2 i 1i

    2 i 1

    xx

    nsn 1

    Ento, se 1 2 3 4 5n 5, x 3, x 5, x 0, x 2, x 6! ! ! ! ! ! , temos:

    52 2 2 2 2 2

    ii 1

    x 3 5 0 2 6 74!

    ! !

    Logo,

    = = =

    2

    74 7474 745 5s 14,8

    5 1 4

    a) O que est errado nesse clculo?b) Qual a soluo correta?

    P7.2) Combinando duas amostrasForam coletados os dados relativos a uma determinada varivel para duas amostras distintas. Apresen-

    tam-se a seguir, para cada uma delas, os resultados obtidos quanto a: tamanho da amostra, mdia e desvio padro.

    Amostra No de Obs. Mdia Desvio Padro1 5 7,4 6,3092 4 11,5 9,983

    a) Considerando agora a amostra combinada, ou seja, a amostra composta por todas as nove observa-es, qual o valor da sua mdia?

    b) Qual o seu desvio padro?

    P7.3) Atualizao da medianaTemos um conjunto de dados com 11 observaes j devidamente ordenadas:

    ( ) ( ) ( )

  • P R O B A B I L I D A D E E E S TAT S T I C A ELSEVIER

    278

    P7.4) Implantes mamrios raciocnio equivocadoUm determinado fabricante produz implantes mamrios utilizando gel de silicone. Os dados a seguir

    se referem tenso de ruptura desses implantes, e foram obtidos por meio de testes fsicos realizados com uma amostra de tamanho n = 20:

    72,2 80,1 70,4 67,8 70,9 72,1 75,1 73,0 59,4 77,265,1 66,5 64,1 79,0 70,6 70,3 63,1 64,4 74,9 75,3

    Com base nesses dados, obtenha os quartis Q1, Q2 e Q3.Foi apresentada a seguinte soluo:

    Posio 1 2 3 4 5 6 7 8 9 10Valor 72,2 80,1 70,4 67,8 70,9 72,1 75,1 73 59,4 77,2

    Posio 11 12 13 14 15 16 17 18 19 20Valor 65,1 66,5 64,1 79 70,6 70,3 63,1 64,4 74,9 75,3

    1P 20 10,5osio

    2Q2 !! o 1 1Q2 77,2 65,1 71,15

    2 2! x x !

    1 10,5Posio(Q1) 5,752

    ! ! o 1 3Q1 70,9 72,1 71,8

    4 4! x x !

    10,5 20Posio(Q3) 15,252

    ! ! o 3 1Q3 70,6 70,3 70,5254 4

    ! x x !

    a) Algo est errado nessa soluo. O que ?b) Qual a soluo correta?

    P7.5) Preos de automveisA tabela de frequncias a seguir se refere aos preos (em reais) pelos quais foram anunciados 2.695

    automveis para venda em um determinado site.

    Faixa de preo FrequnciaAt R$ 7.000 344De R$ 7.001 a R$ 10.000 419De R$ 10.001 a R$ 15.000 530De R$ 15.001 a R$ 20.000 443De R$ 20.001 a R$ 25.000 320De R$ 25.001 a R$ 30.000 229De R$ 30.001 a R$ 40.000 220De R$ 40.001 a R$ 50.000 99De R$ 50.001 a R$ 100.000 80Acima de R$ 100.000 11Total 2.695

    book.indb 278book.indb 278 07/08/2012 09:54:3107/08/2012 09:54:31

  • P R O B A B I L I D A D E E E S TAT S T I C A ELSEVIER

    278

    P7.4) Implantes mamrios raciocnio equivocadoUm determinado fabricante produz implantes mamrios utilizando gel de silicone. Os dados a seguir

    se referem tenso de ruptura desses implantes, e foram obtidos por meio de testes fsicos realizados com uma amostra de tamanho n = 20:

    72,2 80,1 70,4 67,8 70,9 72,1 75,1 73,0 59,4 77,265,1 66,5 64,1 79,0 70,6 70,3 63,1 64,4 74,9 75,3

    Com base nesses dados, obtenha os quartis Q1, Q2 e Q3.Foi apresentada a seguinte soluo:

    Posio 1 2 3 4 5 6 7 8 9 10Valor 72,2 80,1 70,4 67,8 70,9 72,1 75,1 73 59,4 77,2

    Posio 11 12 13 14 15 16 17 18 19 20Valor 65,1 66,5 64,1 79 70,6 70,3 63,1 64,4 74,9 75,3

    1P 20 10,5osio

    2Q2 !! o 1 1Q2 77,2 65,1 71,15

    2 2! x x !

    1 10,5Posio(Q1) 5,752

    ! ! o 1 3Q1 70,9 72,1 71,8

    4 4! x x !

    10,5 20Posio(Q3) 15,252

    ! ! o 3 1Q3 70,6 70,3 70,5254 4

    ! x x !

    a) Algo est errado nessa soluo. O que ?b) Qual a soluo correta?

    P7.5) Preos de automveisA tabela de frequncias a seguir se refere aos preos (em reais) pelos quais foram anunciados 2.695

    automveis para venda em um determinado site.

    Faixa de preo FrequnciaAt R$ 7.000 344De R$ 7.001 a R$ 10.000 419De R$ 10.001 a R$ 15.000 530De R$ 15.001 a R$ 20.000 443De R$ 20.001 a R$ 25.000 320De R$ 25.001 a R$ 30.000 229De R$ 30.001 a R$ 40.000 220De R$ 40.001 a R$ 50.000 99De R$ 50.001 a R$ 100.000 80Acima de R$ 100.000 11Total 2.695

    book.indb 278book.indb 278 07/08/2012 09:54:3107/08/2012 09:54:31

  • C A P T U L O 7 ANLISE EXPLORATRIA DE DADOS AMOSTRAIS

    279

    a) Determine a mdia e o desvio padro dessa varivel.b) Determine a mediana e a distncia interquartil dessa varivel.

    P7.6) Telefonia fi xa per capitaA tabela de dados brutos a seguir reporta o nmero de linhas telefnicas por mil habitantes em cada

    estado do Brasil, em 2001.

    Telefonia fi xa per capita em cada estado do Brasil em 2001(em linhas telefnicas por mil habitantes)

    Acre 183,8 Maranho 86,1 Rio Janeiro 347,5Alagoas 125,4 M. Grosso 199,6 R. G. do Norte 150,1Amap 193,3 M. G. do Sul 235,3 R. G. do Sul 236,9Amazonas 162,0 Minas Gerais 218,6 Rondnia 214,6Bahia 142,3 Par 128,0 Roraima 214,1Cear 140,6 Paraba 125,4 Santa Catarina 257,3D. Federal 456,8 Paran 244,2 So Paulo 362,8E. Santo 228,7 Pernambuco 147,8 Sergipe 140,7Gois 231,4 Piau 118,2 Tocantins 113,8Fonte: Almanaque Abril 2002

    a) Construa um ramo-folha para essa varivel.b) Determine os seus quartis.c) Construa o seu box plot.d) H outliers entre essas observaes? Quais?

    P7.7) Habitantes por leito hospitalar nos estados do BrasilA tabela a seguir contm o nmero de habitantes por leito hospitalar em cada estado do Brasil em 2005.

    Nmero de habitantes/leito no Brasil em 2005

    Rio Janeiro 341,30 Minas Gerais 414,94 D. Federal 469,48Gois 344,83 Mato Grosso 418,41 Tocantins 471,70R. G. do Sul 354,61 R. G. do Norte 418,41 Rondnia 497,51Paran 362,32 Acre 421,94 Alagoas 507,61M. G. do Sul 364,96 So Paulo 436,68 Par 520,83Sta. Catarina 375,94 Maranho 440,53 Sergipe 552,49Pernambuco 395,26 E. Santo 446,43 Amazonas 641,03Paraba 398,41 Bahia 456,62 Roraima 653,59Piau 404,86 Cear 467,29 Amap 800,00

    Fonte: IBGE Pesquisa Assistncia Mdico-Sanitria

    a) Calcule a mdia, a mediana, o desvio padro e a distncia interquartil.b) Faa um box plot desses dados.c) Repita o item (a), porm excluindo o estado do Amap.d) Compare as variaes em cada uma dessas quatro medidas, com e sem o Amap, e extraia concluses

    a esse respeito.

    book.indb 279book.indb 279 07/08/2012 09:54:3107/08/2012 09:54:31

  • P R O B A B I L I D A D E E E S TAT S T I C A ELSEVIER

    280

    P7.8) Propriedades da distribuio NormalSeja X uma varivel aleatria com distribuio Normal de mdia P e desvio padro V. Sejam 1q X ,

    2q X e 3q X os trs quartis de X, ou seja, eles so tais que 1P(X q (X)) 1/4 ! ; 2P(X q (X)) 1/2 ! ;

    3P(X q (X)) 3/4 ! .

    Finalmente, sejam 1 3 1a q (X) 1,5 q (X) q (X)! e 1 3 1b q (X) 1,5 q (X) q (X)! .

    a) Obtenha expresses matemticas para 1q X , 2q X e 3q X em funo de P e V.b) Prove que ? AP a X b 0,99 " .

    Obs.: Essa uma avaliao probabilstica do procedimento para apontar observaes aberrantes (usando medidas resistentes) que foi exposto na teoria, para o caso de dados provenientes de um modelo Gaussiano.

    P7.9) Proximidade entre medidas de centralidade e entre medidas de dispersoQuando o ramo-folha, obtido com base em um conjunto de dados relativos a uma determinada varivel,

    sugere que: existe simetria em torno de um valor central; no h observaes discrepantes;

    qual a sua expectativa no que se refere: proximidade entre a mdia e a mediana dessa varivel? proximidade entre o desvio padro e a distncia interquartil dessa varivel?Justifi que as suas respostas.

    Sugesto: Imagine, por exemplo, que os dados foram gerados a partir de uma distribuio Normal.

    P7.10) Nmero de hotis nos municpios da Regio Serrana do RJOs dados a seguir se referem ao nmero de estabelecimentos hoteleiros em cada um dos 37 municpios

    da Regio Serrana do Estado de Rio de Janeiro em 2001.

    Nmero de hotis na Regio Serrana do RJ 2001

    Municpio Hotis Municpio Hotis Municpio HotisAreal 3 Resende 36 Nova Friburgo 84Barra Mansa 22 Engenheiro Passos 4 Lumiar 16Barra do Pira 18 Visconde de Mau 12 So Pedro da Serra 14Engo. Paulo de Frontin 8 Rio Claro 10 Paty do Alferes 8Itatiaia 121 Rio das Flores 2 Petrpolis 83Maring 17 Sapucaia 5 Petrpolis / arredores 58Maromba 20 Trs Rios 15 Rio Bonito 6Penedo 55 Valena 34 S. J. do Vale do Rio Preto 5Mendes 5 Conservatria 20 Silva Jardim 6Paraba do Sul 12 Volta Redonda 14 Terespolis 44Pira 7 C. de Macacu 14 Vassouras 9Porto Real 4 Guapimirim 7Quatis 5 Miguel Pereira 12

    book.indb 280book.indb 280 07/08/2012 09:54:3107/08/2012 09:54:31

  • C A P T U L O 7 ANLISE EXPLORATRIA DE DADOS AMOSTRAIS

    279

    a) Determine a mdia e o desvio padro dessa varivel.b) Determine a mediana e a distncia interquartil dessa varivel.

    P7.6) Telefonia fi xa per capitaA tabela de dados brutos a seguir reporta o nmero de linhas telefnicas por mil habitantes em cada

    estado do Brasil, em 2001.

    Telefonia fi xa per capita em cada estado do Brasil em 2001(em linhas telefnicas por mil habitantes)

    Acre 183,8 Maranho 86,1 Rio Janeiro 347,5Alagoas 125,4 M. Grosso 199,6 R. G. do Norte 150,1Amap 193,3 M. G. do Sul 235,3 R. G. do Sul 236,9Amazonas 162,0 Minas Gerais 218,6 Rondnia 214,6Bahia 142,3 Par 128,0 Roraima 214,1Cear 140,6 Paraba 125,4 Santa Catarina 257,3D. Federal 456,8 Paran 244,2 So Paulo 362,8E. Santo 228,7 Pernambuco 147,8 Sergipe 140,7Gois 231,4 Piau 118,2 Tocantins 113,8Fonte: Almanaque Abril 2002

    a) Construa um ramo-folha para essa varivel.b) Determine os seus quartis.c) Construa o seu box plot.d) H outliers entre essas observaes? Quais?

    P7.7) Habitantes por leito hospitalar nos estados do BrasilA tabela a seguir contm o nmero de habitantes por leito hospitalar em cada estado do Brasil em 2005.

    Nmero de habitantes/leito no Brasil em 2005

    Rio Janeiro 341,30 Minas Gerais 414,94 D. Federal 469,48Gois 344,83 Mato Grosso 418,41 Tocantins 471,70R. G. do Sul 354,61 R. G. do Norte 418,41 Rondnia 497,51Paran 362,32 Acre 421,94 Alagoas 507,61M. G. do Sul 364,96 So Paulo 436,68 Par 520,83Sta. Catarina 375,94 Maranho 440,53 Sergipe 552,49Pernambuco 395,26 E. Santo 446,43 Amazonas 641,03Paraba 398,41 Bahia 456,62 Roraima 653,59Piau 404,86 Cear 467,29 Amap 800,00

    Fonte: IBGE Pesquisa Assistncia Mdico-Sanitria

    a) Calcule a mdia, a mediana, o desvio padro e a distncia interquartil.b) Faa um box plot desses dados.c) Repita o item (a), porm excluindo o estado do Amap.d) Compare as variaes em cada uma dessas quatro medidas, com e sem o Amap, e extraia concluses

    a esse respeito.

    book.indb 279book.indb 279 07/08/2012 09:54:3107/08/2012 09:54:31

  • C A P T U L O 7 ANLISE EXPLORATRIA DE DADOS AMOSTRAIS

    281

    Com base nesse conjunto de dados foram calculados:

    Mdia 22, 027Mediana 12Q1 6Q3 20DIQ 14

    Se for utilizado o critrio para identifi cao de observaes discrepantes que se baseia em medidas re-sistentes, teremos Cerca Superior Q3 1,5 DIQ 20 1,5 14 41! ! x ! . Assim, seis das 37 observaes (16%) seriam apontadas como possveis outliers, isto , municpios onde haveria um nmero anormalmente alto de hotis: Terespolis (44), Penedo (55), Petrpolis/arredores (58), Petrpolis (83), Nova Friburgo (84) e Itatiaia (121).

    Responda:a) Por que a mdia resultou em um valor bem maior que a mediana nesse caso?b) Por que tantos municpios teriam sido apontados pelo critrio que identifi ca outliers?

    P7.11) Dfi cit habitacional no Estado do Rio de JaneiroA tabela a seguir contm o nmero de domiclios rsticos em alguns municpios do Estado do Rio de

    Janeiro no ano 2000.

    Nmero de domiclios rsticos no RJ 2000

    Angra dos Reis 572 Miracema 216Araruama 117 Niteri 914Barra do Pira 741 Nova Friburgo 295Barra Mansa 250 Nova Iguau 457Belford Roxo 339 Petrpolis 1.839Cabo Frio 566 Queimados 81Campos dos Goytacazes 1.119 Resende 66Duque de Caxias 556 Rio das Ostras 123Guapimirim 51 Sto. Antnio de Pdua 88Itabora 132 So Gonalo 394Itagua 70 So Joo de Meriti 103Itaperuna 74 So Pedro da Aldeia 77Japeri 122 Saquarema 289Maca 143 Seropdica 159Mag 567 Terespolis 329Maric 64 Valena 229Fonte: Fundao Joo Pinheiro (FJP), Centro de Estatstica e Informaes (CEI)

    a. Determine os quartis.b. Obtenha um grfi co box plot para esses dados.c. Seria o grfi co ramo-folha adequado para representar estes dados? Por qu?

    book.indb 281book.indb 281 07/08/2012 09:54:3107/08/2012 09:54:31

  • Sexo Masculino:

    Mdia: 22; 30 Mediana: 22; 00Moda: 22; 00 1o Quartil: 20; 003o Quartil: 25; 00 Varincia: 7; 51Mnimo: 17; 00 Mximo: 26; 00

    Sexo Feminino:

    Mdia: 20; 88 Mediana: 21; 00Moda: 22; 00 1o Quartil: 19; 003o Quartil: 23; 00 Varincia: 11; 93Mnimo: 10; 00 Mximo: 28; 00

    (a) Qual dos grupos (masculino ou feminino) evidencia desempenho maisheterogneo? Justique com base a uma medida estatstica apropriada.

    (b) H evidncia de dados discrepantes (outliers) no grupo masculino? Jus-tique.

    (c) H evidncia de dados discrepantes (outliers) no grupo feminino? Jus-tique.

    (d) Analise a assimetria da distribuio dos escores do grupo masculino.(e) Analise a assimetria da distribuio dos escores do grupo feminino.

    Exerccio 2 Houve uma denncia por parte dos operrios de uma indstria de que,toda vez que ocorreria um acidente em uma seo da indstria, ocorreriam outros emoutras sees mais ou menos no mesmo horrio. Em outras palavras, os acidentesno estavam ocorrendo ao acaso. Para vericar esta hiptese, foi feita uma contagemdo nmero de acidentes por hora durante um certo nmero de dias (24 horas pordia). Os resultados da pesquisa esto abaixo:

    Nmero de Acidentes por Hora 0 1 2 3 4 5 6 7 8Nmero de Horas 200 152 60 30 13 9 7 5 4

    (a) Qual o nmero mdio de acidentes por hora?(b) E o nmero mediano?(c) Qual a moda?(d) Qual o desvio-padro?(e) Avalie os dados quanto assimetria.(f) Avalie os dados quanto curtose.

    3 Coeciente de Correlao

    Vimos anteriormente que o diagrama de disperso (scatterplot) usado quandodesejamos avaliar a relao entre duas variveis. A visualizao um primeiro passopara um entendimento dessa possvel inuncia de uma varivel sobre outra, mash que se medir a correlao entre elas. O coeciente de correlao (r) amedida comumente utilizada para se avaliar a correlao linear entre duas variveisquantitativas.

    5