apostila estatisticaii-paulo simas

Upload: paulo-simas

Post on 11-Jul-2015

132 views

Category:

Documents


0 download

TRANSCRIPT

CQE 2011- ASQ - USIMINAS APOSTILA1 DE ESTATSTICA II Tpicos do programa para certificao em Engenharia da Qualidade da ASQC:VI MTODOS QUANTITATIVOS (53 QUESTES):D Deciso estatstica:1- Estimao Pontual e Intervalar (estimadores eficientes e tendenciosos, erros padres, intervalos de tolerncia, intervalos de confiana);2- Testes de Hiptese: Testes para Mdias, Varincias e Propores; Nvel de Significncia, poder, erros tipo I e tipo II; Significncia Estatstica versus Prtica;3- Comparao Emparelhada;4- Testes de Ajuste;5- Anlise de Varincia (ANOVA);6- Tabelas de Contingncia.E Medindo e Modelando Relacionamento entre Variveis:1- Regresso Linear Simples e Mltipla atravs dos Mnimos Quadrados (isto , calcular e usar o modelo de regresso para estimao e inferncia, interpretar estatsticas de regresso);2- Correlao Linear Simples (isto , calcular e interpretar o coeficiente de correlao, realizar teste de hiptese e calcular o intervalo de confiana para o coeficiente de correlao);3- Anlise Temporal Bsica (isto , media aritmtica mvel, suavizao, estimao de tendncias, variaes sazonais, variaes cclicas, grficos de sries temporais).1 Referncias: Jurans Quality Control Handbook - Fourth Edition - Section 44 (44.41 a 44.81, 44.88 a 44.108) Estatstica Aplicada Administrao - William J. Stevenson - Ed. Harbra Ltda., 1986. Estatstica - Pedro Luiz de Oliveira Costa Neto - Ed. Edgard Blcher Ltda., 1991.Pg.:1CQE 2011- ASQ - USIMINAS MTODOS QUATITATIVOSDECISES ESTATSTICASAo induzir, estaremos sujeitos a erro. A estatstica indutiva ir nos dizer at que ponto poderemos estar errando e com que probabilidade.ESTIMAO PONTUAL E INTERVALARExemplo: Em uma amostra aleatria de 100 itens de uma populao existem 15 itens defeituosos:15 , 010015= p uma estimativa pontual da proporo de defeituosos do lote (populao); o intervalo de confiana de 95% para p: 0,08 a 0,22; o intervalo de tolerncia de 95% para 99% da populao: 0,05 a 0,25.Pg.:2E s t i m a o d e P a r m e t r o s T e s t e d e H i p t e s e sE S T A T S T I C A I N D U T I V A :O b j e t i v o :T i r a r c o n c l u s e s p r o b a b i l s t i c a s s o b r e o s a s p e c t o s d a s p o p u l a e s ,c o m b a s e n a o b s e r v a o d e a m o s t r a s e x t r a d a s d e s s a s p o p u l a e s .M d i aA m o s t r a s g r a n d e s ( n > = 3 0 )A m o s t r a s p e q u e n a s ( n < 3 0 )D e s v i o p a d r oM d i a d a p o p u l a o c o n h e c i d aM d i a d a p o p u l a o d e s c o n h e c i d aV a r i n c i aP r o p o r oP o r P o n t oD e s v i o p a d r o p o p u l a c i o n a l c o n h e c i d oD e s v i o p a d r o p o p u l a c i o n a l d e s c o n h e c i d oM d i aV a r i n c i aD e s v i o p a d r oP r o p o r oI n t e r v a l o d e C o n f i a n a :C o n t m o p a r m e t r oI n t e r v a l o d e T o l e r n c i aC o n t m u m a % d a p o p u l a oP o r I n t e r v a l oE s t i m a o d e P a r m e t r o s P o p u l a c i o n a i sCQE 2011- ASQ - USIMINAS 1.1. CONCEITOS: Estimador:umaquantidade,calculadaemfunodoselementosdaamostra, que serusadanoprocessodeestimaodoparmetrodesejado. Oestimador uma estatstica.Estimativa: cada valor assumido por um estimador.parmetro a ser estimado;T um estimador de ;t uma dada estimativa.1.2. PROPRIEDADES DOS ESTIMADORES: justeza ou no tendenciosidade : a mdia dos estimadores igual ao parmetro. ) T ( consistncia :seaumentarmosn, diminumosoerrodaestimao, ouseja, amostras suficientemente grandes tornam o erro de estimao to pequeno quanto se queira. eficincia : se T1e T2so dois estimadores de um parmetro, para um mesmo tamanho de amostra, se:( ) [ ] ( ) [ ]2221 T T< , dizemos que T1 mais eficientequeT2paraestimar , ouseja, avarinciadeT1menor doquea varincia de T2. suficincia : oestimador ser suficiente se contiver o mximopossvel de informao com referncia ao parmetro por ele estimado.ESTIMAO POR PONTOESTIMAO POR PONTO DA MDIA DA POPULAO:O melhor estimador para a mdia da populao ( ) a mdia da amostra. ( x )Obs.: a mediana da amostra tem uma eficincia de aproximadamente 64%.Pg.:3CQE 2011- ASQ - USIMINAS 1.2.1. ESTIMAO POR PONTO DA VARINCIA DAPOPULAO:O melhor estimador da varincia da populao (2) a varincia da amostra (s2).1.2.1.1. QUANDO A MDIA DA POPULAO CONHECIDA:( )2n1 i2in1 i2i2nxnxs 1.2.1.2. QUANDO A MDIA DA POPULAO DESCONHECIDA:Neste caso usamos a mdia da amostra ( x ) como estimador de . O estimador s2 estar viciado (tendencioso) em relao a2. Para corrigir, devemos multiplicar o estimador por

,_

1 nn, assim:( )1 nn / x x1 nx x2n1 iin1 i2in1 i2i2s

,_

1.2.2. ESTIMAO POR PONTO DO DESVIO PADRO ( ) DAPOPULAO:Odesvio padro da amostra (s) umestimador viciado do desvio padro da populao.1.2.2.1. PARA AMOSTRAS GRANDES ( n 25): Neste caso o vcio tende a zero, logo 2s s o desvio padro da amostra um bom estimador do desvio padro da populao.1.2.2.2. PARA AMOSTRAS PEQUENAS ( n< 25): Neste caso conveniente corrigir o vcio do estimador s mediante um coeficiente, designado por c2, obtendo-se a estatstica:( )nx xc1s2n1 ii2xPg.:4CQE 2011- ASQ - USIMINAS n c2n c2n c2n c22 0.564 5 0.841 8 0.903 12 0.9363 0.724 6 0.869 9 0.914 15 0.9494 0.798 7 0.888 10 0.923 20 0.962c2 : Costa Neto, pag. 681.2.3. ESTIMAO POR PONTO DE UMA PROPOROPOPULACIONAL: A proporo da amostra p, a melhor estimativa para a proporo populacional p.1.3. ESTIMAO POR INTERVALO: 1.3.1. INTERVALO DE CONFIANA 1.3.1.1. INTERVALO DE CONFIANA PARA A MDIA:

/2Intervalo de confiana (1- )/2

E estimativa por ponto Grau de confiana: a probabilidade (1 - ) de que o intervalo contenha o valor do parmetro que estamos estimando. a probabilidade de erro na estimao.1.3.1.1.1. INTERVALO DE CONFIANA PARA A MDIADA POPULAO QUANDO CONHECIDO: populao infinita distribuio dex normal:Pg.:5CQE 2011- ASQ - USIMINAS Queremos construir um intervaloxteo, com uma probabilidade conhecida (1 - ) de conter o valor real do parmetro, ou seja,( ) + 1 e x e x P0 0. Portanto, os limites do intervalo de confiana so x- eo, x+ eo, ouxteo.Como a populao infinita e o conhecido, podemos usar a distribuio normal. Assim, o intervalo de confiana para a mdia com um nvel de confiana (1 - ), ser:n. z x2tExemplo: Umaamostrade100elementos, commdia35,6, foi extradadeuma populao com desvio padro igual a 2,0. Construir o intervalo de 95 % e 99 % de confiana para a mdia desta populao.x = 35,6 ; = 2,0 ; n = 100.xteo = n. z x2t; na tabela normal: z /2 = z 0,975 = 1,96 ((1-0,025) = 0,975).Pg.:6CQE 2011- ASQ - USIMINAS Logo: 392 , 01002. 96 , 1 e0 392 , 0 6 , 35 e x0t t , com probabilidade de 95% de conter .95 , 0 ) 992 , 35 200 , 35 ( P .intervalo para 99% de confiana, seria:z /2 = z 0,995 = 2,575 ((1-0,005) = 0,995), logo: 515 , 0 6 , 351002. 575 , 2 6 , 35nz x e x2 / 0t t t t .1.3.1.1.2. INTERVALO DE CONFIANA PARA A MDIAQUANDO DESCONHECIDO: o mais comum de ocorrer. Se no conhecemos , o primeiro passo ser estim-lo com base na amostra. Mas s no um estimador justo; a correo feita usando-se t de Student, ao invs de z.ns. t x e x2 / ; 1 n 0 t tExemplo: Uma amostra de 4 elementos, extrada de uma populao normal, forneceu mdia 8,20 e desvio padro 0,40. Construir o intervalo de 99% de confiana para a mdia desta populao.n = 4 ;= x 8,20 ; s = 0,40 ; (1 - ) = 0,99. Pg.:7CQE 2011- ASQ - USIMINAS Pela tabela t 3; 0,005 = 5,841.168 , 1 20 , 8440 , 0. 841 , 5 20 , 8ns. t xns. t x005 , 0 ; 3 2 / ; 1 nt t t t (7,032 a 9,368)0,99 = 9,368) P(7,032 Usando-se z ao invs de t, o intervalo seria:515 , 0 20 , 8440 , 0. 575 , 2 20 , 8nz x e x2 / 0t t t t (7,685 a 8,715).O intervalo menor do que quando usamos t.Portanto, usando-se z ao invs de t o intervalo de confiana diminui aumenta o erro .Pg.:8CQE 2011- ASQ - USIMINAS 1.3.1.2. INTERVALO DE CONFIANA PARA A VARINCIADA POPULAO:22 / 1 ; 1 n2 2 22 / ; 1 n2s ). 1 n ( s ). 1 n ( Exemplo: Uma amostra de 11 elementos extrada de uma populao normal, forneceu varincia s2 = 7,08. Construir um intervalo de 90% para a varincia dessa populao.Soluo: da tabela de 2, temos: 307 , 18940 , 3205 , 0 ; 1022 / ; 1 n295 , 0 ; 1022 / 1 ; 1 n usando a frmula acima: 00 , 18 3,87 940 , 3 / 08 , 7 ). 1 11 ( 307 , 18 / 08 , 7 ). 1 11 (2 2 significando que: P(3,87 2 18,00) = 0,90.obs.: o intervalo no simtrico.1.3.1.3. INTERVALODE CONFIANA PARAODESVIOPADRO DA POPULAO:22 / 1 ; 1 n2 22 / ; 1 n2s ). 1 n ( s ). 1 n ( 1.3.1.4. INTERVALO DE CONFIANA PARA UMAPROPORO POPULACIONAL:Pg.:9CQE 2011- ASQ - USIMINAS n / ) p 1 ( p z p/2 t onde: nfp a proporo amostral n ) p 1 ( p z e2 / 0 ) 1 ( ) e p p e p ( P0 0 + Exemplo:Retirada uma amostra de 1000 peas da produo de uma mquina, verificou-se que 35 eram defeituosas. Qual o intervalo de confiana ao nvel de 95% para a proporo de defeituosas fornecidas pela mquina?Soluo:0114 , 0 1000 ) 035 , 0 1 ( 035 , 0 . 96 , 196 , 195 , 0 ) 1 (035 , 010003510000025 , 0 2 / ez znfpnlogo, o intervalo de confiana : 0,035 t0,0114.1.3.2. INTERVALO DE TOLERNCIA Intervalodetolerncia ointervaloquecontmumadeterminadaproporoda populao com uma probabilidade especificada. Os pontos extremos do intervalo so chamados de limites de tolerncia. Os intervalos de tolerncia so da forma: s . K x t , comKdeterminadodeformaqueointervalocontenhaumaproporoPda populao comconfiana . (valores de K: Pyzdek - bible - tabela 11 do apndice).Exemplo: Se numa amostra de 20 elementos,x = 1,00287 e s = 0,00034, o intervalo de tolerncia de 95%, para 99% da populao, ser:1,00287 t3,615 (0,00034) = 1,00164 a 1,00410.(Obs.: ver tambm a tabela 44.25 da pgina 44.48 do Juran).Pg.:10CQE 2011- ASQ - USIMINAS 1.3.2.1. TEOREMA DE CHEBYSHEV (TCHEBYSHEFF): Para qualquer distribuio contnua, a probabilidade de se ter um valor que desvia da mdia por mais do que k desvios padro (k 1), menor ou igual a 2k1.2k1) k ) x ( P ou )k11 ( ) k x k ( P2 + 1.4. TAMANHO DA AMOSTRA: Desejvel: alto nvel de confiana com intervalos de pequena amplitude estimativa com pequena probabilidade de erro e grande preciso.1.4.1. TAMANHO DA AMOSTRA PARA ESTIMAO DAMDIA COM O CONHECIDO: n / . z e2 / 0 20 2 /) e / . z ( n 1.4.2. TAMANHO DA AMOSTRA PARA ESTIMAO DAMDIA COM DESCONHECIDO: Se ainda no retiramos a amostra, no conhecemos o s. A soluo tirarmos uma amostra piloto no n elementos e, com base nela, estimarmos o s; a20 2 / ; 1 n) e s . t ( n se n n , a amostra piloto ser suficiente.Pg.:11CQE 2011- ASQ - USIMINAS 1.4.3. TAMANHO DA AMOSTRA PARA A ESTIMAO DAPROPORO POPULACIONAL:1.4.3.1. QUANDO P CONHECIDO: ) p 1 .( p . ) e z ( n20 2 / 1.4.3.2. QUANDO P DESCONHECIDO: O grfico p versus p.(1-p), uma parbola com o mximo em p.(1-p) = 1/4.logo, se tomarmos o valor mximo de p.(1-p), seguramente o valor de n obtido ser suficiente para a estimao; assim:20 2 /20 2 /) e . 2 z ( 4 1 . ) e / z ( n Pg.:12CQE 2011- ASQ - USIMINAS TESTE DE HIPTESES feita uma afirmao sobre uma populao (geralmente sobre algum parmetro da populao).O teste de hipteses a validao da afirmao, com base na anlise dos dados de uma amostra da populao.Etapas: formulao de uma hiptese sobre a populao; obteno de uma amostra dessa populao; manipulao dos dados da amostra; concluso (rejeio ou no da hiptese), com base num critrio de aceitao.Exemplo: um comprador de parafusos especifica um LR = 50 kg/mm2. Tendo recebido um lote de 100.000 peas, deseja saber se o mesmo atende a especificao. testar todos os parafusos retirar uma amostra e com base nos resultados dos testes concluir com certo grau de confiana .Assim, teramos a hiptese: a mdia do lote = 50 kg/mm2.O teste pode ser feito de 3 maneiras: < 50;> 50;50.Pg.:13M d i a V a r i n c i a P r o p o r oT e s t e d e H i p t e s e sCQE 2011- ASQ - USIMINAS Conceitos:Hiptese nula H0: a hiptese existente, isto , a hiptese a ser testada. uma afirmao que diz que o parmetro populacional tal como especificado.Hiptese alternativa H1: a hiptese contrria a H0, ou seja, ela complementar a H0.Teste de hiptese o processo estatstico que nos leva, com uma probabilidade conhecida de erro,a rejeitar ou no H0.Obs.: oquetestamosH0; portanto, oquerejeitamosounosertambmH0. O resultado do teste ser sempre em funo de H0. No exemplo anterior, temos:n = 100.000 parafusos; = 50 kg/mm2 As hipteses so: H0 = 50 kg/mm250 kg/mm250 kg/mm2Soluo: calculamos o intervalo de confiana (1- ) para , e verificamos se a mdia da amostra est dentro ou fora do intervalo.Se a mdia da amostra cair dentro do intervalo de confiana, no se rejeita H0:, caso contrrio, rejeita-se.Pg.:14CQE 2011- ASQ - USIMINAS Casos possveis:Primeiro caso:H0: = 50 kg/mm2H1: < 50 kg/mm2Segundo caso:H0: = 50 kg/mm2H1: > 50 kg/mm2Terceiro caso:H0: = 50 kg/mm2H1: 50 kg/mm2Pg.:15CQE 2011- ASQ - USIMINAS 1.5. TESTE DE UMA MDIA 1.5.1. TESTE DE UMA MDIA POPULACIONAL COM CONHECIDO:Distribuio amostral para a mdia norma reduzida (z).Testes possveis:1 ocaso : 2 ocaso :3 ocaso :H0: = 0H0: = 0H0: = 0H1: < 0H1: > 0H1: 01.5.1.1. 1 CASO: H0: = 0H1: < 0Ouseja, qualquer valor encontradonaamostraquesejamaior ouigual aolimite inferior do grau de significncia do nosso teste nos levar a no rejeitar H0 (aceitar o lote)portanto, x1 ser o valor crtico: n . z e x0 0 0 1 .Se a mdia da amostra for menor que1 x , a hiptese H0 rejeitada soluo grfica.Soluo matemtica:Rejeita-se H0 se:n. z x0 < ou < zn) x (0como:. calc0zn) x ( , rejeita-se H0 se: zcalc. < -z.Pg.:16CQE 2011- ASQ - USIMINAS 1.5.1.2. 2 CASO: H0: = 0H1: < 0O limite ser: n . z x0 2 + Conseqentemente, se: 2x x >, rejeita-se H0 soluo grfica.ou>z z. calc , rejeita-se H0 soluo matemtica.1.5.1.3. 3 CASO: H0: = 0H1: 0Os limites sero:n . z x2 / 0 1 e n . z x/2) (1 0 2 + .Rejeita-se H0, se:1x x soluo grfica./2 calc.z z 2 / . calcz z> soluo matemtica.Pg.:17CQE 2011- ASQ - USIMINAS Resumindo, para o teste de uma mdia populacional com conhecido:Hiptese Rejeita-se H0 se:H0: = 0zcalc. < -z H1:< 0H0: = 0zcalc. > z (1- ) H1: > 0H0: = 02 / . calcz z>H1: 0Exemplo:o desvio padro de uma populao igual a 22. Se uma amostra de 100 elementos, retirada da populao, forneceu uma mdia de 115,8, podemos afirmar que a mdia desta populao inferior a 120, ao nvel de 5% de significncia?n = 100 ; = 22 ;x = 115,8 ; = 0,05.Teste: H0: = 120H1: 0 H1: 0As solues matemticas e grficas so idnticas s do caso anterior, usando-se t ao invs de z.Hiptese Rejeita-se H0 se:H0: = 0 ; 1 n calc. 1 nt tH1: > 0H0: = 02 / ; 1 n calc. 1 nt t >H1: 0Exemplo: Em indivduos sadios, o consumo renal de oxignio distribui-se normalmente emtorno de 12 cm3/min. Deseja-se investigar, combase em5 indivduos portadores de certa molstia, se esta tem influncia no consumo renal de oxignio. Os consumos mdios para 5 pacientes foram: 14,4; 12,9; 15,0; 13,7; 13,5. Qual a concluso ao nvel de 1% de significncia?n = 5 ;x = 13,90 ; sx = 0,81.Teste: H0: 0 = 12 ; 0 12.Vamos calcular o intervalo: 67 , 1 5 81 , 0 . 604 , 4 5 81 , 0 . t n s . t e005 , 0 ; 4 2 / ; 1 n 0 Portanto, o intervalo : 12 t1,67. Logo, rejeita-se H0, ou seja, a amostra indica que, ao nvel de 1% de significncia a molstia tem influncia no consumo renal mdio de oxignio.Soluo matemtica: 21 , 5 5 / 81 , 0 /( ) 00 , 12 90 , 13 ( t t. calc ; 4 . calc ; 1 n Pg.:19CQE 2011- ASQ - USIMINAS 604 , 4 21 , 5 t t604 , 4 t2 / ; 1 n calc ; 1 n005 , 0 ; 4> > Rejeita-se H0.1.6. TESTE DE UMA VARINCIA POPULACIONAL: Distribuio amostral usada para varincia 2 202 2/ s ). 1 n ( Testes possveis:1 ocaso : 2 ocaso : 3 ocaso :H0: 2 = 20H0: 2 = 20 H0: 2 = 20H1: 2 < 20H1: 2 > 20 H1: 2 20A soluo semelhante aos casos anteriores:Hiptese Rejeita-se H0 se:H0: 2 = 2021 ; 1 n2calc < H1:2 < 20H0: 2 = 202; 1 n2. calc > H1: 2 > 20H0: 2 = 202 / 1 ; 1 n2. calc < ouH1: 2 2022 / ; 1 n cal < Exemplo: Uma amostra de 10 elementos,extrada de uma populao supostamente normal, fornece uma varincia igual a 12,4. Este resultado suficiente para concluir, ao nvel de 5% de significncia, que a vari6ancia desta populao inferior a 25?n = 10 ; s2 = 12,4 ; = 0,05 ; 20 = 25 ; 2n-1;1- = 29;0,95 = 3,325.Teste: H0: 2 = 25 ; H1: 2 < 25.464 , 4 25 / ) 4 , 12 x 9 ( / s ). 1 n (202 2. calc como: 295 , 0 ; 92. calc > no se rejeita H0.Pg.:20CQE 2011- ASQ - USIMINAS 1.7. TESTE DE UMA PROPORO POPULACIONAL: Distribuio amostral usada para uma proporo zn ) p 1 .( p) p p (z0 00. calc Testes possveis:1 ocaso :2 ocaso :3 ocaso :H0: p = p0 H0: p = p0 H0: p = p0H1: p < p0 H1: p > p0H1: p p0As condies de deciso so as mesmas da mdia com conhecido.1.8. TIPOS DE ERRO: 1.8.1. ERRO TIPO I: Na estimao de parmetros, vimos que a probabilidade do valor encontrado estar correto e ns afirmarmos que ele no est correto. o risco de estimar, ou seja, o erro de estimao.ERRO TIPO I ERRO RISCO DO PRODUTORComete-se um erro Tipo I, rejeitando-se H0 sendo H0 verdadeira.A probabilidade de um erro Tipo I igual ao nvel de significncia de um teste de hiptese ( ).O risco do produtor, porque este o risco do produtor ver rejeitado um lote bom produzido.Pg.:21CQE 2011- ASQ - USIMINAS 1.8.2. ERRO TIPO II: Por outro lado, pode ocorrer que o valor encontrado se ache na regio de no rejeio (1- ), quando na realidade ele maior ou menor do que o valor esperado.ERRO TIPO II ERRO RISCO DO CONSUMIDORComete-se um erro Tipo II, no rejeitando H0 sendo H0 falsa.risco do consumidor, porque o risco dele aceitar um lote fora da especificao.Para se determinar a probabilidade de um erro Tipo II, necessrio conhecer a mdia real da populao.(Obs.: ver Stevenson, pag. 245: Clculo da probabilidade de um erro tipo II)Resumindo:RealidadeH0 verdadeira H0 falsaDecisoNo rejeitar H0deciso correta(1- )erro Tipo II( )Rejeitar H0erro Tipo I( )deciso correta(1- )1.9. NVEL DE SIGNIFICNCIA E INTERVALO: regio (1): no rejeitamos H0 em ambos os casos, 5% ou 1%;regies (2) e (4): no rejeitamos H0 para 1%, mas rejeitamos para 5%;regies (3) e (5): rejeitamos H0 em ambos os casos.Pg.:22CQE 2011- ASQ - USIMINAS Portanto, a deciso de rejeitar ou no H0, depende do nvel de significncia ( ) escolhido. INTERVALO 1.10. PODER: O Poder do Teste em projeto experimental refere-se probabilidade de rejeitar corretamente a hiptese nula que noh efeitodemonstrvel estatisticamente. (ASQ, p.3-99).Hiptese VerdadeiraDeciso Hiptese Nula (HO) Hiptese Alternativa (H1)No Rejeitar HODeciso Correta1-Erro Tipo IIRejeitar HOErro Tipo IDeciso Correta1-1.11. SIGNIFICNCIA ESTATSTICA VERSUS PRTICA Em um teste de hipteses, grandes amostras podem levar a rejeitar uma hiptese nula e concluir que h diferenas estatisticamente significativas. Mas pode ocorrer que no h diferena prtica significativa. Exemplo: Umfabricantepodeafirmar queoconsumodeumautomvel de 13Km/l. Testes posteriores, com amostras de 45 carros, resultaram em uma mdia de (12,8 t 0,1) Km/l com nvel de significncia de 5%. Apesar do teste apontar em uma diferena estatisticamente significativa, no h diferena prtica que seja relevante.Pg.:23CQE 2011- ASQ - USIMINAS 1.12. OUTROS TESTES: Testes de HiptesesTestes ParamtricosSe referem aos parmetros da PopulaoTestes No-paramtricosSe referem a outros aspectos que no aos parmetros da populaoFonte: Mattar, Fauze N. Pesquisa de Marketing. p.203 - Edio compacta So Paulo: Atlas, 1996.Pg.:24CQE 2011- ASQ - USIMINAS COMPARAO EMPARELHADA : Comparaodeduasmdias:Nestecaso, temos2amostrasoqueiremostestar agora so os parmetros equivalentes das populaes envolvidas. Testaremos hipteses referentes ao valor real da diferena entre duas mdias populacionais:H0 1 2: normalmente, 1 2 1 20 igualdade de 2 mdias.Temos dois casos a considerar: dados emparelhados e no emparelhados.1.13. DADOS EMPARELHADOS: Sodadosqueestorelacionados2a2, segundoalgumcritrio. Porexemplo: 20 coelhoscompesosdiferentessoalimentadoscomumaraoporumperodode tempo. Os coelhos so pesados aps o teste. Queremos saber se houve aumento do peso mdio dos coelhos.Se os dados so emparelhados, faz sentido calcular as diferenas di correspondente a cada par de valores portanto, teremos uma nica amostra com n diferenas.Neste caso, teremos: H0: 1 - 2 = = d, contra uma hiptese alternativa H1, que poder corresponder a um teste unilateral ou bilateral igual ao problema de se fazer o teste de uma nica mdia, j visto usa-se t:n s) d (td. calc Pg.:25CQE 2011- ASQ - USIMINAS d = mdia da amostra das diferenas;= valor testado da mdia das diferenas nas populaes;sd= desvio padro da amostra das diferenas;n = tamanho da amostra das diferenas.Exemplo: 10 cobaias foram submetidas ao tratamento com certa rao durante uma semana. Os animais foram identificados e pesados antes e aps o regime, conforme dados abaixo. Podemos concluir, ao nvel de 1% de significncia, que o uso da rao contribuiu para o aumento do peso mdio dos animais?Cobaia peso antes (xi)peso aps (yi)di = xi - yi1 635 640 -52 704 712 -83 662 681 -194 560 558 25 603 610 -76 745 740 57 698 707 -98 575 585 -109 633 635 -210 669 682 -13d = -6,6 ; s2d = 49,6 ; sd = 7,043.teste de hiptese ser:H0: d = 0H1: d < 0282 , 6 10 / ) 043 , 7 x 821 , 2 ( n / s . t n / s . t ed 01 , 0 ; 9 d ; 1 n 0+ 282 , 6 282 , 6 0 e 0 x0 1 logo, rejeitamos H0 ao nvel de 1%, portanto conclumos que o uso da rao contribuiu para o aumento do peso mdio.Pg.:26CQE 2011- ASQ - USIMINAS Soluo matemtica:821 , 2 t t t96 , 210 043 , 76 , 6n / s) d (t01 , 0 ; 9 ; 1 n . critd. calc como: tcalc. < -tcrit. rejeita-se H0.1.14. DADOS NO EMPARELHADOS: No temos correlao entre os dados antes e aps (populaes no correlacionadas). Seosdadosnosoemparelhados, nofazsentidocalcular adiferenaentreos valores das amostras. Otestedeverser baseadonadiferena( 2 1 x x ) entreas mdias das duas amostras.1.14.1. QUANDO OS DESVIOS PADRO SO CONHECIDOS (1CASO):Sendo teste de hiptese de mdia com desvio padro conhecido, a distribuio a ser usada a normal reduzida z.222 1212 1. calcn n) x x (z + n1 e n2 so os tamanhos das duas amostras; podem ou no serem diferentes.Quando 1 = 2:2 12 1. calcn 1 n 1 .) x x (z+ Exemplo: Umamquinaenchelatascombasenopesolquidoetemumdesvio padro de 5g. Duas amostras retiradas em dois perodos, com n1 = 10 latas e n2 = 20 latas, fornecerampesos lquidos mdios de184,6ge188,9g. Desconfia-sequea regulagemdamquinaquantoaopesomdiofornecidopossatersidomodificada entre a coleta das amostras. Qual a concluso ao nvel de 5 e 1% de significncia?H0: 1 - 2 = 0H1: 1 - 2 0Dos dados: n1 = 10 ; 6 , 184 x1 ; n2 = 20 ; 9 , 188 x2 .= 0,05 ( /2 = 0,025)Pg.:27CQE 2011- ASQ - USIMINAS 22 , 220 1 10 1 . 50 ) 9 , 188 8 , 184 (n 1 n 1 .) x x (z96 , 1 z z2 12 1. calc025 , 0 2 / + + 2 / . calcz z>logo, a nvel de 5%, rejeitamos H0.= 0,01 ( /2 = 0,005)zcalc = mesmo anterior.z0,005 = 2,576Portanto, a nvel de 1% de significncia no rejeitamos H0.Concluso: a desconfiana foi verificada ao nvel de 5%, porm no podemos rejeitar H0 ao nvel de 1% de significncia.1.14.2. QUANDO OS DESVIOS PADRO DAS POPULAES SODESCONHECIDOS MAS PODEM SER SUPOSTOS IGUAIS (2 CASO):1 = 2 = sendo teste de hiptese de mdia com desvio padro desconhecido, usamos a distribuio t.Como 2 desconhecido, devemos substitu-lo por sua estimativa:2 n ns ). 1 n ( s ). 1 n (s2 122 221 1 2p + + que uma varincia ponderada.como no clculo usamos 2 estimativas (s1 e s2), o n de graus de liberdade desta estatstica (n1 + n2 - 2). 2 1 p2 12 n2- + n1n 1 n 1 . s) x x ( t+ Pg.:28CQE 2011- ASQ - USIMINAS Exemplo: Os dados abaixo se referem a 5 determinaes da resistncia de dois tipos de concreto. Ao nvel de 5% de significncia, h evidncia de que o concreto 1 mais resistente que o concreto 2.Concreto 1 Concreto 254 5055 5458 5651 5257 535 , 7 s73 , 2 s55 x2111

0 , 5 s23 , 2 s53 x22225 , 2 s 25 , 62 n ns ). 1 n ( s ). 1 n (sp2 12221 2p + + Testaremos as hipteses: H0: 1 = 2 1 - 2 = 0H1: 1 > 2 1 - 2 > 026 , 15 1 5 1 . 5 , 2) 53 55 (n 1 n 1 . s0 ) x x (t86 , 1 t t2 1 p2 1. calc05 , 0 ; 8 05 , 0 ; 2 2 n 1 n++ + +1 ; 1 n ; 1 n . calc2 1F F2221 . calcs s F H1: 21 < 22H0: 21 = 22 >; 1 n ; 1 n . calc2 1F F2221 . calcs s F H1: 21 > 22H0: 21 = 222 / ; 1 n ; 1 n . calc2 1F F >2221 . calcs s F < > H1: 21 22Exemplo: Duas amostras com 10 e 15 elementos, extradas de populaes normais, forneceramvarincias respectivamenteiguais a6,34e18,7. Aonvel de5%de significncia, devemos aceitar que as populaes tenham o mesmo grau de disperso?Teste:H0: 21 = 22H1: 21 22Dados: 18,7 = s34 , 6 s15 n 10 n22212 1 3,87 e 3,77 entre F F F95 , 234 , 67 , 18ssF025 , 0 ; 9 ; 14 2 / ; 1 n ; 1 n crit2122. calc1 2 como: Fcalc. < Fcrtico no se rejeita a hiptese H0Pg.:31CQE 2011- ASQ - USIMINAS 1.16. COMPARAO DE DUAS PROPORESPOPULACIONAIS:Usa-se a normal reduzida z (grandes amostras- n > 20):Hiptese Rejeita-se H0H0: p1 - p2 = zcalc. < -zH1: p1 < p2H0: p1 - p2 = zcalc. > zH1: p1 > p2H0: p1 - p2 = |zcalc.|> z /2H1: p1 p2onde:22 211 12 1. calcn) p 1 ( pn) p 1 ( p) p p (z + TESTE DE AJUSTE ( GOODNESS-OF-FIT): Os testes de ajuste so no paramtricos: Teste de aderncia (teste de aderncia pelo 2); Teste de independncia.1.17. TESTE DE ADERNCIA: No teste de aderncia, a hiptese testada refere-se forma da distribuio da populao. Admitimos por hiptese que a distribuio da varivel de interesse na populao de determinado modelo (binomial, hipergeomtrica, etc.), e testamos esse modelo. Ou seja, verificamos a boa ou m aderncia dos dados da amostra ao modelo. Arejeiodahipteseaumdadonvel designificncia, indicaqueomodelo testado inadequado para representar a populao. A no rejeio da hiptese, a um dado nvel de significncia, indica que o modelo testado adequado.Pg.:32CQE 2011- ASQ - USIMINAS 1.17.1. TESTE DE ADERNCIA PELO 2: Este teste baseia-se na estatstica: k1 ik1 i i2ii2i i 2nEOE) E O (onde:2 a estatstica do teste, com graus de liberdade;Oi a freqncia observada de uma determinada classe;Ei a freqncia esperada desta classe, segundo o modelo testado = nipi;n o nmero de elementos da amostra;k nmero de classes ou valores considerados;pi probabilidade de se obter um valor da varivel na classe esperada, segundo o modelo.Observao:Se os Ei < 5, devero ser juntados para que Ei 5; = k-1-m, onde m o nmero de parmetros do modelo estimados independentemente a partir da amostra.H0 ser rejeitada se: 2; ;2calc ; > no adere ao modelo.Exemplo: onmerodedefeitospor unidadeobservadosemumaamostrade100 aparelhos de TV, apresentou a seguinte distribuio de frequncia:n de defeitos0 1 2 3 4 5 6 7n de aparelhos25 35 18 13 4 2 2 1Verificar se o nmero de defeitos por unidade segue, razoavelmente, uma distribuio de Poisson com nvel de 5% de significncia.H0: a distribuio do nmero de defeitos por unidade Poisson;H1: a distribuio no Poisson.Pg.:33CQE 2011- ASQ - USIMINAS Poisson:! re) r x ( pr , =mdiadadistribuio. Portanto, Poissonficabem definido conhecendo-se . Como no conhecemos o da populao vamos estim-lo pela amostra.55 , 1100) 7 ... 36 35 0 (nf . xxi i+ + + + Calculemos agora os pi por Poisson.Calcula-se o 2:ii icalcEE O22.) (xifi = OipiEi = pi . n (Oi-Ei)2/Ei0 25 0,212 21,2 0,6811 35 0,329 32,9 0,1342 18 0,255 25,5 2,2063 13 0,132 13,2 0,0034 4 0,051 5,15 2 9 0,016 1,67,2 0,4506 2 0,004 0,47 1 0,001 0,1n = 1002calc. = 3,474Clculo do 2crit. : = (k-1-m); k n de parcelas somadas para o clculo do 2 = 5;m n de parmetros do modelo (no caso Poisson) estimados a partir da amostra = 1 (apenas ); portanto: = 5-1-1 = 3 .815 , 7205 , 0 ; 3 2. crit2. calc < no rejeitamos H0 a varivel adere razoavelmente bem ao modelo de Poisson.Pg.:34CQE 2011- ASQ - USIMINAS 1.18. TESTE DE INDEPENDNCIA: OstestesdeindependnciasorealizadosatravsdeTabelasdeContingnciaque sero tratados posteriormente.ANLISE DE VARINCIA (ANOVA) 1.19. INTRODUO A anlise de varincia uma tcnica que pode ser usada para determinar se as mdias de duas ou mais populaes so iguais.1.19.1. FUNDAMENTOS LGICOS DA ANOVA Oexamedasvarinciasrevelaaigualdadeounodasmdias populacionais, dentro das suposies bsicas estabelecidas. Se quer saber se as diferenas observadas entre as mdias devido somente variabilidade inerente das observaes ou se causada por essa variabilidade mais uma real diferena entre as mdias das populaes de onde as amostras foram retiradas. A anlise se d pela utilizao de dois processos diferentes para estimar a varincia de uma populao baseado num grupo de amostras.Seasduasestimativassoaproximadamenteiguaisnoserejeitaahiptese nula, ou seja as amostras podem ser da mesma populao. Conclumos ento, que as mdias amostrais, a no ser por diferenas introduzidas por causas aleatrias, so iguais.Se uma das estimativas muito maior que a outra rejeita-se a hiptese nula, ou seja, asamostrasdevempertencerapopulaesdiferentes. Existealgo, almda aleatoriedade, que causa a diferena entre as mdias.1.19.2. SUPOSIES H 3 suposies bsicas para se aplicar a anlise de varincia:- as amostras devem ser aleatrias e independentes;- as amostras devem ser extradas de populaes normais;- as populaes devem ter varincias iguais (condio de homocedasticidade).Pg.:35CQE 2011- ASQ - USIMINAS Porm o mtodo robusto, isto , mesmo para situaes em que ocorre o afastamento dashiptesesbsicas (comopor exemplo, amostrasdedistribuiesdesviadas da normalidade, varincias um pouco diferente,...), ainda assim leva a resultados vlidos com razovel aproximao.1.20. COMO TESTAR AS VARINCIAS? 1)Umaformadeestimaravarinciapopulacionaltomaramdiadasvarincias amostrais, que emgeral amelhor estimativa emvirtudedomaior nmerode observaes. Como cada varincia amostral reflete apenas a variao dentro de cada amostra, ela conhecida como estimativa da varincia dentro:1]1

+ + + + + + + n1 in1 in1 i2ki22i21i2k232221 2w) x x ( ... ) x x ( ) x x () 1 n .( k1ks ... s s ssonde: si = varincia da amostra i;k = nmero de amostras;n = nmero de amostras em cada classe.Essa estimativa da varincia dentro das amostras serve como padro de comparao para a estimativa da varincia entre amostras.2) Calcula-se a varincia entre as amostras. Isso feito atravs de uma distribuio amostral de mdias. A distribuio amostral de mdias de uma populao normal, tem distribuio normal com mdia igual a mdia da populao e desvio padro igual a n :2x2x2x 2xxxnn n como no conhecemos 2x, ser necessrio estim-lo:11]1

k12j2xb2xk1 jk1j2j2x2x2x2x 2x1 k) x x (. n s . n s skxx onde1 k) x x (ss nsnssPg.:36CQE 2011- ASQ - USIMINAS A comparao entre varincias feita atravs do teste de F que compara a razo entre varincias:2w2bssF o valor resultante da estatstica comparado a um valor tabelado, que indica o valor mximo da estatstica no caso de H0 ser verdadeira, a um determinado nvel de significncia.1.20.1. A TABELA ANOVA Amostras1 2 3 ... kx11x12x13... x1kx21x22x23... x2kObservaes x31x32x33... x3k... ... ... ... ...xn1xn2xn3... xnkSomatrio = x x1 x2 x3 xkn dados amostran1n2n3... nkMdias amostrais x1x2x3... xk x2 = somatrio dos quadrados x2 x2 x2... x2k . nT= Cx T2k1 in1 jij onde C um fator de correo.Pg.:37CQE 2011- ASQ - USIMINAS 1.20.1.1. TABELA ANOVA PARA AMOSTRAS DETAMANHOS IGUAIS:Fonte de variaoSoma dos quadradosGraus de liberdadeQuadrado mdio (varincia)Fcalc Fcrit (tabelado)Entre amostras CnTSSB2i(k - 1)) 1 k (SSBs MSB2b MSWMSB ); 1 n .( k ); 1 k (FDentro das amostrasSSB TSS SSW k . (n -1)) 1 n .( kSSWs MSW2w - -TotalC x TSS2 (n.k - 1) - - -Para amostras de tamanhos diferentes, a soma dos quadrados entre amostras calculada como:k2k222121nT...nTnTSSB + + + e o nmero de graus de liberdade para o clculo da varincia dentro das amostras :k ) n (iTABELAS DE CONTINGNCIAS a representao tabular das freqncias observadas.Exemplo: 100pessoasforamentrevistadassobreumprojetodelei; oresultado colocado em forma de uma tabela de contingncia:OpinioSexo Favorvel Desfavorvel Indiferente TotaisHomens 33 12 15 60Mulheres 7 20 13 40Totais 40 32 28 100Pg.:38CQE 2011- ASQ - USIMINAS Temos atabelade contingncia2x3. Avarivel sexotemduas classificaes possveis e a varivel opinio 3 classificaes possveis.Queremos testar se as variveis envolvidas so ou no independentes.O teste de independncia:H0: as variveis so independentes;H1: as variveis no so independentes.O teste ser feito usando 2, semelhante ao teste de aderncia. r1 is1 j ij2ij ij 2E) E O (2 = a estatstica do teste, com graus de liberdade;r = nmero de linhas;s= nmero de colunas;Oij = freqncia observada na interseo da linha i com a coluna j;Eij = freqncia esperada na interseo da linha i com a coluna j;n= nmero de elementos da amostra.(o livro do Costa Neto explica a frmula na pg. 137)Rejeita-se H0 se 2calc > 2crt.Vamosrealizar otestedeindependnciaparaatabelaacima, aonvel de1%de significncia.Monta-se a tabela:33 12 15 60 = tL17 20 13 40 = tL240 = tc1 32 = tc2 28 = tc3 100 = tClculo do 2:Oij Eij = tLi . tcj / t233 60 . 40 / 100 = 24,0 3,37512 60 . 32 / 100 = 19,2 2,70015 60 . 28 / 100 = 16,8 0,1937 40 . 40 / 100 = 16,0 5,06320 40 . 32 / 100 = 12,8 4,05013 40 . 28 / 100 = 11.2 0,289= 2calc = 15,670Pg.:39CQE 2011- ASQ - USIMINAS 2crt. = 2 ; = 2 ;0,01.macete para clculo do : na tabela anterior, risque uma linha e uma coluna: 33 12 157 20 13 conte o que sobrou, = 2; ou: = (L-1).(c-1).2crt. = 2 ; = 2 ;0,01 = 22;0,01 = 9,21.Como: 2calc > 2crt rejeita-se H0.Portanto, a hiptese de independncia entre opinio e sexo rejeitada, ao nvel de 1%.Pg.:40CQE 2011- ASQ - USIMINAS E. MEDINDO E MODELANDO O RELACIONAMENTO ENTRVARIVEIS1. REGRESOLINEARDEMNIMOS QUADRADOS SIMPLES EMLTIPLANaanlisederegresso, buscamosorelacionamentofuncionalentreduasoumais variveis causa e efeito; predio. Funo que exprime o relacionamento linha de regresso.Alinhaderegressoexplicagrandepartedavariaodavarivel predita. A variaoque permanece semser explicada e justificada aoacasovariao residual.Regresso linear:Temos uma varivel aleatria dependente (varivel y) e uma (no caso de regresso simples) ou vrias (no caso de regresso mltipla) variveis no aleatrias independentes (variveis x suposta sem erro).Varivel aleatriaapresentauma parcela de variaoresidualque responsvel pela disperso dos pontos experimentais em relao linha de regresso.Praticamente, temos muitos casos emqueavarivel xpodeser medidacom preciso muito maior do que y e, alm disso, em muitos casos os valores de x so pr-escolhidos pelo experimentador.J os valores de y, sendo aleatrios, no podem ser exatamente previstos e sero determinados experimentalmente. Portanto, os valores de x independem de y; j os valores de y dependem dos valores de x.Pg.:41S i m p l e s M l t i p l aL i n e a r N o - L i n e a rR e g r e s s oCQE 2011- ASQ - USIMINAS A regresso visa obter uma equao para prever os valores da varivel dependente y em funo da(s) varivel(is) independente(s) x. Temos uma equao da forma: y = (x) + ,onde: denota a funo de regresso; a componente aleatria da variao de y.1.1. CLCULO E USO DO MODELO DE REGRESSO MTODO DOS MNIMOS QUADRADOS:xyDevemos procurar a reta para a qual se consiga minimizarn1 i2idonde di so as distncias indicadas acima, isto , a variao residual em torno da reta estimativa.[ ] [ ] n1 i2i2i i2i) x . b a y ( min ) y y ( min d minOs valores de a e b que minimizam a expresso acima so os que anulam as derivadas parciaisdesta expresso em relao a a e b , respectivamente.nx . b ya) x ( ) x .( n) y ).( x ( ) y . x .( nb2 2 Pg.:42CQE 2011- ASQ - USIMINAS Exemplo: os seguintes dados foram obtidos experimentalmente:x 1 2 3 4 5 6 7 8y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0Obter a equao da reta de mnimos quadrados e calcular o coeficiente de correlao linear.00,511,520 5 10x y x.y x2 y21 0,5 0,5 1 0,252 0,6 1,2 4 0,363 0,9 2,7 9 0,814 0,8 3,2 16 0,645 1,2 6,0 25 1,446 1,5 9,0 36 2,257 1,7 11,9 49 2,898 2,0 16,0 64 4.0036 9,2 50,5 204 12,64174 , 0nx . b ya217 , 0) x ( ) x .( n) y ).( x ( ) y . x .( nb2 2 Portanto: y = 0,174 + 0,217 .xPg.:43CQE 2011- ASQ - USIMINAS 978 , 0) y ( ) y .( n . ) x ( ) x .( n) y )( x ( ) y . x .( nr2 2 2 2 Obs.: os valores preditos so valores mdios; a extrapolao dos resultados arriscada; a reta de regresso passa sempre pelo ponto) y , x (1.2. ESTIMAO E INFERNCIA EM REGRESSO LINEAR: Por que existe disperso?porque no existe um relacionamento perfeito entre as duasvariveisnapopulaohoutrasvariveisqueinfluenciamosvaloresda varivel dependenteemgeral umoudoisfatoresrespondempor quasetodaa variao da varivel dependente.Premissas da anlise de regresso: a varivel dependente aleatria; para cada valor de x h uma distribuio condicional de ys que normal; os desvios padro de todas as distribuies condicionais so iguais (homoscedasticidade).Pg.:44IMPORTANTE:CQE 2011- ASQ - USIMINAS - O erro padro da estimativa:Disperso na populao: quanto maior a disperso, menor a preciso das estimativas.A quantidade de disperso na populao pode ser estimada com base na disperso das observaes amostrais em relao reta de regresso:2 ny . x . b y . a y2 n) y y (s2 2i ie se = desvio padro da distribuio de pontos em torno da reta de regresso;(n-2) = nmero de graus de liberdade perdemos dois g.l. ao calcular a e b.- Inferncias sobre b:indicaes de relacionamento nos dados amostrais quando no existe relacionamento na populao,devido a fatores aleatrios na amostragem.Questo: as variveis so relacionadas?No coeficiente angular = 0.Sim coeficiente angular 0.Teste de hipteses:H0: = 0H1: 0Como o desvio padro da populao desconhecido, usamos t de Student,com (n-2) graus de liberdade.b bsbs0 bo a~padr desvioesperado) (valor- amostral) valor(t sb desvio padro da distribuio amostral do coeficiente angular.[ ]b bb2 2 e bs . t b t.s - bt.s b : para confiana de intervalon / ) x ( x1. s s+ t Pg.:45CQE 2011- ASQ - USIMINAS indica o intervalo provvel que pode estar; pode ser usado para testar a significncia de um coeficiente angular amostral.Exemplo: verificar se no exemplo anterior, podemos suspeitar do no relacionamento das variveis a um nvel de significncia de 1%.H0: = 0H1: 0[ ]crit 005 , 0 ; 6 2 / ); 2 n (bcalc2 2e b2et 707 , 3 t t12 , 12sbt0179 , 0n / ) x ( x1. s s116 , 02 ny . x . b y . a ys Como tcalc > tcrit rejeitamos a hiptese H0Intervalo de confiana para : b tt.sb 0,217 t0,067 0,15 0,284.O coeficiente de determinao r 2 O coeficiente de determinao, r2, exprime a proporo da variao total de y que explicada pela reta de regresso. variao total: variao dos pontos em torno de y:2i) y y ( variao no explicada: desvios verticais dos yis em relao a reta de regresso no podem ser explicados somente pelo valor de x:(RES) SS ) y y (2i i variao explicada: quantidade de desvio explicada pela reta de regresso a diferena entre a variao total e a no explicada:(REG) SS ) y y ( ) y y (2i i2i Pg.:46CQE 2011- ASQ - USIMINAS SS(RES) + (REG) SS(REG) SS) y y () y y ( ) y y ( total variaoexplicada variaor2i2i i2i 2 Para clculo: [ ]2 nn / ) y ( y . nsss1ss sr2 22y2y2e2y2e2y 2 0 r2 1; r2 = 1 no haveria variao residual e todos os pontos estariam alinhados; r = t0,7 teramos r2 = 0,49, significando que a curva de regresso no consegue explicar nem a metade da variao de y. razovel supor que outras variveis, no includas no estudo, sejam importantes; r 0,9terbastanteutilidadeotraadodacurvaderegresso, poisela explica mais de 80% da variao total de y.- ANOVA para regresso simples:Fonte de variaoSoma dos Quadrados (SS)Graus de liberdade (df)QuadradoMdio(MS)FDevido regresso2i) y y (11(REG) SS= (REG) MS(RES) MS(REG) MSResduo2i i) y y ((n-2)2 - n(RES) SS= (RES) MSTotal2i) y y ( (n-1)Para o exemplo anterior:Fonte de variao SS df MS FDevido regresso 1,9793 1 1,9793 147,15Resduo 0,0807 6 0,01345Total 2,06 7Pg.:47CQE 2011- ASQ - USIMINAS Obs.: notequeovalor deFigual aoquadradodovalor detnotestede significncia; no mera coincidncia teste F com 1 d.f. no numerador teste t.- Regresso linear mltipla: Uma varivel dependente (y) e duas ou mais variveis independentes (xi): + + + + + k k 2 2 1 1 0x . ... x . x . y Obteno da equao de predio:k k 2 2 1 1 0x . b ... x . b x . b b y + + + + a imposio do critrio dos mnimos quadrados leva a um sistema de equaes, cuja soluo fornece os bis.- Funes linearizveis:Certas funes, mediante transformaes convenientes, linearizam-se, o que torna simples a soluo do problema de regresso. Por exemplo: x . B A zlog = B ; log = A ; ylog = z fazendolog . x log y log. yx+ + (outros exemplos: tabela III.4, pg. 272, bible - Pyzdek).Obs.: quando o processo de linearizao envolve transformaes na varivel dependente y, as premissas feitas na anlise de regresso podem deixar de valer; neste caso, fica prejudicada a aplicao dos testes estatsticos.Pg.:48CQE 2011- ASQ - USIMINAS 2. CORRELAO LINEAR SIMPLES : Anlise de dados amostrais para saber se e como duas ou mais variveis esto relacionadas uma com a outra numa populao. Anlise de correlao mede a fora ou grau de relacionamento entre duas variveis til no trabalho exploratrio. Anlisederegressodescreveorelacionamentoemtermosmatemticos (equao). importante, inicialmente, fazer umgrficodedispersodas variveis visualizao de como as variveis se correlacionam (qual a tendncia de variao conjunta).2.1. TIPOS DE CORRELAO LINEAR: Acorrelaoconsideraavariaoconjuntadeduasmedies, nenhumadelas restringida pelo experimento, e que a distribuio de freqncia conjunta seja normal (normal bivariada). Tanto x como y so variveis aleatrias contnuas.No h dependncia funcional entre as variveis; a anlise de correlao fornece um valor (coeficiente de correlao), que quantifica o grau de correlao.Correlao linear positiva quando observado que para maiores valores de x temos a tendncia de obtermos maiores valores de y e vice-versa.Pg.:49CQE 2011- ASQ - USIMINAS Correlao linear negativapara maiores valores de x a tendncia se observar menores valores de y e vice-versa.Correlao linear nula quando, intermediariamente, temos os casos de variveis no correlacionadas.Correlao no linear so outros tipos de correlao que podem existir mas que no so lineares.Pg.:50CQE 2011- ASQ - USIMINAS 2.2. CLCULO E INTERPRETAO DO COEFICIENTE DECORRELAO Coeficiente r de Pearson:Propriedades: sinal (+ ou -) indica qual a tendncia de variao conjunta das duas variveis; magnitude indica a perfeio do relacionamento (quo prximos da reta esto os pontos individuais).O coeficiente r de Pearson pode ser escrito como; n1 iin1 i2in1 ii i) y y ( . ) x x () y y ).( x x (rpara clculo manual, a frmula mais prtica a seguinte: 2 2 2 2) y ( ) y .( n . ) x ( ) x .( n) y )( x ( ) y . x .( nr(ver Correlao Momento-Produto: Conceituao - Stevenson, pg.370). r uma estimativa do coeficiente de correlao populacional r uma estatstica; adimensional seu valor no afetado pelas unidades das variveis; varia de -1 a +1 facilita a interpretao; r = -1 correlao linear negativa perfeita; r = +1 correlao linear positiva perfeita; r = 0 ausncia de relacionamento.Obs.: um alto valor de r, embora estatisticamente significativo, pode no implicar qualquer relao de causa eefeito,massimplesmente a tendnciaqueasvariveis apresentam quanto sua variao conjunta.Pg.:51CQE 2011- ASQ - USIMINAS 2.3. TESTE DE HIPTESE DE r : se a amostra tem apenas 2 pontos r = 1isto no quer dizer que temos uma correlao linear perfeita, mas apenas que a amostra pequena para se tirar concluso. Algumas vezes, deinteressesaber seovalor calculadoder, aliadocomo respectivo tamanho da amostra, permite concluir, a um dado nvel de significncia , se existe uma correlao linear entre as variveis devemos ento, testar as hipteses:H0: = 0 H1: 0 ou > 0 ou < 0.O teste feito com t de Student: 2calc 2 nr 12 n. r ) t (; 0 parat t0 > ou0 < parat t2 / ; 2 n crit.; 2 n . crit Exemplo: verificar se podemos, ao nvel de 5%de significncia, concluir pela existnciadecorrelaopositivaentrealturaepesodaspessoas, conformetabela abaixo:Pessoa 1 2 3 4 5 6 7 8 9 10Altura (cm)174 161 170 180 182 164 156 168 176 175Peso (kg) 73 66 64 94 79 72 62 64 90 81020406080100150 160 170 180 190HWPg.:52CQE 2011- ASQ - USIMINAS Clculo de r: 772 , 0 r127753 y . x56643 y 745 y291678 x1706 x22 Teste de hipteses:H0: = 0H1: > 00 crit calc.05 , 0 ; 8 . crit2calc 2 nH se - rejeita t t como860 , 1 t t44 , 3) 772 , 0 ( 12 10. 772 , 0 ) t ( > Podemos concluir pela existncia de correlao positiva, ao nvel de 5% de significncia.2.4. INTERVALODE CONFIANA PARA COEFICIENTE DECORRELAO:Para uma amostra moderadamente grande (n25), o intervalo de confiana para dado por:onde: r: coeficiente de correlao estimado; ln: logaritmo neperiano; tanh: tangente hiperblica , tanh= (ex- e-x)/(ex+e-x); Z /2: obtido da tabela de distribuio normalizada.Pg.:531]1

+

,_

+ 1]1

,_

+ 3 nZr 1r 1ln21tanh3 nZr 1r 1ln21tanh2 / 2 /CQE 2011- ASQ - USIMINAS Exemplo: Uma amostra de tamanho n=30 foi retirada para verificar tempo de falha de umcomponente eletrnico e a temperatura na qual o componente usada. O coeficientedecorrelaoentreotempodefalhaeatemperaturaencontradofoi r=0,32. Construa um intervalo com 95% de confiana para o coeficiente de correlao verdadeiro .Concluso: umavez queointervalocontmovalor zero, temos evidnciapara concluirmos que acorrelaoentre tempodefalha etemperaturade usono significativamente diferente de zero no nvel 95% de confiana.Pg.:541]1

+ ,_

+ 1]1

,_

+3 3096 , 132 , 0 10,32 1ln21tanh3 3096 , 132 , 0 10,32 1ln21tanh [ ] [ ] 3372 , 0 3316 , 0 tanh 3372 , 0 3316 , 0 tanh + 7088 , 0 0456 , 0 CQE 2011- ASQ - USIMINAS 3. ANLISE DE SREIS TEMPORARIS BSCIAS : 2 3.1. DEFINIO: Uma srie temporal um conjunto de dados estatsticos que so coletados, registrados eobservadosemsucessivosincrementosdetemposdeterminados, comumenteem intervalos iguais. Aanlise dos dados de uma srie temporal tempor objetivo determinar se eles apresentam algum padro no-aleatrio. Os padres no-aleatrios podem ser usados para predies quanto ao futuro. O grande potencial do estudo de sriestemporaisresidenapossibilidadedeprediodeumvalordesconhecidoda srie.Exemplo: A tabela a seguir apresenta o crdito aos consumidores no Brasil, em percentagem do PIB, segundo dados do Banco Central.3.2. COMPONENTES DE UMA SRIE TEMPORAL 3.2.1. TENDNCIA (T) (Tendncia - Movimentos a longo prazo ou seculares)Direogeral segundooqual parecequeogrficosedesenvolveemumlongo intervalo de tempo indicado pela curva de tendncia.2 Bibliografia usada: MILONE, Giuseppe & ANGELINI, Flvio. Estatstica Aplicada. So Paulo. Editora Atlas. 1995.Pg.:55Crdito ao ConsumidorAnoUS$ Bilhes % do PIB80 12,8 3,681 9,8 2,982 13,3 3,983 7,2 2,284 7,3 2,185 8,2 2,286 6,8 1,787 3,7 0,988 2,9 0,789 2,6 0,690 1,6 0,491 2,1 0,592 3,3 0,8Crdito ao Consumidor0246810121480 82 84 86 88 90 92AnoUS$ Bilhes % do PIBCQE 2011- ASQ - USIMINAS Finalidades de se isolar a componente de tendncia: a base do processo decisrio (estimativa de demanda futura);Remover a tendncia de modo a permitir a anlise de outras componentes;Identificar a tendncia de modo a permitir lev-la em conta ao planejar decises.3.2.1.1. MTODOS PARA ISOLAR A TENDNCIA: 3.2.1.1.1. ANLISE DE TENDNCIA: o melhor processo. A tendncia dos dados dada pela curva de ajustamento.Quando a anlise de regresso usada em dados de sries temporais (como em dados financeiros), freqentemente ocorre autocorrelacionamento dos resduos Quando existe autocorrelacionamento dos resduos, a anlise de regresso no conduz a bons resultadosA presena de autocorrelao dos resduos freqentemente indica que uma ou mais varveis importantes no foram consideradas no modelo.Teste paraverificaose existe autocorrelaodos resduostestede Durbin-Watson.Mtodos de anlise quando existe autocorrelao dos resduosmtodo das primeiras diferenas (o mais simples).3.2.1.1.2. MDIAS MVEIS: "Este processo, que objetiva suavizar as variaes na varivel estudada tem a grande vantagem de no exigir a determinao de nenhuma curva a qual a tendncia deva se adaptar. Oajustamentofeitocombasenas "mdias mveis deordemk", que consistenoconjuntodasmdiasdosltimoskvaloresdasriededados(quanto maior aordemdas mdias maior a"suavizao" obtida). Emboraomtodoseja bastanteflexvel edeaplicaosimples, filtrandofacilmenteasvariaescclicas, estacionais ou aleatrias, temdiversas desvantagens. Uma delas que reduz o tamanho da srie original; outra a de no ser aplicvel para o estudo que acontece foradointervaloconsiderado; outramais equepodegerar movimentos cclicos inexistentes nos dados originais; e, por fim; como toda a mdia, afetada por valores extremos, podendo gerar algumas distores.Pg.:56CQE 2011- ASQ - USIMINAS Aescolhadaordemdasmdiasmveisdependedoperododociclo. Osefeitos cclicos(maisossazonaiseosaleatrios)deumasrietemporalseroeliminados tomando-se mdias mveis de ordem igual ao perodo do ciclo.O efeito de utilizao de uma mdia mvel remover as variaes sazonais, cclicas e irregulares, o que resta considerado tendncia.Limitao: quase impossvel remover completamente variaes cclicas e irregulares.Ideal: mdias com perodos de tempo longo.Problema: quanto mais dados, menos sensvel a mdia se torna a observaes recentes (s vezes necessrio ponderao)05101520250 5 10 15 20MM de 5 perodosLinear (Seqncia1)3.2.2. CCLICO (C) (Movimentos ou variaes cclicas)3 So oscilaes a longo prazo ou desvios em torno da reta ou curva de tendncia. Podem ser ou no peridicos.Pg.:57CQE 2011- ASQ - USIMINAS 3 Pode ser obtida de uma das seguintes expresses:ouonde: A a amplitude da onda; T o ciclo do perodo; u a fase.3.2.3. SAZONAL (S) (Movimentos ou variaes por estaes ou sazonais) So variaes cclicas a prazo relativamente curto. So padres idnticos, ou quase, que uma srie temporal parece obedecer durante os mesmos meses de anos sucessivos. So resultantes de eventos peridicos.3 Ocorrem regularmente dentro do perodo de um ano.Finalidades de se isolar a componente sazonal: remover o padro sazonal para se estudar a variao cclica; identificar os fatores sazonais para lev-los em conta na tomada de decises.3 Mtodos para isolamento: Porcentagem da Mdia; Porcentagem da Tendncia; Porcentagem das Mdias Mveis; Srie de Elos Relativos;Tcnicamaisusadaparaanlisedavariaosazonalmtododarazo-para-a-mdia-mvel (ratio-to-moving-average method)(ver Stenvenson, pag.425).Pg.:581]1

Tu tA y) (2 sen 1]1

Tu tA y) (2 cos CQE 2011- ASQ - USIMINAS 3.2.4. IRREGULAR (I) (Movimentos irregulares ou aleatrios).So deslocamentos espordicos das sries temporais, provocados por eventos casuais.Ordinariamente so analisadas conjuntamente.Para isolar variaes cclicas, deve-se remover as outras variaes (tendncia e sazonal) depende do modelo adotado para a srie.Remoo das variaes sazonais: dados anuais ou mdia mvel de 12 meses (dados mensais)Remoo da tendncia: regresso ou mdia mvel de longo prazo.3.3. MODELOS DE SRIES TEMPORAIS: Omodelodeumasrieaespecificaodeforasquecontribuemparao movimento das sries e uma forma de se analisar o modo como essas foras interagem influenciando tanto a direo quanto a magnitude da srie. Multiplicativo: Y = T x C x S x I Aditivo: Y = T + C + S + I Misto: Y = T x C + S x IY = T x C x S + IPg.:59CQE 2011- ASQ - USIMINAS O mtodo clssico da anlise de sries temporais procura selecionar as componentes tendncia, variao cclica, variaes sazonais e variaes irregulares dos dados, a fim de analisar cada componente individualmente.3.4. ANLISES DE PADRO Na anlise de um modelo importante a avaliao dos resduos.Resduos que apresentem padres seqenciais no aleatrios (patterns) ou outliers so evidncias de modelos inadequados.Existem 4 maneiras de se plotar os resduos: global; em ordem cronolgica; contra a varivel predita (varivel resposta); contra a(s) varivel(is) independentes.Se as suposies feitas no desenvolvimento do modelo forem corretas, esperado que os resduos apresentem uma distribuio aproximadamente normal com mdia zero histograma de resduos padronizados nos d uma idia da distribuio dos resduos.Os padres seqenciais so avaliados pelas outras 3 maneiras de se plotar os resduos.Pg.:60CQE 2011- ASQ - USIMINAS DISTRIBUIO NORMALrea da cauda direita sob distribuio NormalObs.:Tabela melhor para se pegarvalor de /2 para problemas de INTERVALO DE CONFIANA.Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.03590.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.07530.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.11410.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.15170.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.18790.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.22240.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2518 0.25490.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.28520.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.31330.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.33891.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.36211.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.38301.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.40151.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.41771.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.43191.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.44411.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.45451.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.46331.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.47061.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.47672.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.48172.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.48572.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.48902.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.49162.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.49362.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.49522.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.49642.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.49742.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.49812.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.49863.0 0.4986 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.49903.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.49933.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.49953.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.49973.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 0.49983.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.49983.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.49993.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.49993.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.5000 0.5000 0.50003.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000Pg.:61Mdiaz