curso estatÍstica excel (reparado)

Upload: francisco-nagib-jr

Post on 17-Jul-2015

167 views

Category:

Documents


0 download

TRANSCRIPT

Curso de Estatstica Descritiva e Anlise Exploratria de Dados1. Conceitos fundamentais da estatstica descritivaPopulao: Toda questo de pesquisa define um universo de objetos aos quais os resultados do estudo devero ser aplicados. Amostra: Uma amostra um subconjunto de indivduos da populao alvo. Varivel: uma caracterstica da populao Varivel qualitativa (ou categrica) nominal: So aquelas cujas respostas podem ser encaixadas em categorias, sendo que cada categoria independente, sem nenhuma relao com as outras: sexo (masculino, feminino), raa (branco, preto, outro), etc. Varivel qualitativa (ou categrica) ordinal: So aquelas cujas categorias mantm uma relao de ordem com as outras, que podem ser regulares ou no (existe uma ordem natural nas categorias): classe social (alta, mdia, baixa), auto percepo de desempenho em Estatstica (pssimo, ruim, regular, bom, timo), etc. Varivel quantitativa discreta: So aquelas resultantes de contagens, constituem um conjunto finito de valores: nmero de filhos, nmero de reprovaes em estatstica, idade em anos completos, etc. Varivel quantitativa contnua: Resultados de mensuraes, podem tomar infinitos valores: pontuao na escala de atitude, nota na prova de estatstica, pontuao no vestibular, etc.

2. Medidas de Tendncia CentralMdia aritmtica o valor que representa um conjunto de valores da populao ou de uma amostra. Definida como a soma de todos os valores da populao ou amostra dividida pelo nmero de observaes. Por exemplo: renda per capita de um pas, esperana de vida, renda familiar mdia, pontuao mdia na escala de atitudes em relao Estatstica, etc. Frmula:

Para obter no excel: Clique na guia frmulasinserir funo selecione a funo mdiaok em Nm1 selecione o intervalo de dados que deseja obter a mdiaok. Formula para obter no Excel: =MDIA(clula de inicial do intervalo de dados:clula final dointervalo de dados)

Mdia Ponderada o valor que representa um conjunto de valores da populao ou de uma amostra. Difere da mdia aritmtica porque atribui pesos a cada valor da populao ou amostra. A mdia aritmtica ponderada p de um conjunto de nmeros x1, x2, x3, ..., xn cuja importncia relativa ("peso") respectivamente p1, p2, p3, ..., pn calculada da seguinte maneira:

p

=

Formula para obter no Excel: =SOMARPRODUTO(matriz de valores;matriz de pesos)/SOMA(matriz de pesos)

Mediana Mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, o valor situado de tal forma no conjunto que separa em dois subconjuntos de mesmo nmero de elementos. Ou seja, 50% dos valores esto abaixo da mediana e 50% dos valores esto acima da mediana. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo medok em Nm1 selecione o intervalo de dados que deseja obter a medianaok. Formula para obter no Excel: =MED(clula de inicial do intervalo de dados:clula final dointervalo de dados)

Moda Moda o valor que surge com mais frequncia se os dados so discretos, ou, o intervalo de classe com maior frequncia se os dados so contnuos. Esta medida especialmente til para reduzir a informao de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais no se pode calcular a mdia e por vezes a mediana. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo modo.nicook em Nm1 selecione o intervalo de dados que deseja obter a modaok. Formula para obter no Excel: = MODO.NICO(clula de inicial do intervalo de dados:clula finaldo intervalo de dados)

Obs: Como a mdia sensvel presena de dados atpicos, isto , valores altos podem elevar o valor da mdia ou valores baixos podem diminuir o valor da mdia. Com isso, nem sempre a mdia representa bem os dados. Nessas situaes, aconselha-se usar a mediana. J a moda, vai ser interessante quando estamos trabalhando com grficos e tabelas de frequncias. Exerccios Medidas de Tendncia central 1. Obtenha no excel a mdia, a mediana e a moda dos dados abaixo:

Ms Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro

Gasto mensal com combustvel R$ R$ R$ R$ R$ R$ R$ R$ R$ R$ R$ R$ 225,50 257,40 205,30 195,00 260,00 295,00 181,56 199,50 205,30 265,90 205,30 275,65

Interprete os resultados. 2. Alcebades participou de um concurso, onde foram realizadas provas de Portugus, Matemtica, Biologia e Histria. Essas provas tinham peso 3, 3, 2 e 2, respectivamente. Sabendo que Alcebades tirou 8,0 em Portugus, 7,5 em Estatstica, 8,0 em Biologia e 9,0 em Histria. Construa uma tabela no excel com os dados e responda qual foi a mdia que ele obteve?

3. Medidas de DispersoMnimo o menor valor do conjunto de dados. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo mnimook em Nm1 selecione o intervalo de dados que deseja obter o nmero mnimook. Formula para obter no Excel: = MNIMO(clula de inicial do intervalo de dados:clula final dointervalo de dados)

Mximo o maior valor do conjunto de dados. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo mximook em Nm1 selecione o intervalo de dados que deseja obter o nmero mximook. Formula para obter no Excel: = MXIMO(clula de inicial do intervalo de dados:clula final dointervalo de dados)

Varincia um valor que mede o grau de disperso dos valores da varivel, na populao ou na amostra, em relao mdia populacional ou a mdia amostral. Definida como a soma dos

quadrados dos desvios dos valores da varivel em relao a sua mdia, divido pelo nmero de observaes:

Valores altos da varincia indicam grande disperso dos dados e consequentemente heterogeneidade nos dados, ou seja, os dados assumem valores diferentes e distantes uns dos outros. Valores baixos da varincia indicam pequena disperso dos dados e consequentemente homogeneidade nos dados, ou seja, os dados assumem valores similares e prximos uns dos outros. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo VAR.A (amostra) ou VAR.P (populao)ok em Nm1 selecione o intervalo de dados que deseja obter a varinciaok. Formula para obter no Excel: =VAR.A(clula de inicial do intervalo de dados:clula final dointervalo de dados) do intervalo de dados) (amostra) =VAR.P(clula de inicial do intervalo de dados:clula final (populao)

Desvio padro Tambm um valor que mede o grau de disperso dos valores da varivel, na populao ou na amostra, em relao mdia populacional ou a mdia amostral. O desvio padro a raiz quadrada da varincia:

S2Valores altos do desvio padro indicam grande disperso dos dados e consequentemente heterogeneidade nos dados, ou seja, os dados assumem valores diferentes e distantes uns dos outros. Valores baixos do desvio padro indicam pequena disperso dos dados e consequentemente homogeneidade nos dados, ou seja, os dados assumem valores similares e prximos uns dos outros. Para obter no excel: Clique na guia frmulasinserir funo selecione a funo DESVPAD.A (amostra) ou DESVPAD.P (populao)ok em Nm1 selecione o intervalo de dados que deseja obter desvio padrook. Formula para obter no Excel: =DESVPAD.A(matriz de dados) (amostra)=DESVPAD.P(matriz de dados) (populao)

Coeficiente de Variao O coeficiente de variao CV a diviso do desvio padro pela mdia. A medida relativa CV permite a comparao de conjuntos de dados, pois seu resultado o desvio padro por unidade de mdia. Comparando duas variveis, a varivel que tiver menor CV tem menor disperso ou variabilidade. Formula para obter no Excel: = (clula contendo o valor do desvio padro/clula contendo o valorda mdia)*100

Exerccio Medidas de Disperso 1. Obtenha no excel para cada ano: a mdia, mediana, moda, mnimo, mximo, varincia,

desvio padro e coeficiente de variao dos dados abaixo.Gasto mensal com combustvel 2009 R$ 223,50 R$ 287,40 R$ 211,30 R$ 325,00 R$ 280,00 R$ 315,00 R$ 305,00 R$ 199,50 R$ 185,30 R$ 265,90 R$ 185,30 R$ 295,65 2010 R$ 175,50 R$ 307,40 R$ 285,30 R$ 175,00 R$ 262,50 R$ 295,00 R$ 181,56 R$ 159,50 R$ 262,50 R$ 285,90 R$ 235,30 R$ 262,50 2011 R$ 325,50 R$ 357,40 R$ 225,30 R$ 205,00 R$ 245,00 R$ 215,00 R$ 247,50 R$ 247,50 R$ 305,30 R$ 247,50 R$ 310,30 R$ 215,65

Ms Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro

Interprete os resultados. Em qual ano o gasto mdio com combustvel foi menor, em qual ano teve uma menor variabilidade de gasto com combustvel?

4. Tabelas de Frequncia e Anlise GrficaA frequncia do valor de uma varivel o nmero de repeties desse valor. Quando determinamos a frequncia de alguma varivel torna-se necessrio a construo de uma distribuio de frequncia (tabela com as respectivas frequncias dos possveis valores que a varivel em estudo pode assumir). Frequncia Absoluta: a contagem das repeties de cada valor dentro da varivel; Frequncia Relativa Percentual: o resultado de dividir sua frequncia absoluta pelo tamanho da amostra multiplicado por 100. Frequncia Acumulada: a soma das frequncias absolutas ou relativas percentuais da primeira classe at a ltima classe da tabela de frequncia.

Exemplo: Distribuio de Frequncia dos Salrios dos Bolsistas do Programa Pacto Federativo Lotados em Salvador, 2011

Classes de Salrios AT3 - R$ 720,00 AT2 - R$ 960,00 GT5- R$ 1.700,00 ITEC3- R$ 1.800,00 ITEC2- R$ 2.400,00 ITEC1- R$ 3.600,00 Total

Frequncia Absoluta 77 8 35 15 24 3 162

Frequncia Relativa Percentual 47,53 4,94 21,60 9,26 14,81 1,86 100,0

Frequncia Acumulada Absoluta 77 85 120 135 159 162 -

Frequncia Acumulada Percentual 47,53 52,47 74,07 83,33 98,14 100 -

Interpretao: Aproximadamente metade dos bolsistas do Pacto Federativo lotados em Salvador recebe bolsa de R$ 720,00 (47,53%). A classe AT3 a classe modal, pois tem a maior frequncia. 52,47% dos bolsistas recebem bolsas abaixo de R$ 1.000,00 e 47,53% dos bolsistas recebem bolsa acima de R$ 1.700,00. Grfico de Pizza O grfico de pizza deve ser usado preferencialmente para apresentar variveis com no mximo 4 eventos. Como construir no excel: Clique na guia InserirPizzaescolha o tipo de grfico de pizza desejadona janela aberta clique com o lado direito do mouse e escolha selecionar dadosem intervalo de classe dos dados selecione os dados que deseja fazer o grfico de pizzaokna guia Design escolha o Layout do grfico coloque titulo no grficoclique com o lado direito do mouse em cima do titulo e escolha a fonte e o estilo de fonte desejadaclique com o lado direito do mouse em cima da legenda e escolha a fonte e o estilo de fonte desejadaclique com o lado direito do mouse em cima dos rtulos dos dados e escolha a fonte e o estilo de fonte desejada para mudar o visual de seu grfico clique primeiro com o lado esquerdo do mouse e depois o lado direito do mouse e escolha formatar ponto de dadosem opes de srie e escolha o ngulo desejadoem preenchimento escolha o tipo de preenchimento e a cor desejada em cor da borda escolha cor desejadaem formato 3D escolha o bisel superior e inferior e escolha o material desejado. Grfico de Barras O grfico de barras deve ser usado preferencialmente para apresentar variveis com mais 4 eventos. Como construir no excel: Clique na guia InserirBarrasescolha o tipo de grfico de barras desejadona janela aberta clique com o lado direito do mouse e escolha selecionar dadosem intervalo de classe dos dados selecione os dados que deseja fazer o grfico de barrasokna guia Design escolha o Layout do grfico coloque titulo no grficoclique com o lado direito do mouse em cima do titulo e escolha a fonte e o estilo de fonte desejadaclique com o lado direito do mouse em qualquer barra do grfico e selecione adicionar rtulos aos dados clique com o lado direito do mouse em cima dos rtulos dos dados e escolha a fonte e o estilo de fonte desejada para mudar o visual de seu grfico clique duplo pausado primeiro com o lado esquerdo do mouse e depois clique simples com o lado direito do mouse e escolha formatar ponto de dadosem opes de srie e escolha a

profundidade desejado e a largura da barra desejadaem preenchimento escolha o tipo de preenchimento e a cor desejada em cor da borda escolha cor desejadaem formato 3D escolha o bisel superior e inferior e escolha o material desejadono eixo y do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixono eixo x do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixoem opes de eixo determine o valor mnimo, mximo, unidade principal e secundria do eixo. Grfico de Colunas O grfico de colunas deve ser usado preferencialmente para apresentar variveis com mais 4 eventos. Como construir no excel: Clique na guia InserirColunasescolha o tipo de grfico de colunas desejadona janela aberta clique com o lado direito do mouse e escolha selecionar dadosem intervalo de classe dos dados selecione os dados que deseja fazer o grfico de colunasokna guia Design escolha o Layout do grfico coloque titulo no grficoclique com o lado direito do mouse em cima do titulo e escolha a fonte e o estilo de fonte desejadaclique com o lado direito do mouse em qualquer coluna do grfico e selecione adicionar rtulos aos dados clique com o lado direito do mouse em cima dos rtulos dos dados e escolha a fonte e o estilo de fonte desejada para mudar o visual de seu grfico clique duplo pausado primeiro com o lado esquerdo do mouse e depois clique simples com o lado direito do mouse e escolha formatar ponto de dadosem opes de srie e escolha a profundidade desejado e a largura da coluna desejadaem preenchimento escolha o tipo de preenchimento e a cor desejada em cor da borda escolha cor desejadaem formato 3D escolha o bisel superior e inferior e escolha o material desejadono eixo x do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixoescolha o alinhamento desejado para o textono eixo y do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixoem opes de eixo determine o valor mnimo, mximo, unidade principal e secundria do eixo. Grfico de Linhas O grfico de linhas deve ser usado quando esta se analisando um conjunto de dados ao longo do tempo. Como construir no excel: Clique na guia InserirLinhasescolha o tipo de grfico de linha desejadona janela aberta clique com o lado direito do mouse e escolha selecionar dadosem intervalo de classe dos dados selecione os dados que deseja fazer o grfico de linhasokna guia Design escolha o Layout do grfico coloque titulo no grficoclique com o lado direito do mouse em cima do titulo e escolha a fonte e o estilo de fonte desejadapara mudar o visual de seu grfico clique primeiro com o lado esquerdo do mouse e depois clique com o lado direito do mouse e escolha formatar sries de dadosem opes de Marcador escolha o tipo desejadoem Preenchimento de Marcador escolha o tipo de preenchimento e a cor desejada em cor da linha escolha cor desejada em estilo da linha escolha a largura e o tipo de trao desejado em formato 3D escolha o bisel superior e inferior e escolha o material e a lunimosidade desejadano eixo x do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixoescolha o alinhamento desejado para o textono eixo y do grfico clique com o lado esquerdo do mouse e escolha a fonte e o estilo de fonte do eixoem opes de eixo determine o valor mnimo, mximo, unidade principal e secundria do eixo.

Exerccios Tabela de Frequncia e Anlise Grfica no Excel Determine as frequncias relativas percentuais, acumuladas absolutas e acumuladas percentuais do grau de escolaridade dos funcionrios da EBDA. Faa um grfico de coluna para representar os dados e analise o grfico.1.

Tabela do Grau de Escolaridade dos Funcionrios da EBDAEscolaridade Analfabeto Primrio incompleto (1 a 4 Srie) Primrio completo (1 a 4 Srie) 1 Grau incompleto (5 a 8 Srie) 1 Grau completo (Ginsio) 2 Grau incompleto (Colegial) 2 Grau completo (Colegial) Curso tcnico Superior incompleto Superior completo Superior com especializao Superior com mestrado Superior com doutorado No informou Total Fonte: Recursos Humanos Frequncia 2 25 66 39 56 31 546 143 21 600 52 48 5 2 1636

2.

Faa um grfico de barras com as informaes abaixo, bem como, a anlise grfica: Tabela do Estado Civil dos Funcionrios da EBDAEstado Civil Frequncia Casado 1033 Concubinato 12 Divorciado 149 No informou 1 Solteiro 413 Vivo 28 Total 1636 Fonte: Recursos Humanos Percentual 63,14 0,73 9,11 0,06 25,25 1,71 100,0

3. Faa um grfico de linha com as informaes abaixo e analise o mesmo:Ms Janeiro Fevereiro Gasto mensal com combustvel R$ R$ 225,50 257,40

Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro

R$ R$ R$ R$ R$ R$ R$ R$ R$ R$

205,30 195,00 260,00 295,00 181,56 199,50 205,30 265,90 205,30 275,65

4. Faa um grfico de pizza com as informaes abaixo e analise o mesmo: Tabela da Categoria de Atividade dos Bolsistas Lotados em SalvadorCategoria ADM Ater Subprojeto Total Frequncia 43 5 114 162 Percentual 27 3 70 100,0

Exerccios com os contedos abordados no Excel1.

Apresente os resultados dos exerccios feitos durante o curso.