estatistica-aula06 estatistica descritiva

Download Estatistica-Aula06 Estatistica Descritiva

Post on 12-Dec-2015

2 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

Aula de estatistica descritiva

TRANSCRIPT

  • Prof. Anderson Paiva03/10/2014

    Aula 06 - Estatstica Descritiva

    UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO ACADMICO DO AGRESTE

    CURSO DE ENGENHARIA CIVILESTATSTICA

    Prof. Anderson PaivaSlide 2

    Anlise Bidimensional Em algumas anlises de dados pode surgir a necessidade de se fazer um estudo sobre o comportamento conjunto de duas ou mais variveis e para isso a distribuio conjunta de frequncias de grande utilidade.

    Vamos analisar em princpio o caso de 2 variveis

    Prof. Anderson PaivaSlide 3

    Anlise Bidimensional possvel observar a ocorrncia de trs situaes distintas que requerem tcnicas estatsticas tambm distintas. As trs situaes distintas que podem ocorrer so:

    2 variveis so Qualitativas; 2 variveis so Quantitativas; 1 varivel Qualitativa e 1 varivel Quantitativa.

    Prof. Anderson PaivaSlide 4

    Associao de duas variveis qualitativas

    Para ilustrar, analisaremos como se comportam as variveis: regio de procedncia (X) e grau de instruo (Y ) cuja distribuio de frequncias pode ser representada por uma tabela de dupla entrada abaixo:

  • Prof. Anderson PaivaSlide 5

    Associao de duas variveis qualitativasObservaes:1. Cada clula do corpo da tabela apresenta o nmero de ocorrncia simultnea dos valores (x; y) de X e Y , constituindo a distribuio conjunta;2. A coluna dos totais (frequncias marginais de X) constitui a distribuio marginal de X;

    Prof. Anderson PaivaSlide 6

    Associao de duas variveis qualitativasObservaes:3. A linha dos totais (frequncias marginais de Y ) constitui a distribuio marginal de Y ;4. Idntico ao caso de uma varivel, as frequncias absolutas podem ser expressas em termos de frequncias relativas e/ou porcentagens, sendo que, estas medidas podem ser obtidas em relao ao total geral, em relao ao total de cada linha ou em relao ao total de cada coluna, de acordo com o objetivo de cada anlise;

    Prof. Anderson PaivaSlide 7

    Associao de duas variveis qualitativasQuestes:a) O percentual de pessoas que possuem o 2 grau e que so do interior.

    Resp: 19,4%;b) Dentre os que possuem o 2 grau, qual o percentual de pessoas provenientes do interior?

    Resp: 38,9%;

    Prof. Anderson PaivaSlide 8

    Associao de duas variveis qualitativasQuestes:c) Sabendo-se que uma pessoa veio do interior, qual a probabilidade, em termos percentuais, de ter o 2 grau?

    Resp: 58,3%.

  • Prof. Anderson PaivaSlide 9

    Associao de duas variveis qualitativas Para responder estas e outras questes, torna-se til a construo de tabelas de dupla entrada contendo as frequncias relativas em termos de porcentagem, tendo como referncia o total geral, os totais de cada linha ou coluna, de acordo com a questo a ser respondida. Vejamos como ficam estas tabelas:

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 11% 14% 6% 31%

    Interior 8% 19% 6% 33%

    Outra 14% 17% 6% 36%

    Total marginal de Y 33% 50% 17% 100%

    Prof. Anderson PaivaSlide 10

    Associao de duas variveis qualitativas

    Prof. Anderson PaivaSlide 11

    Associao de duas variveis qualitativas

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 36% 45% 18% 100%

    Interior 25% 58% 17% 100%

    Outra 38% 46% 15% 100%

    Total marginal de Y 33% 50% 17% 100%

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 33% 28% 33% 31%

    Interior 25% 39% 33% 33%

    Outra 42% 33% 33% 36%

    Total marginal de Y 100% 100% 100% 100%

    Prof. Anderson PaivaSlide 12

    Associao de duas variveis qualitativas

    0%

    10%

    20%

    30%

    40%

    50%

    60%

    70%

    80%

    90%

    100%

    1 Grau 2 Grau Superior Total

    Outra

    Interior

    Capital

  • Prof. Anderson PaivaSlide 13

    Dependncia de Variveis Ocorre com bastante frequncia em anlises de distribuio conjunta o questionamento sobre a existncia de dependncia ou no entre as variveis, alm da necessidade de se saber o grau de dependncia entre elas, caso exista.

    De modo geral, o grau de dependncia entre duas variveis quantificado pelos coeficientes de associao ou correlao. Usualmente, esses coeficientes variam de zero at um, sendo que, s vezes, variam de -1 a 1.

    Desta maneira, valores prximos de zero do indcios de independncia entre as variveis e, valores prximos de 1 (ou -1) indicam um alto grau de dependncia positiva (ou negativa).

    Prof. Anderson PaivaSlide 14

    Dependncia de Variveis Existe ou no associao entre sexo e carreira, escolhido por 200 alunos?

    X \ Y Masculino Feminino Total

    Economia 85 35 120

    Administrao 55 25 80

    Total 140 60 200

    X \ Y Masculino Feminino Total

    Economia 61% 58% 60%

    Administrao 39% 42% 40%

    Total 100% 100% 100%

    No h dependncia, pois independente do sexo mantm-se a mesma proporo.

    Prof. Anderson PaivaSlide 15

    Dependncia de Variveis Existe ou no associao entre sexo e carreira, escolhido por 200 alunos?

    H disparidade entre as propores. Desta forma, sexo e carreira so variveis associadas (dependentes).

    X \ Y Masculino Feminino Total

    Fsica 100 20 120

    Cincias Sociais 40 40 80

    Total 140 60 200

    X \ Y Masculino Feminino Total

    Fsica 71% 33% 60%

    Cincias Sociais 29% 67% 40%

    Total 100% 100% 100%

    Prof. Anderson PaivaSlide 16

    Associao de duas variveis qualitativasMedida de Associao entre duas Variveis Qualitativas Coeficiente de contingncia (C)

    oij a frequncia absoluta observada na i-sima casela; eij a frequncia absoluta esperada na i-sima casela, caso houvesse independncia entre as variveis, ou seja, quando a proporo em cada categoria de uma varivel (fixada o total em linha ou coluna) igual ou prxima a proporo marginal. n o nmero mximo de observaes No entanto, o valor mximo de C depende de r e s, que so o nmero de categorias das variveis X e Y , respectivamente. Para evitar esse inconveniente, costuma-se definir um outro coeficiente, que varia entre 0 e 1, dado por

    Qui-quadrado de Pearson

  • Prof. Anderson PaivaSlide 17

    Associao de duas variveis qualitativasExerccio: Verifique se h associao entre as variveis regio de procedncia e grau de instruo, utilizando uma medida de associao.

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 36% 45% 18% 100%

    Interior 25% 58% 17% 100%

    Outra 38% 46% 15% 100%

    Total marginal de Y 33% 50% 17% 100%

    Prof. Anderson PaivaSlide 18

    Associao de duas variveis qualitativasExerccio: Verifique se h associao entre as variveis regio de procedncia e grau de instruo, utilizando uma medida de associao.

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 36% 45% 18% 100%

    Interior 25% 58% 17% 100%

    Outra 38% 46% 15% 100%

    Total marginal de Y 33% 50% 17% 100%

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 33% 50% 17% 100%

    Interior 33% 50% 17% 100%

    Outra 33% 50% 17% 100%

    Total marginal de Y 33% 50% 17% 100%

    Valores observados

    Valores esperados

    Prof. Anderson PaivaSlide 19

    Associao de duas variveis qualitativasExerccio: Verifique se h associao entre as variveis regio de procedncia e grau de instruo, utilizando uma medida de associao.

    X \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 4 5 2 11

    Interior 3 7 2 12

    Outra 5 6 2 13

    Total marginal de Y 12 18 6 36

    Valores observados

    Valores esperadosX \ Y 1 Grau 2 Grau Superior Total marginal de X

    Capital 3,63 5,50 1,87 11

    Interior 3,96 6,00 2,04 12

    Outra 4,29 6,50 2,21 13

    Total marginal de Y 12 18 6 36

    Prof. Anderson PaivaSlide 20

    Associao de duas variveis qualitativasExerccio: Verifique se h associao entre as variveis regio de procedncia e grau de instruo, utilizando uma medida de associao.

    C = 0,1350

    T = 0,0681

    0,6683

    N = 36

    As variveis so basicamente independentes, pois o valor de coeficiente prximo de 0.

  • Prof. Anderson PaivaSlide 21

    Associao de duas variveis quantitativasMedida de Associao entre duas Variveis Quantitativas

    Neste caso, pode-se aplicar um procedimento anlogo ao realizado para a anlise de variveis qualitativas.

    E, por se tratar de variveis quantitativas, antes de construir uma tabela de dupla entrada, os dados marginais podem ser agrupados em intervalos de classe, assim como no caso de uma nica varivel.

    Em anlises de associao entre variveis quantitativas, so possveis procedimentos analticos mais refinados.

    Prof. Anderson PaivaSlide 22

    Associao de duas variveis quantitativasMedida de Associao entre duas Variveis Quantitativas

    Diagrama de Disperso O diagrama (ou grfico) de disperso nada mais que a representao de pares dos valores observados (x; y) num sistema cartesiano.

    Prof. Anderson PaivaSlide 23

    Associao de duas variveis quantitativasMedida de Associao entre duas Variveis Quantitativas Diagrama de Disperso

    Prof. Anderson PaivaSlide 24

    Associao de duas variveis quantitativasMedida de Associao entre duas Variveis Quantitativas Coeficiente de Correlao Dados n pares de valores (x1; y1); (x2; y2); ...; (xn; yn), chama-se coeficiente de correlao entre as variveis X e Y o valor obtido por

    ou seja, a mdia dos produtos dos valores reduzidos (padronizados) das variveis. Enquanto o coeficiente T para variveis qualitativas s assume valores ente 0 e 1, o coeficiente de correlao pode assumir qualquer valor entre -1 e 1. Frmula alternativa

  • Prof. Anderson PaivaSlide 25

    Associao de duas variveis quantitativasMedida de Associao entre duas Variveis Quantitativas Coeficiente de Correlao

    O numerador da expresso acima, que mede o total de concentrao dos pontos pelos quatro quadrantes, d origem covarincia que um