capÍtulo 1 - federal university of juiz de fora · web viewcapÍtulo 2 representaÇÃo tabular e...

23
CAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são dispostos resumidos em forma de tabelas e estas são representadas por meio de gráficos. A disposição dos dados em de tabelas é denominada representação tabular e a disposição dos dados em gráficos é denominada representação gráfica. Os gráficos podem ser construídos a partir das tabelas ou dos dados. 2.1. REPRESENTAÇÃO TABULAR DOS DADOS Denomina-se tabela, em geral, uma disposição escrita não discursiva das informações de um fenômeno destacando-se as informações numéricas que constituem os dados da tabela. Para ilustrar a utilidade de uma tabela na análise estatística considere o banco de dados a seguir que contém os dados do número de desempregadosem certo município em cada região administrativa do mesmo em 2017 e 2018. n.º n.º de desempregados região ano 1 1 723 A 2017 2 2 180 A 2018 3 2 607 B 2017 4 2 940 B 2018 5 3 654 C 2017 6 2 750 C 2018 7 2 632 D 2017 8 1 610 D 2018 Estes dados podem ser dispostos segundo a espécie e a região como na tabela a seguir. Tabela 2.1Desempregados no município X segundo a região administrativa e o ano, 2017-2018 região ano 2017 2018 (1) região A 1 723 2 180 região B 2 607 (2) 2 940

Upload: others

Post on 22-Feb-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

CAPÍTULO 2REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS

Com o objetivo de facilitar a análise, os bancos de dados são dispostos resumidos em forma de tabelas e estas são representadas por meio de gráficos. Adisposição dos dados em de tabelas é denominada representação tabular e a disposição dos dados em gráficos é denominada representação gráfica. Os gráficos podem ser construídos a partir das tabelas ou dos dados.

2.1.REPRESENTAÇÃO TABULAR DOS DADOS

Denomina-se tabela, em geral, uma disposição escrita não discursiva das informações de um fenômeno destacando-se as informações numéricas que constituem os dados da tabela. Para ilustrar a utilidade de uma tabela na análise estatística considere o banco de dados a seguir que contém os dados do número de desempregadosem certo município em cada região administrativa do mesmo em 2017 e 2018.

n.º n.º de desempregados região ano1 1723 A 20172 2180 A 20183 2607 B 20174 2940 B 20185 3654 C 20176 2750 C 20187 2632 D 20178 1610 D 2018

Estes dados podem ser dispostos segundo a espécie e a região como na tabela a seguir.Tabela 2.1Desempregados no município X segundo

a região administrativa e o ano, 2017-2018

região ano2017 2018(1)

região A 1723 2180região B 2607(2) 2940região C 3654 2750região D 2632 1610

Fonte: Secretaria de Ação Social Nota: Considerados somente os empregos formais (1) Previsão feita em novembro de 2017 (2) Meses de janeiro a novembro

Esta disposição é denominada tabela. Na construção das tabelas estatísticas deve-se observar as normas do apêndice 2 no final deste capítulo.

2.1.1. CONSTITUIÇÃO DE UMA TABELA

Uma tabela é constituída de espaços e elementos que podem ser essenciais ou complementares.

Page 2: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

2.1.1.1.Espaços

a)Topo: é o espaço superior da tabela destinado ao seu número e ao seu título.

b)Corpo ou centro: é o espaço central da tabela destinado à moldura, aos dados numéricos e aos termos necessários à sua compreensão. O corpo da tabela contém quatro espaços menores: oespaço do cabeçalho, a coluna, a linha e a casa ou célula.

c)Espaço do cabeçalho: é o espaço superior do corpo da tabela destinado à indicação do conteúdo das colunas.

d)Linhas: são os espaços horizontais do corpo da tabela que contêm os dados numéricos e os termos que especificam os mesmos.

e)Colunas: são os espaços verticais do corpo da tabela que contêm dados numéricos e os termos que especificam os mesmos. As colunas que contêm os dadosnuméricos da tabela são denominadas colunas numéricas e a coluna que contém os termos que especificam as linhas é denominada coluna indicadorasendo obrigatoriamente situada à esquerda do corpo da tabela. Uma tabela pode ter mais de uma coluna indicadora.

f)Casas ou células: são os cruzamentos das linhas com as colunas. Uma casa contém somente umdado.

g)Rodapé: é o espaço inferior da tabela destinado aos elementos complementares.

2.1.1.2.Elementos essenciais

Os elementos essenciais devem existir em todas as tabelas e são apresentados a seguir.

a)Título:é a informação concisa colocada no topo da tabela que indica a natureza do fato observado eas abrangências local e temporal dos dados. Se o documento contém mais de uma tabela as mesmas deve ser numeradas. O número é colocado antes do título sendo separado do mesmo por um travessão e precedido da palavra Tabela (com a inicial maiúscula).

b)Dado numérico: é a quantificação de um fato específico observado. Pode ser o dado de uma variável quantitativa, a frequência ou a proporção de um dado de uma variável qualitativa ou quantitativa.

c)Moldura: é o conjunto de traços destinados a estruturar o corpo da tabela.A moldura deve ter no mínimo três traços horizontais: o primeiro para separar o topo do corpo da tabela, o segundo para separa o espaço do cabeçalho do restante do corpo da tabela e o terceiro para separar o corpo da tabela do rodapé.

d) Cabeçalho: é o conjunto de termos na parte superior do corpo da tabela que especificam o conteúdo da(s) coluna(s) indicadora(s) e numérica(s).

e)Indicador de linha: é o conjunto de termos que especificam o conteúdo de uma linha. Osindicadores de linha são dispostos na(s) coluna(s) indicadora(s).

2.1.1.3.Elementos complementares

Os elementos complementares existem somente quando são necessários e são apresentados a seguir.

a) Fonte: é a informação colocada no rodapé da tabela destinada a indicar a procedência dos dados.

b) Notas: são informações destinadas a esclarecer todo o conteúdo da tabela. No caso de haver duas ou mais notas, estas devem ser numeradas por algarismos romanos.

c) Chamadas: são informações destinadas a esclarecer o conteúdo de uma casa, linha ou coluna da tabela. As chamadas são indicadas no corpo da tabela por algarismos arábicos entre parênteses e a numeração deve crescer da esquerda para a direita e de cima para baixo. Quando uma chamada

2

Page 3: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

se refere a uma linha seu número deve ser colocado no indicador da mesma. Quando uma chamada se refere a uma coluna seu número deve ser colocado no indicador da mesma.

2.1.2. ESQUEMA GERAL DE UMA TABELA

Considerando-se todos os elementos segue abaixo o esquema geral de uma tabela.

2.1.3.SINAIS CONVENCONAIS

Em algumas situações uma casa de determinada tabela é preenchida por um sinal convencional em vez do valor correspondente. Os sinais convencionais mais utilizados são:a) ... dado numérico não disponível;b) -dado numérico igual a zero não resultante de arredondamento;c) x dado numérico omitido a fim de evitar individualização da informação; d) 0; 0,0; 0,00; 0,000, etcdado numérico igual a zero resultante de um dado numérico originalmente

positivod) 0; 0,0; 0,00; 0,000, etcdado numérico igual a zero resultante de um dado

numéricooriginalmentenegativoPode-se usar outros sinais convencionais a critério de quem elabora a tabela. Quando

uma tabela contém sinal(is) convencional(is) o(s) mesmo(s) devem(s) ser apresentado(s) em nota com os respectivos significados.

2.1.4. TABELA DE SIMPLES ENTRADA E TABELA DE MÚLTIPLA ENTRADA

Quanto ao número de critérios na classificação dos dados, uma tabela pode ser de simples entrada ou de múltipla entrada. Uma tabela é de simples entrada quando os dados de uma variável em estudo são classificados segundo um único critério como na tabela a seguir.

Tabela 2.2Pessoas satisfeitas com a administração dodo município X em 2018 por classe socioeconômicanuma amostra de 1722 pessoas

classe socioeconômica número de pessoasclasse A....................... 718classe B........................ 523classe C........................ 189classe D...................... 292

Neste caso a variável em estudo é o número de indivíduos e o critério usado para a classificação dos dados desta variável é a região.

Uma tabela é de múltipla entrada quando os dados de uma variável são classificados segundo mais de um critério. Se os dados são classificados segundo dois critérios, a tabela é de dupla entrada como a seguir porque os dados do número de indivíduos são classificados segundo dois critérios: a espécie e a região.

3

Page 4: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

Tabela 2.3Situação de 8059 pessoas economicamente ativas do município X segundoa região administrativa de seus domicílios e a situação, julho de 2019

região administrativasituação

totalempregadas desempregadas aposentadas

região A.................... 1 459 232 164 1 855região B.................... 2 230 266 136 2 632região C.................... 1 721 223 77 2 021região D................... 1 299 181 71 1 551total......................... 6 709 902 448 8 059

Neste caso a variável em estudo é o número de pessoas e os critérios para a classificação dos dados são a região administrativa e a situação das mesmas.

Se os dados de uma variável são classificados segundo 3 critérios, a tabela é de tripla entrada e assim por diante. A tabela a seguir é de tripla entrada porque os dados do número de pessoas economicamente ativas são classificados segundo 3 critérios: a região administrativa, a situação e o gênero.

Tabela 2.4Situação de 8059 pessoas economicamente ativas do município X segundo a regiãoadministrativa de seus domicílios e gênero, março de 2019

região administrativa

situaçãoempregadas desempregadas aposentadas

masculino feminino masculino feminino masculino feminino

região A.................... 846 613 153 79 120 44

região B.................... 1360 870 157 109 91 45região C.................... 792 929 138 85 50 27

região D.................... 675 624 128 53 45 26

total......................... 3673 3036 576 326 306 142

Neste caso a variável em estudo é o número de indivíduos e os critérios para a classificação dos dados são a espécie, a região e o sexo.

Pelo exposto acima nota-se que cada critério usado na classificação dos dadoscorrespondeauma entrada da tabela.

2.1.5.DISTRIBUIÇÃO DE FREQUÊNCIA

Para facilitar a análise dos dados de uma população (ou de uma amostra) de uma variável é conveniente resumi-los agrupando-os em categorias e indicando-se o número de dados em cada uma. Esta disposição é denominada distribuição de frequência.

As categorias podem ser os próprios dados ou intervalos numéricos denominados classes. No primeiro caso diz que os dados são agrupados isolados e no segundo caso os dados são agrupados em classes. O número de dados de determinada categoria é denominado freqüência absoluta ou simplesmente frequência da mesma. Além da frequência absoluta pode-se indicar também as frequências relativas das categorias. Asfreqüências relativas são úteis quando se deseja comparar duas ou mais distribuições de frequência. As frequências relativas podem ser unitárias ou percentuais.

A frequência relativa unitária de uma categoria é o quociente da frequência absoluta da mesma pelo tamanho da população (ou da amostra) enquanto que a frequência relativa percentual de uma categoria é o percentual de dados na mesma e representa o número de dados nesta categoria para cada 100dados da população (ou da amostra). A frequência relativa percentual pode ser obtida de duas maneiras: multiplicando-se a frequência relativa unitária por 100 (caso esta já exista)

4

Page 5: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

ou diretamente dividindo-se a frequência absoluta pelo tamanho da população (ou da amostra) e multiplicando-se o resultado por 100.

A distribuição de frequência absoluta e a distribuição de frequência relativa podem ser apresentadas em tabelas ou em gráficos. No caso de apresentação em tabelas as categorias são dispostas na coluna indicadora e as freqüências absolutas e relativas são dispostas nas colunas numéricas. A distribuição de freqüência absoluta e a distribuição de freqüência relativa podem ser apresentadas numa mesma tabela ou em tabelas separadas.

Quando uma distribuição de freqüência relativa é apresentada numa tabela ou num gráfico usa-se preferencialmente as frequências relativas percentuais porque são mais fáceis de serem interpretadas do que as frequências relativas unitárias.

As frequências relativas unitárias são utilizadas no cálculo de várias medidas descritivas de uma população ou de uma amostra a serem estudadas no próximo capítulo.

Para facilitar a construção da distribuição de freqüência de uma variável os dados iniciais, denominados dados brutos porque estão desordenados, devem ser dispostos em ordem crescente. O conjunto de dados após a ordenação é denominado rol.

2.1.10.1.Distribuição de freqüência de uma variável qualitativa

Se a variável em estudo é qualitativa o número de dados distintos é pequeno e assim sendo, as categorias são os dados (atributos da variável) como ilustra a tabela esquemática a seguir.

Títulovariável número de elementos %

x1 f 1 f 1/ N×100 ou f 1 /n×100x2 f 2 f 1/ N×100 ou f 1 /n×100⋮ ⋮ ⋮

xk−1 f k−1 f 1/ N×100 ou f 1 /n×100xk f k f 1/ N×100 ou f 1 /n×100

total N oun 100

Neste caso os dados são agrupados isolados. Se duas ou mais categorias têm um número de dados muito pequeno em relação às demais, podem ser reunidas numa única categoria.

Quando a variável é qualitativa ordinal é recomendável dispor os dados na coluna indicadora da tabela em ordem crescente.

Exemplo 2.1. A reação de 20 chefes de família de determinado município a uma medida governamental em julho de 2019 é classificada comomuito insatisfeito(1), insatisfeito(2), indiferente(3), satisfeito(4) e muito satisfeito(5). Realizou-se uma pesquisa com 20 chefes de família do referido município e os dados codificados estão no banco de dados a seguir.

3 2 3 2 4 1 3 1 3 2 3 4 2 2 3 4 5 1 3 2Construa uma tabela contendo as distribuições de freqüência absoluta e relativa destes

dados.Resolução

1.º)Códigos em ordem crescente1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 5

2.º)TabelaTabela 2.5Reação de 20 chefes de família do município X a

uma medida governamental, julho de 2019reação número de chefes de família %

muito insatisfeito 3 15insatisfeito.......... 6 30indiferente.......... 7 35satisfeito............. 3 15

5

Page 6: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

muito satisfeito... 1 5total..................... 20 100

2.1.10.2.Distribuição de freqüência de uma variável quantitativa

Se a população (ou amostra) tem poucos dados distintos (no máximo 20 no contexto deste curso) as categorias são os próprios dados como no caso da variável qualitativa e a tabela é construída do mesmo modo que no exemplo anterior ou seja, os dados são agrupados isolados. Como a variável é quantitativa os dados devem ser dispostos em ordem crescente na coluna indicadora como ilustra a tabela esquemática a seguir.

Títulovariável número de elementos %

x(1) f 1 f 1/ N×100 ou f 1 /n×100x(2) f 2 f 1/ N×100 ou f 1 /n×100⋮ ⋮ ⋮

x(k−1) f k−1 f 1/ N×100 ou f 1 /n×100

x(k ) f k f 1/ N×100 ou f 1 /n×100

total N oun 100

ondex(1)é o menor dado, x(2)é o segundo menor dado, ..., x(k1)é o penúltimo menor dado e x(k)é o maior dado sendo f1, f2, ..., f(k1) e fk suas respectivas frequências.

Exemplo 2.2.Realizou-se um experimento que consistiu em observar o número de pessoas em 40 domicílios de determinada região em junho de 2019. Os dados obtidos são apresentados a seguir. 4 4 4 7 4 1 2 3 6 4 6 4 4 6 3 5 3 4 4 4 5 6 5 4 7 4 5 3 4 5 6 2 5 2 7 8 3 5 5 3Construa as distribuições de frequência absoluta e relativa destes dados.

Resolução1.º) Dados em ordem crescente (rol)1 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 7 8

2.º) Tabela Tabela 2.10Pessoas por domicílio em 40 domicílios da região X

em junho de 2019pessoas por domicílio número de domicílios %

1 1 2,52 3 7,53 6 15,04 13 32,55 8 20,06 5 12,57 3 7,58 1 2,5

total 40 100,0Se a variável em estudo é quantitativa com muitos dados distintos (mais de 20 no neste

curso) as categorias são intervalos denominados classes como ilustra a tabela esquemática aseguir.

6

Page 7: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

Títulovariável número de elementos %

li1| ls1 f 1 f 1/ N×100 ou f 1 /n×100li2∨ls2 f 2 f 2/ N×100 ou f 1 /n×100

⋮ ⋮ ⋮linc1|lsnc1 f nc−1 f nc−1 /N×100 ou f nc−1 /n×100linc|lsnc f nc f nc /N×100 ou f nc/n×100

total N oun 100

Esta tabela tem nc classes sendo as mesmas fechadas à esquerda e abertas à direitasendoli1 e ls1 os limites inferior e superior, respectivamente, da primeira classe, li2 e ls2 os limites inferior e superior, respectivamente, da segunda classe, ..., linc1 e lsnc1 os limites inferior e superior, respectivamente, da (k1)-ésima classe (penúltima) e linc e lsnc os limites inferior e superior, respectivamente, da k-ésima classe (última). Tem-se ainda quef1, f2,, ..., fnc1, e fnc, são as frequências da primeira, da segunda, ..., da (k1)-ésima e da k-ésimaclasse, respectivamente.

Nesta tabela as classes são fechadas à esquerda e abertas à direita. Pode-se usar classes abertas à esquerda e fechadas à direita (li|ls), fechadas à esquerda e à direita(li||ls) ou abertas à esquerda e à direita (lils). Dá-se preferência às classes fechadas à esquerda e abertas à direita em primeiro lugar e às classes abertas à esquerda e fechadas à direita em segundo lugar porque caso as demais sejam utilizadas existe um risco de excluir algum dado no caso das classes fechadas à esquerda e à direita ou de considerar duas vezes um mesmo dado no caso das classes abertas à esquerda e à direita.

Nas classes fechadas à esquerda e abertas à direita ou nas abertas à esquerda e fechadas à direita o limite superior de uma classe é igual ao limite inferior da seguinte (se houver) e portanto as mesmas são contíguas; nas classes fechadas à esquerda e à direita o limite superior de uma classe é menor do que o limite inferior da seguinte (se houver) e portanto as mesmas não são contíguas existindo um intervalo entre as mesmas; nas classes abertas à esquerda e à direita o limite superior de uma classe é maior do que o limite inferior da seguinte e portanto as mesmas não são contíguas existindo uma sobreposição do final de uma com o início da seguinte. Se forem usadas classes fechadas à esquerda e abertas à direita os limites devem ser escolhidos de modo que algum dado não se situe no intervalo entre duas classes consecutivas pois caso isto ocorra o mesmo será excluído da tabela.

Se forem usadas classes abertas à esquerda e à direita os limites devem ser escolhidos de modo que algum dado não se situe na sobreposição de duas classes consecutivas pois se isto ocorrer o mesmo seria considerado duas vezes. Para que nenhum dado esteja situado entre duas classes consecutivas no primeiro caso ou na sobreposição de duas classes consecutivas no primeiro caso, o intervalo entre classes ou a sobreposição deve ser inferior à menor diferença possível entre dois dados que é 1(um) se os dados são inteiros ou arredondados para inteiro, 0,1 de os dados têm uma casa decimal, 0,01 de os dados têm duas casas decimais e assim por diante.

Para uma determinada classe, qualquer que seja seu tipo, a diferença c=lsli é denominada amplitude da mesma.

Em determinadas aplicações as classes são substituídas por seus pontos médios Denomina-se ponto médio de uma classe o valor equidistante dos limites da mesma que pode ser dado pela média aritmética dos limites, ou pela soma do limite inferior com a metade da amplitude ou pela diferença entre o limite superior e a metade da amplitude. Assim, o ponto médio de uma classe cujos limites inferior e superior são li e ls, respectivamente, e cuja amplitude é c é dado por (li+ls)/2, li+c/2 ou lsc/2.O ponto médio de uma classe representa os dados da mesma. Isto significa que quando se refere ao ponto médio de determinada classe, considera-se que os dados da mesma são iguais ao referido ponto médio. A distribuição de frequência destes dados considerando os pontos médios em vez das classes é apresentada na tabela a seguir.

Ao se iniciar a construção de uma tabela de distribuição de frequência deve-se determinar o número de classes e a amplitude das mesmas. O número de classes deve ser escolhido

7

Page 8: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

de modo que as frequências cresçam a partir da primeira classe até uma classe intermediária atingindo um valor máximo e diminua a partir desta classe até a última. Caso isto não seja possível após vários valores da amplitude das classes, pode-se juntar duas ou mais classes numa única, sendo que neste caso as classes terão amplitudes desiguais. Sempre que possível usa-se sempre classes de mesma amplitude o que facilita a análise da tabela. A experiência mostra que o número de classes deve estar entre 5 e 15 (existe polêmica com relação o número máximo de classes: alguns admitem um máximo de 20 classes). Ajustificativa para estes limites do número de classes é que, ao se agrupar os dados em classes há perda de informações porque os dados perdem a sua individualidade. Se o número de classes for muito pequeno a análise poderá ser bastante prejudicada pela grande perda de informações; por outro lado, se o número de classes for demasiadamente grande, ocorre bem menos perda de informações, porém ocorrerão dificuldades na análise porque a tabela se torna muito extensa contrariando o objetivo que é resumir os dados para facilitar a análise. Assim, o número de classes pode ser arbitrado entre 15 e 20 de acordo com o número de dados e ser ajustado até se obter uma distribuição satisfatória. Este procedimento exige experiência e bom senso.

Alternativamente pode-se usar um dos critérios a seguir para determinar o número nc de classes.

a)Regra de Sturges:

O número de classes, nc, é dado pela fórmula a seguir proposta pelo alemão Herbert Sturges:

nc=1+3,3 logn (amostra)ou

nc=1+3,3 log N (população)onde log n ou logN é o logaritmo decimal do tamanho da amostra ou da população. Como o resultado obtido por esta fórmula não é inteiro, arredonda-se o mesmo para o inteiro mais próximo.

b)Regra da raiz quadrada

O número de classes, nc, é dado por:nc=√n (amostra)

ounc=√N (população)

Se a raiz não é exata o valor é arredondado para o inteiro mais próximo.

c)Regra da potência de 2

O número de classes, nc, é o menor valor inteiro tal que 2nc≥n (amostra)

ou2nc≥N (população)

Dependendo do caso, pode ser necessário aumentar ou diminuir o número de classes obtido por estes processos para se obter uma distribuição satisfatória.

Para uma variável X em estudo, tendo sido definido o número de classes, nc e considerando-se classes fechadas à esquerda e abertas à direitas ou abertas à esquerda e fechadas à direita, a amplitude das mesmas é dada inicialmente por

c=x(n )−x(1 )

nc (amostra)ou

8

Page 9: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

c=x( N )−x(1 )

nc (população)

ondex(1)é o menor dado e x(n )(ou x( N )) é o maior dado da amostra (ou da população).Para garantir que todos os dados sejam incluídos na tabela, a amplitude de classe deve

ser o resultado ajustado para um valor acima do obtido (de preferência com o mesmo número de casas decimais que os dados) mesmo que a divisão seja exata.

Quanto aos limites de classe, o maior valor possível para o limite inferior da primeira é igual ao menor dado para classes fechadas à esquerda e igual ao menor dado menos a menor diferença possível entre dois dados para classes abertas à esquerda. Caso deseje, pode usar valores menores porém o menor valor possível do limite inferior da primeira classe deve ser tal que o limite superior da última seja superior ao maior dado para classes abertas à direita ou igual ao maior dado para classes fechadas à direita. Para outros tipos de classes abertas à esquerda e fechadas à direita, fechadas à esquerda e à direita e abertas à esquerda e à direita basta alterar os limites de classe.

Exemplo 2.3. Os dados a seguir referem-se à renda (em R$1000,00) de 40 famílias de determinado município no primeiro semestre de 2019.61 71 74 85 73 63 67 73 88 82 80 88 79 85 69 71 75 82 73 8563 72 71 79 73 75 61 75 86 74 69 79 77 67 72 80 70 76 80 76

Construa as distribuições de frequência absoluta e relativa destes dados usando classes fechadas à esquerda e abertas à direita.

Resolução

1.º)Rol61 61 63 63 67 67 69 69 70 71 71 71 72 72 73 73 73 73 74 7475 75 75 76 76 77 79 79 79 80 80 80 82 82 85 85 85 86 88 88

2.º) Cálculo do número de classes

Neste exemplo o número de classes, nc,será calculado pela fórmula de Sturges.nc=1+3,3 logn

n=40; log40 = 1,6 considerando-se uma casa decimal.nc=1+3,3×1,6=1+5 , 28=6 , 28=6

3.º)Calculo da amplitude da classes

x(1)=61 (menor dado); x(40 )=88 (maior dado)

c=x(40 )−x(1)

nc=88−61

6=4,5

Sendo os dados inteiros, é recomendável que a amplitude seja inteira e a menor diferença possível entre dois dados é igual a 1(um). Assim, o resultado encontrado deve ser ajustado para o menor inteiro acima, ou seja, 5 logo a amplitude das classes é igual a 5 para classes fechadas somente à esquerda ou à direita, 51=4 para classes fechadas à esquerda e à direita e 5+1=6 para classes abertas à esquerda e à direita.

4.º)Classes

Sendo a amplitude das classes igual a 5, o limite inferior da primeira classe é 61(menor dado) e o limite superior é 61+5=66; o limite inferior da segunda classe é 66 (limite superior da primeira classe) e o limite superior é 66+5=71; o limite inferior da terceira classe é 71 (limite superior da segunda classe) e o limite superior é 71+5=76; o limite inferior da quarta classe é 76 (limite superior da terceira classe) e o limite superior é 76+5=81; o limite inferior da quinta classe é 81(limite superior da quarta classe) e o limite superior é 81+5=86; o limite inferior da quinta classe é 86 ((limite superior da quinta classe)e o limite superior é 86+5=91.

5.º)TabelaA tabela é apresentada a seguir.

9

Page 10: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

Tabela 2.7Renda de 40 famílias do município X no primeiro semestre de 2019

renda (R$1000,00) número de famílias % 61|66 4 10,066|71 5 12,571|76 14 35,076|81 9 22,581|86 5 12,586|91 3 7,5

total………........... 40 100,0

Exemplo 2.4. Repita o exemplo 2.3 considerando classes abertas à esquerda e fechadas à direita.

Resolução

Para se obter uma tabela com classes abertas à esquerda e fechadas à direita a partir da tabela 2.11diminui-se 1(um) dos limites das classes e a tabela desejada é apresentada a seguir.

Tabela 2.8Renda de 40 famílias do município X no primeiro semestre de 2019

renda (R$1000,00) número de famílias % 60|65 4 10,065|70 5 12,570|75 14 35,075|80 9 22,580|85 5 12,585|90 3 7,5

total………........... 40 100,0

Exemplo 2.5. Repita o exemplo 2.3 considerando classes fechadas à esquerda e à direita

Resolução

Para se obter uma tabela com classes fechadas à esquerda à direita a partir da tabela2.11 mantém-se os limites inferiores e diminui-se 1(um) dos limites superiores e a tabela desejada é apresentada a seguir.

Tabela 2.9Renda de 40 famílias do município X no primeiro semestre de 2019

renda (R$1000,00) número de famílias % 61||65 4 10,066||70 5 12,571||75 14 35,076||80 9 22,581||85 5 12,586||90 3 7,5

total………........... 40 100,0

Exemplo 2.5. Repita o exemplo 2.3 considerando classes fechadas à esquerda e à direita

Resolução

Para se obter uma tabela com classes abertas à esquerda à direita a partir da tabela2.11 diminui-se 1(um) dos limites inferiores e soma-se 1(um) aos limites superiores e a tabela desejada é apresentada a seguir.

10

Page 11: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

Tabela 2.10Renda de 40 famílias do município x no primeiro semestre de 2019

renda (R$1000,00) número de famílias % 6066 4 10,06571 5 12,57076 14 35,07581 9 22,58086 5 12,58591 3 7,5

total………........... 40 100,0

2.1.11. DISTRIBUIÇÃO DE FREQUÊNCIA ACUMULADA

As distribuições de frequência definida acima são denominadas distribuições de frequência simples porque a frequência se refere somente a um dado (no caso de dados agrupados isolados) ou uma classe (no caso de dados agrupados em classes). No caso de uma variável quantitativa é conveniente em muitas aplicações usar a distribuição de frequência acumulada absoluta ou relativa.

Denomina-se frequência acumulada absoluta, ou simplesmente frequência acumulada de um dado ou de uma classe o número de dados incluindo o dado considerado e os anteriores, no caso de dados agrupados isolados, ou o número de dados incluindo a classe considerada e as classes anteriores, no caso de dados agrupados em classes. Deste modo, a freqüência acumulada de um dado é a soma da freqüência do mesmo com as freqüências dos dados anteriores e a freqüência acumulada de uma classe é a soma da freqüência da mesma com as freqüências das classes anteriores.

A frequência acumulada relativa de um dado ou de uma classe pode ser unitária ou percentual. A frequência acumulada relativa unitária é o quociente da frequência acumulada absoluta da respectiva de um dado ou de uma classe pelo tamanho da população (ou da amostra). A frequência acumulada relativa percentual de um dado ou de uma classe é a frequência acumulada do dado ou da classe para cada 100 dados da população (ou da amostra). Quando se apresenta a frequência acumulada numa tabela dá-se preferência à frequência acumulada relativa percentual porque esta é mais fácil de ser interpretada do que a frequência acumulada relativa unitária. Como no caso das freqüências acumuladas absolutas, a freqüência relativa de um dado é igual à soma da freqüência relativa do mesmo com as freqüências relativas dos dados anteriores e a freqüência relativa de uma classe é igual à soma da freqüência relativa da mesma com as freqüências relativas das classes anteriores.

Exemplo 2.7. Acrescente às distribuições de frequências absolutas e relativas da tabela2.10 do exemplo 2.2 as frequências acumuladas absolutas e relativas.

Resolução

A tabela resultante é apresentada a seguir.Tabela 2.11Pessoas por domicílio em 40 domicílios da região X em junho de 2019

número de pessoas número de domicílios % número de domicílios(1) % (1)

1 1 2,5 1 2,52 3 7,5 4 10,03 6 15,0 10 25,04 13 32,5 23 57,55 8 20,0 31 77,56 5 12,5 36 90,07 3 7,5 39 97,58 1 2,5 40 100,0

total…………….... 40 100,0 Nota: Sinal convencional utilizado: total omitido por ser desnecessário

11

Page 12: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

(1)Acumulado

Se os dados são agrupados em classes, as freqüências acumuladas representam o número de dados inferiores aos respectivos limites superiores quando as mesmas são abertas à direita e iguais ou inferiores a estes limites quando são fechadas à direita, enquanto que as frequências acumuladas relativas percentuais representam o número de dados inferiores aos respectivos limites superiores quando as mesmas são abertas à direita e iguais ou inferiores a estes limites quando são fechadas à direita para 100 dados da população (ou da amostra).

Exemplo 2.8.Acrescente às distribuições de frequências absolutas e relativas da tabela2.11 do exemplo 2.3 as frequências acumuladas absolutas e relativas.

Resolução

A tabela resultante é apresentada a seguir.Tabela 2.12Renda de 40 famílias do município X no primeiro semestre de 2019

renda (R$1000,00) número de famílias % número de famílias (1) % (1)

61|66 4 10,0 4 10,066|71 5 12,5 9 22,571|76 14 35,0 23 57,576|81 9 22,5 32 80,081|86 5 12,5 37 92,586|91 3 7,5 40 100,0

total.....………….. 40 100,0 NOTA: Sinal convencional utilizado: total omitido por ser desnecessário (1)Acumulado

2.2.REPRESENTAÇÃO GRÁFICA DOS DADOS

As tabelas são normalmente representadas por um gráfico para que se tenha uma visão global dos dados o que mais difícil de se conseguir a partir de uma tabela. Os gráficos constituem representações geométricas dos dados e deve ser claros, simples e verídicos.

2.2.1.INTERPRETAÇÃO DE UM GRÁFICO

Ao interpretar um gráfico o analista deve:a)Observar a variação dos dados, ressaltando o valor máximo, o valor mínimo, as variações mais

acentuadas e os dados predominantes, caso existam.b)Verificar, ao longo do tempo, se os valores da variável observada tendem a crescerem,

decrescerem ou a se manterem estacionários. c)Verificar ainda se existem ciclos periódicos e em caso afirmativo, observar a duração

aproximada do mesmo, no caso de séries temporais.d)Verificar se existe uma relação entre duas variáveis.

2.2.2.REGRAS GERAIS NA CONSTRUÇÃO DE UM GRÁFICO

Ao se construir um gráfico deve-se observar as regras a seguir.

a)Todo gráfico deve ter um título colocado no topo do mesmo, fonte (se houver), nota (se houver) e chamada (se houver) colocadas no rodapé. Se o documento contém mais de um gráficoos mesmos devem ser numerados. O número é colocado antes do título sendo separado do mesmo por um travessão e precedido da palavra Gráfico (com a inicial maiúscula).

b) Em caso de informações numéricas nos eixos deve ser indicada a origem dos dados na escala que representa os valores observados.

12

Page 13: CAPÍTULO 1 - Federal University of Juiz de Fora · Web viewCAPÍTULO 2 REPRESENTAÇÃO TABULAR E GRÁFICA DOS DADOS Com o objetivo de facilitar a análise, os bancos de dados são

c)Para facilitar a leitura dos gráficos é recomendável que os números correspondentes às marcas principais das escalas sejam1, 2, 5 ou múltiplos decimais/submúltiplosdecimaisdos mesmos como 10, 20, 500, 0,5, 0,01,por exemplo.

d) As distâncias que indicam as unidades das escalas devem ser rigorosamente uniformes como na ilustração a seguir.

e) Antes de iniciar a construção de um gráfico deve-se verificar a escala a ser usada, levando-se em consideração os valores extremos da variável a ser representada.A origem deve estar abaixo do menor valor observado e o mais próximo possível do mesmo enquanto que o maior valor da escala deve estar acima do maior valor observado e o mais próximo possível do mesmo. A origem e os demais números referentes às marcas de escala devem ser os mais redondos possíveis para facilitar a leitura do gráfico.

f)É facultado o uso de marcas de escala secundárias para facilitar a leitura do gráfico.

g) Pode-se utilizar linhas de grade (linhas auxiliares) para facilitar a leitura do gráfico como na ilustração a seguir.

13