analisecriminal_mod3

32
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009 Página 1 Análise Criminal

Upload: ebio-ninjutsu

Post on 27-Nov-2015

23 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 1

Análise Criminal

Page 2: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 2

Módulo 3 – Análise estatística criminal

Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para

compreender melhor as técnicas utilizadas na análise estatística criminal.

Ao final do módulo, você deverá ser capaz de:

- Definir os principais conceitos relacionados à estatística;

- Correlacionar as séries estatísticas aos fatores básicos que a estruturam;

- Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente;

- Identificar as técnicas utilizadas na estatística descritiva; e

- Definir análise de regressão.

O conteúdo deste módulo está dividido em cinco aulas: Aula 1 – Conceitos básicos

Aula 2 – Séries estatísticas

Aula 3 – Apresentação dos dados

Aula 4 – Estatística descritiva

Aula 5 – Análise de regressão

Aula 1 - Conceitos básicos

O termo estatística surgiu da expressão em latim– statisticum collegium – que significa

palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando

a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo

adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise

estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e

segurança pública.

Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística. - População: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma

característica em comum.

- Censo: É uma coleção de dados relativos a todos os elementos de uma população.

Page 3: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 3

- Amostra: É uma coleção de dados relativos a uma parte da população que a representa. É

usada, na maioria das vezes, por causa da impossibilidade e dos custos de coletar informações

de todos os elementos da população.

- Variáveis: São objetos que servem para guardar informações e permitem dar nomes a cada

uma das partes da informação que se quer guardar. Por exemplo, tratando-se de vitimização

dos indivíduos, há como variáveis distintas: quantos crimes o indivíduo sofreu, sua

escolaridade, seu gênero, sua idade, etc.

- Fluxo de execução da análise estatística: O trabalho de análise estatística resulta da

execução de quatro etapas dispostas conforme o diagrama abaixo: coleta, crítica,

apresentação e análise dos dados.

A execução do fluxo da análise estatística envolve sempre a possibilidade de se ter que

retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados

pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de

apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes

para garantir uma boa compreensão do fenômeno estudado. Figura 6: Fluxo da execução da análise estatística

Coleta de Dados – Após a definição do problema a ser estudado e o estabelecimento do

projeto de pesquisa (objetivo, a forma pela qual os dados serão coletados, cronograma das

Coleta de dados

Crítica de dados

Apresentação de dados

Elaboração de mapas

Elaboração de gráficos

Elaboração de tabelas

Análise

Elaboração do próprio conteudista.

Page 4: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 4

atividades, custos envolvidos, exame das informações disponíveis e delineamento da amostra),

o passo seguinte é a coleta de dados, que consiste na busca ou compilação das informações

em variáveis, componentes do fenômeno a ser estudado.

Crítica dos dados – A revisão crítica dos dados procede com a finalidade de identificar e

suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros

enganos. Esses valores podem ocorrer, principalmente, por problemas de preenchimento ou

digitação dos questionários.

Apresentação dos dados – Convém que sejam organizados em conjunto de dados de forma

prática e racional, para facilitar sua apresentação no formato de tabelas, gráficos ou mapas. A

execução dessa etapa ocorre de forma interligada à próxima etapa referente à análise dos

dados, pois com o desenvolvimento da análise é possível descobrir outras tabelas, gráficos ou

mapas que sejam necessários para uma melhor compreensão do fenômeno estudado.

Análise – Análise das informações produzidas a partir da leitura das tabelas, gráficos e mapas,

sistematizando as conclusões em um relatório.

Elaboração de tabelas / Elaboração de gráficos / Elaboração de mapas - Estatística descritiva: São técnicas analíticas utilizadas para resumir e apresentar os dados de uma

pesquisa, visando descrevê-la.

Estatística Descritiva: são técnicas analíticas utilizadas para resumir e apresentar os dados

de uma pesquisa, visando descrevê-la.

A execução desse fluxo da análise estatística envolve sempre a possibilidade de se ter que

retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados

pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de

apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes

para garantir uma boa compreensão do fenômeno estudado.

Aula 2 - Séries estatísticas

Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma

ordem de classificação, ou seja, uma seqüência de números que se refere a uma certa

variável. Três fatores básicos estruturam a construção de séries estatísticas:

Page 5: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 5

- Época – Fator temporal ou cronológico a que se refere o fenômeno analisado;

- Local – Fator espacial ou geográfico onde o fenômeno acontece; e

- Fenômeno – Espécie do fator que é descrito.

Esses fatores levam a existência de quatro tipos distintos de séries estatísticas: série temporal, série geográfica e série específica.

Síntese dos tipos de séries estatísticas

SITUAÇÃO TEMPORAL GEOGRÁFICA ESPECÍFICA

Parte variável Época Local Fenômeno

Parte fixa Local e fenômeno Época e fenômeno Época e local

Série temporal A série temporal (cronológica, histórica, evolutiva ou marcha) é identificada pelo caráter variável do fator cronológico.

Tabela 2 – Existência de plantão 24 horas nas DEAMs (Brasil-2003/2005)

Fonte: MJ/SENASP

Elaboração do próprio conteudista.

Existência de plantão 24 horas

2003

2004

2005

N. Abs. % N. Abs. % N. Abs. %

SIM

61

21,11

54

20,22

41

18,39

NÃO

228

78,89

213

79,78

182

81,61

Total

289

100,00

267

100,00

223

100,00

Page 6: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 6

Série geográfica A série geográfica (territoriais, espaciais ou de localização) é identificada pelo caráter variável do fator local.

Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil

habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.

Vítimas Taxas Vítimas / 100mil hab.

Acre 152 22,1Alagoas 1.592 52,2Amapá 191 31,0Amazonas 689 20,8Bahia 3.138 22,5Ceara 1.677 20,4Distrito Federal 646 27,1Espírito Santo 1.699 49,0Goiás 1.298 22,6Maranhão 771 12,5Mato Grosso 739 25,9Mato Grosso do Sul 658 28,6Minas Gerais 3.594 18,5Para 1.945 27,4Paraíba 807 22,3Paraná 2.897 27,9Pernambuco 4.215 49,6Piauí 402 13,2Rio de Janeiro 5.992 38,5Rio Grande do Norte 405 13,3Rio Grande do Sul 1.972 18,0Rondônia 445 28,5Roraima 64 15,9Santa Catarina 649 10,9São Paulo 7.274 17,7Sergipe 560 28,0Tocantins 192 14,4

Homicídios DolososUnidades da Federação

Tabela 3 – Distribuição das vítimas de homicídio doloso e

taxa de vítimas por 100 mil habitantes entre as unidades

da federação (Brasil – 2006) - Fonte: MS/SVS.

Page 7: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 7

Série específica A série específica (categórica ou por categoria) é identificada pelo caráter variável do fator

fenômeno.

Indicadores criminais Número de ocorrências

Taxa por 100 mil hab. (1)

Crimes violentos letais e intencionais 40.974 23,6

Crimes violentos não-letais contra pessoa

61.232 35,2

Crimes violentos contra o patrimônio 903.773 519,6

Delitos envolvendo drogas 87.170 50,1

Delitos de trânsito 320.265 184,1

Homicídios dolosos 38.180 22,0

Tentativas de homicídio 36.080 20,7

Lesões corporais 696.774 400,6

Estupros 14.557 16,5

Atentados violentos ao pudor 10.355 7,8

Extorsões mediante seqüestro 475 0,4

Roubos 903.298 519,4

Furtos 2.022.896 1.163,1

Aula 3 – Apresentação dos dados

Uma vez que os dados foram coletados, deve-se ter atenção ao examiná-los, pois, muitas

vezes, o conjunto de valores é extenso e desorganizado e há risco de se perder a visão global

do fenômeno analisado. Para que isso não ocorra, é interessante reunir os valores em tabelas,

gráficos ou mapas, facilitando sua compreensão.

Tabela 4 – Ocorrências registradas pelas polícias civis por número e taxas por

100 mil habitantes (Brasil – 2005) - Fonte: MJ/SENASP.

Page 8: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 8

Um dos objetivos da construção de tabelas é sistematizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da sua variação.

A tabela é uma maneira de apresentar resumidamente um conjunto de dados.

Construção de tabelas

Tabela 5 – Unidades operacionais dos corpos de bombeiros militares (Brasil - 2004) Título da tabela - Conjunto de informações, as mais completas possíveis, respondendo às

perguntas: O quê? Quando? e Onde? – localizado no topo da tabela, além de contar a palavra

“TABELA” e sua respectiva numeração.

Corpo da tabela - É o conjunto de linhas e colunas que contêm informações sobre a variável

em estudo. A substituição de uma informação da tabela pode ser feita pelos seguintes sinais:

(...) informação é coletada, mas não está disponível; (–) informação não coletada e (?) quando

há dúvida da validade da informação.

Tipos de unidades operacionais dos corpos de bombeiros

Número de unidades operacionais

N.Abs (%)

Batalhões e grupamentos 190

17,6

Companhias e subgrupamentos 279

25,8

Centros executores de atividades operacionais

361

33,4

Destacamentos com sede própria e pelotões independentes

252

23,3

Total de unidades operacionais

1082 100,0

Fonte: MJ/SENASP.

Rodapé Elementos complementares da tabela:

Page 9: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 9

a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados

numéricos;

b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo da tabela; e

c) Chamadas: Símbolo remissivo atribuído a algum elemento de uma tabela que necessita de

uma nota específica. Construção de gráficos

A construção de gráficos atende as mesmas finalidades da construção das tabelas –

representar os resultados de forma simples, clara e verdadeira, demonstrar a evolução do fenômeno em estudo e observar a relação dos valores analisados. A disposição dos

elementos é idêntica a das tabelas.

- Título do gráfico

Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?

Quando? e Onde? – localizado no topo do gráfico, além de contar a palavra “GRÁFICO” e sua

respectiva numeração.

- Corpo do gráfico

É a representação gráfica da análise efetuada.

- Rodapé Elementos complementares do gráfico:

a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados

numéricos;

b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo do gráfico;

e

c) Chamadas: Símbolo remissivo atribuído a algum elemento do gráfico que necessita de uma

nota específica.

Tipos de gráficos

Page 10: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 10

Gráficos em colunas

Conjunto de retângulos dispostos verticalmente, separados por um espaço. Gráfico 2 – Percentual dos custos da violência e criminalidade em relação ao PIB Municipal

(São Paulo – 1999, Rio de Janeiro – 1995 e Belo Horizonte – 1999)

0

1

2

3

4

5

6

São Paulo Rio de Janeiro Belo HorizonteMunicípios

Perc

entu

al d

o PI

B M

unic

ipal

Fonte: CRISP, ILANUD e ISER

Page 11: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 11

Gráficos de Barras

Conjunto de retângulos dispostos horizontalmente, separados por um espaço. Gráfico 3 – Percentual da população que considera que a polícia faz um bom trabalho (34

países – 2002)

Gráficos em setores

Fonte: Nuttall et al. (2002).

Page 12: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 12

Representação através de um círculo, por meio de setores, sendo muito utilizado quando se

quer comparar cada valor de uma série com o seu total (proporção).

Gráfico 4 – Percentual dos IMLs que possuem verba própria e percentual dos IMLs conforme

cobertura das despesas de manutenção pelas verbas próprias (Brasil - 2003)

Fonte: MJ/SENASP.

Gráficos em de linhas ou curvas

Utilizado principalmente para representar séries temporais.

Gráfico 5 – Taxa de homicídios por 100 mil habitantes (Brasil – 1980/2005)

1012

1416

1820

2224

2628

30ta

xa h

omic

idio

s po

r 100

mil

1980

1983

1986

1989

1991

1995

1998

2000

2003

2005

ano

Fonte: MS/SVS.

Aula 4 – Estatística descritiva

Existência de verba própria

Não ( 84%)

Sim ( 16%)

Verba própria cobre todas as despesas de manutenção

Não ( 82%)

Sim ( 18%)

Page 13: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 13

Como você estudou na aula 1, a análise descritiva envolve técnicas para organizar, resumir e

descrever os dados de uma pesquisa.

Para facilitar a descrição dos dados são utilizados alguns parâmetros, apresentados a seguir,

de forma didática, divididos em cinco grupos:

- Parâmetros para comparação relativa;

- Distribuição de freqüência;

- Medidas de tendência central;

- Medidas de dispersão; e

- Análise de correlação.

Parâmetros para comparação relativa

Proporção É obtida a partir do cálculo de uma parte do conjunto sobre o seu total. Considere 10

pessoas retidas em uma delegacia, das quais 4 são homens. A proporção de homens é de

4/10 = 0,4, ou seja, temos 0,4 homens por pessoa retida na delegacia. Considere que 20

ocorrências são registradas em um município, das quais 10 são homicídios dolosos. A

proporção de homicídios é de 10/20 = 0,5, ou seja, 0,5 homicídios por ocorrência registrada no

município. Porcentagem

As porcentagens são obtidas a partir do cálculo das proporções, simplesmente

multiplicando-se o quociente obtido por 100. A palavra porcentagem significa “por cem”. Uma

vez que a soma das proporções é a igual a 1, a soma das porcentagens é igual a 100, a menos

que as partes não sejam mutuamente exclusivas e exaustivas. Assim, nos exemplos de

proporção, há 40% de homens entre as pessoas retidas e 50% de homicídios entre as

ocorrências registradas no município. Razão

Definida a razão de um número A em relação a um número B como “A dividido por B”, como

por exemplo, a razão de policiais por viatura no Brasil é de (policiais)/(viaturas) = 618.613 /

76.074 = 8,13, ou seja, há 8,13 policiais por viatura. Resta esclarecer que a razão busca

relacionar quantidades de itens diferentes, como: policiais por viatura, PIB por habitantes,

recursos financeiros gastos pela polícia militar pelo total do efetivo da polícia militar, etc.

Page 14: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 14

Tabela 6 – Gastos das polícias militares segundo tipo de gasto (Brasil – 2005)

Fonte: MJ/SENASP .

Cálculos da proporção, porcentagem e razão – Tabela 6 - Proporção de gastos com a folha de pagamento

Para cada real gasto pelas polícias militares, 91 centavos são referentes à folha de pagamento

- Porcentagem de gastos com a folha de pagamento:

Cerca dos 91% dos gastos das polícias militares são referentes à folha de pagamento.

Razão de gastos com folha de pagamento por gastos com aquisição de viatura.

Para cada um real gasto com aquisição de viatura são gastos R$ 69,63 com a folha de

pagamento.

0,91 x 100 = 91%

5.516.952.440,11 = 69,63

79.226.268,00 Folha de pagamento Aquisição de viaturas

5.516.952.440,11

6.005.508.679,78

= 0,91 Gasto com a folha de pagamento

Gasto total

Page 15: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 15

Tabela 7 – Efetivo das polícias civis, segundo a categoria profissional (Brasil – 2005)

Fonte: MJ/SENASP.

Categorias profissionais Polícia Civil

Total do efetivo

Delegado 5.479

Inspetor 9.655

Investigador e detetives 15.162

Agente 16.517

Papiloscopista 2.170

Escrivão 10.764

Carcereiro 2.145

Outros 8.988

Total 70.880 Fonte: MJ/SENASP.

Cálculos da proporção, porcentagem e razão – Tabela 7

- Proporção de investigadores e detetives:

Para cada profissional do efetivo da polícia civil, existem 0,23 investigadores e detetives.

Tipo de gasto das polícias militares

Valor gasto (R$)

Folha de pagamento R$ 5.516.952.440,11

Material de consumo R$ 162.438.522,90

Aquisição de viaturas R$ 79.226.268,00

Outros R$ 246.891.448,77

Total R$ 6.005.508.679,78

15.162

70.880

= 0,23

Page 16: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 16

- Porcentagem de investigadores e detetives:

Cerca dos 23% do efetivo da Polícia Civil são investigadores e detetives.

Razão do efetivo de escrivães pelo efetivo de delegados:

Para cada delegado existem 1,9 escrivães.

Distribuição de freqüências

A distribuição de freqüência é o conjunto de mensurações de freqüências para os dados observados.

- Freqüência absoluta: É o número de vezes que o valor de uma determinada variável é

observado.

- Freqüência absoluta acumulada: É a soma das freqüências absolutas dos valores inferiores

ou iguais ao valor dado.

- Freqüência relativa: É a razão da freqüência absoluta pelo número total de observações.

- Freqüência relativa acumulada: É a soma das freqüências relativas dos valores inferiores ou

iguais ao valor dado.

- Distribuição de freqüência: É uma forma de apresentar as freqüências. São apresentadas

as variáveis seguidas de suas freqüências absolutas.

Exemplo - Número de homicídios ocorridos em 16 cidades distintas

Tabela 8 – Distribuição de freqüência dos homicídios

Elaboração do próprio conteudista.

Cidades Homicídios Cidades Homicídios

10.764 5.479

= 1,9

0,23 x 100 = 23%

Page 17: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 17

Cidade 1 3 Cidade 9 5

Cidade 2 9 Cidade

10

6

Cidade 3 0 Cidade

11

8

Cidade 4 3 Cidade

12

10

Cidade 5 4 Cidade

13

12

Cidade 6 5 Cidade

14

12

Cidade 7 5 Cidade

15

14

Cidade 8 5 Cidade

16

18

Número de homicídios

Freqüência absoluta

Freqüência absoluta

acumulada

Freqüência relativa

Freqüência relativa

acumulada

0 1 1 0,0625 0,0625

3 2 3 0,1250 0,1875

4 1 4 0,0625 0,2500

5 4 8 0,2500 0,5000

6 1 9 0,0625 0,5625

8 1 10 0,0625 0,6250

9 1 11 0,0625 0,6875

10 1 12 0,0625 0,7500

12 2 14 0,1250 0,8750

14 1 15 0,0625 0,9375

18 1 16 0,0625 1,00

Total 16 1,00

Page 18: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 18

Distribuição de freqüências

- Freqüência absoluta: Na primeira coluna foram colocados, em ordem crescente, todos os

possíveis números de homicídios ocorridos em 16 cidades. Na segunda coluna, aparecem

quantas cidades sofreram aquele número de homicídios. Na tabela 8, a freqüência absoluta de

0 homicídio é um, ou seja, das 16 cidades analisadas somente uma delas teve 0 homicídio. A

freqüência absoluta de 3 homicídios é dois, ou seja, duas cidades tiveram 3 homicídios. A

freqüência absoluta de 4 homicídios é um, ou seja, uma cidade teve 4 homicídios, e assim por

diante.

- Freqüência absoluta acumulada: Foi construída a terceira coluna da tabela 8, somando a

cada linha a freqüência absoluta. Na primeira linha, a freqüência absoluta acumulada coincide

com a freqüência absoluta (1). Na segunda linha soma-se a freqüência absoluta acumulada da

primeira linha (1) com a freqüência absoluta da segunda linha (2), obtendo uma freqüência

acumulada 3. Na terceira linha, soma-se a freqüência absoluta acumulada anterior (3) com a

freqüência absoluta dessa categoria (1), sendo a freqüência acumulada igual a 4, e assim por

diante.

- Freqüência relativa: A freqüência relativa é dada pela divisão da freqüência absoluta da

categoria pelo número total de cidades, obtendo-se o percentual das cidades que sofreram

aquele número de crimes. Para obter a freqüência relativa de 0 homicídio divide-se a

freqüência absoluta dessa categoria (1) pelo total (16) – (1)/(16) = 0,0625, ou seja, 0,0625 das

cidades têm 0 homicídio. Da mesma forma encontra-se que 0,125 das cidades têm 3

homicídios, 0,625 das cidades têm 4 homicídios, 0,25 das cidades têm 5 homicídios.

Multiplicando a freqüência relativa por cem, encontra-se a porcentagem das cidades com

determinado número de homicídios. Por exemplo: 0,0625 x 100 = 6,25, ou seja, 6,25% das

cidades não sofrem homicídios.

- Freqüência relativa acumulada: É obtida de forma similar a freqüência absoluta acumulada,

ou seja, somando a cada linha a freqüência relativa das categorias dos números de homicídio.

Na primeira linha, a freqüência relativa acumulada coincide com a freqüência relativa. Na

segunda linha ao se somar a freqüência relativa acumulada da primeira linha (0,0625) com a

freqüência relativa da segunda linha (0,125), resulta na freqüência acumulada de 0,1875.

Page 19: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 19

Gráficos utilizados na distribuição de freqüênciaHistograma é um gráfico de barras

justapostas, com a área das barras proporcional à freqüência absoluta.

Exemplo: Gráfico 6 – Histograma da distribuição de homicídios por cidade

V A R 0 0 0 0 1

1 7 , 51 5 , 0

1 2 , 51 0 , 0

7 , 55 , 0

2 , 50 , 0

Fre

qu

en

cy

7

6

5

4

3

2

1

0

Número de Homicídios

Freq

uênc

ia A

bsol

uta

V A R 0 0 0 0 1

1 7 , 51 5 , 0

1 2 , 51 0 , 0

7 , 55 , 0

2 , 50 , 0

Fre

qu

en

cy

7

6

5

4

3

2

1

0

Número de Homicídios

Freq

uênc

ia A

bsol

uta

Elaboração do próprio conteudista.

Gráficos utilizados na distribuição de freqüência - Polígono de freqüência: É a representação gráfica de uma distribuição de freqüências

absolutas. São gráficos de linhas que unem os pontos médios das bases superiores dos

retângulos de um histograma.

- Polígono de freqüência acumulada: É a representação gráfica de uma distribuição de

freqüências absolutas acumuladas. São gráficos de linhas que unem os pontos

correspondentes ao limite superior da freqüência acumulada.

Gráfico 7 – Polígonos de freqüência e freqüência acumulada relativos a distribuição de

homicídios por cidade

Page 20: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 20

Elaboração do próprio conteudista.

Medidas de tendência central

São indicadores que resumem a distribuição de um conjunto de dados e devem ser utilizados quando se pretende comparar distintos grupos de dados, como por exemplo,

comparações entre diferentes regiões ou comparações de uma mesma região em tempos

distintos, dentre outras situações.

- Média: É a soma de todos os resultados dividida pelo total dos casos.

- Moda: É a observação que ocorre com maior freqüência em uma amostra.

- Mediana: É o valor da variável que ocupa a posição central nos dados, ou seja, que divide a

amostra ao meio.

Exemplo: Considerando os dados hipotéticos da aula anterior, mostrados na tabela 8, as

medidas de tendência central em relação à distribuição de homicídios por cidade é:

Variável Média Moda Mediana

Número de homicídio 7,4375 5 5,5

0

2

4

6

8

10

12

14

16

18

0 3 4 5 6 8 9 10 12 14 18 Número de homicídio

Freq

üênc

ia

Polígono de freqüência Polígono de freqüência acumulada

Elaboração do próprio conteudista.

Page 21: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 21

Como calcular a média, a moda e a mediana

Média

Somam-se todos os homicídios ocorridos e divide-se por 16, que é o número de cidades.

Média = (0+3+3+4+5+5+5+5+6+8+9+10+12+12+14+18)/16 = 119/16 = 7,4375

Mediana: Há duas fórmulas para calcular a mediana:

- número de observação par: Mediana = (X(n/2)+ X[(n/2)+1])/2

- número de observação ímpar: Mediana = X[(n+1)/2]

Para o cálculo da mediana, o primeiro passo é a ordenação crescente das observações, como

mostrado no exemplo anterior (cálculo da média). Após a ordenação das observações,

identifica-se cada uma delas por um índice numérico. No exemplo citado X2 é igual a 3, ou seja,

a cidade 2, nesta seqüência de cidades em ordem crescente de número de homicídios, possui

3 homicídios. No mesmo exemplo, a mediana é calculada da seguinte forma:

Mediana = (X(n/2)+ X[(n/2)+1])/2 = (X(16/2)+ X[(16/2)+1])/2 = (X8+ X9)/2 = (5 + 6)/2 = 11/2 = 5,5

Moda: O valor que ocorreu com maior freqüência absoluta. No exemplo citado, o valor 5

ocorreu mais vezes, 4 vezes.

Outros conceitos

Para compreender melhor os cálculos das medidas apresentadas, conheça mais três - Taxa bruta - é o estimador mais simples para o risco de ocorrência de um evento, definindo-se como a razão entre o número de eventos ocorridos na área e o número de pessoas expostas à ocorrência desse evento. O cálculo da taxa é desenvolvido quando se

precisa comparar a incidência de fenômenos entre diferentes regiões, com tamanho

populacional diferente, ou uma mesma região onde a população varia com o tempo. O valor da

taxa é calculado pela divisão do número de vítimas efetivas pelo tamanho da população de

Page 22: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 22

risco, ou seja, pelo tamanho da população que poderia sofrer esse crime, e o valor obtido é

multiplicado por 100 mil.

Quartis

São os valores que determinam uma divisão do conjunto de dados em quatro partes iguais.

Decis

São os valores que determinam uma divisão do conjunto de dados em dez partes iguais.

Exemplo Veja a tabela 10 em anexo – Ocorrências de estupro registradas pelas polícias civis segundo unidade da federação (Brasil – 2005) Diferente da maior parte das ocorrências criminais, os estupros vitimam apenas mulheres e,

por essa razão, o cálculo de sua taxa tem como denominador a população feminina.

O cálculo da taxa de estupros em Rondônia é efetuado pela seguinte fórmula:

A importância do cálculo da taxa é verificada, por exemplo, quando observam que apesar da

Polícia Civil de São Paulo ter registrado 3.903 vítimas de estupro, em 2005, a unidade da

federação com maior incidência de estupros foi Roraima, com apenas 81 ocorrências

registradas. Dado a diferença do tamanho da população dessas UFs, em São Paulo foram 18,9

vítimas para cada grupo de 100.000 mulheres e, em Roraima, 42,4 vítimas para cada grupo de

100.000 mulheres.

Cálculos

Para se determinar a taxa de uma região geográfica (que reúne várias UFs) não deve-se

calcular a média das taxas das UFs, pois esse cálculo não leva em consideração o tamanho da

população de cada UF dentro da região geográfica. O correto é somar as vítimas de todas as UFs, a população de todas as UFs e realizar o cálculo da taxa média da região geográfica.

(número de estupro ocorridos em Rondônia) x (100.000) =

(população feminina em Rondônia)

224 x (100.000) = 30,03

745.802

Page 23: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 23

Veja a seguir a diferença gerada a partir desses dois tipos de cálculo.

BRASIL, REGIÕES E UNIDADES DA FEDERAÇÃO

POPULAÇÃO FEMININA

TOTAL DE OCORRÊNCIAS DE

ESTUPRO

TAXA POR 100.000

MULHERES

Região Sudeste 40.064.296 6.419 16,02

Minas Gerais 9.721.532 1.047 10,77

Espírito Santo 1.719.969 140 8,14

Rio de Janeiro 8.001.992 1.329 16,61

São Paulo 20.620.803 3.903 18,93

Taxa da Região Sudeste:

Média das taxas das UFs da Região Sudeste:

Cálculos

Moda: A amostra de taxa de estupro não apresenta moda, dado que as taxas de estupro entre

as 27 unidades da federação não têm valores repetidos.

Mediana: Como a informação de 1 das UFs não está disponível, para o cálculo da mediana

devem ser consideradas apenas 26 UFs (número par de observações). Assim, a mediana será

calculada através da fórmula:

onde X é a taxa de estupro em cada UF e n é o numero de UFs

Mediana = (X(n/2)+X[(n/2)+1])/2 = (X(26/2)+X[(26/2)+1])/2 = (X13+X14)/2 = (18,8+18,93)/2 = 18,865

Identificação dos quartis

A identificação dos quartis pode ser exemplificada da seguinte forma

40.064.296 6.419 x (100.000) = 16,02

10,77 + 8,14 + 16,61 + 18,93 = 54,45 = 13,61 4 4

(X(n/2)+ X[(n/2)+1]) 2

Page 24: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 24

Figura 7: Identificação dos quartis para a distribuição de estupros entre as unidades da

federação (Brasil / 2005) - Fonte: MJ/SENASP e IBGE.

Brasil/2005A Secretaria Estadual de Segurança Pública do Paraná não encaminhou

informações sobre as ocorrências de estupros no ano de 2005 para a SENASP. Portanto, essa

unidade da Federação não foi considerada nos cálculos.

Medidas de dispersão

É um conjunto de medidas que descrevem a variabilidade de um conjunto de dados e permite verificar como os dados estão distribuídos em torno da tendência central.

São medidas de dispersão: amplitude, variância e desvio padrão.

Para que você entenda melhor os cálculos das medidas de dispersão, volte aos dados

hipotéticos da tabela 8.

- Amplitude: É a diferença entre o maior e o menor valor dos dados analisados. Se os

dados são categóricos, a amplitude é a diferença entre o limite superior da última categoria e o

limite inferior da primeira categoria.

Q1

Q2

Q3

4,94 6,27 7,32 8,14 8,89 10,52 10,77 11,27 11,44 11,74 16,61 16,91 18,8 18, 93 19,12 20,27 20,77 22,89 25,38 27,08 27,53 30,03 32,2 32,96 36,81 42,4

Page 25: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 25

Como calcular a Amplitude

Para calcular a amplitude subtrai-se o número de homicídios da cidade 16 (18), que é o maior, do número de homicídios da cidade 3 (0), que é o menor.

Amplitude = 18 – 0 = 18

Medidas de dispersão

- Variância: É a medida do grau de dispersão dos dados em torno da média. Mostra o quanto agrupado ou disperso estão os dados. A variância é representada por s2.

Como calcular a variância

Para o cálculo da variância na amostra, primeiramente, subtrai-se o número de homicídios em

cada cidade (Xi) da média da amostra ( X ) e eleva-se esse valor a segunda potência. Média =

s²=[2.(3-7,4375)]²+(9-7,4375)²+(0-7,4375)²+(4-7,4375)²+[4.(5-7,4375)]²+(6-7,4375)²+(8-

7,4375)²+(10-7,4375)²+[2(12-7,4375)]²+(14-7,4375)²+(18-7,4375)²=

119/16 = 7,4375

s²=39,3828+2,4414+5,3164+11,8164+23,7656+2,0664+0,3164+6,5664+41,6328+43,0664+111

,5664=

Em seguida, somam-se as diferenças e divide-se o resultado pelo número de observação da

amostra menos um (n-1). Novamente, Xi representa o número de homicídios que ocorreram na

cidade i.

Logo: Variância = )1(

)(...)()( 222

212

−−++−+−

=n

XXXXXXs n

Média: É a soma de todos os resultados dividida pelo total dos casos.

Medidas de dispersão

- Desvio Padrão: É obtido através da raiz quadrada da variância. Sua representação é

realizada por σ.

= 337,9374 s² = 337,9374

16-1 15

= 22,52917

Page 26: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 26

Como calcular o desvio padrão Após descobrir o valor da variância, calcula-se a sua raiz quadrada, esse resultado, é o valor

do desvio padrão.

74649,452971,222 === ss

Todos os pacotes estatísticos, incluindo o Excel, fazem o cálculo da variância como do desvio

padrão desse valor automaticamente.

Tabela 11 – Medidas de dispersão

Variável Amplitude Variância (σ2) Desvio padrão (σ)

Número de homicídio 18 22,52917 4,74649

Elaboração do próprio conteudista.

Exemplo prático de uso das medidas de dispersão

Após o diagnóstico da situação de um estado, identifica-se que duas (2) regiões se destacam

pelas altas taxas de incidência de homicídios.

Comparando as medidas de dispersão das taxas municipais de homicídios para essas duas

regiões, descobre-se que em uma delas os valores estão mais dispersos do que na outra

região. Isto significa que na região onde os valores estão menos dispersos o problema da alta incidência de homicídios está distribuído de forma ampla, atingindo grande parte dos municípios da região.

Na região onde os valores estão mais dispersos ocorre o contrário: a incidência de homicídios está concentrada em alguns poucos municípios e um outro conjunto significativo de municípios tem incidência baixa de homicídios.

Nesse caso, identificar o grau de dispersão dos dados informará se é preciso planejar a ação tendo como foco todos os municípios da região ou apenas alguns que têm a situação mais precária.

Page 27: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 27

Coeficiente de correlação

A análise de correlação tem como objetivo medir a intensidade ou grau de associação linear entre duas variáveis, sem, no entanto, determinar a relação funcional entre elas, ou seja, que uma variável é responsável pela alteração na outra.

A análise é realizada através da interpretação do coeficiente de correlação, permitindo

identificar se um fator está associado a outro: se o desemprego está associado à incidência

criminal, se o aumento do número de policiais está associado a uma redução da incidência de

crimes e se o aumento do salário dos policiais está associado a uma melhora na eficiência dos

órgãos de segurança pública, dentre outras relações.

Pelo coeficiente de correlação, é possível saber se o desemprego está associado ao aumento da criminalidade, mas não é possível saber se é o desemprego que causa o aumento do crime ou se é o aumento do crime que leva ao aumento no desemprego. Coeficiente de correlação

Mede a intensidade de associação linear entre duas variáveis. Por exemplo, a associação entre número de homicídio e número de armas de fogo. Seu cálculo é realizado com base

na variância da amostra, através da seguinte fórmula:

r = sxy / (sxsy)

1)()(

−−= ∑

nYYXX

s iixy

Onde: sx é o desvio padrão da variável X, no exemplo, número de homicídio. sy é o desvio

padrão da variável Y, no exemplo, número de armas de fogo.

A interpretação do coeficiente de correlação não permite fazer inferências (deduções).

Considerando o exemplo da arma de fogo e do homicídio, suponha que o coeficiente de

correlação seja 0,6, portanto positivo. Pode-se afirmar que as duas variáveis se correlacionam

positivamente, mas não pode prever o número de homicídio com base no número de arma de

fogo. Para se constatar a relação funcional entre as duas variáveis e fazer a inferência, é

necessário a análise de regressão, apresentada na subseção seguinte.

Page 28: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 28

A interpretação desse coeficiente é simples. Considerando que r é sempre um valor entre -1 e

+1, temos:

- Se r = 0, não existe correlação;

- Quanto mais próximo de -1 ou de +1, mais forte é a correlação;

- Se r < 0 existe uma correlação negativa, ou seja, quando uma variável cresce a outra

decresce. No exemplo, quando o número de arma de fogo decresce, o número de homicídio

cresce; e

- Se r > 0 existe uma correlação positiva, ou seja, quando uma variável cresce a outra também

cresce. No exemplo, quando o número de arma de fogo cresce, o número de homicídio cresce.

Os pacotes estatísticos calculam o coeficiente de correlação automaticamente.

Aula 5 – Análise de regressão

A análise de regressão procura determinar a relação funcional entre duas ou mais variáveis. O termo regressão foi introduzido pela primeira vez em 1886, por Francis Galton, no

estudo da relação entre as alturas de pais e filhos. Hoje, os modelos de regressão são

amplamente utilizados em várias áreas do conhecimento, inclusive na análise criminal.

O principal objetivo da análise de regressão é modelar o relacionamento entre uma variável (chamada de dependente) e outras variáveis (chamadas explicativas). Em outras

palavras, procura determinar em que medida as variáveis explicativas se relacionam com a variável dependente. Para isso, estima-se o valor médio da variável dependente, a partir dos valores das variáveis explicativas. Veja o exemplo. No exemplo apresentado no cálculo do coeficiente de correlação (associação entre número de

homicídio e número de armas de fogo), não há interesse em saber somente a correlação entre

a arma de fogo e o homicídio, quer se saber em que medida um aumento ou diminuição no

número de armas de fogo implica no aumento ou diminuição de homicídios.

Para isso, estima-se uma regressão linear considerando como variável dependente o número

de homicídio e, como variável explicativa, o número de arma de fogo. Essa estimativa fornece

uma equação, através da qual, é possível inferir o número médio de homicídio de acordo com o

número de arma de fogo. Entretanto, como a regressão estima uma relação estatística, ela está

Page 29: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 29

sempre sujeita a um erro. Toda a análise de regressão se baseia na correção desse erro estatístico através de diversos métodos que variam de acordo com o tipo e distribuição dos dados.

Para realizar a análise de regressão é necessário um conhecimento avançado em estatística e

em álgebra, fugindo do escopo desse curso. O conhecimento necessário para a realização de

uma análise de regressão é conteúdo suficiente para a realização de um curso especifico sobre

o tema.

Para os interessados em aprofundar no assunto, dois manuais bastante conhecidos na área

são indicados: Wooldridge (Wooldridge, J.M. Introdução à Econometria: uma abordagem

moderna, São Paulo: Pioneira Thomson Learning, 2006) e Gujarati (Gujarati, D. Econometria

Básica. São Paulo, Makron, 3ª edição, 2000).

Neste módulo são apresentados exercícios de fixação para auxiliar a compreensão do conteúdo. O objetivo destes exercícios é complementar as informações apresentadas nas páginas anteriores.

1. Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação. Quando o fator básico que estrutura a construção de séries estatísticas é o fator descrito, podemos dizer que esta série é:

( ) Uma série temporal.

( ) Uma série geográfica.

( ) Uma série específica.

( ) Uma série bipartida.

( ) Uma série espacial.

Page 30: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 30

2. Uma vez que os dados foram coletados, muitas vezes o conjunto de valores é extenso e desorganizado e seu exame requer atenção, pois há risco de perder a visão global do fenômeno analisado. Para que isso não ocorra é interessante reunir os valores em: ( ) Tabelas, organogramas e mapas.

( ) Tabelas, cronogramas e mapas.

( ) Tabelas, fluxogramas e mapas.

( ) Tabelas, gráficos e mapas.

3. A análise descritiva se constitui de técnicas utilizadas para organizar, resumir e descrever os dados de uma pesquisa. O parâmetro para a comparação relativa, obtido a partir do cálculo de uma parte do conjunto sobre o seu total é denominado:

( ) Porcentagem

( ) Razão

( ) Proporção

4. “A distribuição de freqüência é o conjunto de mensurações de freqüências para os dados observados. A _____________ é o número de vezes que o valor de uma determinada variável é observado”. Marque a alternativa correta que completa a frase acima na área tracejada:

( ) Freqüência absoluta acumulada.

( ) Freqüência relativa acumulada.

( ) Freqüência relativa.

( ) Freqüência absoluta.

( ) Distribuição de freqüência.

Page 31: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 31

Gabarito

1. Uma série específica.

2. Tabelas, gráficos e mapas.

3. Proporção

4. Freqüência absoluta.

Este é o final do módulo 3

Análise estatística criminal

Page 32: AnaliseCriminal_Mod3

Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009

Página 32

Anexo - Tabela 10