Download - AnaliseCriminal_Mod3
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 1
Análise Criminal
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 2
Módulo 3 – Análise estatística criminal
Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para
compreender melhor as técnicas utilizadas na análise estatística criminal.
Ao final do módulo, você deverá ser capaz de:
- Definir os principais conceitos relacionados à estatística;
- Correlacionar as séries estatísticas aos fatores básicos que a estruturam;
- Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente;
- Identificar as técnicas utilizadas na estatística descritiva; e
- Definir análise de regressão.
O conteúdo deste módulo está dividido em cinco aulas: Aula 1 – Conceitos básicos
Aula 2 – Séries estatísticas
Aula 3 – Apresentação dos dados
Aula 4 – Estatística descritiva
Aula 5 – Análise de regressão
Aula 1 - Conceitos básicos
O termo estatística surgiu da expressão em latim– statisticum collegium – que significa
palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando
a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo
adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise
estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e
segurança pública.
Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística. - População: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma
característica em comum.
- Censo: É uma coleção de dados relativos a todos os elementos de uma população.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 3
- Amostra: É uma coleção de dados relativos a uma parte da população que a representa. É
usada, na maioria das vezes, por causa da impossibilidade e dos custos de coletar informações
de todos os elementos da população.
- Variáveis: São objetos que servem para guardar informações e permitem dar nomes a cada
uma das partes da informação que se quer guardar. Por exemplo, tratando-se de vitimização
dos indivíduos, há como variáveis distintas: quantos crimes o indivíduo sofreu, sua
escolaridade, seu gênero, sua idade, etc.
- Fluxo de execução da análise estatística: O trabalho de análise estatística resulta da
execução de quatro etapas dispostas conforme o diagrama abaixo: coleta, crítica,
apresentação e análise dos dados.
A execução do fluxo da análise estatística envolve sempre a possibilidade de se ter que
retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados
pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de
apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes
para garantir uma boa compreensão do fenômeno estudado. Figura 6: Fluxo da execução da análise estatística
Coleta de Dados – Após a definição do problema a ser estudado e o estabelecimento do
projeto de pesquisa (objetivo, a forma pela qual os dados serão coletados, cronograma das
Coleta de dados
Crítica de dados
Apresentação de dados
Elaboração de mapas
Elaboração de gráficos
Elaboração de tabelas
Análise
Elaboração do próprio conteudista.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 4
atividades, custos envolvidos, exame das informações disponíveis e delineamento da amostra),
o passo seguinte é a coleta de dados, que consiste na busca ou compilação das informações
em variáveis, componentes do fenômeno a ser estudado.
Crítica dos dados – A revisão crítica dos dados procede com a finalidade de identificar e
suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros
enganos. Esses valores podem ocorrer, principalmente, por problemas de preenchimento ou
digitação dos questionários.
Apresentação dos dados – Convém que sejam organizados em conjunto de dados de forma
prática e racional, para facilitar sua apresentação no formato de tabelas, gráficos ou mapas. A
execução dessa etapa ocorre de forma interligada à próxima etapa referente à análise dos
dados, pois com o desenvolvimento da análise é possível descobrir outras tabelas, gráficos ou
mapas que sejam necessários para uma melhor compreensão do fenômeno estudado.
Análise – Análise das informações produzidas a partir da leitura das tabelas, gráficos e mapas,
sistematizando as conclusões em um relatório.
Elaboração de tabelas / Elaboração de gráficos / Elaboração de mapas - Estatística descritiva: São técnicas analíticas utilizadas para resumir e apresentar os dados de uma
pesquisa, visando descrevê-la.
Estatística Descritiva: são técnicas analíticas utilizadas para resumir e apresentar os dados
de uma pesquisa, visando descrevê-la.
A execução desse fluxo da análise estatística envolve sempre a possibilidade de se ter que
retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados
pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de
apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes
para garantir uma boa compreensão do fenômeno estudado.
Aula 2 - Séries estatísticas
Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma
ordem de classificação, ou seja, uma seqüência de números que se refere a uma certa
variável. Três fatores básicos estruturam a construção de séries estatísticas:
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 5
- Época – Fator temporal ou cronológico a que se refere o fenômeno analisado;
- Local – Fator espacial ou geográfico onde o fenômeno acontece; e
- Fenômeno – Espécie do fator que é descrito.
Esses fatores levam a existência de quatro tipos distintos de séries estatísticas: série temporal, série geográfica e série específica.
Síntese dos tipos de séries estatísticas
SITUAÇÃO TEMPORAL GEOGRÁFICA ESPECÍFICA
Parte variável Época Local Fenômeno
Parte fixa Local e fenômeno Época e fenômeno Época e local
Série temporal A série temporal (cronológica, histórica, evolutiva ou marcha) é identificada pelo caráter variável do fator cronológico.
Tabela 2 – Existência de plantão 24 horas nas DEAMs (Brasil-2003/2005)
Fonte: MJ/SENASP
Elaboração do próprio conteudista.
Existência de plantão 24 horas
2003
2004
2005
N. Abs. % N. Abs. % N. Abs. %
SIM
61
21,11
54
20,22
41
18,39
NÃO
228
78,89
213
79,78
182
81,61
Total
289
100,00
267
100,00
223
100,00
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 6
Série geográfica A série geográfica (territoriais, espaciais ou de localização) é identificada pelo caráter variável do fator local.
Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil
habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.
Vítimas Taxas Vítimas / 100mil hab.
Acre 152 22,1Alagoas 1.592 52,2Amapá 191 31,0Amazonas 689 20,8Bahia 3.138 22,5Ceara 1.677 20,4Distrito Federal 646 27,1Espírito Santo 1.699 49,0Goiás 1.298 22,6Maranhão 771 12,5Mato Grosso 739 25,9Mato Grosso do Sul 658 28,6Minas Gerais 3.594 18,5Para 1.945 27,4Paraíba 807 22,3Paraná 2.897 27,9Pernambuco 4.215 49,6Piauí 402 13,2Rio de Janeiro 5.992 38,5Rio Grande do Norte 405 13,3Rio Grande do Sul 1.972 18,0Rondônia 445 28,5Roraima 64 15,9Santa Catarina 649 10,9São Paulo 7.274 17,7Sergipe 560 28,0Tocantins 192 14,4
Homicídios DolososUnidades da Federação
Tabela 3 – Distribuição das vítimas de homicídio doloso e
taxa de vítimas por 100 mil habitantes entre as unidades
da federação (Brasil – 2006) - Fonte: MS/SVS.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 7
Série específica A série específica (categórica ou por categoria) é identificada pelo caráter variável do fator
fenômeno.
Indicadores criminais Número de ocorrências
Taxa por 100 mil hab. (1)
Crimes violentos letais e intencionais 40.974 23,6
Crimes violentos não-letais contra pessoa
61.232 35,2
Crimes violentos contra o patrimônio 903.773 519,6
Delitos envolvendo drogas 87.170 50,1
Delitos de trânsito 320.265 184,1
Homicídios dolosos 38.180 22,0
Tentativas de homicídio 36.080 20,7
Lesões corporais 696.774 400,6
Estupros 14.557 16,5
Atentados violentos ao pudor 10.355 7,8
Extorsões mediante seqüestro 475 0,4
Roubos 903.298 519,4
Furtos 2.022.896 1.163,1
Aula 3 – Apresentação dos dados
Uma vez que os dados foram coletados, deve-se ter atenção ao examiná-los, pois, muitas
vezes, o conjunto de valores é extenso e desorganizado e há risco de se perder a visão global
do fenômeno analisado. Para que isso não ocorra, é interessante reunir os valores em tabelas,
gráficos ou mapas, facilitando sua compreensão.
Tabela 4 – Ocorrências registradas pelas polícias civis por número e taxas por
100 mil habitantes (Brasil – 2005) - Fonte: MJ/SENASP.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 8
Um dos objetivos da construção de tabelas é sistematizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da sua variação.
A tabela é uma maneira de apresentar resumidamente um conjunto de dados.
Construção de tabelas
Tabela 5 – Unidades operacionais dos corpos de bombeiros militares (Brasil - 2004) Título da tabela - Conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê? Quando? e Onde? – localizado no topo da tabela, além de contar a palavra
“TABELA” e sua respectiva numeração.
Corpo da tabela - É o conjunto de linhas e colunas que contêm informações sobre a variável
em estudo. A substituição de uma informação da tabela pode ser feita pelos seguintes sinais:
(...) informação é coletada, mas não está disponível; (–) informação não coletada e (?) quando
há dúvida da validade da informação.
Tipos de unidades operacionais dos corpos de bombeiros
Número de unidades operacionais
N.Abs (%)
Batalhões e grupamentos 190
17,6
Companhias e subgrupamentos 279
25,8
Centros executores de atividades operacionais
361
33,4
Destacamentos com sede própria e pelotões independentes
252
23,3
Total de unidades operacionais
1082 100,0
Fonte: MJ/SENASP.
Rodapé Elementos complementares da tabela:
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 9
a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados
numéricos;
b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo da tabela; e
c) Chamadas: Símbolo remissivo atribuído a algum elemento de uma tabela que necessita de
uma nota específica. Construção de gráficos
A construção de gráficos atende as mesmas finalidades da construção das tabelas –
representar os resultados de forma simples, clara e verdadeira, demonstrar a evolução do fenômeno em estudo e observar a relação dos valores analisados. A disposição dos
elementos é idêntica a das tabelas.
- Título do gráfico
Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?
Quando? e Onde? – localizado no topo do gráfico, além de contar a palavra “GRÁFICO” e sua
respectiva numeração.
- Corpo do gráfico
É a representação gráfica da análise efetuada.
- Rodapé Elementos complementares do gráfico:
a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados
numéricos;
b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo do gráfico;
e
c) Chamadas: Símbolo remissivo atribuído a algum elemento do gráfico que necessita de uma
nota específica.
Tipos de gráficos
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 10
Gráficos em colunas
Conjunto de retângulos dispostos verticalmente, separados por um espaço. Gráfico 2 – Percentual dos custos da violência e criminalidade em relação ao PIB Municipal
(São Paulo – 1999, Rio de Janeiro – 1995 e Belo Horizonte – 1999)
0
1
2
3
4
5
6
São Paulo Rio de Janeiro Belo HorizonteMunicípios
Perc
entu
al d
o PI
B M
unic
ipal
Fonte: CRISP, ILANUD e ISER
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 11
Gráficos de Barras
Conjunto de retângulos dispostos horizontalmente, separados por um espaço. Gráfico 3 – Percentual da população que considera que a polícia faz um bom trabalho (34
países – 2002)
Gráficos em setores
Fonte: Nuttall et al. (2002).
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 12
Representação através de um círculo, por meio de setores, sendo muito utilizado quando se
quer comparar cada valor de uma série com o seu total (proporção).
Gráfico 4 – Percentual dos IMLs que possuem verba própria e percentual dos IMLs conforme
cobertura das despesas de manutenção pelas verbas próprias (Brasil - 2003)
Fonte: MJ/SENASP.
Gráficos em de linhas ou curvas
Utilizado principalmente para representar séries temporais.
Gráfico 5 – Taxa de homicídios por 100 mil habitantes (Brasil – 1980/2005)
1012
1416
1820
2224
2628
30ta
xa h
omic
idio
s po
r 100
mil
1980
1983
1986
1989
1991
1995
1998
2000
2003
2005
ano
Fonte: MS/SVS.
Aula 4 – Estatística descritiva
Existência de verba própria
Não ( 84%)
Sim ( 16%)
Verba própria cobre todas as despesas de manutenção
Não ( 82%)
Sim ( 18%)
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 13
Como você estudou na aula 1, a análise descritiva envolve técnicas para organizar, resumir e
descrever os dados de uma pesquisa.
Para facilitar a descrição dos dados são utilizados alguns parâmetros, apresentados a seguir,
de forma didática, divididos em cinco grupos:
- Parâmetros para comparação relativa;
- Distribuição de freqüência;
- Medidas de tendência central;
- Medidas de dispersão; e
- Análise de correlação.
Parâmetros para comparação relativa
Proporção É obtida a partir do cálculo de uma parte do conjunto sobre o seu total. Considere 10
pessoas retidas em uma delegacia, das quais 4 são homens. A proporção de homens é de
4/10 = 0,4, ou seja, temos 0,4 homens por pessoa retida na delegacia. Considere que 20
ocorrências são registradas em um município, das quais 10 são homicídios dolosos. A
proporção de homicídios é de 10/20 = 0,5, ou seja, 0,5 homicídios por ocorrência registrada no
município. Porcentagem
As porcentagens são obtidas a partir do cálculo das proporções, simplesmente
multiplicando-se o quociente obtido por 100. A palavra porcentagem significa “por cem”. Uma
vez que a soma das proporções é a igual a 1, a soma das porcentagens é igual a 100, a menos
que as partes não sejam mutuamente exclusivas e exaustivas. Assim, nos exemplos de
proporção, há 40% de homens entre as pessoas retidas e 50% de homicídios entre as
ocorrências registradas no município. Razão
Definida a razão de um número A em relação a um número B como “A dividido por B”, como
por exemplo, a razão de policiais por viatura no Brasil é de (policiais)/(viaturas) = 618.613 /
76.074 = 8,13, ou seja, há 8,13 policiais por viatura. Resta esclarecer que a razão busca
relacionar quantidades de itens diferentes, como: policiais por viatura, PIB por habitantes,
recursos financeiros gastos pela polícia militar pelo total do efetivo da polícia militar, etc.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 14
Tabela 6 – Gastos das polícias militares segundo tipo de gasto (Brasil – 2005)
Fonte: MJ/SENASP .
Cálculos da proporção, porcentagem e razão – Tabela 6 - Proporção de gastos com a folha de pagamento
Para cada real gasto pelas polícias militares, 91 centavos são referentes à folha de pagamento
- Porcentagem de gastos com a folha de pagamento:
Cerca dos 91% dos gastos das polícias militares são referentes à folha de pagamento.
Razão de gastos com folha de pagamento por gastos com aquisição de viatura.
Para cada um real gasto com aquisição de viatura são gastos R$ 69,63 com a folha de
pagamento.
0,91 x 100 = 91%
5.516.952.440,11 = 69,63
79.226.268,00 Folha de pagamento Aquisição de viaturas
5.516.952.440,11
6.005.508.679,78
= 0,91 Gasto com a folha de pagamento
Gasto total
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 15
Tabela 7 – Efetivo das polícias civis, segundo a categoria profissional (Brasil – 2005)
Fonte: MJ/SENASP.
Categorias profissionais Polícia Civil
Total do efetivo
Delegado 5.479
Inspetor 9.655
Investigador e detetives 15.162
Agente 16.517
Papiloscopista 2.170
Escrivão 10.764
Carcereiro 2.145
Outros 8.988
Total 70.880 Fonte: MJ/SENASP.
Cálculos da proporção, porcentagem e razão – Tabela 7
- Proporção de investigadores e detetives:
Para cada profissional do efetivo da polícia civil, existem 0,23 investigadores e detetives.
Tipo de gasto das polícias militares
Valor gasto (R$)
Folha de pagamento R$ 5.516.952.440,11
Material de consumo R$ 162.438.522,90
Aquisição de viaturas R$ 79.226.268,00
Outros R$ 246.891.448,77
Total R$ 6.005.508.679,78
15.162
70.880
= 0,23
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 16
- Porcentagem de investigadores e detetives:
Cerca dos 23% do efetivo da Polícia Civil são investigadores e detetives.
Razão do efetivo de escrivães pelo efetivo de delegados:
Para cada delegado existem 1,9 escrivães.
Distribuição de freqüências
A distribuição de freqüência é o conjunto de mensurações de freqüências para os dados observados.
- Freqüência absoluta: É o número de vezes que o valor de uma determinada variável é
observado.
- Freqüência absoluta acumulada: É a soma das freqüências absolutas dos valores inferiores
ou iguais ao valor dado.
- Freqüência relativa: É a razão da freqüência absoluta pelo número total de observações.
- Freqüência relativa acumulada: É a soma das freqüências relativas dos valores inferiores ou
iguais ao valor dado.
- Distribuição de freqüência: É uma forma de apresentar as freqüências. São apresentadas
as variáveis seguidas de suas freqüências absolutas.
Exemplo - Número de homicídios ocorridos em 16 cidades distintas
Tabela 8 – Distribuição de freqüência dos homicídios
Elaboração do próprio conteudista.
Cidades Homicídios Cidades Homicídios
10.764 5.479
= 1,9
0,23 x 100 = 23%
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 17
Cidade 1 3 Cidade 9 5
Cidade 2 9 Cidade
10
6
Cidade 3 0 Cidade
11
8
Cidade 4 3 Cidade
12
10
Cidade 5 4 Cidade
13
12
Cidade 6 5 Cidade
14
12
Cidade 7 5 Cidade
15
14
Cidade 8 5 Cidade
16
18
Número de homicídios
Freqüência absoluta
Freqüência absoluta
acumulada
Freqüência relativa
Freqüência relativa
acumulada
0 1 1 0,0625 0,0625
3 2 3 0,1250 0,1875
4 1 4 0,0625 0,2500
5 4 8 0,2500 0,5000
6 1 9 0,0625 0,5625
8 1 10 0,0625 0,6250
9 1 11 0,0625 0,6875
10 1 12 0,0625 0,7500
12 2 14 0,1250 0,8750
14 1 15 0,0625 0,9375
18 1 16 0,0625 1,00
Total 16 1,00
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 18
Distribuição de freqüências
- Freqüência absoluta: Na primeira coluna foram colocados, em ordem crescente, todos os
possíveis números de homicídios ocorridos em 16 cidades. Na segunda coluna, aparecem
quantas cidades sofreram aquele número de homicídios. Na tabela 8, a freqüência absoluta de
0 homicídio é um, ou seja, das 16 cidades analisadas somente uma delas teve 0 homicídio. A
freqüência absoluta de 3 homicídios é dois, ou seja, duas cidades tiveram 3 homicídios. A
freqüência absoluta de 4 homicídios é um, ou seja, uma cidade teve 4 homicídios, e assim por
diante.
- Freqüência absoluta acumulada: Foi construída a terceira coluna da tabela 8, somando a
cada linha a freqüência absoluta. Na primeira linha, a freqüência absoluta acumulada coincide
com a freqüência absoluta (1). Na segunda linha soma-se a freqüência absoluta acumulada da
primeira linha (1) com a freqüência absoluta da segunda linha (2), obtendo uma freqüência
acumulada 3. Na terceira linha, soma-se a freqüência absoluta acumulada anterior (3) com a
freqüência absoluta dessa categoria (1), sendo a freqüência acumulada igual a 4, e assim por
diante.
- Freqüência relativa: A freqüência relativa é dada pela divisão da freqüência absoluta da
categoria pelo número total de cidades, obtendo-se o percentual das cidades que sofreram
aquele número de crimes. Para obter a freqüência relativa de 0 homicídio divide-se a
freqüência absoluta dessa categoria (1) pelo total (16) – (1)/(16) = 0,0625, ou seja, 0,0625 das
cidades têm 0 homicídio. Da mesma forma encontra-se que 0,125 das cidades têm 3
homicídios, 0,625 das cidades têm 4 homicídios, 0,25 das cidades têm 5 homicídios.
Multiplicando a freqüência relativa por cem, encontra-se a porcentagem das cidades com
determinado número de homicídios. Por exemplo: 0,0625 x 100 = 6,25, ou seja, 6,25% das
cidades não sofrem homicídios.
- Freqüência relativa acumulada: É obtida de forma similar a freqüência absoluta acumulada,
ou seja, somando a cada linha a freqüência relativa das categorias dos números de homicídio.
Na primeira linha, a freqüência relativa acumulada coincide com a freqüência relativa. Na
segunda linha ao se somar a freqüência relativa acumulada da primeira linha (0,0625) com a
freqüência relativa da segunda linha (0,125), resulta na freqüência acumulada de 0,1875.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 19
Gráficos utilizados na distribuição de freqüênciaHistograma é um gráfico de barras
justapostas, com a área das barras proporcional à freqüência absoluta.
Exemplo: Gráfico 6 – Histograma da distribuição de homicídios por cidade
V A R 0 0 0 0 1
1 7 , 51 5 , 0
1 2 , 51 0 , 0
7 , 55 , 0
2 , 50 , 0
Fre
qu
en
cy
7
6
5
4
3
2
1
0
Número de Homicídios
Freq
uênc
ia A
bsol
uta
V A R 0 0 0 0 1
1 7 , 51 5 , 0
1 2 , 51 0 , 0
7 , 55 , 0
2 , 50 , 0
Fre
qu
en
cy
7
6
5
4
3
2
1
0
Número de Homicídios
Freq
uênc
ia A
bsol
uta
Elaboração do próprio conteudista.
Gráficos utilizados na distribuição de freqüência - Polígono de freqüência: É a representação gráfica de uma distribuição de freqüências
absolutas. São gráficos de linhas que unem os pontos médios das bases superiores dos
retângulos de um histograma.
- Polígono de freqüência acumulada: É a representação gráfica de uma distribuição de
freqüências absolutas acumuladas. São gráficos de linhas que unem os pontos
correspondentes ao limite superior da freqüência acumulada.
Gráfico 7 – Polígonos de freqüência e freqüência acumulada relativos a distribuição de
homicídios por cidade
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 20
Elaboração do próprio conteudista.
Medidas de tendência central
São indicadores que resumem a distribuição de um conjunto de dados e devem ser utilizados quando se pretende comparar distintos grupos de dados, como por exemplo,
comparações entre diferentes regiões ou comparações de uma mesma região em tempos
distintos, dentre outras situações.
- Média: É a soma de todos os resultados dividida pelo total dos casos.
- Moda: É a observação que ocorre com maior freqüência em uma amostra.
- Mediana: É o valor da variável que ocupa a posição central nos dados, ou seja, que divide a
amostra ao meio.
Exemplo: Considerando os dados hipotéticos da aula anterior, mostrados na tabela 8, as
medidas de tendência central em relação à distribuição de homicídios por cidade é:
Variável Média Moda Mediana
Número de homicídio 7,4375 5 5,5
0
2
4
6
8
10
12
14
16
18
0 3 4 5 6 8 9 10 12 14 18 Número de homicídio
Freq
üênc
ia
Polígono de freqüência Polígono de freqüência acumulada
Elaboração do próprio conteudista.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 21
Como calcular a média, a moda e a mediana
Média
Somam-se todos os homicídios ocorridos e divide-se por 16, que é o número de cidades.
Média = (0+3+3+4+5+5+5+5+6+8+9+10+12+12+14+18)/16 = 119/16 = 7,4375
Mediana: Há duas fórmulas para calcular a mediana:
- número de observação par: Mediana = (X(n/2)+ X[(n/2)+1])/2
- número de observação ímpar: Mediana = X[(n+1)/2]
Para o cálculo da mediana, o primeiro passo é a ordenação crescente das observações, como
mostrado no exemplo anterior (cálculo da média). Após a ordenação das observações,
identifica-se cada uma delas por um índice numérico. No exemplo citado X2 é igual a 3, ou seja,
a cidade 2, nesta seqüência de cidades em ordem crescente de número de homicídios, possui
3 homicídios. No mesmo exemplo, a mediana é calculada da seguinte forma:
Mediana = (X(n/2)+ X[(n/2)+1])/2 = (X(16/2)+ X[(16/2)+1])/2 = (X8+ X9)/2 = (5 + 6)/2 = 11/2 = 5,5
Moda: O valor que ocorreu com maior freqüência absoluta. No exemplo citado, o valor 5
ocorreu mais vezes, 4 vezes.
Outros conceitos
Para compreender melhor os cálculos das medidas apresentadas, conheça mais três - Taxa bruta - é o estimador mais simples para o risco de ocorrência de um evento, definindo-se como a razão entre o número de eventos ocorridos na área e o número de pessoas expostas à ocorrência desse evento. O cálculo da taxa é desenvolvido quando se
precisa comparar a incidência de fenômenos entre diferentes regiões, com tamanho
populacional diferente, ou uma mesma região onde a população varia com o tempo. O valor da
taxa é calculado pela divisão do número de vítimas efetivas pelo tamanho da população de
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 22
risco, ou seja, pelo tamanho da população que poderia sofrer esse crime, e o valor obtido é
multiplicado por 100 mil.
Quartis
São os valores que determinam uma divisão do conjunto de dados em quatro partes iguais.
Decis
São os valores que determinam uma divisão do conjunto de dados em dez partes iguais.
Exemplo Veja a tabela 10 em anexo – Ocorrências de estupro registradas pelas polícias civis segundo unidade da federação (Brasil – 2005) Diferente da maior parte das ocorrências criminais, os estupros vitimam apenas mulheres e,
por essa razão, o cálculo de sua taxa tem como denominador a população feminina.
O cálculo da taxa de estupros em Rondônia é efetuado pela seguinte fórmula:
A importância do cálculo da taxa é verificada, por exemplo, quando observam que apesar da
Polícia Civil de São Paulo ter registrado 3.903 vítimas de estupro, em 2005, a unidade da
federação com maior incidência de estupros foi Roraima, com apenas 81 ocorrências
registradas. Dado a diferença do tamanho da população dessas UFs, em São Paulo foram 18,9
vítimas para cada grupo de 100.000 mulheres e, em Roraima, 42,4 vítimas para cada grupo de
100.000 mulheres.
Cálculos
Para se determinar a taxa de uma região geográfica (que reúne várias UFs) não deve-se
calcular a média das taxas das UFs, pois esse cálculo não leva em consideração o tamanho da
população de cada UF dentro da região geográfica. O correto é somar as vítimas de todas as UFs, a população de todas as UFs e realizar o cálculo da taxa média da região geográfica.
(número de estupro ocorridos em Rondônia) x (100.000) =
(população feminina em Rondônia)
224 x (100.000) = 30,03
745.802
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 23
Veja a seguir a diferença gerada a partir desses dois tipos de cálculo.
BRASIL, REGIÕES E UNIDADES DA FEDERAÇÃO
POPULAÇÃO FEMININA
TOTAL DE OCORRÊNCIAS DE
ESTUPRO
TAXA POR 100.000
MULHERES
Região Sudeste 40.064.296 6.419 16,02
Minas Gerais 9.721.532 1.047 10,77
Espírito Santo 1.719.969 140 8,14
Rio de Janeiro 8.001.992 1.329 16,61
São Paulo 20.620.803 3.903 18,93
Taxa da Região Sudeste:
Média das taxas das UFs da Região Sudeste:
Cálculos
Moda: A amostra de taxa de estupro não apresenta moda, dado que as taxas de estupro entre
as 27 unidades da federação não têm valores repetidos.
Mediana: Como a informação de 1 das UFs não está disponível, para o cálculo da mediana
devem ser consideradas apenas 26 UFs (número par de observações). Assim, a mediana será
calculada através da fórmula:
onde X é a taxa de estupro em cada UF e n é o numero de UFs
Mediana = (X(n/2)+X[(n/2)+1])/2 = (X(26/2)+X[(26/2)+1])/2 = (X13+X14)/2 = (18,8+18,93)/2 = 18,865
Identificação dos quartis
A identificação dos quartis pode ser exemplificada da seguinte forma
40.064.296 6.419 x (100.000) = 16,02
10,77 + 8,14 + 16,61 + 18,93 = 54,45 = 13,61 4 4
(X(n/2)+ X[(n/2)+1]) 2
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 24
Figura 7: Identificação dos quartis para a distribuição de estupros entre as unidades da
federação (Brasil / 2005) - Fonte: MJ/SENASP e IBGE.
Brasil/2005A Secretaria Estadual de Segurança Pública do Paraná não encaminhou
informações sobre as ocorrências de estupros no ano de 2005 para a SENASP. Portanto, essa
unidade da Federação não foi considerada nos cálculos.
Medidas de dispersão
É um conjunto de medidas que descrevem a variabilidade de um conjunto de dados e permite verificar como os dados estão distribuídos em torno da tendência central.
São medidas de dispersão: amplitude, variância e desvio padrão.
Para que você entenda melhor os cálculos das medidas de dispersão, volte aos dados
hipotéticos da tabela 8.
- Amplitude: É a diferença entre o maior e o menor valor dos dados analisados. Se os
dados são categóricos, a amplitude é a diferença entre o limite superior da última categoria e o
limite inferior da primeira categoria.
Q1
Q2
Q3
4,94 6,27 7,32 8,14 8,89 10,52 10,77 11,27 11,44 11,74 16,61 16,91 18,8 18, 93 19,12 20,27 20,77 22,89 25,38 27,08 27,53 30,03 32,2 32,96 36,81 42,4
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 25
Como calcular a Amplitude
Para calcular a amplitude subtrai-se o número de homicídios da cidade 16 (18), que é o maior, do número de homicídios da cidade 3 (0), que é o menor.
Amplitude = 18 – 0 = 18
Medidas de dispersão
- Variância: É a medida do grau de dispersão dos dados em torno da média. Mostra o quanto agrupado ou disperso estão os dados. A variância é representada por s2.
Como calcular a variância
Para o cálculo da variância na amostra, primeiramente, subtrai-se o número de homicídios em
cada cidade (Xi) da média da amostra ( X ) e eleva-se esse valor a segunda potência. Média =
s²=[2.(3-7,4375)]²+(9-7,4375)²+(0-7,4375)²+(4-7,4375)²+[4.(5-7,4375)]²+(6-7,4375)²+(8-
7,4375)²+(10-7,4375)²+[2(12-7,4375)]²+(14-7,4375)²+(18-7,4375)²=
119/16 = 7,4375
s²=39,3828+2,4414+5,3164+11,8164+23,7656+2,0664+0,3164+6,5664+41,6328+43,0664+111
,5664=
Em seguida, somam-se as diferenças e divide-se o resultado pelo número de observação da
amostra menos um (n-1). Novamente, Xi representa o número de homicídios que ocorreram na
cidade i.
Logo: Variância = )1(
)(...)()( 222
212
−−++−+−
=n
XXXXXXs n
Média: É a soma de todos os resultados dividida pelo total dos casos.
Medidas de dispersão
- Desvio Padrão: É obtido através da raiz quadrada da variância. Sua representação é
realizada por σ.
= 337,9374 s² = 337,9374
16-1 15
= 22,52917
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 26
Como calcular o desvio padrão Após descobrir o valor da variância, calcula-se a sua raiz quadrada, esse resultado, é o valor
do desvio padrão.
74649,452971,222 === ss
Todos os pacotes estatísticos, incluindo o Excel, fazem o cálculo da variância como do desvio
padrão desse valor automaticamente.
Tabela 11 – Medidas de dispersão
Variável Amplitude Variância (σ2) Desvio padrão (σ)
Número de homicídio 18 22,52917 4,74649
Elaboração do próprio conteudista.
Exemplo prático de uso das medidas de dispersão
Após o diagnóstico da situação de um estado, identifica-se que duas (2) regiões se destacam
pelas altas taxas de incidência de homicídios.
Comparando as medidas de dispersão das taxas municipais de homicídios para essas duas
regiões, descobre-se que em uma delas os valores estão mais dispersos do que na outra
região. Isto significa que na região onde os valores estão menos dispersos o problema da alta incidência de homicídios está distribuído de forma ampla, atingindo grande parte dos municípios da região.
Na região onde os valores estão mais dispersos ocorre o contrário: a incidência de homicídios está concentrada em alguns poucos municípios e um outro conjunto significativo de municípios tem incidência baixa de homicídios.
Nesse caso, identificar o grau de dispersão dos dados informará se é preciso planejar a ação tendo como foco todos os municípios da região ou apenas alguns que têm a situação mais precária.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 27
Coeficiente de correlação
A análise de correlação tem como objetivo medir a intensidade ou grau de associação linear entre duas variáveis, sem, no entanto, determinar a relação funcional entre elas, ou seja, que uma variável é responsável pela alteração na outra.
A análise é realizada através da interpretação do coeficiente de correlação, permitindo
identificar se um fator está associado a outro: se o desemprego está associado à incidência
criminal, se o aumento do número de policiais está associado a uma redução da incidência de
crimes e se o aumento do salário dos policiais está associado a uma melhora na eficiência dos
órgãos de segurança pública, dentre outras relações.
Pelo coeficiente de correlação, é possível saber se o desemprego está associado ao aumento da criminalidade, mas não é possível saber se é o desemprego que causa o aumento do crime ou se é o aumento do crime que leva ao aumento no desemprego. Coeficiente de correlação
Mede a intensidade de associação linear entre duas variáveis. Por exemplo, a associação entre número de homicídio e número de armas de fogo. Seu cálculo é realizado com base
na variância da amostra, através da seguinte fórmula:
r = sxy / (sxsy)
1)()(
−
−−= ∑
nYYXX
s iixy
Onde: sx é o desvio padrão da variável X, no exemplo, número de homicídio. sy é o desvio
padrão da variável Y, no exemplo, número de armas de fogo.
A interpretação do coeficiente de correlação não permite fazer inferências (deduções).
Considerando o exemplo da arma de fogo e do homicídio, suponha que o coeficiente de
correlação seja 0,6, portanto positivo. Pode-se afirmar que as duas variáveis se correlacionam
positivamente, mas não pode prever o número de homicídio com base no número de arma de
fogo. Para se constatar a relação funcional entre as duas variáveis e fazer a inferência, é
necessário a análise de regressão, apresentada na subseção seguinte.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 28
A interpretação desse coeficiente é simples. Considerando que r é sempre um valor entre -1 e
+1, temos:
- Se r = 0, não existe correlação;
- Quanto mais próximo de -1 ou de +1, mais forte é a correlação;
- Se r < 0 existe uma correlação negativa, ou seja, quando uma variável cresce a outra
decresce. No exemplo, quando o número de arma de fogo decresce, o número de homicídio
cresce; e
- Se r > 0 existe uma correlação positiva, ou seja, quando uma variável cresce a outra também
cresce. No exemplo, quando o número de arma de fogo cresce, o número de homicídio cresce.
Os pacotes estatísticos calculam o coeficiente de correlação automaticamente.
Aula 5 – Análise de regressão
A análise de regressão procura determinar a relação funcional entre duas ou mais variáveis. O termo regressão foi introduzido pela primeira vez em 1886, por Francis Galton, no
estudo da relação entre as alturas de pais e filhos. Hoje, os modelos de regressão são
amplamente utilizados em várias áreas do conhecimento, inclusive na análise criminal.
O principal objetivo da análise de regressão é modelar o relacionamento entre uma variável (chamada de dependente) e outras variáveis (chamadas explicativas). Em outras
palavras, procura determinar em que medida as variáveis explicativas se relacionam com a variável dependente. Para isso, estima-se o valor médio da variável dependente, a partir dos valores das variáveis explicativas. Veja o exemplo. No exemplo apresentado no cálculo do coeficiente de correlação (associação entre número de
homicídio e número de armas de fogo), não há interesse em saber somente a correlação entre
a arma de fogo e o homicídio, quer se saber em que medida um aumento ou diminuição no
número de armas de fogo implica no aumento ou diminuição de homicídios.
Para isso, estima-se uma regressão linear considerando como variável dependente o número
de homicídio e, como variável explicativa, o número de arma de fogo. Essa estimativa fornece
uma equação, através da qual, é possível inferir o número médio de homicídio de acordo com o
número de arma de fogo. Entretanto, como a regressão estima uma relação estatística, ela está
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 29
sempre sujeita a um erro. Toda a análise de regressão se baseia na correção desse erro estatístico através de diversos métodos que variam de acordo com o tipo e distribuição dos dados.
Para realizar a análise de regressão é necessário um conhecimento avançado em estatística e
em álgebra, fugindo do escopo desse curso. O conhecimento necessário para a realização de
uma análise de regressão é conteúdo suficiente para a realização de um curso especifico sobre
o tema.
Para os interessados em aprofundar no assunto, dois manuais bastante conhecidos na área
são indicados: Wooldridge (Wooldridge, J.M. Introdução à Econometria: uma abordagem
moderna, São Paulo: Pioneira Thomson Learning, 2006) e Gujarati (Gujarati, D. Econometria
Básica. São Paulo, Makron, 3ª edição, 2000).
Neste módulo são apresentados exercícios de fixação para auxiliar a compreensão do conteúdo. O objetivo destes exercícios é complementar as informações apresentadas nas páginas anteriores.
1. Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação. Quando o fator básico que estrutura a construção de séries estatísticas é o fator descrito, podemos dizer que esta série é:
( ) Uma série temporal.
( ) Uma série geográfica.
( ) Uma série específica.
( ) Uma série bipartida.
( ) Uma série espacial.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 30
2. Uma vez que os dados foram coletados, muitas vezes o conjunto de valores é extenso e desorganizado e seu exame requer atenção, pois há risco de perder a visão global do fenômeno analisado. Para que isso não ocorra é interessante reunir os valores em: ( ) Tabelas, organogramas e mapas.
( ) Tabelas, cronogramas e mapas.
( ) Tabelas, fluxogramas e mapas.
( ) Tabelas, gráficos e mapas.
3. A análise descritiva se constitui de técnicas utilizadas para organizar, resumir e descrever os dados de uma pesquisa. O parâmetro para a comparação relativa, obtido a partir do cálculo de uma parte do conjunto sobre o seu total é denominado:
( ) Porcentagem
( ) Razão
( ) Proporção
4. “A distribuição de freqüência é o conjunto de mensurações de freqüências para os dados observados. A _____________ é o número de vezes que o valor de uma determinada variável é observado”. Marque a alternativa correta que completa a frase acima na área tracejada:
( ) Freqüência absoluta acumulada.
( ) Freqüência relativa acumulada.
( ) Freqüência relativa.
( ) Freqüência absoluta.
( ) Distribuição de freqüência.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 31
Gabarito
1. Uma série específica.
2. Tabelas, gráficos e mapas.
3. Proporção
4. Freqüência absoluta.
Este é o final do módulo 3
Análise estatística criminal
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 32
Anexo - Tabela 10