Buscar

ANÁLISE ESPACIAL DE INFORMAÇÕES DE SEGURANÇA PÚBLICA DO CENTRO URBANO DE SÃO JOSÉ DO RIO PRETO/SP

Prévia do material em texto

Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 371-381. 
 
M. G. y Sanches; J. A. Quintanilha 
 
ANÁLISE ESPACIAL DE INFORMAÇÕES DE SEGURANÇA PÚBLICA 
DO CENTRO URBANO DE SÃO JOSÉ DO RIO PRETO/SP 
 
Manuela Gallo y Sanches 
José Alberto Quintanilha 
 
Escola Politécnica da Universidade de São Paulo 
Departamento de Engenharia de Transportes 
Laboratório de Geoprocessamento 
Av. Prof. Almeida Prado, Travessa 2, no. 83 
Cidade Universitária - São Paulo - Brasil 
CEP.: 05508-900 - Tel: +55 11 3091 5504 
{mgallo,jaquinta}@usp.br 
 
 
RESUMO - O presente trabalho tem como objetivo testar uma metodologia que reúna ferramentas de 
análises espacial e estatística aplicadas a dados criminais de São José do Rio Preto/SP. Dados sócio-
econômicos de 1991 da FIBGE e ocorrências criminais relativas ao primeiro trimestre de 2001 cedidas 
pela Delegacia Seccional do Município, formaram o córpus do estudo. Para escolher quais variáveis 
explicativas estavam associadas ao índice de criminalidade, foi usada a regressão linear múltipla 
identificando a Renda e Instalação Sanitária com um ajuste de 0,76. Apesar dos resíduos possuírem 
média zero e distribuição normal, foi detectado o problema da heterocedasticidade dos dados. Para 
corrigi-lo, optou-se por transformar todos os termos da regressão em funções logarítmicas. Observou-se 
que a heterocedasticidade foi resolvida, resultando em um ajuste de 0,78. Para determinar agregamentos 
através de amostras pontuais utilizou-se a Função K. O uso de indicadores de autocorrelação global e 
local identificou a existência de agregamento de setores censitários, no centro da área de estudo onde a 
criminalidade é maior. Concluiu-se que os agregamentos encontrados nas amostras pontuais revelaram 
que existem áreas em que a criminalidade difere da encontrada no centro urbano. 
 
ABSTRACT - The present study has as aim to apply a methodology capable to congregate tools of 
spatial and statistical analysis applied to the criminal data of São José do Rio Preto/SP-Brazil. Social-
economic data from 1991, by FIBGE and criminal occurrences yielded by the Regional Police of the city, 
related to the first three months of 2001, formed the córpus for the study. To discover and choose which 
variables would be associated to the crime index, the multiple linear regression identifying the Average 
Income and Sanitary Installation was used with an adjustment of 0,76. Despite the analysis of regression 
residues having average zero and showing a normal errors distribution, the problem of the 
heteroscedasticity of the data was detected. To correct it, we needed to transforme all the terms of the 
regression into logarithmic functions. Great part of the heteroscedasticity was handled, resulting in a 
adjustment of 0,78. To determine clusters through a sample of points where occurred the crimes, 
Function K was used. The use of global and local autocorrelation allowed us to identify the existence of 
clusters in the center of the studied area where crime is more intense. The final conclusion is that the 
clusters found through these points show the existence of some areas where crime has a different way 
from the urban center of the city. 
 
 
1 INTRODUÇÃO 
 
Conforme a Fundação Sistema Estadual de Análise 
de Dados (FSEADE), São José do Rio Preto/SP 
apresentou em 1999 cerca de 20.000 ocorrências 
criminais (ocorrências registradas em boletins nos 
Distritos Policiais) e mais de 25.000 ocorrências policiais 
(serviços da polícia prestados à comunidade sem 
necessidade de registros em boletins). 
Como a questão da segurança alarma grande parte 
da população, tornou-se indispensável pesquisar formas 
de amenizar este fenômeno, sejam elas através da 
reestruturação das polícias civil e militar, sejam através de 
propostas governamentais ou ainda de trabalhos 
acadêmicos. 
O intuito deste trabalho é desenvolver uma 
metodologia que utilize análise espacial e estatística em 
dados socioeconômicos conjuntamente com o índice de 
criminalidade, no primeiro trimestre de 2000, 
possibilitando a identificação de bolsões de agregamento 
entre os setores censitários do centro urbano de São José 
do Rio Preto/SP. Para identificar quais as regiões onde a 
relação da criminalidade é mais intensa, são necessários 
conjuntos de ferramentas estatísticas e espaciais tais como 
correlações e regressões, indicadores globais e locais e 
diagramas de espalhamento de Moran. 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
As utilizações destas técnicas para o estudo da 
criminalidade vêm se acentuando frente às crescentes 
demandas do setor de Segurança Pública. 
Serão tratadas neste trabalho ocorrências relativas 
aos Crimes contra o Patrimônio, dados que se referem a 
furtos e roubos em estabelecimentos comerciais, em 
veículos, em residências e Crimes contra a Pessoa, dados 
que se referem a furtos e roubos contra a pessoa. 
Segundo Bailey e Gatrell (1995), os Sistemas de 
Informações Geográficas abrangem muito mais do que 
simples facilidades de visualização e as funções de análise 
espacial são cada vez mais importantes. Atualmente estas 
funções de análise vão além de simples consultas e a 
integração do software de geoprocessamento com um 
módulo de funções de estatística espacial é cada vez 
maior. 
As polícias civil e militar do município 
demonstram particularmente interesse nas análises 
elaboradas para diagnosticar as irregularidades da sua 
atuação e interagir estes problemas principalmente com a 
comunidade e autoridades vigentes. 
 
2 OBJETIVOS 
 
O objetivo específico do projeto é desenvolver 
uma metodologia que seja capaz de determinar as áreas de 
risco criminal através de ferramentas de análise espacial e 
estatística relacionando variáveis sócio-econômicas e 
ocorrências criminais, por setor censitário. 
 
3 ÁREA DE ESTUDO 
 
A área de estudo compreende a região central do 
município de São José do Rio Preto/SP e possui como 
características principais 106 Setores Censitários e 748 
delitos criminais. 
 
4 FUNDAMENTAÇÃO TEÓRICA 
 
Segundo Bailey e Gatrell (1995), a análise espacial 
pode ser definida como o estudo quantitativo de 
fenômenos que estão localizados no espaço. Os processos 
de análise espacial incluem conceitualmente três etapas 
básicas interrelacionadas: a visualização espacial, a 
análise exploratória e a modelagem dos dados. A análise 
exploratória permite descrever a distribuição espacial dos 
dados e os padrões de associação espacial, ou seja, 
padrões de agrupamento, sendo uma etapa essencial para 
a modelagem dos dados. A modelagem inclui os 
procedimentos de validação estatística e modelos de 
estimação dos dados, por exemplo, para afirmar que um 
determinado fenômeno pode ser considerado uma variável 
aleatória e possui uma determinada distribuição de 
probabilidade. 
Anselin (1996), subdivide a primeira etapa 
considerada por Bailey and Gatrell, a visualização, em 
seleção e manipulação. De forma geral, a visualização 
considera a essência de manipular e consultar um banco 
de dados geográficos e criar diferentes mapas temáticos, 
permitindo explorar visualmente o dado objeto de análise. 
 
4.1 Análise de Padrões Pontuais 
 
Um padrão pontual é nada mais que um conjunto 
de dados que consiste em uma série de localizações 
pontuais e indicam a ocorrência de um determinado 
evento de interesse. Aqui, “evento” é utilizado para se 
referir a qualquer tipo de fenômeno localizado em um 
espaço e que possa estar relacionado a uma representação 
pontual (Câmara et al. 1999). 
O CrimeStat, software utilizado nesta etapa, 
apresenta na versão 1.1, dois procedimentos para a análise 
de padrões pontuais: o método da distância aovizinho 
mais próximo e o da função K. Estes dois métodos 
analisam as propriedades dos dados, conhecidas como de 
segunda ordem ou dependência espacial. 
A análise da distância utilizando o método ao 
vizinho mais próximo fornece estatísticas sobre as 
distâncias a partir da distribuição dos pontos. Uma 
maneira de verificar o grau de dependência espacial em 
um padrão de pontos é observar se o comportamento da 
distribuição dessas distâncias identifica pontos 
aglomerados ou dispersos (Manual CrimeStat, 2000). Este 
método procura estimar a função de distribuição 
cumulativa baseando-se nas distâncias entre um evento 
escolhido aleatoriamente e um evento mais próximo, 
dividindo-a posteriormente pelo número de eventos que 
estão presentes na região (Manual do Spring, 2001). 
A Função K é uma ferramenta exploratória, 
normalmente utilizada para comparar a estimação dos 
eventos pontuais proporcionando uma descrição mais 
efetiva da dependência espacial (Manual do Spring, 
2001). Alguns softwares de Estatística Espacial que 
contém este tipo de método calculam um raio para a 
região de influência baseado na área do projeto (extensão) 
atribuindo um peso variável conforme a distância. Para 
entender essa função imagina-se que cada evento é 
visitado e ao seu redor são construídos círculos 
espaçados. O número acumulado de eventos dentro de 
cada um desses círculos é contado. Todos os eventos são 
visitados e o número de pontos que caem dentro de uma 
distância h de todos os eventos é calculado. A contagem 
destes eventos é então transformada em uma função de 
raiz quadrada, que quando plotada em um gráfico, em 
função da distância h, picos positivos indicam atração 
espacial ou agrupamento e picos negativos indicam 
repulsão ou regularidade (CrimeStat, 2000). 
 
4.2 Análise Espacial em Áreas 
 
Nas análises espaciais de dados divididos por 
áreas, um dos problemas encontrados é a presença de 
descontinuidade entre os polígonos que pode ser 
eliminada através de técnicas que permitam estabelecer a 
continuidade espacial entre áreas distintas. (Anselin, 
1995) 
Segundo Anselin (1996), uma das técnicas mais 
utilizadas para resolver o problema da descontinuidade 
entre áreas distintas é a construção da matriz de 
continuidade espacial W(n x n) onde n é um conjunto de 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
áreas {A1,..,An}, e cada um dos elementos wij representa 
uma medida de proximidade entre Ai e Aj. Esta medida de 
proximidade pode ser calculada a partir de um dos 
seguintes critérios: 
ü wij = 1, se o centróide de Ai está a uma 
determinada distância de A, caso contrário wij= 
0; 
ü wij = 1, se Ai compartilha um lado comum com 
Aj , caso contrário wij = 0; 
ü wij = lij/li, onde lij é o comprimento da fronteira 
entre Ai e Aj e li é o perímetro de Ai. 
O uso da matriz de continuidade espacial torna-se 
essencial para explorar se o valor observado de um 
atributo depende ou não dos valores desta mesma variável 
nas localizações vizinhas (Anselin, 1996). O conceito de 
dependência espacial, chamado por vários autores de 
autocorrelação espacial, mede o nível de interdependência 
geográfica entre as variáveis e a força deste 
relacionamento. Uma das formas de se detectar a 
autocorrelação espacial dos dados, segundo Anselin 
(1995), é através do uso de indicadores globais e locais de 
associação espacial. 
Para Carvalho, et al. (1997) o Índice de Moran 
Global testa se as áreas conectadas apresentam maior 
semelhança quanto ao indicador estudado do que o 
esperado em um padrão aleatório, ou seja, é uma medida 
de correlação espacial que indica afastamentos em relação 
a uma distribuição espacial aleatória. Tais afastamentos 
indicam a existência de padrões espaciais, como por 
exemplo: aglomerado ou tendência espacial. Os desvios, 
em relação à média de cada atributo são multiplicados 
pelos desvios da vizinhança, obtidos pela matriz de 
proximidade espacial, que representa a estrutura e/ou a 
dependência espacial das áreas envolvidas. 
De uma forma geral, o Índice de Moran, segundo 
Anselin (1996), testa se as áreas conectadas apresentam 
maior semelhança quanto ao indicador estudado do que o 
esperado num padrão aleatório. Nas referências 
consultadas, a hipótese nula indica total aleatoriedade 
espacial, mostrando que não existe relação entre o valor 
do atributo com sua localização espacial. 
Carvalho (1997) reforça, como a maioria dos 
autores nesta área, que o Índice de Moran apresenta um 
intervalo de valores entre –1 e +1, quantificando o grau de 
autocorrelação existente, sendo positivo para correlação 
direta e negativo quando inversa. 
A interpretação do índice de Moran como um 
coeficiente de regressão sugere, segundo Anselin (1996), 
o uso de um diagrama de espalhamento para visualizar a 
associação espacial entre o valor do atributo de cada 
elemento (zi) com a média dos valores dos vizinhos 
(Wzi), denominado de diagrama de espalhamento de 
Moran. Este diagrama também pode ser apresentado na 
forma de um mapa temático bidimensional, onde cada 
polígono é apresentado indicando-se o seu quadrante 
(Anselin, 1995). 
Anselin (1995) destaca, no manual do software 
SpaceStat, as características dos dados espaciais, 
divididos em quatro quadrantes. Os quadrantes Q1 e Q2 
no diagrama de espalhamento ou “High-High” e “Low-
Low” seus equivalentes no mapa temático, representam 
respectivamente valores positivos e médias positivas, e 
valores negativos e médias negativas, indicando pontos de 
associação espacial positiva, no sentido que uma área 
possui valores semelhantes à média de seus vizinhos. Os 
quadrantes Q3 e Q4 no diagrama de espalhamento ou 
“High-Low” e “Low-High” seus equivalentes no mapa 
temático, representam respectivamente valores positivos e 
médias negativas, e valores negativos e médias positivas, 
indicando pontos de associação espacial negativa, no 
sentido que uma área possui valores distintos da média de 
seus vizinhos. Pode-se dizer que estes pontos marcam 
uma região de possível transição entre regimes espaciais 
distintos. 
Para analisar padrões numa escala de maior 
detalhe, Anselin (1996) aconselha a utilização de 
indicadores de associação espacial local como o Moran 
Local que permite identificar as diferentes localizações de 
uma variável distribuída espacialmente. Quando usados 
em conjunto com o Índice (I) de Moran, tais indicadores 
refinam nosso conhecimento sobre os processos que dão 
origem à dependência espacial, pois nos permitem 
identificar as áreas geradas e a dependência espacial que 
não são evidenciados pelos índices globais. Estes 
indicadores produzem um valor para cada objeto, 
permitindo desta maneira a identificação dos valores dos 
atributos semelhantes (Clusters) e objetos anômalos 
(Outliers). 
Anselin (1995) considera também que um 
indicador local de autocorrelação espacial - LISA, tem 
que atender a dois objetivos: permitir a identificação de 
padrões de associação espacial significativo e ser uma 
decomposição do índice global de associação espacial. O 
autor destaca que o Indicador Local ou Moran Local 
computa o valor de um objeto multiplicando-se a matriz 
de proximidade espacial, pela média dos desvios de seus 
vizinhos. 
Um dos aspectos mais importantes e laboriosos do 
uso do Moran Local, colocado por Anselin (1996) diz 
respeito à sua significância estatística. Novamente aqui 
podemos utilizar técnicas semelhantes às utilizadas no 
Moran Global como, por exemplo, a hipótese de 
normalidade. Determinada a significância de Moran 
Local, é muito útil gerar um mapa temático (LISA Map) 
indicando as regiões que apresentam correlação local 
significativamente diferente do resto dos dados. Estas 
regiões são chamadas de "bolsões" denão 
estacionariedade, pois são áreas com dinâmica espacial 
própria e que merecem análise detalhada. O LISA Map, 
como é chamado por Anselin (1995), classifica os valores 
do índice local em 4 grupos: não significantes, com 
significância de 95%, com significância de 99% e com 
significância de 99,9% . 
 
4.3 Pressupostos da Regressão e Testes de Hipóteses 
 
Para determinar se o modelo de regressão linear 
múltipla é apropriado, é necessário inicialmente avaliar se 
existe relação significativa entre a variável dependente 
(índice de criminalidade) e o conjunto de variáveis 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
explicativas (renda média e número de domicílios que 
possuem rede geral de instalação sanitária). Como existe 
mais de uma variável explicativa, as hipóteses nula e 
alternativa podem ser elaboradas, segundo Levine et al. 
(1998) das seguintes formas: 
· Quando não existe relação linear entre a variável 
dependente e as variáveis explicativas; 
Ho: b1 = b2 = 0 (1) 
· Quando pelo menos um coeficiente da regressão não 
é igual a zero. 
 H1: (pelo menos um bj ¹ 0) (2) 
 
Normalmente, após o cálculo de regressão, 
algumas anális es devem ser feitas com a finalidade de 
garantir os resultados obtidos. A construção de gráficos, 
nesta etapa, torna-se imprescindível para analisar os 
pressupostos de uma regressão conforme Levine et al., 
(1998) destaca a seguir. 
O primeiro pressuposto, a normalidade, requer 
que os valores de Y sejam normalmente distribuídos para 
cada valor de X. Muitos dos testes e análises no 
diagnóstico da regressão espacial são baseados em 
hipóteses sobre a normalidade da distribuição dos 
resíduos. O teste de normalidade dos resíduos, sugerido 
pelo SpaceStat (1995) é a estatística Jarque-Bera que 
segue a distribuição Quiquadrado com 2 graus de 
liberdade. Uma pequena probabilidade indica uma 
rejeição da hipótese nula de normalidade dos resíduos. Se 
este for o caso, os testes de heterocedasticidade e 
dependência espacial devem ser interpretados com 
cautela, pois eles estão baseados na distribuição normal. 
O segundo pressuposto, a homocedasticidade, 
requer que as variações em torno da linha de regressão 
sejam constantes para todos os valores de X. Isto significa 
que Y varia na mesma proporção, quando X for um valor 
baixo e quando X for um valor elevado. Quando as 
variações em torno da linha de regressão não são 
constantes acontece a heterocedasticidade. Em análise de 
dados espaciais este problema é freqüentemente 
encontrado, especialmente quando os dados estão em 
unidades espaciais irregulares (com áreas diferentes) e 
quando há diferenças regionais sistemáticas (Devore 
1999). Para amenizar este tipo de anormalidade, Anselin 
(1996) propõe certas transformações matemáticas nos 
dados utilizados como, por exemplo, a função logarítmica 
de base dez (Log 10). No SpaceStat, o teste que comprova 
a existência ou não da heterocedasticidade dos dados é o 
KB (Koenker, 1981 e Koenker e Basset, 1982) que segue 
como o teste de normalidade a distribuição Quiquadrado 
com P graus de liberdade, onde P é o número de variáveis 
na especificação da heterocedasticidade. 
O terceiro pressuposto, a independência dos erros, 
requer que o erro (a diferença residual entre valores 
observados e previstos de Y) deva ser independente para 
cada valor de X. Isto é avaliado através do valor Índice (I) 
de Moran calculado na regressão linear múltipla pelo 
SpaceStat. 
 
4.4 Análise de Resíduos 
 
Levine et al (1998), define resíduos ou valores de 
erros estimados como sendo a diferença entre os valores 
de observados e os valores previstos da variável 
dependente para os valores dados das variáveis 
independentes. O autor considera que a análise de 
resíduos é utilizada para avaliar se o modelo é apropriado 
para o conjunto de dados e estudar potenciais violações 
dos pressupostos do modelo. 
Como o modelo de regressão contém em si 
algumas hipóteses sobre o erro, tais como distribuição 
normal, independência, média igual a zero e variância 
constante, torna-se necessária uma investigação 
aprimorada sobre os resíduos provenientes da função de 
regressão. 
 Para examinar a adequação do modelo de 
regressão ajustado torna-se indispensável o desenho dos 
resíduos padronizados ou ajustados no eixo vertical e os 
valores correspondentes aos valores das variáveis 
explicativas no eixo horizontal. “Se o modelo ajustado for 
apropriado para os dados, não haverá padrão aparente 
nesse gráfico de resíduos em relação às variáveis 
explicativas. No entanto, se o modelo ajustado não for 
apropriado, existirá uma relação entre os valores de X e 
os resíduos“ (Levine, et al. 1998). 
Segundo Devore, (1999) a construção de gráficos 
ajuda a avaliar o modelo de regressão. Exemplos disso é a 
construção de histogramas para verificar a distribuição 
normal dos resíduos padronizados ou ainda a visualização 
dos valores padronizados no eixo X e dos valores 
observados no eixo Y para verificar se há violação do 
pressuposto da homocedasticidade. 
 
5 MATERIAIS E MÉTODOS 
 
O trabalho foi dividido nas seguintes etapas: coleta 
de dados, digitação dos Boletins de Ocorrência, 
geocodificação das ocorrências criminais e distritos 
policiais, digitalização manual dos Setores Censitários, 
cálculo da Renda Média, cálculo do Índice de 
Criminalidade, seleção de variáveis, análises tabulares e 
análises espaciais. 
 Para que fosse possível realizar as análises 
espaciais e estatísticas no município foi necessário buscar 
as seguintes informações: 
· Variáveis sócio-econômicas datadas de 1991 e 
memorial descritivo dos setores censitários; 
· Base Cartográfica do município de São José do Rio 
Preto contendo eixos de rua e, 
· Boletins de Ocorrência compreendendo o período de 
Janeiro, Fevereiro e Março de 2000. 
 As variáveis sócio-econômicas e a divisão setorial 
censitária foram adquiridas na Fundação Instituto 
Brasileiro de Geografia e Estatística (FIBGE). A listagem 
das variáveis foi disponibilizada pelo órgão em meio 
digital, com extensão compatível ao software Excell. No 
entanto, a divisão setorial, disponibilizada em formato 
texto (denominada memorial descritivo), reunia 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
informações técnicas sobre cada setor censitário, 
indicando o início e o fim de cada polígono. Para que a 
etapa de digitalização manual dos Setores Censitários 
fosse possível, foi necessário adquirir a Base Cartográfica 
(em projeção UTM – Universal Transverse Mercator), 
através da Prefeitura Municipal de São José do Rio 
Preto/SP, contendo os eixos de rua, no entanto sem 
nomenclatura. 
Os boletins de ocorrência, cedidos pela Delegacia 
Seccional do município foram disponibilizadas através de 
documentos impressos contendo várias informações, entre 
elas: a especificação criminal, o tipo de delito praticado, o 
local onde aconteceu o crime e o bairro. 
A divisão territorial dos Setores Censitários, por 
sua vez, não está disponível em meio digital, o que nos 
obriga à edição dos mesmos, ou seja, foi necessário 
consultar o arquivo-documento cedido pela FIBGE que 
especifica as características de cada setor e assim gerar os 
polígonos. É importante salientar que, sem os polígonos 
correspondentes aos setores censitários, não é possível 
realizar nenhum tipo de análise espacial em áreas, 
tornando este processo dependente e imprescindível. 
A elaboração dos 106 setores censitários foi 
realizada tomando-se como base os eixos de rua do 
município, através do memorial descritivo fornecido pela 
FIBGE indicandoos pontos iniciais e finais de um 
polígono. Deve-se lembrar que o município de São José 
do Rio Preto possui ao todo sete Distritos Policiais no 
entanto quatro deles, os mais movimentados, estão 
contidos na área piloto do projeto. 
 
5.1 Seleção das Variáveis Utilizadas 
 
Analisando-se a quantidade de variáveis sócio-
econômicas adquiridas pela FIBGE, optou-se por 
selecionar previamente quinze (15) variáveis que 
pudessem indicar tanto o perfil do morador, quanto as 
condições de infra-estrutura de cada setor censitário. A 
Tabela I a seguir apresenta todas as variáveis que fizeram 
parte do estudo. 
Tabela 1 - Descrição das Variáveis 
 Fonte: FIBGE, 1991 
 
Segundo o sociólogo Túlio Kahn (1999), membro 
do Instituto Latino Americano das Nações Unidas para a 
Prevenção do Delito e o Tratamento de Delinqüentes – 
ILANUD - o cálculo do índice de criminalidade é 
elaborado da seguinte forma: somatório das taxas por 100 
mil habitantes ou 10 mil habitantes (conforme o tamanho 
do município) das ocorrências criminais (crimes contra a 
vida, furtos e roubos contra a pessoa e contra o 
patrimônio), multiplicados cada uma pela pena média 
atribuída pelo código penal, dividido pelo número de 
indicadores do índice ou total de delitos criminais. Para o 
município em questão, foi utilizada a taxa equivalente a 
10 mil habitantes, já que a cidade comporta cerca de 400 
mil habitantes. Matematicamente o Índice de 
Criminalidade seria expresso da seguinte maneira: 
 
å ldeDelitosNúmeroTota
aisDelitosCriPenaMédiaTaxas min**
 (3) 
 
5.2 Geocodificação das Ocorrências Criminais 
 
Para geocodificar as ocorrências criminais, foi 
necessário em primeiro lugar organizar o banco de dados 
com o máximo de informações contidas nos documentos 
fornecidos pela Delegacia Seccional de São José do Rio 
Preto/SP. 
 Uma destas informações é a chamada 
especificação criminal conforme o Código Penal 
Brasileiro (2000) dividida em: Crimes contra a Vida, 
Furtos contra a Pessoa, Furtos e Roubos de Veículos, 
Furtos e Roubos em Residências, Furtos e Roubos no 
Comércio e Roubos contra a Pessoa. Foram digitados no 
aplicativo Excell, 748 registros criminais cedidos pela 
Delegacia Seccional do Município de São José do Rio 
Preto, referente aos meses de Janeiro, Fevereiro e Março 
de 2000. 
Os dados criminais, bem como os quatro distritos 
policiais, pertencente à área de estudo, foram 
geocodificados manualmente via endereçamento através 
de dois guias: um oficial da cidade (1983) e outro virtual 
pelo site http://www.geodados.com.br (1999). Cada ponto 
foi verificado em ambas as fontes citadas, possibilitando 
melhor qualidade de localização dos pontos. É importante 
lembrar que até a finalização desta etapa, a Base 
Cartográfica do município cedido pela Prefeitura, não 
continha informações de endereçamento dos eixos de rua, 
já que este procedimento exige tempo para estruturá-la. 
Isto implicou na edição nominal de algumas ruas para 
agilizar a localização exata dos pontos. 
 
5.3 Softwares Utilizados 
 
Com o intuito de realizar os objetivos propostos, 
foram utilizados dois softwares estatísticos: o SpaceStat 
que trabalha com módulos que calculam índices de 
correlação espacial das variáveis de interesse tais como: o 
Índice de Moran Global e o Índice de Moran Local e 
outras funções indicadas à regiões, e o CrimeStat, que 
trabalha com amostras pontuais para determinar a 
presença de agrupamentos. 
Variáveis Descrição
INDCRIMA Índice de Criminalidade
TOTDOMA Total de Domicílios
RMEDA Renda Média Nominal dos Chefes de Família
TOTCASA Total de Casas
TOTAPA Total de Apartamentos
INSTD Número de Domicílios que possuem Rede Geral de Instalação Sanitária
IMPROPA Número de Imóveis Próprios
IMALUGA Número de Imóveis Alugados
CF17ESA Chefes de Família de 1 a 7 Anos de Estudo
CF814ESA Chefes de Família de 8 a 14 Anos de Estudo
CF15ESA Chefes de Família com Mais de 15 Anos de Estudo
POPHA População de Homens
POPMA População de Mulheres
POPALFA População Alfabetizada
DENDEM Densidade Demográfica
ABAGA Abastecimento de Água
LIXOCOLA Lixo Coletado por Domicílio
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
O software escolhido para visualizar os resultados 
gerados no SpaceStat foi o ArcView já que os mesmos 
possuem interface. 
 
5.4 Análise Espacial e Estatística 
 
Foram analisados, no software Excell, dados 
referentes às ocorrências criminais de Janeiro, Fevereiro e 
Março de 2000 e às variáveis sócio-econômicas da 
FIBGE. Para tanto, foram utilizadas determinadas 
ferramentas de análise tais como correlações e regressões 
e ferramentas visuais (assistente de gráfico). 
As correlações realizadas no Excell, definiram 
quais variáveis seriam importadas para o software 
ArcView. Logo após este processo, foi gerada a matriz de 
proximidade espacial dos dados, atribuída como matriz 
peso (W) em todos os cálculos elaborados no software 
estatístico SpaceStat. No software SpaceStat foram 
gerados: a matriz de correlação espacial dos dados, o 
cálculo dos Indicadores de Autocorrelação Espacial: 
Global e Local das variáveis, divididas pela área de cada 
setor censitário, fato que indicou maior correlação entre 
os dados uma vez que a força de associação diminui 
utilizando valores absolutos, e a regressão linear múltipla. 
A vantagem de utilizar um software de análise 
espacial como o SpaceStat é que este considera a 
distância entre os centróides de cada setor censitário, o 
compartilhamento dos lados em comum e a relação 
existente entre estes lados e o perímetro da área em 
questão o que difere das análises tabulares. (Manual 
SpaceStat, 1995) 
 
6 RESULTADOS 
 
Como primeira abordagem, verificou-se que as 
variáveis que possuem maior correlação com o índice de 
criminalidade são, em ordem de importância: Número de 
Domicílios que possuem Rede Geral de Instalação 
Sanitária e Renda Média. Aparentemente, estas variáveis 
estão associadas à fenômenos que auxiliam a 
criminalidade. 
 
6.1 Regressão Linear Múltipla 
 
A Regressão Linear Múltipla considerou como 
variável dependente (Y) o Índice de Criminalidade e 
como variáveis explicativas (X), Renda Média e Número 
de Domicílios com Rede Geral de Instalação Sanitária. 
 A regressão espacial gerou como resultados 
expostos na Tabela I, um R2 = 0,7704 e de R 2 Ajustado = 
0,7659. A estatística F calculada foi de 172,767 com 
probabilidade de 1,24 E–33. Analisando o valor de F na 
Estatística de Regressão, foi possível verificar a rejeição 
da hipótese nula para H0 já que F(172,77) > 3,07 (valor 
crítico na distribuição) e sua probabilidade p (1,24 E –33) 
< 0,05 (nível de confiança adotado). Isto significa que 
pelo menos um coeficiente de regressão é diferente de 
zero e pelo menos uma das variáveis explicativas está 
relacionada ao índice de criminalidade, validando a 
regressão. Para validar a regressão e a confiabilidade do 
R2 foram analisados os testes de multicolinearidade, 
normalidade, heterocedasticidade e dependência espacial. 
 
Tabela 2- Informações sobre a Regressão Linear 
Múltipla 
 
Tabela 3 - Diagnósticos da Regressão Linear 
Múltipla 
 
O teste referente à heterocedasticidade indicou, 
através dos valores da distribuição t-Student que o valor 
obtido na regressão espacial (48,31) com 2 graus de 
liberdade é muito maior do que o valor crítico esperado. É 
possível dizer que há heterocedasticidade dos dados e que 
os erros ou resíduos da regressão provavelmente não 
possuem distribuição constante para as observações. 
O valor calculado para o I de Moran (0,03) 
mostrou que não há autocorrelação espacial entre a 
variável dependente e suas observações. No entanto, o 
valor de 0,82 indica que hávalores de atributo acima da 
média global e de alto peso de proximidade para uma 
probabilidade de 0,40 o que possibilita identificar áreas 
com valores semelhantes agrupados espacialmente. 
O número condicional encontrado na regressão 
espacial foi de 3,06 indicando que não há indícios de 
multicolinearidade nos dados. Segundo Anselin et al. 
(1996) o número condicional deve ser menor que 20, caso 
contrário o diagnóstico deste pressuposto é favorável. 
Foi possível verificar através do teste de 
normalidade com 2 graus de liberdade e uma 
probabilidade extremamente baixa, a rejeição da hipótese 
nula de distribuição normal do erro, o que significa que 
pelo menos um dos coeficientes da regressão é diferente 
de zero. A distribuição normal dos erros também foi 
verificada através da construção de gráficos, conforme a 
seção de análise de resíduos. 
 
6.2 Análise de Resíduos 
 
Pode-se observar através da Figura 1 abaixo que os 
erros ou resíduos padronizados possuem média igual a 
zero e distribuição normal, como havia sido previsto na 
regressão espacial. 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
 
Figura 1- Histograma dos resíduos padronizados 
 
 Para certificar o pressuposto da homocedasticidade 
foi construído um gráfico entre os resíduos da regressão 
conforme a ilustração da Figura 2. 
Figura 2- Resíduos Padronizados X Observados 
 
Na figura acima foi possível identificar a violação 
do pressuposto da homocedasticidade, denominado 
heterocedasticidade dos dados e por esta razão algumas 
transformações nas variáveis foram realizadas com o 
intuito de eliminar este problema. 
O mapa residual mostrou, conforme a Figura 3 que 
há valores muito altos e muito baixos de resíduos nos 
setores identificados pela cor vermelha e azul 
respectivamente. 
 Figura 3- Mapa Residual 
 
A partir desta análise visual, é possível dizer que 
este modelo de regressão que prevê o Índice de 
Criminalidade não se aplica nestes setores censitários e 
que a modelagem torna-se mais eficiente nos setores que 
possuem valores de resíduos intermediários. 
Analisando-se todos os resultados anteriores 
optou-se por amenizar a heterocedasticidade dos dados e 
por conseqüência proporcionar o melhor ajuste do modelo 
de regressão para prever o índice de criminalidade nos 
setores censitários. 
As três variáveis que fazem parte da regressão 
linear múltipla (índice de criminalidade, renda média e 
número de domicílios que possuem rede geral de 
instalação sanitária) foram transformadas através da 
função logarítmica de base dez (Log 10 ). 
A regressão onde todos os termos que comp õem o 
modelo foram transformados na função LOG10, indicou 
valores de R2 (0,78), R2 ajustado (0,78), Teste F (187,99) 
e F de significação (4,21 E-35), como pode ser visto na 
Tabela 4 abaixo. 
 
Tabela 4- Informações sobre a Regressão Linear Múltipla 
usando Log10 
 
A ilustração da Tabela 5 exibe os diagnósticos da 
regressão espacial onde foi possível observar que não há 
multicolinearidade nos dados já que o número condicional 
(11,18) é menor que 20. 
 
Tabela 5- Diagnósticos da Regressão Linear Múltipla 
usando Log10 
 
O teste de heterocedasticidade, avaliou a variável 
Log10 (Índice de Criminalidade) com uma probabilidade 
de 0,052 e indicou, segundo a distribuição t-Student, que 
o valor crítico esperado está entre 3,0777< t < 6,3138. 
Analisando-se o histograma, verificou-se conforme 
a Figura 4 que os dados possuem distribuição normal e 
média igual a zero o que valida o teste de normalidade 
dos dados. 
O valor do I de Moran (-0,036) mostra que não 
dependência espacial entre os dados já que a 
probabilidade calculada pelo SpaceStat é praticamente 
nula. 
 
Figura 4- Histograma da Regressão usando usando Log10 
 
A construção do gráfico dos resíduos padronizados 
em relação aos valores observados para a variável Log10 
índice de criminalidade, conforme a Figura 5 não indicou 
nenhuma violação dos pressupostos. 
 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
Figura 5- Resíduos Padronizados X Valores Observados 
Log10 (Índice de criminalidade) 
 
O mapa residual, ilustrado na Figura 6 abaixo, 
indicou valores positivos para os resíduos padronizados 
somente na área onde está localizada a represa municipal. 
Pode-se dizer que este modelo da regressão não se 
enquadra nesta área; porém, o mesmo não acontece com o 
restante dos setores censitários estudados onde os valores 
residuais são mais baixos, proporcionando melhor ajuste 
do modelo de regressão. 
 
Figura 6- Mapa Residual da Regressão usando Log10 em 
todos os termos 
 
6.3 Modelo de Regressão 
 
Considerando-se que a melhor regressão 
encontrada foi aquela onde todas as variáveis estudadas 
foram transformadas na função logarítmica de base dez 
(Log 10 ), o modelo de regressão que melhor se ajusta para 
prever o fenômeno da criminalidade no centro urbano de 
São José do Rio Preto/SP pode ser expresso como: 
i
iii
XXY e++++= 2750918,0688897,001842,2 1
^
 
Onde: 
Yi é o valor previsto para o Índice de Criminalidade 
 
2,01842 é a interseção de Y; 
 
0,688897 é a inclinação de Y em relação à variável X1 
(Renda Média) 
 
0,750918 é a inclinação de Y em relação à variável X2 
(Instalação Sanitária) 
 
e = Erro aleatório em Y para a observação i 
 
6.4 Análise Espacial em Áreas 
 
Com a finalidade de estimar a variabilidade 
espacial dos dados por Setor Censitário, a ferramenta 
básica utilizada foi a matriz de proximidade espacial, 
calculada no SpaceStat, segundo Anselin (1996) a partir 
dos seguintes critérios: vizinhança, proximidade dos 
centróides de cada polígono e comprimento da fronteira 
entre eles. 
 
6.4.1 Indicador Global de Autocorrelação Espacial 
 
As Figuras 7, 8 e 9 a seguir mostram os resultados 
do método Moran Global ou Moran Significance aplicado 
sobre as variáveis: índice de criminalidade, renda média e 
número de domicílios com rede geral de instalação 
sanitária. 
Figura 7- Moran Global para Índice de Criminalidade 
 
Figura 8- Moran Global para Renda Média 
 
Figura 9- Moran Global para Número de Domicílios com 
Rede Geral de Instalação Sanitária 
 
 Os valores identificados como “High-High 
representam valores positivos e médias positivas e 
indicaram pontos de associação espacial significativos 
para o índice de criminalidade nos setores que abrangem 
o centro da cidade onde a concentração de ocorrências 
criminais é maior. O indicador global mostrou que há 
aglomerados para a renda média nos setores que 
pertencem aos bairros Redentora e Imperial. Isto deve-se 
ao fato do valor da renda ser maior nestes bairros, por 
consequência a qualidade de vida dos habitantes é melhor. 
Foram identificados dois bolsões com valores positivos 
para a variável instalação sanitária tanto no centro 
comercial quanto no bairro Redentora, o que significa que 
a quantidade de domicílios com rede geral de instalação 
sanitária é mais alta. 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
 
6.4.2 Indicador Local de Autocorrelação Espacial 
 
 As Figuras 10, 11 e 12 apresentam os resultados do 
método LISA - Moran Local aplicados sobre as variáveis: 
Índice de Criminalidade, Renda Média e Número de 
Domicílios com Rede Geral de Instalação Sanitária. 
 
O LISA MAP identificou para a variável índice de 
criminalidade focos, altamente significativos nos setores 
centrais urbanos mostrados em vermelho. Isto significaque o valor do índice de criminalidade não é aleatório 
nestas condições e que existe uma dependência espacial 
muito forte desta variável nestes setores onde a 
significância é de 99,9%. Setores marcados em verde, 
foram identificados com 95%. 
Figura 10- Moran Local para Índice de Criminalidade 
Figura 11- Moran Local para Renda Média 
Figura 12- Moran Global para Número de Domicílios 
com Rede Geral de Instalação Sanitária 
 
Algo similar aconteceu para os valores da renda 
média, no entanto em proporções menores. Os setores 
identificados pela cor vermelha mostraram que há dois 
bolsões com nível de significância de 99,9% sugerindo a 
dependência espacial nestas áreas. 
Foi identificado também um bolsão de 
agregamento de setores censitários para a variável de 
instalação sanitária (99,9%) na região comercial do 
município. A explicação deste fenômeno provavelmente é 
a razão da quantidade de domicílios comerciais ser maior 
no centro da cidade e sua maioria possuir rede geral de 
instalação sanitária. 
 
6.4.3 Moran Scartterplot 
 
Uma maneira adicional de visualizar o índice de 
Moran proposto por Anselin (1996), é a espacialização do 
relacionamento entre os valores observados e os valores 
das médias locais através de diagramas de espalhamento, 
denominado MoranScartterplot conforme as Figuras 13, 
14 e 15 abaixo. 
Figura 13- Moran Scatterplot para Índice de 
Criminalidade 
Figura 14- Moran Scatterplot para Renda Média 
 
Figura 15- Moran Scatterplot para Domicílios com Rede 
Geral de Instalação Sanitária 
 
Foram observados valores positivos e médias 
positivas em vermelho (High-High) para a variável 
índice de criminalidade no centro urbano do município. 
Foi possível identificar um pequeno agregamento de 
setores censitários localizados ao norte, justificando a 
criminalidade significativa nestas áreas. As associações 
positivas indicaram que nestes setores os valores de índice 
de criminalidade são altos bem como de seus vizinhos. Os 
valores negativos e médias negativas em rosa (Low-Low) 
estão amostrados na região periférica do município. Os 
setores identificados como “High-Low” e “Low-High” 
são valores de transição entre os mais altos e mais baixos. 
Os valores positivos e médias positivas da renda 
média marcam claramente em vermelho um bolsão 
concentrando setores censitários que pertencem em sua 
maioria a bairros de alto padrão. Foram verificadas 
regiões de transição de regime, para a esta variável 
exatamente nos locais de borda. 
 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
O diagrama de espalhamento de Moran identificou 
uma grande área em vermelho para os valores de 
instalação sanitária abrangendo boa parte do centro 
urbano e bairros próximos a ele. Também foram 
identificadas regiões de transição de regimes nas bordas 
com altos valores diferenciando as características de 
vizinhança. 
 
6.5 Análise Espacial em Pontos 
 
Para utilizar a Função K, foi realizada a análise de 
clusters pretendidos através da estimação de Kernel 
obtendo como resultado 45 clusters com uma separação 
de no mínimo 4 metros entre eles. O resultado final, 
conforme a Figura 16 foi a identificação de 27 clusters 
com tamanhos de elipses proporcionais a 1 desvio padrão. 
 
Figura 16- Determinação de Clusters com Função K 
 
A localização dispersa dos clusters identificados 
pela Função K mostra que existem diversos agrupamentos 
de pontos com características muito semelhantes tanto em 
valor (índice de criminalidade). 
 
7 Conclusões 
 
O desenvolvimento da metodologia permitiu 
determinar as áreas de risco criminal através de 
ferramentas de análise espacial e estatística relacionando 
variáveis sócio-econômicas e ocorrências criminais, por 
setor censitário. 
A regressão que melhor modelou a criminalidade 
nos setores censitários foi a que todos os termos foram 
transformados em função logarítmica. A modelagem 
deste fenômeno visto de forma espacial, considera 
principalmente as características de vizinhança de cada 
área sendo isso um fator determinante da estratégia de 
policiamento a ser empregado, já que valores elevados 
referentes à taxa de criminalidade revelam condições de 
segurança deterioradas. 
A análise de resíduos mostrou que os erros da 
regressão possuem distribuição normal e média igual a 
zero e que a distribuição dos erros padronizados ou 
ajustados pelos erros observados e estimados mostrou que 
o problema da heterocedasticidade foi eliminado e que 
não há violação de nenhum pressuposto de regressão. 
Além dos testes estatísticos presentes na regressão 
elaborada no SpaceStat, um dos quesitos que valida o 
modelo é independência entre os erros calculados e a 
variável dependente através da análise do valor do Índice 
(I) de Moran. O cálculo do I de Moran na regressão 
logarítimica indicou que não há dependência espacial 
entre os erros calculados e a variável dependente. 
O modelo de regressão adotado se adapta à maioria 
dos setores censitários como foi detectado no mapa 
residual, exceto na área que compreende a Represa 
Municipal onde os valores residuais estão acima do 
esperado. 
Os indicadores de autocorrelação Global e Local 
indicaram aglomerados de setores censitários nas três 
variáveis de estudadas: Log10 (índice de criminalidade), 
Log10 (renda média) e Log10 (instalação sanitária). A 
aplicação do Moran Global identificou agrupamento de 
setores muito parecidos nas três variáveis significando 
que elas estão correlacionadas. O Moran Local mostrou 
que existem setores censitários acima do padrão aleatório 
o que conseqüentemente indica uma dependência espacial 
muito forte destas variáveis nestes setores. 
No caso das amostras pontuais deve-se considerar 
a atribuição da variável índice de criminalidade como 
Intensidade nos cálculos dos clusters. Isto significa que 
além da distância entre os eventos, há a intensidade, que 
funciona como peso na determinação precisa dos clusters. 
A utilização de ferramentas de análise espacial 
apresentou vantagens em relação a análise estatística 
convencional principalmente quando considerou-se a 
matriz de continuidade espacial (W). A distância entre os 
centróides, o compartilhamento dos lados e o 
comprimento da fronteira de cada área são critérios 
fundamentais na análise espacial, fato que não ocorre na 
análise estatística convencional. 
 
AGRADECIMENTOS 
 
· à Escola Politécnica da Universidade de São Paulo – 
EPUSP; 
· ao Laboratório de Geoprocessamento e Departamento 
de Engenharia de Transportes da EPUSP; 
· à Fundação de Amparo à Pesquisa do Estado de São 
Paulo – FAPESP e 
· à Delegacia Seccional de São José do Rio Preto/SP. 
 
REFERÊNCIAS 
 
ANSELIN, L. SpaceStat users guide: 1.80. California 
University, Santa Barbara, 1995. 
 
ANSELIN, L. Local indicators of spatial association- 
LISA. Geographical Analysis, Ohio, v. 27, n. 2, 1996. 
 
CARVALHO, M. S. Aplicação de métodos de análise 
espacial na caracterização de áreas de risco à saúde. 
1997. Tese (Doutorado) - Universidade Federal do Rio de 
Janeiro, Rio de Janeiro. 
 
CRIMESTAT. Users guide: 1.1. Ned Levine & 
Associates. National Institute of Justice (NIJ), 
Washington, DC. Julho 2000. 
 
Anais do Simpósio Brasileiro de Geomática, Presidente Prudente – SP, 9-13 de julho de 2002. p. 000-000 
 
M. G. y Sanches; J. A. Quintanilha 
DEVORE, J. L. et al. Probability and Statistics for 
Engineering and the Sciences. 5 Edição. Editora 
Duxbury, 2000. 
 
FUNDAÇÃO INSTITUTO BRASILEIRO DE 
GEOGRAFIA E ESTATÍSTICA/FIBGE. Censo 
Demográfico 1991 - Resultado do universo relativo às 
características da população e dos domicílios. Rio de 
Janeiro: 1993. 
 
GEDODATA. Geodados, Mapeamento e Pesquisa.Desenvolvido pela própria empresa. Apresentando 
consulta por endereçamento. Disponível em < 
http://www.geodata.com.br>. São José do Rio Preto/SP, 
1999 Acesso em: 20 ago. 2000. 
 
KAHN, T. Instituto Latino Americano das Nações 
Unidas para a Prevenção do Delito e o Tratamento de 
Deliquentes - ILANUD. Disponível em: 
<http:/www.conjunturacriminal.com.br> 
 
LEVINE, M. D. et al. Estatística: Teoria e 
Aplicações usando Microsoft Excell (em português). 
Ed. LTC, 1998, 811p.

Continue navegando