Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 3 Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Doriam Borges 2 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • Meta Situar a estatística como instrumento para análise de fenômenos da violência e da criminalidade e para auxílio na tomada de decisõeses- tratégicas na área de segurança pública.Apresentar os conceitos básicos de variáveis e níveis de mensuração. Introduzir os conceitos iniciais de organização de dados por meio de distribuição de frequência. Mostrar como interpretar corretamente dados estatísticos. Objetivos Ao final desta aula, você deverá ser capaz de: 1. Identificar os níveis de mensuração de uma variável; 2. Distinguir que tipo de variável é mais indicada para cada situação; 3. Identificar o tipo de uma série estatística; 4. Utilizaras frequências absoluta, relativa, acumulada e acumulada relativa, para descrever, analisar e interpretar os dados referentes à estatísticadescritiva. 3 Estatística Aplicada à Segurança Pública Mensuração de dados em Segurança Pública: abrindo portas para a modernidade Fonte: http://www.freeimages.com/photo/12754 Experiências de sucesso no combate à criminalidade apontam para uma nova concepção de políticas públicas que utilizem tanto a ideia de que é necessário o gerenciamento de um sistema organizado de infor- mações quanto o uso de indicadores de desempenho que possibilitem o desenvolvimento de políticas públicas de segurança modernas e racio- nais, capazes de reduzir a violência a índices menores. Portanto, a com- binação de propostas de políticas de prevenção e contenção da violência com informações qualificadas sobre a realidade que se quer atingir é um caminho possível e eficaz a ser trilhado pelos estados e municípios brasileiros na busca da edificação de um sistema de segurança pública eficaz, que sirva como base de apoio e instrumento operacional de uma política consistente, que conte com profissionais qualificados, equipa- mentos adequados, tecnologia moderna, um gerenciamento racional que esteja hábil para trabalhar com planejamento, monitoramento e avaliação de desempenho. Por que desenvolver instrumentos de mensuração do agir e das ações das instituições de Segurança Pública? Por que e para que medir? 4 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • Fonte: http://www.freeimages.com/photo/93509 Fonte: http://www.freeimages.com/photo/1415055 Um olhar preciso e bem direcionado, focado em que e em como essas instituições agem, tem trazido êxito e maior eficiência a diferen- tes órgãos de Segurança Pública nos Estados Unidos, como também na América Latina, França, Inglaterra, Austrália, entre outros países. Nesses países, as instituições de segurança puderam rever seus proce- dimentos e atingir uma melhora em sua atuação, aperfeiçoando-se e, sobretudo, atingindo suas metas, após uma reflexão com base em indi- cadores de desempenho, estimulada por diversas orientações, diálogos entre profissionais interessados pelo assunto de Segurança Pública e re- presentantes das instituições. Essa mudança de atitude foi possível gra- ças à utilização de indicadores de desempenho, às parcerias com órgãos públicos, e ao apoio das comunidades beneficiadas pelo atendimento destas instituições, que passaram a colaborar, uma vez que sua confian- ça nessas instituições aumentou. Contudo, a utilização de mecanismos modernos de análise de da- dos na área de Segurança Pública no Brasil ainda é escassa. Estamos no início. Este problema tem afetado a elaboração e planejamentos de políticas públicas de segurança. Vamos discutir, nesta aula,alguns conceitos fundamentais para am- pliar a análise de dados de segurança pública, violência e criminalidade: variáveis, mensuração e nível de mensuração. Quando você chegar ao final desta aula,entenderá o papel crucial de mensuração de variáveis para a pesquisa e quais são as regras gerais na utilização dos dados para o desenvolvimento de teorias ou geração de conhecimento. A ideia nessa discussão é fazer com que você se torne crítico ao ana- lisar os dados. Só porque você tem uma informação, isso não quer di- 5 Estatística Aplicada à Segurança Pública zer que você pode fazer qualquer tipo deanálise a partir dela. É preciso conhecer as regras e os limites de cada tipo de dado. Ao conhecer esses limites e potenciais das mensurações, provavelmente,você poderáutili- zar medidas inteligentes para coisas complexas. Na medida em que você conhece melhor os seus dados, o nível de mensuração das variáveis que está utilizando e o tipo de análise que melhor se encaixa aos seus obje- tivos e hipóteses de estudo, mais aprofundadas e consistentes serão as suas conclusões. O que são variáveis e para que servem? Para começar, vamos falar de variável. Variável é algo que pode ter mais de um valor. Esses valores podem ser palavras ou números. Se você perguntar a uma mulher com quantos anos ela teve a sua primeira gra- videz, a resposta será um número (16 ou 40, ou outro número); mas, se você perguntar a ela sobre sua comida preferida, a resposta será uma palavra (feijoada ou lasanha, por exemplo). A pesquisa social é baseada na definição de variáveis , buscando asso- ciações entre elas e na tentativade entender se – e como – a variação de um fenômeno causa variação em outro. Algumas variáveis comuns que você vai encontrar na pesquisa social são cidade, sexo, raça/cor, educa- ção, renda, estado civil e ocupação. Algumas das variáveis que você poderá ver em pesquisas na área de segurança pública incluem o número de roubos a transeunte por cada rua de um bairro violento, distância entre o local da morte e da residên- cia de uma vítima de homicídio, tempo de resposta para as solicitações de atendimento recebidas pela Polícia, etc. Antes de contemplar a possibilidade de mensurar um conjunto de objetos,você precisater clareza sobre a definição teórica da dimensão que será objeto da medição. Além disso, também é necessáriogerar um instrumento de medida que mensure apenas a dimensão que se pre- tende estudar, e não outras.Dessa forma, o instrumento de mensura- çãovai respeitar o princípio da unidimensionalidade. Altura, peso, idade eestado civil são variáveis unidimensionais e são relativamente fáceis de medir. Mas você sabia que muitas variáveis apresentam problemas, justamente por mensurar simultaneamente, de forma escondida, mais de uma dimensão?A orientação política (uma pessoa pode ser conser- vadora ou liberal) é uma variável multidimensional e, portanto, é muito mais difícil de medir. Provavelmente, você já deve ter ouvido pessoas 6 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • falando sobre orientação política como se fosse uma variável unidimen- sional, ou seja, um indivíduo escolhe ser estritamente conservador ou estritamente liberal. Mas se você pensar sobre isso, as pessoas podem ser liberais sobre algumas dimensões da vida e conservadoras sobre ou- tras. Por exemplo, um indivíduo pode concordar fortemente com a afir- mação de que “homens e mulheres devem receber o mesmo salário para trabalhosiguais”, e também com a afirmação de que “a reforma agrária não é necessáriaem nosso país”. Ou seja, a mesma pessoa pode concor- dar com uma afirmação de orientação política liberal e outra afirmação de orientação política conservadora – duas das muitas dimensões da orientação política. Fonte: http://www.freeimages.com/photo/1060296 Mesmo algo aparentemente simples, como a renda,pode ser multidi- mensional. Para medir a renda anual de brasileiros aposentados no Rio deJaneiro, por exemplo, você tem que considerar os benefícios de pre- vidência social, fundos de pensão privados, presentes familiares, ganhos em jogos, créditos tributários, juros sobre a poupança, etc. Você está vendo que essa não é uma questão trivial, pois uma dimen- são teórica pode estar, por sua vez, composta por várias subdimensões, como é o caso do coeficiente de inteligência, que pode ser calculado a partir de sub-coeficientes de inteligência espacial, numérica e verbal. Nesse caso, desde que o conceito teórico inclua esses subcomponentes e a relação entre eles respeite certos requisitos teóricos e empíricos, não haveria ruptura da unidimensionalidade. 7 Estatística Aplicada à Segurança Pública A medição de variáveis: tipologias Como variáveis, geralmente, se entende qualquer qualidade ou ca- racterística de um objeto (ou evento) que contenha, ao menos, dois atributos (categorias ou valores) que possam classificar um objeto ou evento determinado. Os atributos são as distintas categorias ou valores que compõem a variável. Em função delas, classificam-se os objetos (ou eventos) em um grupo ou outro. Variáveis como idade (em anos), altura (em cen- tímetros), e renda (em reais) assumem valores (numéricos). Por outro lado, variáveis como sexo (homem, mulher), estado civil (solteiro, casa- do, viúvo, separado, divorciado) ou sentimento de insegurança (muito inseguro, inseguro, nem inseguro nem seguro, seguro, muito seguro) assumem categorias. A medição de uma variável consiste, precisamente, no processo de atribuir valores ou categorias as distintas características que conformam o objeto de estudo. Para que a medição se realize adequadamente, você deve cumprir dois requisitos básicos: a) Exaustividade Fonte: http://www.freeimages.com/photo/1396218 A medição de uma variável deve ser feita de forma que esta com- preenda o maior número de atributos (categorias ou valores) possível. O propósito é que incluam qualquer valor que possa aparecer na vari- ável. Por exemplo, se os valores da variável religião fossem “católico”, “evangélico” e “espírita”, a medição não seria exaustiva, pois uma pessoa de religião judaica não teria nenhum valor para representá-la. É por isso 8 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • que se costuma acrescentar uma categoria residual —“outra”— que ga- ranta que todos os valores sejam contemplados. Vale ressaltar que o ide- al é que esta categoria “outros” inclua apenas um número reduzido de casos. Quando a categoria “outros” representa uma grande proporção dos casos, a medida de categorias não será muito útil analiticamente, embora seja exaustiva. Nesse caso, você deve analisar os casos contidos nessa categoria residual para tentar formular, a partir dela, outras cate- gorias adicionais mais específicas. b) Exclusividade Os distintos atributos que compõem a variável devem ser mutua- mente exclusivos. Portanto, devem ser definidos de maneira que qual- quer observação só possa ser classificada em um único atributo, não em vários. Imagine um sistema de atributos para a variável “ocupação” com os seguintes valores: trabalhador manual, trabalhador não manual, pro- fissional, funcionário, empresário, outra. O sistema não é mutuamente excludente porque, por exemplo, um médico que trabalha num hospital público é, ao mesmo tempo, um profissional e um funcionário. Existem diferentes modalidade de variáveis. No Quadro a seguir, são resumidos os principais critérios de classificação das variáveis. Tabela 1.2: Tipologias de variáveis segundo critérios de classificação Nível de Mensuração Variáveis qualitativas 1) Nominais 2) Ordinais Variáveis quantitativas 3) Intervalar 4) Razão Escala de Medição 1) Contínuas 2) Discretas Função de Investigação 1) Independentes 2) Dependentes Tipos de variável segundo o nível de mensuração Variáveis qualitativas a) Variáveis Nominais: são as variáveis que só cumprem as condições essenciais de exaustividade e de exclusividade (mutuamente exclusivo). 9 Estatística Aplicada à Segurança Pública Os valores de uma variável nominal compreendem uma lista de nomes. Você pode listar as religiões, profissões e tipos de crime, assim como frutas, emoções, partes do corpo, coisas para fazer no fim de semana, partido político, enfim, a lista de coisas que você pode listar é inter- minável. Osvalores da variável constituem, justamente, as categorias de classificação. Esses valores são arbitrários e não podem ser ordenados de acordo com a dimensão mensurada, Isto é, os casos são diferentes quanto à sua natureza, e não quanto ao grau. Por exemplo, a variável “partido no qual votou nas últimas eleições” pode ter como valores os seguintes: PSDB, PFL, PT, etc. Para facilitar, cada partido pode receber um código numérico (1: PSDB; 2: PFL; 3: PT, etc.). Mas a ordenação pode ser qualquer uma, já que os valores são arbitrários. Assim, poderí- amos ter dado o valor 1 ao PT e o 2 ao PSDB, porque, na verdade não há uma ordenação dos casos em relação à dimensão. O PSDB não é “mais” nem “menos” partido do que o PFL. b) Variáveis ordinais: são variáveis cujos atributos participam das ca- racterísticas anteriormente referidas, além da possibilidade de pode or- denar, no sentido de “maior que” ou “menor que”. Não obstante, conti- nua sem poder conhecer a magnitude exata que diferencia um atributo do outro. As variáveis ordinais são, igualmente, qualitativas. Expressam uma qualidade do objeto ou acontecimento, e não uma quantidade. Um exemplo de uma variável ordinal seria a classe social, com os valores: A, B, C, D e E. A classe A é obviamente superior à classe B e ela é superior à classe C, de forma que não é possível alterar a ordem das classes à vontade e colocá-las de qualquer outra forma, como: A,D,B,E,C. En- tretanto, não é possível dizer que a diferença entre as classes A e C seja a mesma que entre as classes C eE. Isso significa que, mesmo que você conceda um código numérico a cada classe – A=1, B=2, C=3, D=4, E=5 – não poderá, a rigor, submeter esses números a operações aritméticas como soma e subtração. Assim, a “classe média” de todos os sujeitos seria um conceito de interpretação problemática, justamente porque não há garantias da equivalência de que os intervalos entre os valores sejam constantes. Variáveis quantitativas c) Variáveis intervalares: constituem variáveis quantitativas. Variáveis intervalares têm todas as propriedades de variáveis nominais e ordinais. Elas são uma lista exaustiva e mutuamente exclusiva de atributos, e têm 10 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • uma estrutura de ordenação. Além disso, esse tipo de variável tem uma propriedade adicional: as distâncias entre os atributos são significativas. A diferença entre 30° C e 40° C é o mesmo 10°, como a diferença entre 15° C e 25° C, e a diferença entre um valor de QI de 90 e 100 é a mesma que a diferença entre uma de 130 e 140. Por outro lado, 40°C não é duas vezes mais quente do que 20° C, e uma pessoa que tem um QI de 150 não é de 50% mais inteligente do que uma pessoa com um QI de 100. d) Variáveis de Razão: as variáveis de razão são aquelas que têm um ponto zero verdadeiro, ou seja, o valor0representa a ausência do fenô- meno que está sendomensurado. Por exemplo, o valor na renda significa ausência de renda. A consequência de um verdadeiro ponto zero é que as medidas passam a ter propriedades de relação. Uma pessoa que tem 40 anos de idade é 10 anos mais velha do que ade 30 anos, e uma pessoa que tem 20 anos é 10 anos mais velha do que uma pessoa que tem 10 anos. Isso também é verdade para uma variável intervalar. Além disso,numa variável de razão, por exemplo, uma pessoa que tem 20 anosé duas vezes mais velha que uma pessoa com 10 anos, e uma pessoa com 40 anos é duas vezes mais velha que uma pessoa com 20 anos. Isto por- que a idade 0 significa mesmo ausência de idade e, portanto, não muda de uma escala para outra. Esse ponto de origem fixo permite que os valores possam ser submetidos a operações de multiplicação e divisão, e não apenas de soma e subtração. Agora, a ideia de “o dobro da idade” faz sentido. Em suma, quando você tem que mensurar variáveis que podem ser quantitativas ou qualitativas, terá que decidir, por exemplo, se procederá por uma medida intervalar ou ordinal. Dependerá de como você dese- nhou o instrumento de coleta das informações. Em geral, recomenda-se optar pela precisão e pelo detalhe, ao invés da generalização. Os atribu- tos da variável sempre poderão ser agrupados em categorias genéricas na fase de análise. Entretanto, nunca poderá proceder ao caso inverso, ou seja, já coletada a informação, você não poderá desmembrar as cate- gorias genéricas em atributos específicos. O ideal é sempre contar com o nível de mensuração mais alto possível. Ou seja, trabalhar com variáveis de razão sempre que possível. Quanto maior for o nível de mensuração, mais propriedades possui a medida e mais amplas serão as análises que poderão ser aplicadas. No entanto, esse nível de mensuração deve ser sustentado pelo fenômeno e pelo instrumento. Se nós assumirmos um nível de mensuração superior ao que se desprende dos dados, estaremos fadados a sérios erros na análise e na interpretação. 11 Estatística Aplicada à Segurança Pública Atividade 1 Atende aoobjetivo 2 Identificando os níveis de mensuração Um questionário foi aplicado aos cinco funcionários de um setor da Secretaria de Segurança Pública, fornecendo os dados apresentados na tabela abaixo. Classifique cada uma das variáveis apresentadas na tabela. Nome Escolaridade Idade (em anos) Anos no Setor José Superior Completo 51 4 Antônio Ensino Médio 36 3 Maria Superior Completo 34 2 Fátima Superior Completo 55 5 Luiz Ensino Médio 22 1 Fábio Superior Completo 60 6 Resposta comentada Nome é uma variável nominal; Escolaridade é uma variável ordinal; Idade é uma variável de razão; Anos no Setor é uma variável de razão. Tipos de variável segundo escala de mensuração Um segundo critério de classificação das variáveis se refere a se a medição foi aplicada em uma escala contínua ou discreta. Assim se di- ferenciam as variáveis contínuas e as discretas. a) Variáveis Contínuas São aquelas variáveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Exemplos: peso, altura, tempo, pressão arterial, idade, renda, etc. 12 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • b) Variáveis Discretas São as variáveis que possuem características que podem assumir apenas um número finito ou infinito contável de valores; assim, somente fa- zem sentido valores inteiros, geralmente contagem de número de filhos, quantidade de investigações que uma delegacia conclui por ano, etc. Tipos de variável segundo sua função na investigação As variáveis também diferem segundo o papel que cumprem em uma pesquisa. Atendendo a este critério de classificação, distinguem-se entre variáveis independentes e dependentes. a) Variáveis independentes, explicativas ou preditoras A variável independente é definida como a que exerce influência sobre outra variável, determinando ou afetando o resultado observado na segunda, com precisão e regularidade. b) Variável dependente A variável dependente resume-se nos fenômenos ou fatores explicados ou identificados, por serem influenciados ou determinados pela variável independente. É o elemento que surge, altera-se ou desaparece quando o investigador introduz, modifica ou remove a variável independente. No contexto da pesquisa, a variável independente é o antecedente, e a variável dependente é o resultado. Os pesquisadores procuram fazer previsões acerca do comportamento das variáveis dependentes a partir das características das variáveis independentes e, de maneira inversa, podem desejar aclarar um determinado fato ou fenômeno (variável de- pendente) por meio da identificação do acontecimento (variável inde- pendente) que o ocasionou. Atividade 2 Atende ao objetivo 3 Cada tipo de variável para cada problema. 13 Estatística Aplicada à Segurança Pública Nos estudos apresentados a seguir, identifique se a variável é discreta ou contínua. a) O número de acidentes com motos durante um ano em um cruzamento. b) O volume de sangue colhido para um exame. c) O período necessário para chegar ao trabalho. d) O número de dias chuvosos no mês de julho em uma cidade. Resposta comentada a) variável discreta b) variável contínua c) variável contínua d) variável discreta Dados estatísticos: apresentação tabular Existem duas formas básicas para sintetizar informações de uma ou mais variáveis: Tabelas e Gráficos. Nesta parte da aula, você vai aprender os conceitos básicos da apresentação de dados estatísticos no formato tabular. Esses conceitos serão muito importantes para a discussão que faremos na próxima aula sobre os princípios e as regras para a elabora- ção de uma tabela e de um gráfico. A apresentação de dados estatísticos na forma tabular consiste na reunião ou grupamento dos dados em ta- belas ou quadros, com a finalidade de apresentá-los de modo ordenado, simples e de fácil percepção e com economia de espaço. Composição de uma tabela a) Elementos básicos Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos: título, corpo (indicadora de coluna, linha e célula), cabeçalho e rodapé. 14 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • Título Cabeçalho Coluna Indicadora C o Célula l Linha u n a Rodapé Exemplo: Brasil - Estimativa de População 2000 – 12 Ano População 2000 169.799.170 2001 172.385.776 2002 174.632.932 2003 176.876.251 2004 179.108.134 2005 184.184.074 2006 186.770.613 2007 189.335.191 2008 189.612.814 2009 191.481.045 2010 190.755.799 2011 192.379.287 2012 193.976.530 Fonte: IBGE b) Principais Elementos de uma Tabela Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela, respondendo às perguntas: O quê? Onde? Quando? Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas. Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Colunas: Parte da tabela que contém uma série vertical de informações. 15 Estatística Aplicada à Segurança Pública Célula: Cruzamento de uma linha com uma coluna. Rodapé: são mencionadas a fonte, se os dados forem extraídos de algu- ma instituição, e também as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados. Séries estatísticas A Série Estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de três elementos: a) da época; b) do local; c) da espécie. Esses elementos determinam o surgimento de quatro tipos funda- mentais de séries estatísticas: a) Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e a espécie. Exemplo: Brasil - Número de vítimas de Mortes Violentas por Agressão 2000 - 12 AnoVítimas de Homicídio (Mortes Violentas por Agressão) 2000 45.360 2001 47.943 2002 49.695 2003 51.043 2004 48.374 2005 47.578 2006 49.145 2007 47.707 2008 50.113 2009 51.434 2010 52.260 2011 52.198 2012 56.337 Fonte:Sistema de Informações sobre Mortalidade – SIM / MS 16 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • b) Séries Geográficas: são aquelas nas quais os dados são reunidos se- gundo o local que varia, permanecendo fixos o tempo e a espécie. Exemplo: Número de vítimas de Mortes Violentas por Agressão segundo Grandes Regiões 2012 Grandes Regiões Vítimas de Homicídio (Mortes Violentas por Agressão) Região Norte 6.087 Região Nordeste 20.978 Região Sudeste 17.155 Região Sul 6.630 Região Centro-Oeste 5.487 Fonte:Sistema de Informações sobre Mortalidade – SIM / MS c) Séries Específicas: são aquelas nas quais os dados são reunidos se- gundo a espécie que varia, permanecendo fixos o tempo e o local. Exemplo: Brasil - Número de vítimas de Mortes Violentas por Agressão segundo o Meio Utilizado 2012 Meio Utilizado Vítimas de Homicídio (Mortes Violentas por Agressão) Arma de Fogo 40.077 Arma Branca 12.052 Outros Meios 2.684 Estrangulamento ou por Meio de Força Corporal 1.484 Envenenamento 40 Total 56.337 Fonte:Sistema de Informações sobre Mortalidade – SIM / MS d) Séries Composta ou Mista: é a combinação de duas ou mais funda- mentais séries estatísticas. Exemplo: 17 Estatística Aplicada à Segurança Pública Geográfica – Temporal Evolução do Número de vítimas de Mortes Violentas por Agressão segundo Grandes Regiões 2002 / 2012 Grandes Regiões 2002 2012 Região Norte 2.943 6.087 Região Nordeste 10.965 20.978 Região Sudeste 27.423 17.155 Região Sul 4.723 6.630 Região Centro-Oeste 3.641 5.487 Total 49.695 56.337 Fonte:Sistema de Informações sobre Mortalidade – SIM / MS Atividade 3 Atende ao objetivo 4 Identificando as Séries Estatísticas Considere a série a seguir. Como você a classificaria? População Brasileira Ano População 2000 166.112.518 2001 172.385.826 2002 174.632.960 2003 176.871.437 2004 181.581.024 2005 184.184.264 2006 186.770.562 2007 184.014.516 2008 189.612.814 2009 191.506.729 2010 190.732.694 2011 192.379.287 2012 193.976.530 2013 201.062.789 Fonte: IBGE 18 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • a) Temporal b) Geográfica c) Mista d) Específica Resposta Comentada A resposta certa é (a) Série Estatística Temporal, pois varia com o passar do tempo (no caso, a cada ano). Distribuição de frequência Se você for estudar uma variável, a primeira coisa que precisa co- nhecer é a sua distribuição através das realizações (valores) da mesma. O objetivo por trás disso é obter informações que não poderiam ser encontradas na observação direta nos dados. Os dados brutos, em ge- ral, não são práticos para responder às questões de interesse do estu- do; então, é necessário resumi-los e, para isso, se faz necessário definir alguns conceitos: a) Frequência absoluta: é o número de vezes que uma determinada característica ou valor numérico é observado. b) Frequência relativa: é a proporção, do total, em que é observada uma determinada característica. Sob determinadas características, as frequências relativas podem ser usadas para estimar quantidades im- portantes como, por exemplo, o percentual de vítimas de roubos a tran- seuntes por sexo, a taxa de homicídios por 100 mil habitantes. Este con- ceito está associado com a definição clássica de probabilidade. c) Frequência acumulada: para um determinado valor numérico ou dado original, é a soma das frequências dos valores menores ou iguais ao referido valor. 19 Estatística Aplicada à Segurança Pública Distribuição de frequências não agrupadas Este tipo de distribuição é utilizado quando o número de valores possíveis da variável em estudo é reduzido. Serve para representar vari- áveis categóricas e, em alguns casos, numéricas. A distribuição de frequência não agrupada é representada em uma tabela que contém, pelo menos, duas colunas: 1. Listagem de todos os possíveis valores da variável; 2. Frequências associadas aos valores da variável em estudo. Exemplo: Segundo pode ser verificado no Sistema de Informações sobre Mor- talidade (SIM), do Ministério da Saúde, em 2012, foram contabilizadas 56.337 mortes por causas externas, devido a agressões (mortes violentas intencionais), no Brasil. Para esse total de mortes, a tabela de distribui- ção de frequência da variável cor/raça é a seguinte: Cor f fr Branca 14.350 0,255 Preta 4.406 0,078 Amarela 73 0,001 Parda 33.850 0,601 Indígena 200 0,004 Ignorado 3.458 0,061 Total 56.337 1,000 Fonte: Sistema de Informações sobre Mortalidade – SIM Onde f é a frequência absoluta (número de observações que temos em uma determinada classe) e fr é a frequência relativa (proporção do número de observações em uma determinada classe em relação ao total de observações, como você abaixo). Distribuição de frequências agrupadas A distribuição de frequência agrupada é utilizada para variáveis nu- méricas contínuas ou quando existem muitos valores possíveis para uma variável discreta. O procedimento de construção da tabela é simples e 20 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • tem como ideia básica criar intervalos ou classes para a variável em es- tudo e calcular as frequências para esses intervalos. Os dados de vítimas de Mortes por Causas Externas devido a Agressão no Brasil, para o ano de 2012, serão utilizados como exemplo. Considerando que neste ano foram registrados 56.337 mortes por Agressão, imagine como seria ana- lisar os dados de idade dessas vítimas? É um volume muito grande de números, o que torna qualquer trabalho inviável. Por isso, a importân- cia em elaborar tabelas de distribuição de frequência agrupadas. Entretanto, ao trabalhar com este tipo de distribuição de frequência, é importante considerar alguns aspectos sobre o agrupamento das fai- xas ou o tamanho dos intervalos. Você pode trabalhar com intervalos do mesmo tamanho ou não, dependendo do tema de estudo. Pode ser útil trabalhar com intervalos de tamanhos diferentes em casos em que existem algumas faixas com características importantes e outras em que não existe grande desenvolvimento. A seguir, você verá uma distribuição de frequência acumulada com intervalos diferentes: Idade das vítimas de morte por agressão Faixa Etária f fr 0 a 10 anos 321 0,006 10 a 14 anos 728 0,013 15 a 19 anos 9.106 0,162 20 a 29 anos 20.966 0,372 30 a 39 anos 12.697 0,225 40 a 49 anos 6.307 0,112 50 a 59 anos 2.928 0,052 60 a 69 anos 1.302 0,023 70 a 79 anos 604 0,011 80 anos e mais 230 0,004 Idade ignorada 1.148 0,020 Total 56.337 1,000 Fonte: Sistema de Informações sobre Mortalidade – SIM 21 Estatística Aplicada à Segurança Pública Elementos de uma distribuição de frequência a) classes de frequência: são os intervalos de variação da variável, representados por i, sendo i = 1,2,3,4,...,k, onde k é o número total de classes. Em nosso exemplo k = 11 b) Limites da classe: são os extremos de cada classe. Limite superior Li Limite inferior li O símbolo li |- Li significa inclusão de li e exclusão de Li l4 = 20 e L4 = 29 c) Amplitude de um intervalo de classe (h) é a medida do intervalo que define a classe h = Li - li h4 = 29-20 = 9 d) Amplitude total da distribuição(AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira (limite inferior mínimo). AT = L(máx) - l (min) AT = 80 - 0 = 80 Deve-se notar que,em nosso exemplo, o limite superior máximo está sendo representado por 80 anos, valor apresentado na tabela. Entretan- to, no ano de 2012, foram registrados 230 vítimas de Mortes Violentas por Agressão com idade superior a 80 anos. e) Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes iguais. xi = (li+Li)/2 x4 = (20+29)/2 = 24,5 f) Frequência simples ou absoluta: é o número de observações corres- pondentes a essa classe ou a esse valor. f1 = 321; f2 = 728; f3 = 9.106; f4 = 20.966; f5 = 12.697;f6 = 6.307;f7 = 2.928; f8 = 1.302;f9 = 604; f10 = 230; f11 = 1.138 22 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • k i i=1 f = n∑ 11 i i=1 f = 56.337∑ Tipos de frequências a) frequência Simples ou Absoluta (fi): é o valor que representa o nú- mero de dados de uma classe, onde : k i i=1 f = n∑ b) Frequência Relativa (fri): é a porcentagem entre a frequência simples e a frequência total: [ ]ii k i i=1 ffr = ×100 % f∑ No exemplo: fr4 = 20.966 / 56.337 = 0,372 x 100 = 37,2 %, ou seja, 37,2% das vítimas de Mortes Violentas por Agressão estão na faixa entre 20 e 29 anos. É obvio que: k i i=1 fr =100%∑ O propósito das frequências relativas é o de permitir a análise e facilitar comparações. c) Frequência Acumulada (Fi): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. 23 Estatística Aplicada à Segurança Pública k 1 2 3 kF = f + f + f + L + f ou k k i i=1 F = f∑ No exemplo F4 = f1 + f2 + f3 = 321 + 728 + 9.106 + 20.966 = 31.121, o que significa que existem 31.121pessoas com até 29 anos sendo vítimas de homicídio (Morte Violenta por Agressão). d) Frequência Acumulada Relativa (Fri): é a porcentagem entre a frequência relativa acumulada da classe e a frequência total da distribuição. [ ]ii k i i=1 FFr = ×100 % f∑ No exemplo, temos Fr4 = 31.121 / 56.337 = 0,552 = 55,2 %, o que significa que 55,2 % das vítimas de Mortes Violentas por Agressão têm 29 anos ou menos de idade. Pode-se, então, montar a seguinte tabela: i Faixa Etária Xi f fri (%) Fi Fri 1 0 a 10 anos 5,0 321 0,6% 321 0,6% 2 10 a 14 anos 12,0 728 1,3% 1.049 1,9% 3 15 a 19 anos 17,0 9.106 16,2% 10.155 18,1% 4 20 a 29 anos 24,5 20.966 37,2% 31.121 55,3% 5 30 a 39 anos 34,5 12.697 22,5% 43.818 77,8% 6 40 a 49 anos 44,5 6.307 11,2% 50.125 89,0% 7 50 a 59 anos 54,5 2.928 5,2% 53.053 94,2% 8 60 a 69 anos 64,5 1.302 2,3% 54.355 96,5% 9 70 a 79 anos 74,5 604 1,1% 54.959 97,6% 10 80 anos e mais 80,0 230 0,4% 55.189 98,0% 11 Idade ignorada - 1.148 2,0% 56.337 100,0% Total 56.337 100,0% Que nos ajuda a responder: 24 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • 1. Quantas vítimas estão na faixa entre 30 e 59 anos? Resp. 21.932vítimas. 2. Qual a percentagem de vítimas com idade inferior a 14 anos? Resp. 1,9%. 3. Qual a percentagem de vítimas que está na faixa de 15 a 29 anos de idade? Resp. 53,4%. 4. Qual a percentagem de vítimas que tem a idade ignorada? Resp. 2%. Atividade 4 Atende aos objetivos 5 e 6 Analisando a distribuição de frequência Analise a arrecadação municipal das 19 Prefeituras da região X em 2014, apresentada na tabela a seguir. Valores da arrecadação municipal em milhões de R$ fi Fi Fr Fr 0 |---- 2.000 6 6 31,58 31,58 2.000 |----- 4.000 4 10 21,05 52,63 4.000 |---- 6.000 6 16 31,58 84,21 6.000 |---- 8.000 2 18 10,53 94,74 8.000 |---- 10.000 1 19 5,26 100,00 Total 19 100,00 Resposta Comentada A arrecadação municipal constitui-se de valores baixos, ou seja, meta- de das prefeituras apresentou uma arrecadação inferior a R$ 4 milhões. Apenas uma prefeitura teve uma arrecadação acima de R$ 8 milhões. Observa-se que em 84,21% dos municípios, a arrecadação municipal foi inferior a R$ 6 milhões. Na faixa de menos de R$ 2 milhões, concen- tram-se 31,58% dos municípios. 25 Estatística Aplicada à Segurança Pública Conclusão Nesta aula, você verificou como a estatística pode ser um instru- mento valioso na análise dosfenômenos da segurança pública. Para tan- to, foram introduzidos alguns conceitos básicos sobre variável e nível de mensuração. Além disso, você verificou que quando os dados são coletados, a principal tarefa a ser realizada é a análise dos resultados. Neste sentido, torna-se necessário transformar os dados brutos num conjunto de nú- meros organizados, que possam ser usados para demonstrar o compor- tamento do fenômeno estudado, por meio de distribuição de frequência. Resumo Variáveis são características que são medidas, controladas ou manipula- das em uma pesquisa. Diferem em muitos aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas. As variáveis diferem em “quão bem” elas podem ser medidas, isto é, em quanta informação seu nível de mensuração pode prover. Os dados podem ainda ser classificados quanto ao seu nível de mensuração (nominal, ordinal, intervalar ou razão). No que se refere à organização de dados, quando você vai analisar um conjunto de informações e começa a considerar as diferentes catego- rias ou classes, e para cada uma delas calcula a sua frequência absoluta, você vai obter a Distribuição de Frequência do conjunto de dados. Esta distribuição de frequências é representada na forma de uma tabela, a que se dá o nome de tabela de frequências. A partir dessa tabela, você vai poder resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais, de forma absoluta ou relativa. Informações sobre a próxima aula Na próxima aula, você vai aprender alguns processos, chamados tabe- las e gráficos, para organizar a informação contida nos dados, de for- ma a realçar as suas características mais importantes. Além disso, você vai descobrir quais os segredos para fazer um gráfico coerente com os seus dados. 26 Aula 3 • Como organizar informações estatísticas: princípios básicos de mensuração e organização de dados Aula 3 • Aula 3 • Leitura Recomendada AGRESTI, A.; FINLAY, B. Métodos Estatísticos para Ciências Sociais. Ed. Penso, 2012 BUSSAB, W. O. e MORETTIN, P. A..Métodos quantitativos: estatística básica. São Paulo, Atual. 1997. SPIEGEL, M. R.. Estatística. São Paulo, McGraw, 1994.
Compartilhar