Baixe o app para aproveitar ainda mais
Prévia do material em texto
PAGE 1 UNIVERSIDADE POTIGUAR ESCOLA DA GESTÃO E NEGÓCIOS ESTATÍSTICA – UNIDADE I 1 - A NATUREZA DA ESTATÍSTICA A palavra estatística formou-se da mesma raiz latina da palavra Estado (Organização Política): status; porque, originalmente, as estatísticas eram colhidas para as finalidades relacionadas com o Estado (com objetivos militares, tributários, recenseamentos, entre outros). 1.1 – PANORAMA HISTÓRICO: Todas as ciências têm suas raízes na história do homem. A Matemática, que é considerada “a ciência que une a clareza de raciocínio à síntese da linguagem”, originou-se do convívio social, das trocas, da contagem com caráter prático, utilitário, empírico. A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade, vários povos já registraram o número de habitantes, de nascimentos de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje chamaríamos de “estatísticas”. Na idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tabuas e tabelas e os primeiros números relativos. No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostras). Atualmente, o público leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errôneos, quanto à validade das conclusões estatísticas: ou crê em sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, quer teórica como prática, ou a conhecem muito superficialmente. Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus processos e técnicas, têm contribuído para a organização dos negócios e recursos do mundo moderno. 1.2 - MÉTODO ESTATÍSTICO 1.2.1 - O método científico: Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos. Podemos dizer, então, que: Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. 1.2.2 - O método experimental: O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química, etc. 1.2.3 - O método estatístico: Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar no preço da mesma. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades, etc. Mas isso tudo é impossível. Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 2 - POPULAÇÃO E AMOSTRA Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos. Podemos dizer, então, que: A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, analise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação. 2.1 – CONCEITOS BÁSICOS: Estatística: é a Ciência que reúne e classifica fatos, baseando-se em seu número e freqüência, tirando conseqüências e conclusões gerais para a tomada de decisão. Objetivo: é a etapa principal, pois a partir da idéia clara do alvo a ser atingido é que é traçada a estratégia de trabalho. É nesta fase que se deve avaliar se o objetivo pretendido é factível, e quais as alternativas existentes também gerariam resultados úteis e interessantes. Qualquer equívoco nesta etapa certamente gerará discrepâncias na fase de análise dos resultados. Informações necessárias: nesta fase se determinam quais informações devem ser coletadas a fim de se atingir o objetivo pretendido. Isto implica em detalhar, também, o procedimento a ser utilizado na coleta, que pode ser, por exemplo, pesquisa de mercado ou um levantamento em banco de dados primários tais como, o Sistema Integrado de Acompanhamento da União. Esta etapa exige a definição da abrangência da população sob estudo, bem como da dimensão da amostra a ser avaliada. População: No uso mais comum da palavra, entende-se por população o conjunto de pessoas ou organismos de uma espécie que habitam uma determinada área geográfica. Deste modo, em nível de seres humanos, pode ser definida como todos os habitantes de um dado país ou área, considerados no seu conjunto. . Em estatística, população é sinônimo de universo, isto é, a coleção completa de unidades (pessoas, instituições, registros ou acontecimentos). População é o conjunto de todos os elementos aos quais estão associadas determinadas características que se gostaria de identificar, conhecer ou mensurar. Ao conjunto de realizações dá-se o nome de população (se finito) e universo (se infinito). O número de elementos da população é representado pela letra N. Exemplo: no estudo dos fatores que influenciam a produção em uma empresa contendo 9000 funcionários, a população de interesse é composta por esses 9000 funcionários. Censo: é a contagemgeral de todos os integrantes da mesma espécie, (população) de determinada área geográfica, seja uma cidade, uma região ou um país. Os censos populacionais constituem a única fonte de informação sobre a situação de vida da população nos municípios e localidades. As realidades locais, rurais ou urbanas, dependem dos censos para serem conhecidas e atualizadas. Os censos produzem informações imprescindíveis para a definição de políticas públicas estaduais e municipais e para a tomada de decisões de investimento, sejam eles provenientes da iniciativa privada ou de qualquer nível de governo. Entre as principais utilizações dos resultados censitários estão as de: 1. Acompanhar o crescimento da população ao longo do tempo; 2. Identificar necessidades na área de saúde, educação, habitação, transporte e energia; 3. Implantar programas de estímulo ao crescimento econômico e desenvolvimento social; 4. Fornecer referências para definir repasses de verbas a estados e municípios; 5. Fornecer referências para definir representação política do país; 6. Conhecer e analisar o perfil da mão-de-obra; 7. Selecionar locais para instalação de fábricas, escolas, creches, cinemas, etc. 8. Fundamentar reivindicações dos cidadãos, como luz, água, esgoto e lixo; 9. Subsidiar as comunidades acadêmicas e técnico-científicas em seus estudos; Variável: é o agrupamento das medidas repetidas de um dado objeto de estudo, realizadas em diferentes unidades de observação. Ex: As variáveis: peso, altura, idade, tempo empregado na realização de uma tarefa podem ser “medidas” para cada funcionário (objeto de estudo) de uma empresa. Tipos de variáveis: As variáveis podem ser quantitativas ou qualitativas. Variável Qualitativa Nominal – é aquela onde os elementos são alocados em categorias que não possuem ordem entre si. Ex: Sexo (masculino, feminino), Estado de origem (PR, SC, RS, SP, etc). Variável Qualitativa Ordinal – é aquela onde os elementos são alocados em categorias (postos) que são ordenadas entre si. Ex: Nível de instrução (primeiro grau completo, segundo grau completo, superior completo, pós-graduação), Classe Social (alta, média, baixa). Variável Quantitativa Discreta – é aquela que só pode assumir valores inteiros positivos inclusive o zero, resultante, normalmente, de uma contagem. Ex: número de filhos, número de acidentes de trabalho, número de faltas. (não tem submúltiplos, não existe ½ filho). Variável Quantitativa Contínua – é aquela que pode assumir infinitos valores entre dois limites quaisquer, resultando, geralmente, de alguma mensuração. Ex: peso, altura, temperatura ambiente, tempo empregado na realização de uma tarefa. (têm submúltiplos, gramas, centímetros). Amostra: é qualquer subconjunto de observações tomadas de uma população. O número de elementos da amostra é representado pela letra n. Exemplo: Suponha-se que se pretenda conhecer o conteúdo de ferro natural a ser exportado por um navio. A população consiste em todo o minério de ferro a ser exportado por esse navio. Parte do minério é examinada, a fim de determinar seu teor de ferro, com o objetivo de tirar uma conclusão a respeito do teor de ferro natural do embarque completo. A parte de mineral selecionado constitui a amostra do embarque. Uma vez que se fará inferência sobre todo o minério embarcado a partir de apenas uma porção dele, a base do processo é a informação incompleta ou de amostra. Amostragem: é o processo criterioso de escolha da amostra, constituindo a parte inicial de qualquer estudo estatístico. Veremos, a seguir, três das principais técnicas de amostragem: 1ª) Amostragem casual ou aleatória simples – Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática essa amostragem pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer k números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: a) Numeramos os alunos de 01 a 90. b) Escrevemos os números de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso 10% da população. 2ª) Amostragem proporcional estratificada – Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: a) SEXO POPULAÇÃO 10% AMOSTRA M F 54 36 10 x 54 / 100 = 5,4 10 x 36 / 100 = 3,6 5 4 Total 90 10 x 90 / 100 = 9,0 9 b) Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. Temos então: 28, 22, 53, 18, 03 – para os meninos; 57, 90, 80, 56 – para as meninas. 3ª) Amostragem sistemática – Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Exemplo: Na linha de produção de uma fábrica, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. EXERCÍCIOS: 1) Classifique as variáveis abaixo: a) Precipitação pluviométrica de uma cidade durante o ano; b) Número de filhos dos casais residentes em determinada cidade; c) Altura dos alunos de determinada escola; d) Sexo das crianças nascidas em uma cidade no mês de janeiro. 2) Em uma escola há oitenta alunos. Obtenha uma amostra de doze alunos. 3) Uma escola de 1° Grau abriga 124 alunos. Obtenha uma amostra representativa correspondendo a 15% da população. 4) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas das famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra? 5) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3° estrato, determine o número total de elementos da amostra. 6) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. 2.2 – FASES DO MÉTODO ESTATÍSTICO: Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo. Essas etapas ou operações são chamadas fases do trabalho estatístico e são de âmbito da Estatística Descritiva. - Definição do problema; - Planejamento; - Coleta de dados; - Crítica dos dados; - Apuração dos dados; - Apresentação dos dados; - Análise e Interpretação dos dados. 2.2.1 - Definição do Problema A primeira fase do trabalho estatístico consiste em uma definição correta do problema aser estudado. Além de considerar detidamente o problema objeto do estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Exemplo: Um fabricante de sabonete, que deseja lançar um produto novo no mercado, poderia estar interessado em um estudo sobre as características dos consumidores atuais. Não havendo estudos semelhantes, ele deverá formular o problema com base em sua própria experiência. Uma lista de fatores relevantes deverá resultar dessa investigação preliminar: número de unidades consumidas por família em cada ano, número médio de pessoas que compõe cada família, as marcas preferidas e assim por diante. Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. 2.2.2 - Planejamento O passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. Que dados deverão ser obtidos? Como se deve obtê-los? É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se pretende atingir. Nesta fase a maior preocupação deve ser na escolha das perguntas, bem como sua correta formulação. O conhecimento da população alvo pode nos levar a dois tipos de levantamento: 1) Levantamento censitário - quando a contagem abranger toda a população; 2) Levantamento por amostragem – quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa mesma fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra, a forma como serão escolhidos os dados. 2.2.3 - Coleta dos dados O terceiro passo é essencialmente operacional, compreendendo a coleta das informações propriamente ditas. Formalmente, a coleta de dados se refere à obtenção, reunião e registro sistemático de dados, com um objetivo determinado. A coleta de dados pode ser feita de duas maneiras, direta e indiretamente. A coleta é direta quando os dados são obtidos de sua fonte originária, sendo os dados assim coletados ditos primários; A coleta direta é classificada de acordo com o tempo, em: a) contínua; b) periódica; c) ocasional. a) A contínua, também denominada registro, é feita continuadamente, tal como a de nascimentos, casamentos e óbitos ou como no de vendas a vista de uma empresa comercial; b) A coleta é periódica quando feita em intervalos constantes de tempo como os censos (de dez em dez anos) e os balanços das uma empresa comercial (a cada ano); c) A coleta é ocasional quando independe do tempo e é feita quando a requer o estudo de um fenômeno como uma epidemia, por exemplo. d) A coleta é indireta quando os dados coletados provêm da direta, sendo os dado assim coletados ditos secundários. 2.2.4 - Crítica ou apreciação dos dados: A fim de não se incorrer em erros de grandes proporções, que possam afetar de maneira sensível os resultados, deve-se estudar os dados coletados através da crítica. Esta por sua vez pode ser: a) externa; b) interna. a) A crítica é externa quando visa às causas dos erros tais como a distração do observador e a má interpretação das pergunta de um questionário; b) A crítica é interna quando se observa o material constituído pelos dados coletados. É o caso, por exemplo, da verificação de transcrições e somas de valores anotados. 2.2.5 - Apuração dos dados: De posse de diversos questionários sobre o mesmo fenômeno, deve-se apurá-los, isto é, somar os dados obtidos e dispor os resultados mediante critérios de classificação. A apuração pode ser manual, mecânica ou eletrônica. Como exemplo, tem-se a apuração dos dados representativos de vendas de uma empresa que podem ser somados e dispostos em correspondência com os meses a que se referem. 2.2.6 - Exposição dos dados: A exposição dos dados observados pode ser apresentada de duas formas diferentes, que não se excluem mutuamente: 2.2.6.1 - Apresentação tabular: Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas estatísticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estatística. As tabelas têm a vantagem de conseguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar. 2.2.6.2 - Apresentação Gráfica: A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica. Embora a apresentação tabular seja de extrema importância, no sentido de facilitar a análise numérica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como a conseguida através de um gráfico. 2.2.7 - Análise e Interpretação dos dados A última fase do trabalho estatístico é a mais importante e também a mais delicada. Nesta, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. O significado exato de cada um dos valores obtidos através do cálculo das várias medidas estatísticas disponíveis deve ser bem interpretado, para desses resultados tirar-se conclusões e previsões. EXERCÍCIOS: 1) Complete: O método experimental é o mais usado por ciências como ___________ e ____________. 2) As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método? 3) O que é Estatística? 4) Cite as fases do método estatístico. 5) Para você, o que é coletar dados? 6) Para que serve a crítica dos dados? 7) O que é apurar dados? 8) Como podem ser apresentados ou expostos os dados? 9) As conclusões, as inferências pertence a que parte da Estatística? 10) Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária? 11) O método estatístico tem como um de seus fins: a) estudar os fenômenos estatísticos. b) estudar qualidades concretas dos indivíduos que formam grupos. c) determinar qualidades abstratas dos indivíduos que formam grupos. d) determinar qualidades abstratas de grupos de indivíduos. e) estudar fenômenos numéricos. 3. AS SÉRIES ESTATÍSTICAS 3.1 – TABELAS: Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isto ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a)Título – É a parte superior da tabela, na qual se indicam a natureza do fato estudado, o local e a época em que foi observado. Conjunto de informações destinado a responder às perguntas: O quê? Quando? Onde? b) Linha – É a parte da tabela que contém uma série horizontal de informações. c) Coluna – É a parte da tabela que contém uma série vertical de informações. d) Casa ou célula – É a parte da tabela formada pelo cruzamento de uma linha com uma coluna, destinada a um registro. e) Corpo – É a parte da tabela composta de linhas e colunas que contêm informações sobre a variável em estudo; f) Cabeçalho – É a parte da tabela que especifica o conteúdo das colunas, e forma a parte superior da tabela; g) Coluna indicadora – parte da tabela que especifica o conteúdo das colunas; h) Rodapé – É o espaço aproveitado em seguida ao fecho da tabela onde são colocadas as notas de natureza informativa (Fonte, notas e chamadas); i) Fonte – É a informação colocada no rodapé da tabelareferindo-se à entidade que originou ou forneceu os dados expostos; j) Notas e chamadas – São as informações, em linguagem concisa, colocadas no rodapé da tabela, em seguida à indicação da fonte, quando a matéria contida na tabela exige esclarecimentos. A nota é usada para conceituação ou esclarecimento geral e a chamada para esclarecer certas minúcias em relação a casas, linhas e colunas. Exemplo: Confeccionar uma tabela da Produção de Café no Brasil de 1978 a 1982, produção em 1.000 t. sendo: 1978 - 2.535 t; 1979 - 2.666 t; 1980 - 2.122 t; 1981 - 3.750 t e 1982 - 2.007t. Fonte IBGE. De acordo com a Resolução 886 da Fundação IBGE, nas células devemos colocar: > um traço horizontal ( - ) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito; > três pontos (...) quando não temos os dados; > um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor; > zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. 3.2 – SÉRIES ESTATÍSTICAS: Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Daí podemos inferir que numa série estatística observamos a existência de três elemento ou fatores: o tempo, o espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica. 3.2.1 - Séries históricas, cronológicas, temporais ou marcha: Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: Tabela 1 PRODUÇÃO DE FERTILIZANTES FOSFATADOS – BRASIL 1985 – 1989 ANOS QUANTIDADE (t) 1985 1986 1987 1988 1989 3.570.115 4.504.201 5.448.835 4.373,226 4.024.813 FONTE: Associação Nacional para Difusão De adubos e Corretivos Agrícolas. 3.2.2 - Séries geográficas, espaciais, territoriais ou de localização: Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: Tabela 2 PRODUÇÃO DE OVOS DE GALINHA NO BRASIL - 1988 REGIÃO QUANTIDADE (1.000 dúzias) Norte Nordeste Sudeste Sul Centro-Oeste 66.092 356.810 937.463 485.098 118.468 FONTE: IBGE. 3.2.3 - Séries específicas ou categóricas: Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: Tabela 3 REBANHOS BRASILEIROS - 1988 ESPÉCIE QUANTIDADE (1.000 cabeças) Bovinos Bubalinos Eqüinos Asininos Muares Suínos Ovinos Caprinos Coelhos 139.599 1.181 5.855 1.304 1.984 32.121 20.085 11.313 909 FONTE: IBGE. 3.2.4 - Séries Conjugadas (Tabela de dupla entrada): Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, Istoé, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo: Tabela 4 TELEFONES INSTALADOS NO BRASIL 1987 a 1989 REGIÃO 1987 1988 1989 Norte Nordeste Sudeste Sul Centro-Oeste 373.312 1.440.531 8.435.308 2.106.145 849.013 403.712 1.567.006 8.892.409 2.192.762 849.401 457.741 1.700.467 8.673.660 2.283.581 944.075 Total 13.158.309 13.905.290 14.059.524 FONTE: IBGE. A conjugação, no exemplo dado, foi série geográfica com série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal. Pode existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou mais entradas. 3.2.5 - Distribuição de Freqüência: Por se tratar de um conceito estatístico de suma importância, merecerá um tratamento especial mais adiante. Exemplo: Tabela 5 ESTATURA DO 100 ALUNOS DA ESCOLA X - 1990 ESTATURAS (cm) N° DE ALUNOS 140 ├ 145 145 ├ 150 150 ├ 155 155 ├ 160 160 ├ 165 165 ├ 170 170 ├ 175 2 5 11 39 32 10 1 Total 100 FONTE: dados fictícios. 3.3 – DADOS ABSOLUTOS E DADOS RELATIVOS: Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. Dados relativos são o resultado de comparações por quocientes (razões) que se estabelecem entre dados absolutos, e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas. 3.3.1 - As porcentagens: Consideremos a série: Tabela 6 MATRÍCULAS NAS ESCOLAS DA CIDADE A - 1990 CATEGORIA N° DE ALUNOS 1° Grau 2° Grau 3° Grau 19.286 1.681 234 Total 21.201 FONTE: dados fictícios. Calculemos as porcentagens dos alunos de cada grau: 1° Grau = 19.286 x 100 / 21.201 = 90,96 ou 91,0% 2° Grau = 1.681 x 100 / 21.201 = 7,92 ou 7,9% 3° Grau = 234 x 100 / 21.201 = 1,10 ou 1,1% Com esses dados, podemos formar uma nova coluna na série em estudo: Tabela 7 MATRÍCULAS NAS ESCOLAS DA CIDADE A - 1990 CATEGORIA N° DE ALUNOS % 1° Grau 2° Grau 3° Grau 19.286 1.681 234 91,0 7,9 1,1 Total 21.201 100,0 FONTE: dados fictícios. Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão matriculados no 1° Grau, 8 aproximadamente, no 2° Grau e 1 no 3° Grau. O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo. Consideremos, agora, a série: Tabela 8 MATRÍCULAS NAS ESCOLAS DA CIDADE A e B - 1990 CATEGORIA N° DE ALUNOS CIDADE A CIDADE B 1° Grau 2° Grau 3° Grau 19.286 1.681 234 38.660 3.399 424 Total 21.201 42.483 FONTE: dados fictícios. Qual das cidades tem, comparativamente, maior número de alunos em cada grau? Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes às porcentagens, obtemos: Tabela 9 MATRÍCULAS NAS ESCOLAS DA CIDADE A e B - 1990 CATEGORIA CIDADE A CIDADE B N° ALUNOS % N° DE ALUNOS % 1° Grau 2° Grau 3° Grau 19.286 1.681 234 91,0 7,9 1,1 38.660 3.399 424 91,0 8,0 1,0 Total 21.201 100,0 42.483 100,0 FONTE: dados fictícios. O que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau. Nota: Do mesmo modo que tomamos 100 para base de comparação, também podemos tomar um outro número qualquer, entre os quais destacamos o número 1. É claro que, supondo o total igual a 1, os dados relativos das parcelas serão todos menores que 1. Em geral, quando usamos 100 para base, os dados são arredondados até a primeira casa decimal; e quando tomamos 1 por base, são arredondados até a terceira casa decimal. Tabela 10 MATRÍCULAS NAS ESCOLAS DA CIDADE A - 1990 ESCOLAS N° DE ALUNOS DADOS RELATIVOS POR 1 POR 100 A B C D E F 175 222 202 362 280 540 0,098 0,125 0,113 0,203 0,158 0,303 9,8 12,5 11,3 20,3 15,8 30,3 Total 1.781 1,000 100,0 FONTE: dados fictícios. Cálculos: A = 175 x 1 / 1781 = 0,098 ou A = 175 x 100 / 1.781 = 9,8 ... 3.3.2 - Índices: Os índices são razões entre duas grandezas. São exemplos de índices: - Índice cefálico = diâmetro transverso do crânio / diâmetro longitudinal do crânio x 100. - Quociente intelectual (QI) = idade mental / idade cronológica x 100. - Densidade demográfica = população / superfície -Índices econômicos: - Produção per capita = valor total da produção / população - Consumo per capita = consumo do bem / população - Renda per capita = renda / população - Receita per capita = recita / população. 3.3.3 - Os Coeficientes: São razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrências). São exemplos de coeficientes: - Coeficiente de natalidade = número de nascimentos / população total. - Coeficiente de mortalidade = número de óbitos / população total. - Coeficientes educacionais: - Coeficiente de evasão escolar = n° de alunos evadidos / n° inicial de matrículas. - Coeficiente de aproveitamento escolar = n° de alunos aprovados / n° final de matrículas. - Coeficiente de recuperação escolar = n° de alunos recuperados / n° de alunos em recuperação. 3.3.4 - As taxas: São os coeficientes multiplicados por uma potência de 10 (10, 100, 1000) para tornar o resultado mais inteligível. São exemplos de taxas: - Taxa de mortalidade = coeficiente de mortalidade x 1.000 - Taxa de natalidade = coeficiente de natalidade x 1.000. - Taxa de evasão escolar = coeficiente de evasão escolar x 100. Exercício: O Estado A apresentou 733.986 matrículas na 1° série, no início do ano de 1989, e 683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e 412.457 matrículas. Qual o Estado que apresentou maior evasão escolar? A - (TEE) = 733.986 – 683.816 / 733.986 x 100 = 0,0683 x 100 = 6,83 ou 6,8% B - (TEE) = 436.127 – 412.457 / 436.127 x 100 = 0,0542 x 100 = 5,42 ou 5,4%. O Estado que apresentou maior Taxa de Evasão Escolar foi o A. EXERCÍCIOS: 1) Considere a série Estatística: SÉRIES ALUNOS % 1ª 2ª 3ª 4ª 546 328 280 120 Total 1.274 Complete-a, determinando as porcentagens com uma casa decimal, arredondando se necessário. 2) Uma escola apresentava, no final do ano, o seguinte quadro: SÉRIES MATRÍCULAS MARÇO NOVEMBRO 1ª 2ª 3ª 4ª 480 458 436 420 475 456 430 420 Total 1.794 1.781 a) Calcule a taxa de evasão, por série. b) Calcule a taxa de evasão da escola. 3) São Paulo tinha, em 1989, uma população projetada de 32.361.700 habitantes. Sabendo que sua área terrestre é de 248.256 km2, calcule a sua densidade demográfica. 4) Considerando que Minas Gerais, em 1988, apresentou população projetada de 15.345.800 hab; superfície de 586.624 km2; nascimentos 337.859 e casamentos 110.473, calcule: a) o índice de densidade demográfica; b) a taxa de natalidade; c) a taxa de nupcialidade. 4 - GRÁFICOS ESTATÍSTICOS 4.1 – GRAFICO ESTATÍSTICO: É uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil: a) Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade: o gráfico deve expressar a verdade sobre o fenômeno em estudo. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. 4.2 – DIAGRAMAS: Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais diagramas, destacamos: 4.2.1 - Gráfico em linha: Esse tipo de gráfico utiliza-se da linha poligonal para representar a série estatística. O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y). Para tornar bem clara a explanação, consideremos a seguinte série: Tabela 11 PRODUÇÃO DE VEÍCULOS DE AUTOPROPULSÃO BRASIL – 1984 a 1989 ANOS QUANTIDADE (1.000 unidades) 1984 1985 1986 1987 1988 1989 865 967 1.056 920 1.069 513 FONTE: ANFAVEA. Vamos tomar os anos como abscissas e as quantidades como ordenadas. Assim, um ano dado (x) e a respectiva quantidade (y) formam um par ordenado (x, y), que pode ser representado num sistema cartesiano. Determinados, graficamente, todos os pontos da série, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que irá nos dar uma poligonal, que é o gráfico em linha correspondente à série em estudo. 0 200 400 600 800 1000 1200 123456 84 85 86 87 88 89 Seqüência1 4.2.2 - Gráfico em colunas ou em barras: É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplos: a) Gráfico em colunas: Tabela 12 CONSTRUÇÃO DE AERONAVES BRASIL – 1984 a 1989 ANOS QUANTIDADE (1.000 unidades) 1984 1985 1986 1987 1988 1989 184 171 167 203 199 197 FONTE: EMBRAER. CONSTRUÇÃO DE AERONAVES BRASIL – 1984 a 1989 0 100 200 300 84 85 86 87 88 89 FONTE: EMBRAER b) Gráfico em Barras: Tabela 13 PRODUÇÃO DE ALHO BRASIL – 1988 ESTADOS QUANTIDADE(t) Santa Catarina Minas Gerais Rio Gde do Sul Goiás São Paulo 13.973 13.389 6.892 6.130 4.179 FONTE: IBGE PRODUÇÃO DE ALHO BRASIL - 1988 05.00010.00015.000 Santa Catarina Minas Gerais Rio Grande do Sul Goiás São Paulo FONTE: IBGE Notas: · Sempre que os dizeres a serem inscritos são extensos, devemos dar preferência ao gráfico de barras (séries geográficas e específicas). Porém, se ainda assim preferirmos o gráfico em colunas, os dizeres deverão ser dispostos de baixo para cima, nunca ao contrário. · A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. · A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade nem maior que os dois terços da largura (ou da altura) dos retângulos. 4.2.3 - Gráfico em colunas ou barras múltiplas: Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.(Tabela de dupla entrada). Exemplo: Tabela 14 BALANÇA COMERCIAL BRASIL – 1984 - 88 ESPECIFICAÇÃO VALOR (US$ 1.000.000) 1984 1985 1986 1987 1988 Exportação Importação 27.005 13.916 25.639 13.153 22.348 14.044 26.224 15.052 33.789 14.605 FONTE: Ministério da Economia BALANÇA COMERCIAL BRASIL - 1984 - 1988 0 5.000 10.000 15.000 20.000 25.000 30.000 35.000 40.000 19841985198619871988 (US$ 1.000.000) Exportação Importação FONTE: Ministério da Economia 4.2.4 - Gráfico em setores: (Pizza) Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360°. Exemplo:Dada a série: Tabela 15 REBANHOS BRASILEIROS 1988 ESPÉCIE QUANTIDADE (milhões de cabeças) Bovinos Suínos Ovinos Caprinos 140 32 20 11 Total 203 FONTE: IBGE Temos: 203 : 360° :: 140 : X1 => X1 = 140 x 360 / 203 => X1 = 248,2 ou 248° X2 = 56,7 ou 57° X3 = 35,4 ou 35° X4 = 19,5 ou 20° REBANHOS BRASILEIROS 1988 Bovinos Suínos Ovinos Caprinos FONTE: IBGE Notas: · O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. · Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando o valor percentual por 3,6. 4.2.5 -. Gráfico Polar: É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia, a arrecadação da Zona Azul durante a semana, o consumo de energia elétrica durante o mês ou o ano, o número de passageiros de uma linha de ônibus ao longo da semana etc. O gráfico polar faz uso do sistema de coordenadas polares. Exemplo: Dada a série: Tabela 16 PRECIPITAÇÃO PLUVIOMÉTRICA MUNICÍPIO DE PORTO ALEGRE – 1995 MESES PRECIPITAÇÃO (mm) Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 174,8 36,9 83,9 462,7 418,1 418,4 538,7 323,8 39,7 66,1 83,3 201,2 FONTE: IBGE · Traçamos uma circunferência de raio arbitrário (damos preferência ao raio de comprimento proporcional à média dos valores da série. Neste caso, Ma = 124,5); · Construímos uma semi-reta partindo de 0 (pólo) e com uma escala (eixo polar); · Dividimos a circunferência em tantos arcos quantas forem as unidades temporais; · Traçamos, a partir do centro 0 (pólo), semi-retas passando pelos pontos da divisão; · Marcamos os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo polar); · Ligamos os pontos encontrados com segmentos de reta; · Se pretendemos fechar a poligonal obtida, empregamos uma linha interrompida. Assim, para nosso exemplo, temos: PRECIPITAÇÃO PLUVIOMÉTRICA DO MUNICÍPIO DE PORTO ALEGRE - 1995 0 200 400 600 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro FONTE: IBGE 4.2.6 - Cartograma: O Cartograma é a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a) Representar dados absolutos (população) – neste caso lançamos mão, em geral, dos pontos, em número proporcional aos dados. b) Representar dados relativos (densidade) – neste caso lançamos mão, em geral de hachuras. Exemplo: Tabela 17 POPULAÇÃO PROJETADA DA REGIÃO SUL DO BRASIL 1990 ESTADO POPULAÇÃO (hab) ÁREA(Km2) DENSIDADE Paraná Santa Catarina Rio Grande do Sul 9.137.700 4.461.400 9.163.200 199.324 95.318 280.674 45,8 46,8 32,6 FONTE: IBGE 4.2.7 - Pictograma: O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Exemplo: Tabela 18 POPULAÇÃO DO BRASIL 1950 - 1980 ANOS HABITANTES (milhares) 1950 1960 1970 1980 51.944 70.191 93.139 119.071 FONTE: IBGE POPULAÇÃO DO BRASIL 1950 – 1980 1950 1960 1970 1980 Cada símbolo representa 10.000.000 de habitantes FONTE: IBGE Na verdade, o gráfico referente à tabela acima é essencialmente um gráfico em barras; porém, as figuras o tornam mais atrativo, o que, provavelmente, despertará a atenção do leitor para o seu exame. Na confecção de gráficos pictóricos temos que utilizar muita criatividade, procurando obter uma otimização na união da arte com a técnica. Exercícios: 1) Represente a série abaixo usando o gráfico em linha: COMERCIO EXTERIOR BRASIL – 1979-88 ANOS QUANTIDADE (1.000 t) EXPORTAÇÃO IMPORTAÇÃO 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 98.010 109.100 123.994 119.990 178.790 141.737 146.351 133.832 142.382 169.396 75.328 71.855 64.066 60.718 55.056 53.988 48.870 60.605 61.975 58.085 FONTE: Banco do Brasil 2) Representa a tabela usando o gráfico em colunas: ENTREGA DE GASOLINA PARA CONSUMO BRASIL – 1985 a 1988 ANOS QUANTIDADE (1.000 m3) 1985 1986 1987 1988 9.793 11.095 9.727 9.347 FONTE: IBGE 3) Usando o gráfico em barras, represente a tabela: CONSUMO DE BORRACHA NA INDÚSTRIA BRASIL – 1988 ESPECIFICAÇÃO QUANTIDADE (t) Pneumáticos Câmaras de ar Correias Material de conserto Outros 238.775 14.086 4.472 19.134 4.647 FONTE: ANFAVEA. 4) Represente a tabela por meio de gráfico de setores: AREA TERRESTRE - BRASIL REGIÕES RELATIVA (%) Norte Nordeste Sudeste Sul Centro-Oeste 45,25 18,28 10,85 6,76 18,86 FONTE: IBGE 5) Represente a tabela abaixo por meio de um gráfico polar: PREÇO DO DÓLAR NO MERCADO PARALELO - NOVEMBRO - 1990 DIAS CRUZEIROS 05 06 07 08 09 108 125 120 105 110 FONTE: ANFAVEA. 5 - DISTRIBUIÇÃO DE FREQÜÊNCIA 5.1 – TABELA PRIMITIVA OU ROL: Vamos considerar a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas, como nos casos de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salários recebidos pelos operários de uma fábrica etc. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores: TABELA 1 (Primitiva) ESTATURAS DE 40 ALUNOS DO COLEGIO A 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Partindo dos dados acima – tabela primitiva – é difícil averiguar em torno de que valor tendem a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura. Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir dos dados não-ordenados. A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol. TABELA 2 (Rol) ESTATURAS DE 40 ALUNOS DO COLEGIO A 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. 5.2 – DISTRIBUIÇÃO DE FREQUÊNCIA: No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Denominamos freqüência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência: TABELA 3 ALUNOS DO COLÉGIO A ESTAT (cm) FREQÜÊNCIA 150 151 152 153 154 155 156 157 1 1 1 1 1 4 3 1 ALUNOS DO COLÉGIO A ESTAT (cm) FREQÜÊNCIA 158 160 161 162 163 164 165 166 2 5 4 2 2 3 1 1 ALUNOS DO COLÉGIO A ESTAT (cm) FREQÜÊNCIA167 168 169 170 172 173 1 2 1 1 1 1 Total 40 Mas o processo dado é ainda inconveniente, já que exige muito espaço mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Assim, se um dos intervalos for, por exemplo, 154 ├ 158, em vez de dizermos que a estatura de 1 aluno é de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e 1 aluno, 157 cm, diremos que nove alunos têm estaturas entre 154, inclusive, e 158 cm. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar os intervalos de classes. NOTA: Nas distribuições de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à classe a que pertence determinado valor da variável; A fim de atender à exigência do item anterior, usar-se-ão as seguintes convenções, usuais em Matemática e na Estatística: 0 ┤10 – corresponde a valores de variável maiores do que zero (excluído este) e até dez, inclusive. 0├ 10 – corresponde a valores da variável, a partir de zero, inclusive, e até dez, exclusive. 0 – 10 – corresponde aos valores da variável maiores do que zero (exclusive este) e até dez (exclusive este). 0 ├┤10 – corresponde os valores da variável, a partir de zero (inclusive) e até dez (inclusive). Chamamos de freqüência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela anterior podem ser dispostos como na tabela abaixo, denominada distribuição de freqüência com intervalos de classe: TABELA 4 ESTATURA DE 40 ALUNOS DO COLÉGIO A ESTATURAS (cm) FREQÜÊNCIAS 150 ├ 154 154 ├ 158 158 ├ 162 162 ├ 166 166 ├ 170 170 ├ 174 4 9 11 8 5 3 Total 40 FONTE: Dados Fictícios Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Assim, na tabela 3 podemos verificar, facilmente que quatro alunos tem 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. Já na tabela 4 não podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que onze alunos têm estatura compreendida entre 158 e 162 cm. O que se pretende com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. 5.3 – ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUENCIA: 5.3.1 - Classe Classes de freqüência ou simplesmente classes são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3,...k (onde k é o número total de classes da distribuição). Assim, em nosso exemplo, o intervalo 154 ├ 158 define a segunda classe (i = 2). Como a distribuição e formada de seis classes, podemos afirmar que k = 6. 5.3.2 - Limites de classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior número, o limite superior da classe (Li). Na segunda classe, por exemplo, temos: l2 = 154 e L2 = 158. Nota: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo ├ (inclusão de li e exclusão de Li). Assim, o indivíduo com uma estatura de 158 cm está incluído na terceira classe (i = 3) e não na segunda. 5.3.3 - Amplitude de um intervalo de classe: (hi) Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe.
Compartilhar