Baixe o app para aproveitar ainda mais
Prévia do material em texto
Capítulo 1 Teoria da Amostragem 1.1 O método científico e a estatística. O método científico é a ordem ou conjunto de processos que devem ser estabelecidos para, através da investigação, atingir determinado objetivo, ou seja, visa estruturar e organizar as fases ou etapas que devem ser estabelecidas na abordagem de uma observação estatística. Este é dividido em método experimental e estatístico. O método experimental é utilizado no estudo dos fenômenos através da experiência. Este método geralmente impõe em cada experiência a exigência de se conservar constante todas às causas dominantes, deixando apenas uma variável, estudando então o seu efeito. O método estatístico consiste da impossibilidade de manter as causas constantes, variando todas essas causas, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. As fases do método estatístico: 1. Definição e identificação do problema; 2. Planejamento do estudo a desenvolver; 3. Coleta de informação (dados) de acordo com o objetivo; 4. Classificação e organização dos dados em suporte informático; 5. Análise dos dados e apresentação dos resultados; 6. Interpretação dos resultados, e de acordo com o problema, elaborar a decisão mais adequada. 1.2 Objetivo da estatística A estatística é a parte da matemática aplicada que possui o objetivo de obter conclusões a partir de dados observados e desempenha papel importante em quase todas as fases da pesquisa humana. Desta maneira podem-se entender grandes volumes de informação e realizar previsões confiáveis. De maneira resumida, pode-se dizer que a Estatística é essencial no avanço dos conhecimentos, para: a) Aumentar nossa confiança nos dados obtidos; b) Entender os princípios básicos de probabilidade; c) Dar suporte às conclusões de trabalhos científicos; d) Estimar o grau de certeza das conclusões tiradas, separando o sinal do ruído; e) Definir critérios para diversos tipos de julgamentos. 1.3 Conceitos fundamentais Para um maior entendimento alguns conceitos devem ser destacados como: Fenômeno estatístico é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. Ex: Estimar a inflação de um determinado país. Dado estatístico é um dado numérico considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. Ex: o valor da inflação. Parâmetros são valores que caracterizam uma população. Para definirmos um parâmetro devemos examinar toda a população. Ex: Meta da inflação em 6.5%. Estimativa é um valor aproximado do parâmetro e é calculado com o uso da amostra. Ex: Prever a inflação durante em um determinado tempo. Um atributo é quando os dados estatísticos apresentam um caráter qualitativo. Ex: ótimo, péssimo, homem, mulher, etc. A População é o maior conjunto tomado como referência na observação de um fenômeno, podendo ser finita ou infinita, concreta ou abstrata. Ex: Discentes da UFOPA. A Amostra é um Subconjunto da população, seu uso gera economia e rapidez dos resultados e deve ser representativa da população. Ex: Discente do PCEDR. 1.4 Variáveis Do ponto de vista estatístico, os indivíduos, as unidades, os itens observados sempre variam, pois se assim não fosse, bastaria o estudo de um único elemento para termos a composição de uma População. E como as unidades variam de um indivíduo para o outro, a Estatística as denomina de variáveis. Essas constituem um conjunto de resultados possíveis de um fenômeno. A cada fenômeno corresponde um número de resultados possíveis. De acordo com o tipo de medição utilizada, as variáveis classificam-se em: 1.4.1 Variáveis Qualitativas a) NOMINAIS ou CATEGÓRICAS: Elas recebem uma designação que exprime uma qualidade, ou seja, uma denominação alfabética, permitindo a distinção entre elas. Exemplo: sexo dos empregados de uma empresa, podendo ser Masculino ou Feminino. A variável Estado civil pode apresentar as seguintes categorias: solteiro, casado, divorciado, viúvo ou, então, solteiro e não solteiros. b) ORDINAIS: São variáveis qualitativas, como as anteriores, mas recebem designação alfabética que representa uma ordem, uma sequência, um posto, uma grau, crescente ou decrescente, permitindo distingui-las na População investigada. Ex: Grau de satisfação em um atentimento, podendo ser ótimo, bom, regular, ruim e péssimo, nota-se que existi uma ordem decrescente de satisfação. 1.4.2 Variáveis Quantitativas a) DISCRETAS: São variáveis que expressam contagem, como por exemplo, números de pessoas por domicilio: 3, 5, 8 ou mais pessoas, ocorrendo somente valores inteiros. OBS: suponha os preços de três sapatos: R$ 56,50, R$ 59,00, R$ 60,35; não temos valores intermediários entre duas quantias quaisquer fixadas pelo vendedor. b) CONTÍNUAS: A expressão numeral destas variáveis pode assumir valores teoricamente ilimitados, sem solução de continuidade entre dois valores quaisquer. Ex: Renda 1.5 Teoria Estatística A Teoria Estatística se divide em dois grandes campos: A Estatística Descritiva e a Estatística Indutiva ou Inferencial. A estatística indutiva ou inferencial consiste em inferir propriedades de um universo sobre a base de uma amostra com resultados conhecidos, isto é, se uma amostra é representativa de uma população, conclusões importantes sobre essa podem ser inferidas em sua análise. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa, o conhecimento de seus problemas, a formação de soluções apropriadas e um planejamento objetivo de ação. A estatística descritiva consiste num conjunto de métodos que ensinam a reduzir uma quantidade de dados bastante numerosa por um número pequeno de medidas, substitutas e representantes daquela massa de dados. Então, é responsável pela coleta, a organização e a descrição dos dados. A coleta de dados pode ser direta e indireta. É direta quando feita sobre elementos informativos de registros obrigatórios, elementos pertinentes aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) contínua – é feita continuamente, tal como a de nascimentos, casamentos e óbitos; b) periódica – quando feita em intervalos constantes de tempo; c) ocasional – quando feita de tal modo que não se considera o tempo em continuidade e nem periódico, a saber, independente do tempo e é feita quando a requer o estudo de um fenômeno. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. 1.6 Amostra A maioria dos estudos estatísticos tem por base os levantamentos e experimentos efetuados com apenas um segmento do Universo, a Amostra. 1.6.1 Representação O tamanho de uma População é representado graficamente pela letra latina N. As Amostras, por sua vez, pela mesma letra, mas minúscula n. Como podemos tirar várias amostras da mesma População, colocamos um subíndice em cada uma, como por exemplo, n1, n2, n3 ... nn. 1.6.2 Vantagens Existem muitas vantagens dos estudos amostrais, entre elas podemos citar: 1. No caso de Populações consideradas infinitas, como por exemplo, as produções de um determinado produto em uma fábrica, pois não se sabe quantos produtos serão fabricados e quanto tempo à empresa funcionará. Nesse caso, a solução é retirar amostrar e generalizar seusresultados para a População. 2. Em alguns casos quando se estuda certos Universos, o interesse investigatório pode destruir as unidade, os indivíduos componentes da População. Ex: um fabricante de lâmpadas precisa testar o tempo médio de seus produtos, para melhor concorrer com outras marcas existentes no mercado. O produtor não pode testar toda sua produção, pois ao final dos experimentos todas as lâmpadas estariam queimadas. 3. Quando as Populações são numerosas, o trabalho consumido, os custos operacionais e a qualificação da mão de obra específica para efetuação de um Censo, tornam-se tão elevados. É por essas razões que o Censo demográfico das Populações de cada país só é efetuado a cada 10 anos. Para obter amostras representativas de uma População é fundamental evitar a interferência do pesquisador nessa fase do procedimento, o essencial é que o investigador não deve escolher a seu arbítrio, a seu gosto, os elementos que constituirão a amostra. 1.7 Técnicas de Amostragem A amostragem é uma técnica para escolher amostras que garanta o acaso na escolha, ou seja, qualquer elemento da população tem a mesma probabilidade de ser escolhido. Se extrairmos um objeto de uma urna, temos a escolha de repor ou não o objeto dentro da urna antes da seguinte extração. No primeiro caso, um objeto em particular pode aparecer várias vezes, enquanto no segundo ele pode aparecer no máximo uma vez. A amostragem onde cada membro da população pode ser escolhido mais de uma vez é chamada de amostragem com reposição, enquanto a amostragem onde cada membro não pode ser escolhido mais de uma vez é chamada de amostragem sem reposição. Uma população finita que é amostrada com reposição pode teoricamente ser considerada infinita desde que amostras de qualquer tamanho podem ser extraídas sem esgotar a população. Para propósitos mais práticos, a amostragem de uma população finita muito grande pode ser considerada como amostragem de uma população infinita. 1.7.1 Amostragem aleatória Simples Na amostragem aleatória cada elemento da população tem a mesma probabilidade de ser incluído na amostra, sem interferência do pesquisador, de modo casual/randômico. Exemplo: Digamos que temos uma amostra de 100 indivíduos, o procedimento é enumerar cada indivíduo de 1 a 100, e sortear cada uma por meio de uma urna contendo os números. Assim, cada indivíduo te uma chance a cada cem para ser sorteado, ou seja, uma probabilidade de 1/100 = 0,01 ou 1% de ser escolhido. 1.7.2 Amostragem sistemática Na amostragem sistemática a primeira unidade é escolhida ao acaso e as demais, a partir da inicial, selecionadas de modo sistemático a intervalos iguais e definidos, até se atingir o tamanho da amostra desejado. O intervalo é estabelecido pela razão entre o tamanho da População e o tamanho da amostra: int N ervalo k n (1.1) Exemplo: População: N = 20 Amostra n = 4 Intervalo: k = 20/4 = 5 Primeiro número escolhido ao acaso entre 1 e 4: n1 = 3 Números subsequentes: 8 (3+5), 13 (8+5). 18 (13+5) Amostra sistemática obtida: n1 = 3, n2 = 8, n3 = 13, n4 = 18 A amostra sistemática apresenta as seguintes vantagens: a) Facilidade de sua obtenção. b) Representatividade amostral melhor expressada. 1.7.3 Amostragem estratificada Na amostragem estratificada a população é dividida em estratos e a amostragem é proporcional a eles. Os estratos constituem-se de indivíduos homogêneos entre si e heterogêneos entre eles. Exemplo: Suponhamos que possuímos uma população de 100 empregados de uma empresa, o objetivo do estudo é inferir sobre a diferença de salários dos trabalhadores levando em consideração a sua raça. Para isso, é necessário dividir a população entre empregados da raça branca, parda e negra. É constatado que existem 42 empregados da raça branca (Nb = 42), 33 da raça parda (Np = 33) e 25 da raça negra (Nn = 25), portanto temos a construção de três estratos. Como a obtenção das amostras deve ser proporcional ao tamanho dos estratos, fazemos para a raça branca o seguinte calculo: 42 42 0,42 42 17,64 18 100 b b b N n N N (1.2) Para raça parda: 33 33 0,33 33 10,89 11 100 p p p N n N N (1.3) Para raça negra: 25 25 0,25 25 6,25 6 100 n n n N n N N (1.4) Neste caso, o tamanho da amostra selecionada seria: 18 11 6 35b p nn n n n (1.5) E se o interesse da pesquisa fosse fixar uma amostra de 30% da população. Para empregados da raça branca: 30 (%) 42 0,30 42 12,60 13 100 b bn Amostra N (1.6) Para empregados da raça parda: 30 (%) 33 0,30 33 9.9 10 100 p pn Amostra N (1.7) Para empregados da raça negra: 30 (%) 25 0,30 25 7,50 7 100 n nn Amostra N (1.8) Neste caso, o tamanho da amostra selecionada seria: 13 10 7 30b p nn n n n (1.9) Pode-se proceder a seleção da amostra de cada extrato por meio da amostragem aleatória simples. 1.7.4 Amostragem por conglomerados ou cluster São amostras obtidas de Unidades coletivas, como bairros, distritos residenciais, quarteirões, etc. EXERCÍCIOS 1. Classificar as variáveis em qualitativas ou quantitativas (continuas e discretas): a) População: os alunos de uma escola Variável: Cor dos cabelos b) População: Casais residentes em uma cidade Variável: Número de filhos c) População: As jogadas de um dado Variável: O ponto obtido em cada jogada d) População: Peças produzidas por certas máquinas Variável: Número de peças produzidas por hora e) População: Peças produzidas por certa máquina Variável: Diâmetro externo 2. A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários esta registrada a seguir: 62 52 73 80 65 50 70 75 80 65 70 77 82 91 75 52 68 86 70 80 Com base nos dados obtidos, responda: a) Qual a população dessa pesquisa? b) Qual é a sua amostra? c) Qual é a variável nessa pesquisa? Ela é discreta ou contínua? 3. Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1=40, n2 = 100 e n3= 60. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3º estrato, determine o número total de elementos da amostra. 4. Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence? 290, 725, 1648, 2025 ou 1120 5. Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª, 28 na 4ª série, 35 na 5ª série, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos e preencha o quadro. Séries População Cálculo proporcional Amostra 1ª 2ª 3ª 4ª 5ª6ª 7ª 8ª Total 250 - 40 6. Indique como seria possível retirar uma amostra sistemática de 35 elementos a partir de uma população ordenada formada por 2590 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1546 a ela pertence? 2323º, 636º, 1841º, 1028º e 242º Capítulo 2 Estatística Descritiva: Representações Tabular e Gráfica 1 Introdução Após a coleta dos dados deve-se organizá-los de tal forma que facilite o entendimento do leitor. Dois procedimentos que se complementam são utilizados pela estatística para a representação dos dados em Tabelas e Gráficos. 2 Tipos de dados 2.1 Dados brutos Quando se efetua a coleta dos dados obtemos um grupo de valores que se denomina de Dados brutos, como se observa, a seguir, de uma amostra de tamanho n = 24: 94 83 32 1 70 66 40 45 53 32 76 89 73 23 39 12 95 46 16 80 67 39 2 54 2.2 Rol O Rol constitui uma relação dos valores dispostos em uma forma ordenada, crescente ou decrescente. Se dispusermos os dados anteriores em uma relação ordenada crescente, teremos: 1 23 39 53 70 83 2 32 40 54 73 89 12 32 45 66 76 94 16 39 46 67 80 95 O Rol já permite observar os valores extremos, 1 e 95, respectivamente. A organização dos dados estatísticos segue certas etapas. 1. A amostra é coletada e é verificada a característica de interesse. 2. São medidos e classificados os dados estatísticos em bruto. 3. É realizada a ordenação crescente dos dados. 4. É construída a tabela de frequências. 5. São construídos os gráficos de interesse. 2.3 Representação tabular A representação tabular consiste na apresentação numérica dos dados dispondo os valores coletados em tabelas constituídas de colunas e linhas, permitindo uma visão geral e imediata, sobretudo de dados muito numerosos. A representação tabular pode se dispor em varias maneiras tais como: séries estatísticas e em distribuições de frequências e de pontos. 2.3.1 Séries estatísticas São constituídas de uma sucessão de dados estatísticos representativas de caracteres qualitativos ou quantitativos, levando-se em consideração, para diferenciá- las, os seguintes elementos: a) Época ou tempo em que o assunto foi investigado. b) Local ou espaço da ocorrência. c) Tema ou espécie objetivo do estudo. 2.3.1.1 Série Temporal Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Exemplo: Tabela 1. Números de desempregados em Belém, 1980/1984. Ano Desempregados 1980 320222 1981 375243 1982 420529 1983 411768 1984 429253 Houve variação no tempo (1980 a 1984), mas o tema estudado (desempregados) e o local do levantamento (Belém) foram os mesmos. 2.3.1.2 Série Geográfica Apresenta como elemento variável o fator geográfico. A época e o Tema (espécie) são elementos fixos. Exemplo: Tabela 2. Números de desempregados em cinco Estados brasileiros, 1990. Estados Desempregados Amazonas 320222 Pará 375243 Maranhão 420529 Rondônia 411768 Amapá 429253 Variou o Local (Estados), permanecendo fixos o Tempo (1990) e o Tema (desempregados). 2.3.1.3 Série Específica ou Categórica O caráter variável é apenas o fato ou espécie. Exemplo: Tabela 3. Grau de escolaridade dos professores da rede pública de ensino do Brasil, 2000. Escolaridade Número de Professores Graduação 348102 Especialização 1753 Mestrado 209 Doutorado 78 Pós-Doutorado 13 Houve variação da categoria (Escolaridade), mantendo-se fixos o Local (Brasil) e o tempo (2000). 2.4 Distribuições de Frequências São tipos de séries estatísticas onde o tempo, o local e o fenômeno são fixos, mas o fenômeno estudado apresenta graduações, ou seja, varia em magnitude ou grau, sendo disposto em linhas e colunas, o que permite avaliar os respectivos valores. Para as distribuições de frequências há necessidade de informações para melhor entendimento dessa parte da Estatística Descritiva. 2.4.1 Tabelas de Frequências de dados não agrupados em classes Essas tabelas são utilizadas para representar variáveis discretas ou descontínuas. Exemplo: Tabela 4. Dentes cariados, Escola B, Belém, 2000. Dentes Cariados (Xi) Número de Estudantes (fi) 2 58 3 106 4 95 5 74 TOTAL = 333 Alunos Na primeira coluna, encabeçada por Xi, são anotados os valores da variável Dentes cariados, e a segunda coluna, denominada fi, é utilizada para contar os valores repetidos da variável, ou seja, as respectivas frequências, permitindo visualizar que o menor numero de dentes cariados foi 2, e o maior numero de repetições correspondeu a 3 cáries ocorridas em 106 alunos. 2.4.2 Tabelas de Frequências de dados agrupados em classes Se a variável for contínua, é aconselhável agrupar os valores obtidos em classes. Quando, entretanto, a variável for discreta, mas o numero de valores for muito grande, recomenda-se também agrupá-los em classes. Exemplo: Tabela 5. Estatura de alunos, Escola C, Escola B, Belém, 2000. Estatura (cm) Números de alunos (fi) 140 ˫150 5 150 ˫160 10 160 ˫170 30 170 ˫180 40 180 ˫190 10 190 ˫200 5 TOTAL = 100 Alunos Os intervalos de classe são simbolizados como segue: I. 20 ˫ 30: a classe compreende os valores 20 até 29,99, exceto o valor 30. II. 20 30: a classe compreende os valores 20,01 até 30,00, exceto o valor 20. III. 20 |-| 30: a classe compreende os valores 20 até 30. IV. 20 - 30: a classe compreende os valores 20,01 até 29,99, exceto os valores 20 e 30. 2.4.2.1 Amplitude Total (At) A Amplitude Total representa a diferença entre o maior e o menor dos valores observados da variável estudados. (2.1) máx mínAt X X (2.1) 2.4.2.2 Classe de Frequência É cada u dos grupos de valores em que se subdivide a Amplitude Total do conjunto de valores estudados da variável em questão. Cada classe é representada pela letra k. O número de classes pode ser calculado das seguintes maneiras: Fórmula de Sturges. 101 3,332 log ( )k N (2.2) Menor inteiro k tal que 2 k > N (2.3) Regra empírica Com N ≤ 25 o valor de k = 5. Com N > 25 o valor de k N . 2.4.2.3 Limites dos Intervalos de Classe São os valores extremos de cada classe, ou seja, o limite inferior e o superior de cada uma. São obtidos da seguinte maneira: At ICl k (2.4) 2.4.2.4 Amplitude dos Intervalos de Classe Representa a diferença entre o maior e o menor valor de cada classe. 2.4.2.5 Tipos de Frequência Uma Tabela de Frequência pode apresentar os seguintes tipos: i. Frequência simples absoluta (fsa): é o número de observações de cada classe, sendo que a soma das frequências é chamada de FrequênciaTotal e corresponde ao número total de observações; ii. Frequência simples relativa (fsr): são obtidas dividindo-se cada frequência simples pelo total e multiplicadas por 100 para representar a percentagem de cada classe. iii. Frequência acumulada absoluta (faa): é resultante da soma da frequência simples absoluta da primeira classe com a segunda, da segunda com a terceira, e assim sucessivamente. iv. Frequência acumulada relativa (far): são obtidas dividindo-se cada frequência acumulada pelo total e multiplicadas por 100 para representar a percentagem de cada classe. A construção da Tabela de Frequências é mostrada abaixo com os respectivos cálculos. Valores distintos ou em intervalos de classe fsa fsr faa far a1 fsa1 1 100sr f N fsa1 1 100sr f N a2 fsa2 2 100sr f N fsa1 + fsa2 = Fa1 1 2 1100 sr sr ar f f F N a3 fsa3 3 100sr f N Fa1 + fsa3 = Fa2 3 1 2100 sr ar ar f F F N ... ... ... N 100% Total N 100% 2.4.4 Roteiro para tabelas de frequências O roteiro deve conter as seguintes etapas 1. Lista dos dados brutos; 2. Transformação em Rol; 3. Determinação da Amplitude Total; 4. Escolha do número de Classes; 5. Determinação da amplitude do Intervalo de Classe; 6. Limite inferior da primeira classe; 7. Limite superior da última classe 8. Traçar a tabela inserindo, na primeira coluna, as classes e nas demais as frequências: simples absoluta, simples relativa, simples acumulada e acumulada relativa. Exemplo: Suponhamos que uma empresa deseja avaliar a distribuição dos salários pagos por hora a seus 30 funcionários. Os dados coletados são: 13,30 15,20 12,40 15,79 9,60 10,40 13,20 8,80 8,30 8,50 11,50 12,60 10,70 12,60 9,70 12,10 13,50 10,30 14,30 9,80 10,40 11,60 12,40 12,90 11,60 10,30 14,20 13,80 10,20 12,30 Seguindo o primeiro passo do roteiro notamos que os dados apresentados são os dados brutos. O segundo passo é colocar os dados em Rol crescente. 8,30 9,60 10,20 10,40 11,50 12,10 12,40 12,90 13,50 14,30 8,50 9,70 10,30 10,40 11,60 12,30 12,60 13,20 13,80 15,20 8,80 9,80 10,30 10,70 11,60 12,40 12,60 13,30 14,20 15,79 O terceiro passo é calcular a Amplitude Total utilizando a equação (2.1) 15,79 8,30 7,5At O quarto passo é calcular o número de classes utilizando a regra empírica. 30 5,46 5k O quinto passo é calcular o intervalo da classe utilizando a equação (2.4). 7,5 1,5 5 ICl O sexto e o sétimo passo referem-se a construir os intervalos das 5 classes. A primeira classe (k = 1) é calculada com o valor mínimo representando o limite inferior da classe e o limite superior acrescido de ICl = 1,5. Logo temos: Para k = 1. 8,3 + 1,5 = 9,8 onde o limite inferior = 8,3 e o limite superior = 9,8. Para k = 2. 9,8 + 1,5 = 11,3 onde o limite inferior = 9,8 e o limite superior = 11,3. Para k = 3. 11,3 + 1,5 = 12,8 onde o limite inferior = 11,3 e o limite superior = 12,8. Para k = 4. 12,8 + 1,5 = 14,3 onde o limite inferior = 12,8 e o limite superior = 14,3. Para k = 5. 14,3 + 1,5 = 15,8 onde o limite inferior = 14,3 e o limite superior = 15,8. Desta forma temos na primeira coluna os valores da variável divididos em cinco classes, admitindo o intervalo fechado à esquerda, e na segunda coluna suas respectivas frequências de cada classe. Classes fsa 8,3 ˫ 9,8 5 9,8 ˫ 11,3 7 11,3 ˫ 12,8 9 12,8 ˫ 14,3 6 14,3 ˫ 15,81 3 Total 30 Para o oitavo passo é necessário o cálculo das fsr, faa e far, assim como indicado na sua tabela. Classes fsa fsr faa far 8,3 ˫ 9,8 5 5 100 17%30 5 5 100 17% 30 9,8 ˫ 11,3 7 7 100 23%30 5 + 7 = 12 5 7 100 40% 30 11,3 ˫ 12,8 9 9 100 30%30 12 + 9 = 21 9 40% 100 70% 30 12,8 ˫ 14,3 6 6 100 20%30 21 + 6 = 27 6 70% 100 90% 30 14,3 ˫ 15,8 3 3 100 10%30 30 3 90% 100 100% 30 Total 30 100% Podemos descrever que: 1. Na frequência acumulada o valor 21 indica que, nessa empresa, 21 funcionários recebem salários/horas abaixo de 12,8 unidades. 2. Podemos constatar, também, certa predominância de salários mais baixos, realmente cerca de 70% da distribuição dos salários concentra-se até o salário de 12,8 unidades. 3. Os maiores salários servem apenas 10% dos funcionários da empresa. 4. 40% dos funcionários (12 funcionários) recebem até 11,3 unidades, sendo 23% (ou seja, 7 funcionários) recebendo entre 9,8 e 11,3 unidades. 2.5 Representação Gráfica A representação Gráfica tem como finalidade uma comunicação rápida, clara e efetiva dos dados, objetos do estudo, às vezes difíceis de serem observados sob a forma de dados numéricos. Após a reunião das unidades em tabelas, elas são apresentadas sob a forma de Gráficos. 2.5.1 Principais tipos de Gráficos 2.5.1.1 Área Destina-se comparar as áreas abrangidas pelos escores de uma ou de duas amostras, exibindo a tendência da contribuição de cada valor em relação ao tempo ou a categoria. Utiliza-se para enfatizar a tendência total entre séries para mesma categoria. Exemplo: Foi realizado um estudo para analisar as diferenças entre remunerações dos empregados da Empresa β com relação a seu salário e gratificação, sendo que estão ordenados por ordem alfabética os empregados que possuem mais tempo de serviço na empresa. A Tabela 6 mostra essas informações. Tabela 6. Salário, Gratificação e Remuneração dos empregados da Empresa β, Santarém, 2010. Empregado Salário Gratificação Remuneração A 3500 1575 5075 B 3500 1890 5390 C 3500 1435 4935 D 3500 1155 4655 E 3500 1540 5040 F 3500 2310 5810 G 3500 1785 5285 H 3500 2065 5565 A Figura 1 mostra a divisão da remuneração dos empregados em áreas correspondentes ao salário e a gratificação. Figura 1. Gráfico de área para os Salários, Gratificações e Remunerações dos empregados da Empresa β, Santarém, 2010. Pode-se notar que o Empregado F possui a maior gratificação e remuneração, enquanto que o Empregado D a menor gratificação e remuneração, apesar de ambos terem o mesmo salário. 2.5.1.2 Colunas Constituída de retângulos da mesma largura e de alturas proporcionais às grandezas que estão representando. Os retângulos são separados uns dos outros por pequenos espaços do mesmo tamanho. É importante atender certos critérios na elaboração destes gráficos, como: 0 1000 2000 3000 4000 5000 6000 7000 A B C D E F G H R e m u n e ra çã o Empregados Gratificação Salário 1. Os espaços entre os retângulos devem ser menores que a largura dos mesmos; 2. Os retângulos devem ser dispostos em ordem decrescente ou crescente; 3. Evitar legendas no interior dos retângulos ou em seus extremos, pois dificulta a comparação; 4. Quando representarem séries temporais, obedecer a ordem cronológica dos dados; 5. As legendas devem ser curtas, para facilidade do entendimento; Alguns exemplos de Gráficos de colunas utilizando os dados dos Empregados da Empresa β: a) Colunas Simples: Figura 2. Gráfico de Colunas Simples Remuneração dos empregados da Empresa β, Santarém, 2010. b) Colunas Justapostas: Figura 3. Gráfico de Colunas Justapostas para os Salários, Gratificaçõese Remunerações dos empregados da Empresa β, Santarém, 2010. 0 1000 2000 3000 4000 5000 6000 7000 D C E A G B H F Remuneração dos Empregados 0 1000 2000 3000 4000 5000 6000 7000 D C E A G B H F Salário Gratificação Remuneração c) Colunas Superpostas: Figura 4. Gráfico de Colunas Superpostas para os Salários, Gratificações e Remunerações dos empregados da Empresa β, Santarém, 2010. 2.5.1.3 Barras O Gráfico de Barras é semelhante ao de colunas, mas disposto no sentido horizontal. Nesse podemos ter textos longos para representar as barras. a) Barras Simples: Figura 5. Gráfico de Barras Simples para a Remuneração dos empregados da Empresa β, Santarém, 2010. 0 2000 4000 6000 8000 10000 12000 14000 D C E A G B H F Remuneração Gratificação Salário 0 1000 2000 3000 4000 5000 6000 7000 Alexandre da Silva Neto Paulo Queiroz Monteiro Fernando Juarez Fonseca Henrique Luiz Junior Rogério Souza Macedo Luis César da Silva Michel de Souza Batista Fabiano Machado Aguiar Remuneração dos Empregados b) Barras Justapostas: Figura 6. Gráfico de Barras Justapostas para os Salários, Gratificações e Remunerações dos empregados da Empresa β, Santarém, 2010. c) Barras Superpostas: Figura 7. Gráfico de Barras Superpostas para os Salários, Gratificações e Remunerações dos empregados da Empresa β, Santarém, 2010. 2.5.1.4 Histograma Um histograma divide uma série de dados em diferentes classes igualmente espaçadas e mostra a frequência de valores em cada classe. Em um gráfico, o histograma mostra diferentes barras, com bases iguais e amplitudes relativas às frequências dos dados em cada classe. O eixo das ordenadas, portanto, mostra a frequência relativa de cada classe e o eixo das abscissas os valores e intervalos das classes. 0 2000 4000 6000 8000 Alexandre da Silva Neto Paulo Queiroz Monteiro Fernando Juarez Fonseca Henrique Luiz Junior Rogério Souza Macedo Luis César da Silva Michel de Souza Batista Fabiano Machado Aguiar Remuneração Gratificação Salário 0 5000 10000 15000 Alexandre da Silva Neto Paulo Queiroz Monteiro Fernando Juarez Fonseca Henrique Luiz Junior Rogério Souza Macedo Luis César da Silva Michel de Souza Batista Fabiano Machado Aguiar Salário Gratificação Remuneração Exemplo: Foi feito um Histograma com os dados da distribuição de frequência dos salários/hora do exemplo anterior. Figura 8. Histograma realizado para a distribuição de frequências dos salários/hora. 2.5.1.5 Gráfico de Linhas Bastante utilizado nas séries temporais, marcando-se o eixo das abscissas (X) os pontos representativos dos períodos – horas, semanas, meses, anos, séculos, etc. – e no eixo das ordenadas (Y) os valores da variável nos respectivos períodos. Exemplo: A Figura 9 mostra o Gráfico de Linhas para os dados da Tabela 1 sobre o numero de desempregados em Belém no período de 1980 até 1984. Figura 9. Gráfico de Linhas para o Número de desempregados em Belém, 1980/1984. 2.5.1.6 Diagrama de Dispersão O diagrama de Dispersão é utilizado nas amostras bivariadas, como ocorre nas Correlações e Regressões Lineares, onde se observam as variáveis X e Y retiradas do mesmo elemento, chamando-se a esse conjunto de Unidade de Associação. 300000 350000 400000 450000 1980 1981 1982 1983 1984 Desempregados Desempregados Exemplo: Suponhamos que uma fabrica dispõe dos seguintes dados sobre o custo e a quantidade produzida de um produto dado pela Tabela 6. Tabela 6. Dados sobre o Custo e a quantidade produzida de certo produto de uma empresa X. Custo (R$) Quantidade Produzida 2421 141 2518 159 2606 160 2718 172 1986 85 1802 87 2975 171 1768 78 1520 58 1480 62 2489 144 Na Figura 10 é feito o Diagrama de Dispersão representando uma relação linear de forma crescente entre as variáveis. Figura 10. Diagrama de Dispersão entre o Custo e a Quantidade Produzida de um produto da Empresa X. 0 500 1000 1500 2000 2500 3000 3500 0 50 100 150 200 C u st o ( R $ ) Quantidade Produzida 2.5.1.7 Pictograma São gráficos de figuras que simbolizam fatos estatísticos, ao mesmo tempo em que indicam a proporcionalidade. Não tem muita precisão, mas são atrativos, daí a utilização em larga escala em publicidade. Exemplo: Tabela 7. Quantidade de peixe pescado no rio “A” da cidade “B” durante 1980 até 2010. Ano Quantidade de peixes 1980 9890 1990 15789 2000 21432 2010 30232 Figura 11. Pictograma da Quantidade de peixe pescado no rio “A” da cidade “B” durante 1980 até 2010. 1980 1990 2000 2010 Cada figura representa 5 mil unidade da Tabela 7. 2.5.1.7 Setor ou Gráfico de Pizza Tem por objetivo comparar várias parcelas com o total, dividindo-se um circulo em setores, cada um compreendendo a um valor da tabela. Exemplo: A Figura 12 mostra o Gráfico de Setor para os dados da Tabela 3 sobre Dentes cariados na Escola B em Belém no de 2000. Figura 12. Gráfico de Setor para o estudo da quantidade de Dentes cariados na Escola B em Belém no ano de 2000. 17.42% 31.83% 28.53% 22.22% Dentes Cariados 2 3 4 5 EXERCÍCIOS 1. Uma Escola quer dividir as turmas de cada série por faixa etária dos alunos, cada turma necessita de pelo menos 10 alunos para ser formada. Os dados coletados se referem a idade dos alunos matriculados na escola para o 4º ano. 12 10 10 12 9 10 14 9 8 9 15 15 13 9 9 13 9 10 12 12 11 14 10 13 13 8 11 12 14 14 10 8 11 9 11 12 13 9 10 13 8 15 9 11 9 10 15 8 11 10 a) Faça a tabela de frequências com os dados agrupados em quatro classes, utilizando |-| em cada classe. b) Faça o Gráfico para representar a frequência simples relativa. c) Faça o Gráfico para representar a frequência acumulada relativa. 2. Quais séries estatísticas definem os dados das tabelas abaixo: a) Tabela 8. A incidência de doenças contagiosas no Estado de São Paulo, 1974. Doenças Número de casos Aftosa 29000 Brucelose 22000 Tuberculose 19000 Raiva 12000 Leptospirose 10000 b) Tabela 9. Maiores exportadores de carne suína (mil t), em 2001 Exportador Quantidade União Européia 1220 Canadá 710 Estados Unidos 699 Brasil 265 China 110 Outros 539 3. Faça gráficos que melhor podem representar os dados das Tabelas 7, 8 e 9. 4. Considere as notas de um teste de inteligência aplicado a 100 alunos de um estabelecimento de ensino: 62 72 78 85 89 95 99 104 111 119 63 73 79 87 90 95 99 104 112 120 64 74 80 87 90 96 99 105 112 120 65 74 80 88 91 97 100 106 113 120 65 74 81 88 91 97 100 107 114 121 67 74 82 89 92 97 101 108 116 122 68 75 83 89 92 98 101 109 117 125 68 76 83 89 92 98 102 110 119 128 68 78 85 89 93 99 102 110 119 128 68 78 85 89 95 99 103 110 119 130 a) Retire uma amostra sistemática de n = 25 alunos admitindo que a amostra da 46º posição foi selecionada. b) Com base na amostra de 25 alunos faça a distribuição de frequências utilizando a regra empírica para o cálculo de k. c) Construa um gráfico para representar a tabelas de frequências utilizando as frequências relativas. 5. Barulho é medido em decibéis, representado por dB. Um decibel corresponde ao nível do som mais fraco que pode ser ouvido emum local silencioso por alguém com boa audição. Um sussurro corresponde a cerca de 30 dB; a voz humana em conversação normal corresponde a cerca de 70 dB; um rádio em volume alto cerca de 100 dB; Desconforto para os ouvidos geralmente ocorre a cerca de 120 dB. Os dados abaixo correspondem aos níveis de barulho medidos em 36 horários diferentes em um determinado local. 82 89 94 110 74 122 112 95 100 78 65 60 90 83 87 75 114 85 69 94 124 115 107 88 97 74 72 68 83 91 90 102 77 125 108 65 6. Os valores abaixo relacionados em rol (estão organizados) representam as alturas dos 40 alunos de uma turma, em cm. Organizar uma distribuição de frequências com 6 classes distintas. 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173
Compartilhar