Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTATÍSTICA APLICADA A NEGÓCIOS Professor Mardônio 2 ÍNDICE INTRODUÇÃO _01 MÓDULO 1 Fases do Método Estatístico e Noções de amostragem _07 MÓDULO 2 Tabelas Estatísticas _20 MÓDULO 3 Distribuição de Frequência _46 MÓDULO 4 Medidas de Tendência Central __ _59 MÓDULO 5 Gráficos Estatísticos _________ _92 MÓDULO 6 Assimetria 111 MÓDULO 7 Medidas de dispersão 121 3 Introdução Breve panorama histórico Para Inesul (2007), a utilização da estatística já remonta a quatro mil anos antes de Cristo, utilizada pelos povos guerreiros na conquista de territórios – recenseamento das terras, dos espólios de guerra, contagem das armas, cavalos e soldados. Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, contavam os rebanhos, as colheitas, distribuíam terras eqüitativamente, cobravam impostos etc. Na Idade Média as informações eram coletadas com finalidades tributárias ou bélicas. O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões. Desde a sua origem a Estatística já visava subsidiar a tomada de decisão. A Estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de Bernoulli, Fermat, Laplace, Gauss, Galton, Pearson, Fisher, Poisson e outros que estabeleceram suas características atuais. Ela continua a progredir na razão direta do desejo de investigação dos fenômenos coletivos. Foi somente no século XIX que a Estatística começou a ganhar importância nas diversas áreas do conhecimento. E a partir do século XX começou a ser aplicada nas grandes organizações, quando os japoneses começaram a falar em qualidade total (Inesul 2007). O Que é Estatística? É um conjunto de técnicas que visam coletar, tratar, sumarizar, analisar e interpretar dados, gerando informações para a solução de problemas do cotidiano. É um instrumental para subsidiar a tomada de decisão. Como citado no livro Estatística, de Murray R. Spiegel, “a estatística está interessada nos métodos científicos para coleta, organização, resumo, apresentação dos dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises”. O método científico Muitos dos conhecimentos que se adquire podem ter sido percebidos inicialmente por acaso, mas processos científicos são desenvolvidos para o estudo e aquisição de conhecimentos da realidade que nos rodeia. Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Gil (1991) observa que para que um conhecimento possa ser considerado científico, torna-se necessário identificar as operações mentais e técnicas que possibilitam a sua verificação. Ou, em outras palavras, determinar o método que possibilitou chegar a esse conhecimento. 4 Método científico é o conjunto de procedimentos intelectuais e técnicos adotados para se atingir o conhecimento. O método experimental consiste em manter constante todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, Química etc. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Lembrar que a Estatística destina-se ao estudo e análise dos fenômenos coletivos. A importância da estatística: O raciocínio é amplamente utilizado pelas pessoas; Inúmeros segmentos sociais necessitam desse conhecimento para balizar suas decisões; Revistas técnicas e estudos especializados fazem referência à estatística; Ela ajuda a desenvolver habilidades para a solução de problemas do cotidiano, etc. Ramos da Estatística: Estatística Descritiva, Estatística Probabilística e Estatística Inferencial. Estatística Descritiva: utiliza os números para descrever e caracterizar fatos, expressando a realidade em termos quantitativos, a partir do tratamento e organização desses dados, tornando mais fácil sua compreensão, entendimento, expondo mais claramente suas características principais, seu perfil, etc. Coletar, descrever e resumir dados constitui-se na primeira fase da análise. Estatística Probabilística ou Teoria da Probabilidade: é aplicada na análise e interpretação de situações que envolvem o acaso, a incerteza, tais como jogos de cartas ou dados, jogos esportivos, a decisão de um empresário de fazer uma campanha de marketing, aumentar o número de vôos de sua companhia para determinada rota, decidir sobre o aumento ou não da produção, entre outras. Estatística Inferencial ou Teoria da Amostragem: é por demais utilizada na análise e interpretação de dados amostrais, ou seja, dados gerados a partir de segmentos representativos da população alvo, para fazer inferências sobre aspectos específicos dessa mesma população. Ela aborda técnicas de como se deve extrair amostras representativas que possibilitem fazer inferência. Daí porque esse ramo também é conhecido como estatística inferencial ou indutiva. Destaque-se que essas três áreas não são utilizadas separadamente. Na prática, elas se misturam, são utilizadas conjuntamente, lançando mão da metodologia científica. As distribuições de probabilidade incorporam a estatística descritiva e a teoria da probabilidade: a base da inferência estatística. 5 Na análise estatística, duas perguntas devem ser respondidas. 1. Como obter dados úteis e confiáveis? Diz respeito à amostragem, aos métodos científicos de obtenção de dados. 2. O que fazer com eles? Refere-se à organização e tratamento dos dados coletados e à análise e interpretação das informações geradas. Para tanto são estudadas as distribuições amostrais, demonstrando porque se pode fazer inferência, desde que a amostra seja corretamente extraída, o papel das distribuições de probabilidade, a importância do tamanho da amostra e do grau de precisão das estimativas. A estatística nas empresas - tomada de decisão. A Estatística é uma ciência dinâmica que contempla uma série de métodos de coleta, análise, interpretação e apresentação de conjuntos de dados, e com freqüência cada vez maior, os processos de decisão se baseiam na análise e interpretação de dados. A diversidade de aplicação da estatística é bastante ampla. Ela pode ser utilizada na contagem de populações; em indústrias, no desenvolvimento de novos produtos, no controle de qualidade e pesquisa de mercado; no mercado financeiro (bancos, bolsa de valores, cartões de crédito e seguradoras), fazendo aplicações financeiras e perfil de clientes; em hospitais e instituições de pesquisa, determinando, por exemplo, os fatores de risco de doenças; e em instituições públicas que lidam com coleta, análise e processamento de dados. A utilização da Ciência Estatística facilita, sobremaneira, o trabalho do administrador de organizar, dirigire controlar a empresa. Os setores que mais têm contratado profissionais dessa área são os setores financeiros e de pesquisas de mercado. Através de pesquisas, coleta de dados e sondagens junto às pessoas, mercado consumidor etc., o administrador pode conhecer a realidade econômica e social de uma população, o potencial de mercado, suas preferências, as expectativas da população sobre a empresa, e assim estabelecer melhor as metas e estratégias a serem adotadas. Algumas áreas de aplicação: pesquisa de mercado, controle de qualidade, previsão de vendas, nível de satisfação dos clientes, avaliação do desempenho da empresa, planejamento da empresa (estoque, faturamento, vendas, salários dos empregados etc.). As indústrias automobilística, de eletrodomésticos e do ramo de alimentação são alguns setores industriais que melhoraram muito, no que se refere à qualidade dos produtos ofertados, após a implementação do controle estatístico de qualidade. 6 Os programas de controle de qualidade dependem muito dos modelos estatísticos. A implantação de tais programas, contemplando as diversas fases do processo produtivo, pode eliminar desperdícios, reduzir custos e a incidência de defeitos, melhorar a qualidade dos produtos, elevar o nível de satisfação dos clientes e ampliar o lucro. Atualmente as empresas têm muitos dados, mas nem todas sabem transformá-los em informação. As técnicas estatísticas são um instrumental muito útil para essa finalidade. No setor público, estados e municípios necessitam de informações para melhor conhecer a realidade estadual/municipal e planejar bem e priorizar as ações de governo, melhor utilizando os recursos públicos. A estatística também pode ser utilizada para medir os impactos dos programas/projetos executados, assim como servir de instrumento para transmitir à sociedade os resultados/impactos das ações realizadas. Ex: Cálculo do Produto Interno Bruto (PIB), nível de pobreza, Índice de Desenvolvimento Humano, Índice de Desenvolvimento Municipal, volume de importações e exportações, emprego e desemprego, evolução das receitas, arrecadação de impostos, composição das despesas, investimentos, prestação de contas junto à população, concentração da renda, monitoramento das políticas sociais, dentre outros. No comércio, por exemplo, para subsidiar o planejamento da cadeia varejista, pesquisas poderiam ser realizadas: o nível de renda da população, intenção de consumo, aceitação dos produtos, os produtos mais consumidos, a relação nível de preço/qualidade dos produtos, evolução do volume de vendas, o faturamento e o emprego, assim como o delineamento do perfil dos estabelecimentos comerciais do estado – Vide estudo IPDC. Alguns exemplos: Censo do Comércio 2005 – censo realizado pelo IPDC. Radar do Comércio – pesquisa realizada pelo IPECE; Desempenho do Comércio Varejista Cearense – publicação trimestral do IPECE; Pesquisa Mensal do Comércio - pesquisa realizada pelo IPDC; Pesquisa Mensal do Comércio - pesquisa realizada pelo IBGE; Pesquisa Anual do Comércio - pesquisa realizada pelo IBGE; Sensor Econômico - pesquisa realizada pelo IPEA; Indicadores Industriais - pesquisa realizada pela FIEC; Pesquisa de Emprego e Desemprego - pesquisa realizada pela Fundação SEADE/DIEESE e STDS/IDT. Índice de Expectativas das Famílias – pesquisa realizada pelo IPEA. 7 Em todos esses trabalhos, estatísticas precisam ser calculadas (médias, taxas de variação, índices, quartis, coeficientes de variação e de correlação, desvio-padrão etc.), analisadas e tudo precisa ser documentado para evitar esquecimentos e possibilitar comparações futuras, momento em que se dá a utilização de tabelas e gráficos que facilitarão a visualização/compreensão das estatísticas que lhes deram origem. Enfim, em um mundo cada vez mais competitivo, empresas com conhecimento de mercado, com informações atualizadas e confiáveis, tomam decisões mais rápidas, decisões mais acertadas, possibilitando um gerenciamento mais eficiente do negócio, partindo na frente da concorrência. Objetivos gerais e conteúdo da disciplina A descrição ou análise dos dados é feita para atender um dos quatro objetivos seguintes: Caracterizar o que é típico no grupo (medidas de tendência central); Indicar a variabilidade dos indivíduos no grupo (medidas de dispersão); Verificar como os indivíduos se distribuem em relação a determinadas variáveis (distribuição de frequência, assimetria, histograma etc.); Mostrar a força e a direção da relação entre as variáveis estudadas (coeficiente de correlação, regressão etc.). Assim, os objetivos gerais da disciplina são os seguintes: Apresentação do método estatístico Construção de distribuições de frequência e sua representação gráfica Interpretação das distribuições de frequência e sua representação gráfica Apresentação de dados em tabelas e gráficos Análise e interpretação de dados em tabelas e gráficos Conceito, cálculo e interpretação de taxas de variação Conceito, cálculo e interpretação de medidas de tendência central Conceito, cálculo e interpretação de medidas de dispersão Conceito, cálculo e interpretação de coeficientes de variação Portanto, o objetivo geral da disciplina é dotar o aluno de conhecimento das técnicas estatísticas de coleta, tratamento, organização, análise e interpretação de dados e previsão de demanda, sempre com foco na tomada de decisão. 8 Módulo 1 - Fases do Método Estatístico e Noções de Amostragem O aspecto mais básico e vital de um tratamento estatístico de dados passa pela necessidade de se observar que tipo de dados o objeto de estudo permite que sejam coletados (Silva, 2003). Isto está incluído na parte do planejamento do estudo/pesquisa. O tratamento estatístico a ser aplicado depende do tipo da variável. Dados são números levantados por ocasião de coleta. Informação é o dado processado. O processamento dos dados é de grande ajuda na análise pois reduz a quantidade de detalhes e destaca os aspectos ou características principais do fenômeno estudado. Variáveis – são características da unidade elementar de pesquisa que pode ter valores diferentes entre as unidades pesquisadas. São itens que originam valores que tendem a exibir um certo grau de variabilidade ao se fazerem mensurações sucessivas. São as características que podem ser observadas ou medidas em cada elemento da população. Ex: a) Volume de vendas mensais de certo produto; b) Nível de investimento de dada empresa; c) Quantidade exportada do produto X; d) Nível de endividamento da empresa; e) Utilização da capacidade instalada; e) Evolução da massa de salários pagos pela empresa; f) Quantidade estocada de um produto; g) Volume de recursos para treinamento dos empregados; h) Recursos aplicados na aquisição de máquinas/equipamentos, etc. i) Faturamento mensal da loja. Variáveis aleatórias – são variáveis cujos valores são resultados numéricos de experimentos aleatórios, em que cada valor está associado à cada realização do experimento. Experimento aleatório – é aquele em que não é possível antecipar o seu resultado, apesar de se conhecer os resultados possíveis. Os resultados são determinados pelo acaso. Vide lançamento de uma moeda ou dado, em que se associa um número a cada resultado. Tipos de Dados/Variáveis - É importante especificar-se o tipo de dado/variável com que se está trabalhando, pois o processo a ser utilizado na análise/tratamentodos dados depende do tipo de dado considerado. Quantitativos Contínuos (Mensurações) Dados (Numéricos) Discretos (Contagem, números inteiros) (natureza) Qualitativos Nominais (Categorias) (Categóricos) Por Postos ou Ordinais (Ordenação, hierarquização) 9 As variáveis contínuas podem assumir qualquer valor num determinado intervalo contínuo, e os dados referentes a essas variáveis classificam-se como dados contínuos. Elas se referem à mensurações e não à contagem. Ex: Altura, peso, comprimento, espessura, velocidade, temperatura, quantidade de gasolina vendida, tempo de atendimento a um cliente, salários, etc. As variáveis discretas são aquelas que só podem assumir certos valores, geralmente inteiros. Os dados discretos são resultantes de um processo de contagem do número de itens. Ex. Número de alunos na sala, número de defeitos mensais por máquina, número de clientes por semana, número de acidentes de trabalho na empresa, unidades vendidas de um produto, número de empregados ou de clientes de uma loja, número de cheques sem fundo. Dados contínuos e discretos são de natureza quantitativa, pois são inerentemente números, exprimem quantidade. Dados nominais – definem-se categorias ou atributos e se conta o número de elementos pertencentes a cada categoria. Não podem ser dispostos em uma ordem. A organização inicial de dados consiste em distribuir esses dados em categorias e determinar com que freqüência cada categoria ocorre (Gênero, classe social, partido político, área geográfica, tempo, instrução, setor de atividade). Dados por postos – surgem de avaliações quando se dispõem os itens segundo preferências, desempenho, classificação, etc. Nesse caso, a diferença entre as classes não faz sentido, pois os valores atribuídos são utilizados para expressar ordem (Nível de satisfação dos clientes, grau de concordância, nível de desempenho, durabilidade do produto, classificação de alunos). O nível ordinal fornece informações sobre a ordenação, mas não indica a magnitude das diferenças entre os valores. Dados nominais e por postos são de natureza qualitativa, envolvendo variáveis que não são inerentemente numéricas. Por isso, devem ser transformados em valores numéricos para serem tratados estatisticamente. Classificação das Variáveis – Alguns exemplos 1. 40 pessoas são usuários de computadores – Discreta 2. O cigarro X tem 16,3 mg de alcatrão - Contínua 3. De todos os arremessos, 30 foram convertidos - Discreta 4. O tempo de deslocamento foi de 5,387 segundos - Contínua 5. Código de endereço postal – Nominal 6. Carros classificados como compactos, subcompactos, médios – Ordinal 7. Nível de satisfação do consumidor – Ordinal 8. Parentesco – Nominal 10 9. Situação de emprego – Nominal 10. Vazão de um poço de petróleo – Contínua 11. Quantidade de leite produzido por vaca – Contínua 12. Resposta tipo SIM ou NÃO – Nominal 13. Uma marca de vinho classificada como excelente, bom ou ruim – Ordinal 14. O carro A teve melhor desempenho – Ordinal 15. Nível de aceitação de um produto – Ordinal 16. Altura dos alunos da classe – Contínua 17. Número de filhos por família – Discreta 18. Cor dos cabelos das clientes de uma loja – Nominal 19. Número de filhos de um casal – Discreta 20. O ponto obtido em cada um dos lançamentos de um dado – Discreta 21. Diâmetro externo das peças produzidas por uma máquina – Contínua 22. Número de ações negociadas na Bolsa de Valores – Discreta 23. Classificação das pessoas após determinado concurso – Ordinal. Segundo Crespo (1999), a Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisão. Estatística Descritiva - coleta, organização e descrição dos dados. Estatística Inferencial - análise e interpretação de dados (o processo de inferir). Fundamentos teóricos da Inferência Estatística As técnicas de amostragem A teoria das probabilidades (distribuições amostrais) Fases do método estatístico 1. A coleta de dados Após cuidadoso planejamento, incluídos a definição dos objetivos da pesquisa, determinação das características mensuráveis do fenômeno a ser estudado, o instrumental de coleta, área geográfica etc. se dá início a coleta de dados. Quanto à sua periodicidade, a coleta pode ser: Contínua – quando feita continuamente, tal qual as pesquisas mensais (PME, PMC); Periódica – quando realizadas em intervalos de tempo constantes (Censos, PNAD); Ocasional – quando feitas ocasionalmente para atender a uma conjuntura ou emergência. 11 2. Crítica dos dados Após coletados, os dados devem ser criticados, consistidos, para verificar possíveis inconsistências, falhas de coleta, erros do informante ou de digitação, etc, para se obter conclusões consistentes e verdadeiras. 3. Apuração dos dados É o tratamento, processamento dos dados. Vide plano de análise e tabulação ou roteiros de entrevista (critérios de classificação) e aplicação dos tratamentos estatísticos (medidas de tendência central, dispersão, separatrizes, correlação etc.). 4. Apresentação dos dados Os dados devem ser apresentados de forma adequada, organizada e clara, tornando mais fácil a sua análise e interpretação. Para tanto, utilizam-se tabelas e gráficos. 5. Análise e interpretação Análise e interpretação do fenômeno estudado através dos métodos da Estatística Indutiva ou Inferencial e tiramos desses resultados conclusões e previsões. Tibone (2010) sintetiza os passos da metodologia estatística nas seguintes etapas: Definição dos objetivos; Planejamento e elaboração da coleta de dados; Classificação dos dados e apresentação dos valores numéricos; Análise dos resultados e Elaboração do relatório com as conclusões. População e Amostra Conceitos 1. População é o conjunto de elementos portadores de, pelo menos, uma característica comum. É a coleção completa de todos os elementos a serem investigados. É também conhecida como universo estatístico ou população estatística. É necessário existir um critério de constituição da população, válido para quaisquer pessoas, no tempo ou no espaço, de modo que não haja dúvidas se determinado elemento pertence ou não à população em estudo. Estatisticamente falando, o conceito de população não se restringe apenas à pessoas. Pode ser o rebanho de uma fazenda, os clientes de uma loja, a produção mensal de uma fábrica, os empresários do comércio, o total de empregados de uma rede de supermercados etc. 12 2. Amostra é um subconjunto finito de uma população. É uma pequena parte dos elementos que compõem o universo. A amostra deve possuir as mesmas características básicas da população, ou seja, ela deve ser representativa da população. Exemplos: a) No controle de qualidade de uma fábrica produtora de pregos, a população poderia ser o total de pregos produzidos em determinado período e a amostra, uma fração desses pregos. b) Na avaliação do nível de satisfação dos clientes de um supermercado, a população ou universo seria todos os clientes que fizeram compras nesse supermercado em certo mês e a amostra 10% desses clientes. c) Para testar o ganho de peso do rebanho de 10 mil bovinos de uma fazenda(população), após tomarem certa vacina, seleciona-se uma amostra de 1.000 bois. Processos estatísticos de abordagem – Censo e Amostragem Na amostragem apenas uma parte da população é investigada. No censo toda a população é investigada. À primeira vista pode parecer que a inspeção de todos os itens de uma população seja mais conveniente. Na prática, a investigação de uma parcela deles é quase sempre válida. De modo geral, a amostragem é preferível ao censo. Utiliza-se a amostragem quando: A população é infinita ou muito grande; A amostragem dá resultados mais atualizados (necessidade de informações mais rápidas); Os itens examinados são destruídos durante a investigação (testes destrutivos); O custo de um censo é bastante elevado; A amostragem geralmente propicia maior precisão (maior controle de todo o processo); Amostras podem gerar informações mais detalhadas. Utiliza-se o censo quando: A população pode ser tão pequena que é mais vantajoso fazer o censo; O tamanho da amostra é grande em relação ao tamanho da população (alta variabilidade na população, população é muito heterogênea); A precisão total é exigida. 13 Algumas técnicas de amostragem Não basta sabermos descrever bem os dados da amostra. É preciso garantir que a amostra selecionada seja obtida por processos adequados. Deve-se tomar cuidado com os critérios que serão utilizados na seleção da amostra, pois ela tem que ser representativa da população. Daí a importância de se dispor de algumas informações sobre a população. O método estatístico fundamenta-se na aplicação da teoria estatística da probabilidade. Há que se considerar, porém, que as explicações obtidas mediante a utilização do método estatístico não podem ser consideradas absolutamente verdadeiras, mas dotadas de boa probabilidade de serem verdadeiras. (Gil, 1991). É possível determinar a probabilidade de acerto de um resultado (nível de confiança) assim como a margem de erro associada a esse resultado (erro de amostragem). A teoria demosntra que, quanto maior for a população, menor deverá ser a proporção da amostra em relação ao universo, para iguais níveis de confiança e limites de erro. A amostragem consiste em um método para não se estudar o conjunto como um todo, mas apenas parte dele, sem que ocorra a perda das características essenciais da população (Bruni, 2010). Tem que haver um critério para a seleção ou escolha dos elementos da amostra. Para que uma amostra seja representativa da população, cada elemento da população deve ter a mesma chance de pertencer à amostra. Cada grupo da população deve ter uma representação na amostra e de forma proporcional ao seu tamanho. 1. Amostragem Aleatória Simples É o procedimento básico da amostragem científica. Todos os outros procedimentos adotados para compor amostras são variações deste (Gil, 1991). É uma técnica em que a população é numerada de 1 a n e, em seguida, por meio de algum processo aleatório (sorteio de números, utilização da tabela de números aleatórios), os elementos da amostra são selecionados. Há a necessidade de se dispor da relação de todos os elementos da população. As amostras aleatórias têm maior probabilidade de reproduzir as características da população e, assim, elas possibilitam fazer inferências sobre aspectos da população, ou seja, tirar conclusões sobre aspectos da população analisando apenas uma parte da mesma. Ex: O proprietário de uma cadeia de lojas de eletrodomésticos, com 20 lojas, deseja estimar o volume de vendas do mês de março próximo, supondo que o volume de vendas será equivalente ao verificado em março do ano anterior. Como ele precisa urgentemente dessa informação para dimensionar seus estoques, ele resolve estimar esse número a partir de uma amostra de 5 lojas. O volume de vendas das lojas de março do ano anterior é apresentado a seguir. 14 Tabela 3 – Volume de vendas da cadeia de lojas X – Estado do Ceará – Mar/08 Fonte: Loja X. a) Como proceder para gerar uma amostra aleatória simples? b) Gere uma primeira amostra de 5 lojas. c) Gere uma segunda amostra de 5 lojas. d) Qual a previsão de vendas para março, segundo as duas amostras? e) Qual foi a fração de amostragem utilizada? Solução: a) Para gerar uma amostra aleatória simples, vamos utilizar uma tabela de números aleatórios, considerando os dois primeiros algarismos da coluna mais à esquerda, para a amostra 1, e para a amostra 2, os dois últimos algarismos da coluna mais à direita, considerando somente os valores entre 01 e 20. b) Amostra 1: 18; 03; 05; 01 e 08. c) Amostra 2: 17; 03; 07; 19 e 12 d) Para a amostra 1: Loja 18 = 490 unidades; Loja 3 = 300 unidades; Loja 5 = 410 unidades; Loja 1 = 500 unidades e Loja 8 = 600 unidades. Média de vendas = 2.300/5 = 460 unidades. Para a amostra 1: Loja 17 = 350 unidades; Loja 03 = 300 unidades; Loja 7 = 550 unidades; Loja 19 = 530 unidades e Loja 12 = 500 unidades. Média de vendas = 2.230/5 = 446 unidades. Pode afirmar que o volume de vendas para março desse ano ficará em torno de 460 unidades, segundo a amostra 1, e de 446 unidades, segundo a amostra 2. Os dados amostrais não devem ser considerados absolutamente exatos. Estão sujeitos a erros. Loja Unidades Vendidas Loja Unidades Vendidas 1 500 11 700 2 450 12 500 3 300 13 460 4 250 14 350 5 410 15 280 6 350 16 160 7 550 17 350 8 600 18 490 9 420 19 530 10 220 20 240 15 Quando técnicas de amostragem são utilizadas, os resultados estão sujeitos a uma margem de erro, que diminui à medida que aumenta o tamanho da amostra. Partindo-se de um erro de 5%, ter-se-iam dois intervalos para a estimativa das vendas: Amostra 1: 5% de 460 = 23 Intervalo = 460 ± 23 Estimativa intervalar: (437, 483) Amostra 2: 5% de 446 = 22 Intervalo = 446 ± 22 Estimativa intervalar: (424, 468) A conclusão é a de que há um empate técnico (as estimativas de venda são estatisticamente iguais), pois há pontos de interseção entre os dois intervalos, sendo as estimativas por intervalo a forma mais adequada de apresentar resultados a partir de amostras, dados os erros de amostragem sempre presentes. Nas amostras aleatórias, as diferenças entre as estatísticas amostrais e os parâmetros populacionais são devidas ao acaso, isto é, às flutuações (variações) das amostras. Portanto, amostras diferentes normalmente geram estimativas distintas, conforme o exemplo dado. e) A fração de amostragem é definida como a proporção de indivíduos da amostra relativamente ao tamanho da população. É dada pela relação f = (n/N).100, onde n é o tamanho da amostra e N, o da população Assim, f = (n/N).100 f = (5/20).100 = 25%. Ex: Supor que há uma população de 100 itens, os quais são numerados de 001 a 100 e se quer selecionar uma amostra de 8 elementos. Utilizando-se uma tabela de números aleatórios, supor que os números sorteados foram: 085, 027, 049, 013, 028, 076, 095 e 005. Assim, os elementos da população com essa numeração serão os que comporão a amostra. Nesse caso, trabalha-se com números de três dígitos para assegurar que todos os itens da população tenham a mesma chance de compor a amostra, ou seja, de ser selecionado. Ex: Um grupo industrial deseja conhecer a reação dos seus consumidoresquanto à nova rotulagem de um dos seus principais produtos. Definindo como área para a avaliação uma região que circunda a empresa, composta de 40 quarteirões, cada um com 10 casas: a) Esboce um plano de amostragem aleatória de dois estágios, selecionando primeiro os 10 quarteirões e, em seguida, 1 casa em cada quarteirão. b) Suponha que se queira usar um plano de somente um estágio, selecionando as 10 casas diretamente. Que problemas poderiam surgir na escolha das casas? Solução: 16 a) 1º estágio – seleção dos quarteirões - Como são 40 quarteirões, numerá-los de 00 a 39. Selecionam-se números aleatórios nesse intervalo, cuja numeração corresponderá aos quarteirões selecionados. 2º estágio – seleção das casas nos 10 quarteirões já sorteados – Após numerar as casas de cada quarteirão de 0 a 9, selecionam-se um número aleatório nesse intervalo, cuja numeração corresponderá à casa selecionada de cada quarteirão. Isto será feito para cada quarteirão isoladamente, sendo repetido 10 vezes. b) Se for uma área homogênea, não haveria maiores problemas. Problemas poderiam ser causados pela heterogeneidade da área (níveis de renda diferenciados, por exemplo). Seria bom organizar, de alguma forma, a listagem das casas para fazer o sorteio aleatório e assegurar uma mesma probabilidade de seleção para todas as casas. Depois de organizada a listagem, as casas seriam numeradas de 000 a 399 e, utilizando- se a tabela de números aleatórios, seria feita a seleção das 40 casas. 2. Amostragem Sistemática É uma variação da Amostragem Aleatória Simples. Exige que a população seja ordenada de modo tal que cada um de seus elementos possa ser unicamente identificado pela posição (lista de pessoas da lista telefônica, população ordenada seguindo a idade ou renda mensal, prontuários médicos de um hospital, produtos de uma linha de produção, cadastro de eleitores etc.). Para efetuar a escolha da amostra, procede-se à seleção de um ponto de partida aleatório entre 1 o inteiro mais próximo à razão da amostragem (N/n). A seguir, selecionam-se os elementos da amostra em intervalos de N/n, sistematicamente, o que possibilitará cobrir-se toda a população. Ex: Vamos supor que numa loja foi feito o cadastro de todos os seus clientes que fizeram compras com cartões de crédito em determinada semana, totalizando 500 clientes, todos numerados de 001 a 500, ordenados segundo o valor de compra. Para averiguar o seu nível de satisfação com o atendimento dispensado, pretende-se selecionar uma amostra de 35 clientes. Como selecionar essa amostra de forma sistemática? A razão de amostragem é dada por 500/35 = 14. Assim, o primeiro cliente a ser entrevistado será um daqueles numerados de 01 a 14. Daí em diante, selecionam-se os demais de 14 em 14 clientes. Ex: Imagine que a COELCE deseja saber o nível de satisfação dos seus clientes pelos serviços prestados em determinada cidade com aproximadamente 10.000 usuários. Como selecionar uma amostra sistemática de 1.000 usuários. Disponibilidade do cadastro de clientes atualizado e organizado. Seleção do primeiro usuário – 10.000/1.000 = 10. Será aquele com numeração entre 1 e 10, dependendo do número sorteado. 17 Os outros 999 usuários serão selecionados de 10 em 10. Observar que o pesquisador não tem, e nem deve ter, nenhuma influencia na seleção dos elementos que irão integrar a amostra. Isto certamente teria implicações nos resultados. 3. Amostragem Estratificada Simples É muito utilizada quando a população é heterogênea, uma população que pode ser divida em diversas subpopulações. Nesse caso, é provável que o tema de interesse da pesquisa varie de um segmento para outro, inclusive dentro de um mesmo segmento (estrato). Portanto, a seleção da amostra deve considerar essas variações, selecionando amostras dos diversos estratos, garantindo assim a representatividade da amostra e elevando a precisão dos resultados. Em cada estrato pode-se utilizar a amostragem aleatória simples ou sistemática na seleção dos seus elementos para compor a amostra. A amostra estratificada caracteriza-se pela seleção de uma amostra de cada subgrupo da população considerada. Cada subgrupo constituirá um estrato. Na amostragem estratificada proporcional, a proporção amostral de cada estrato será compatível com o peso desse estrato na população. Ex: Considerar uma empresa varejista com 4 filiais de portes diferentes, com o total de 1.000 empregados, segundo tabela a seguir. Se o proprietário dessa rede quer avaliar o grau de satisfação de seus empregados, como selecionar uma amostra de 60 empregados? Tabela 1 – Número de empregados por filial da empresa varejista X Filial Nº Empregados (%) A 400 40 B 220 22 C 80 8 D 300 30 Total 1.000 100 Fonte: Empresa X. Como as filiais são de portes distintos e com número de empregados diferentes, vamos utilizar a amostragem estratificada proporcional, em que cada filial integrará um estrato, assegurando que haverá empregados de todas as filiais na amostra. Quantificação das amostras de cada filial (estrato): Filial A = 60.40% = 24 empregados Filial B = 60.22% = 13 empregados Filial C = 60.8% = 5 empregados Filial D = 60.30% = 18 empregados Amostra total = 60 empregados = (24+13+5+18). 18 Ex: Vamos supor que o parque industrial de um estado tem a seguinte configuração. Tabela 1 – Composição do parque industrial do estado X - 2008 Ramos da indústria Nº de indústrias Metal-mecânica 55 Têxtil 78 Alimentos 26 Calçados 42 Construção civil 12 Total 213 Fonte: Cadastro Industrial 2008 (Fictício). Lembra-se que cada grupo da população deve ter uma participação na amostra e de forma proporcional ao seu tamanho para garantir a representatividade da amostra. Considerando uma amostragem estratificada proporcional de 20 empresas, pergunta-se: a) Seria verdadeiro afirmar que a amostra do setor têxtil seria o dobro do setor de calçados? b) Quantas empresas do setor metal-mecânico deveriam ser pesquisadas? c) Uma amostra de 4 empresas do setor de alimentos estaria superestimada? Solução: a) Sim, porque sua representação no universo de empresas do estado é duas vezes maior. Têxtil = 36,62% e calçados = 19,72%. b) O setor metal-mecânico tem uma representação de 25,82%. Assim, 20.0,2582 = 5 empresas. c) Sim, pois seriam necessárias apenas 2 empresas (20.0,1221). Ex: Para avaliar a qualidade do ensino de um colégio, o Diretor resolveu fazer uma pesquisa com os seus 500 alunos. O perfil dos alunos consta na tabela a seguir. Tabela 4 – Número de alunos do Colégio X, por gênero e idade - 2009 Faixa etária Homens Mulheres 10 – 14 80 95 15 – 19 60 80 20 – 24 90 50 25 - 29 30 15 Total 260 240 Fonte: Colégio X. Considerando uma amostragem estratificada proporcional de 40 empresas, pergunta-se:19 a) Quantas mulheres deveriam ser amostradas? b) A amostra de homens de 25 a 29 anos deveria ser duas vezes maior que a de mulheres da mesma faixa etária? c) Qual deveria ser a amostra de homens com idade entre 20 e 24 anos? d) Qual deveria ser a amostra de mulheres com idade entre 10 e 14 anos? e) Os homens estariam representados corretamente por uma amostra de 15 alunos? Solução: a) As mulheres compõem 48% dos alunos. Portanto, 0,48.40 = 19 alunas na amostra. b) Sim, porque sua participação é duas vezes maior. Alunos de 20 e 24 anos = 11,54% dos homens. Mulheres de 20 e 24 anos = 6,25% das mulheres. c) Amostra de homens com idade entre 20 e 24 anos = 0,3662.21 = 8 alunos. d) Amostra de mulheres de 10 e 14 anos = 0,3958.19 = 8 alunas e) Não, pois seriam necessários 21 alunos na amostra. Sua participação na turma é de 52%. Ex: Uma população encontra-se dividida em três estratos, com tamanhos N1 = 80, N2 = 120 e N3 = 60. Ao se realizar uma amostra estratificada proporcional, 12 elementos da amostra foram retirados do estrato 1. Qual o número total de elementos da amostra? A amostragem estratificada proporcional exige que o número de elementos sorteados de cada estrato seja diretamente proporcional ao número de elementos da população contidos nesse estrato. Assim, n1 = (N1/N).n implicando que n = (N. n1)/ N1 onde: n1 – nº de elementos da amostra no estrato 1. n – nº total de elementos da amostra. N - nº total de elementos da população. N1 - nº de elementos da população no estrato 1. Como N = 260 (N1 + N2 + N3) n = (260.12)/80 n = 39 (amostra total) n2 = (N2/N).n n2 = (120/260).39 n2 = 18 (amostra do estrato 2) n3 = (N3/N).n n3 = (60/260).39 n3 = 9 (amostra do estrato 2) 20 Exercícios práticos: 1. Estimar o peso médio da turma, a partir de duas amostras, sendo uma sistemática e outra estratificada por gênero. Qual das duas dará uma estimativa mais consistente? Por que? Considerar uma fração de amostragem de 20%. Pesquisador 1 – Amostragem sistemática; Pesquisador 2 - Amostragem estratificada; Pesquisador 3 – Censo. Discutir os resultados. 2. Uma pesquisa deseja verificar a idade média dos chefes e a renda familiar média da população de 20 famílias residentes em certa localidade (universo), conforme tabela a seguir. Tabela 1 – Idade dos chefes e renda familiar dos moradores da localidade X – Ano Y Nº Família Idade Chefe Renda Familiar Nº Família Idade Chefe Renda Familiar 1 20 900 11 22 1.000 2 35 1.200 12 47 2.000 3 59 1.800 13 34 1.500 4 28 800 14 46 1.800 5 65 900 15 53 2.300 6 39 1.500 16 57 2.200 7 42 2.000 17 29 1.500 8 25 1.400 18 38 1.900 9 47 700 19 45 1.500 10 52 1.100 20 57 2.100 Fonte: Secretária Z do Município. a) Gerar amostras aleatórias simples de tamanho 8 e calcular a idade média dos chefes de família e a renda média familiar dessa localidade (Várias equipes). Determinar também os valores populacionais das duas variáveis e comentar os resultados. b) Estratificar a população e gerar uma amostra proporcional de tamanho 8 e calcular a renda média familiar dessa localidade. Como estratificar? Comparar os resultados. Qual a melhor técnica á luz dos resultados? Estratos da idade: 20 a 35, 36 a 51 e de 52 a 67 anos. Estratos de renda familiar: R$ 700 a R$ 1.250, R$ 1.251 a R$ 1.801 e de R$ 1.802 a R$ 2.352. 21 Módulo 2 – Tabelas Estatísticas Normas de apresentação tabular Inicialmente, deve-se destacar que as normas abordadas a seguir baseiam-se nas recomendações da Associação Brasileira de Normas Técnicas – ABNT, assim como no que é sugerido na publicação Normas de Apresentação Tabular (3ª Edição), elaborada pelo Instituto Brasileiro de Geografia e Estatística – IBGE, datada de 1993. As Normas de Apresentação Tabular fixam conceitos e procedimentos aplicáveis à elaboração de tabelas de dados numéricos, de modo a garantir clareza das informações apresentadas. Conceito de Tabela Segundo o IBGE, tabela é uma “Forma não discursiva de apresentar informações das quais o dado numérico se destaca como informação central.” Ele “adotou o princípio básico de que a informação central de uma tabela é o dado numérico e que todos os outros elementos que a compõem têm a função de complementá-lo.” (IBGE, 1993). Dessa forma, a apresentação tabular deve apresentar os dados de forma sintética, facilitando sua leitura e a interpretação correta do fenômeno analisado. Uma tabela deve apresentar os dados de modo resumido e seguro, oferecendo uma visão geral do comportamento do fenômeno. Elementos de uma tabela Uma tabela é constituída dos seguintes elementos: Título Cabeçalho Linhas, colunas e células Fonte e Notas Tabela 4 - Evolução anual do saldo de emprego formal, por ← Título região – Brasil, Ceará e RMF – 2000 – 2008 ← Cabeçalho Linhas, Centro da Colunas, Tabela Células Fonte: CAGED-MTE. ← Fonte (1): Dados referentes a jan-set/08. ← Nota específica Ano Brasil Ceará RMF 2000 657.596 17.779 11.504 2001 591.079 17.081 10.251 2002 762.414 30.831 13.547 2003 645.433 18.645 14.773 2004 1.523.276 31.240 22.636 2005 1.253.981 30.875 25.110 2006 1.228.686 33.560 21.969 2007 1.617.392 39.722 30.056 2008 1 2.086.570 38.655 30.685 22 Na elaboração de uma tabela identificam-se espaços e elementos. Espaços de uma tabela 1. Topo - espaço superior de uma tabela destinado ao seu número e ao seu título. 2. Centro - espaço central de uma tabela destinado à moldura, aos dados numéricos e aos termos necessários à sua compreensão. É o espaço que contém as informações sobre o fenômeno observado. No centro identificam-se quatro espaços menores: cabeçalho, coluna, linha e célula. 3. Espaço do cabeçalho - espaço superior do centro de uma tabela destinado à indicação do conteúdo das colunas. 4. Coluna - espaço vertical do centro de uma tabela destinado aos dados numéricos (coluna de dados numéricos) e aos indicadores de linha (coluna indicadora, normalmente a primeira à esquerda). 5. Linha - espaço horizontal do centro de uma tabela destinado aos dados numéricos. 6. Célula – espaço mínimo do centro de uma tabela, resultante do cruzamento de uma linha com uma coluna, destinado ao dado numérico ou ao sinal convencional. 7. Rodapé – espaço inferior de uma tabela destinado à fonte, à nota geral e à nota específica. Elementos de uma tabela 1. Dado numérico – quantificação de um fato específico observado. 2. Número - identificador numérico de uma tabela em um conjunto de tabelas. 3. Título – conjunto de termos indicadores do conteúdo de uma tabela. É a indicação que precede a tabela e contém a identificação de três fatores do fenômeno. A época a qual se refere O local onde ocorreu oevento O fenômeno que é descrito De outra forma, o título é o enunciado que vem acima da tabela, descrevendo o seu conteúdo, em que são destacados: 1. o fenômeno a ser descrito; 2. a sua periodicidade, e 3. a sua abrangência geográfica. 4. Moldura - conjunto de traços estruturadores dos dados numéricos e dos termos necessários à sua compreensão. 23 5. Cabeçalho - conjunto de termos indicadores do conteúdo das colunas indicadoras e numéricas. 6. Indicador de linha - conjunto de termos indicadores do conteúdo de uma linha. 7. Classe de freqüência - cada um dos intervalos não superpostos em que se divide uma distribuição de frequência. 8. Sinal convencional - representação gráfica que substitui o dado numérico (símbolo). 9. Fonte – identificador do responsável (pessoas física ou jurídica) ou responsáveis pelos dados numéricos. É a indicação da(s) entidade(s) responsável(eis) pelo levantamento dos dados, ou seja, a(s) instituição(es) que produziu(ram) a base de dados constante na tabela. 10. Nota geral - texto esclarecedor do conteúdo geral de uma tabela. 11. Nota específica - texto esclarecedor de algum elemento específico de uma tabela. 12. Chamada – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica. 13. Unidade de medida - termo indicador da expressão quantitativa ou metrológica dos dados numéricos. Elaboração de uma tabela A seguir são apresentadas algumas normas a serem levadas em consideração quando da elaboração de tabela, segundo o IBGE. 1. Número Uma tabela deve ter número, inscrito no seu topo, sempre que um documento apresentar duas ou mais tabelas, para identificá-la, possibilitando sua localização. Quando for apenas uma tabela, a numeração é dispensável. A identificação de uma tabela deve ser feita com algarismos arábicos, de modo crescente, precedidos da palavra Tabela, podendo ser subordinada ou não a capítulos ou seções de um documento. Ex: Tabela 4 – identifica a quarta tabela de um documento. Tabela 3.5 – identifica a quinta tabela do terceiro capítulo de um documento. Tabela 5.8 – identifica a oitava tabela do quinto capítulo de um documento. 24 2. Título Toda tabela deve ter título, inscrito no topo, para indicar a natureza e as abrangências geográfica e temporal dos dados numéricos. A natureza dos dados numéricos refere-se ao tipo do dado numérico (absoluto ou relativo) e do fato específico observado. No caso de uma tabela que contenha apenas dados numéricos absolutos, é dispensável expressar o tipo. A abrangência geográfica compõe-se do nome próprio do espaço geográfico de referência dos dados numéricos e a abrangência temporal, do ponto no tempo ou da série temporal de referência dos mesmos dados. As indicações da natureza e da abrangência geográfica dos dados numéricos devem ser feitas sem abreviações, por extenso, e de forma clara e concisa. Ex: Variação estadual do emprego formal e do Produto Interno Bruto – Nordeste – 2000 – 2008 Produção de cera de carnaúba, por município, em 2004 e 2007, no Ceará. Produção de cera de carnaúba, por município – Estado do Ceará – 2004/2007 População ocupada, por gênero, segundo as faixas de renda do trabalho principal – Brasil – 2007 Distribuição dos empregos gerados por empresas, segundo as formas de contratação – Regiões Metropolitanas – 2002, 2004 e 2006 Evolução mensal dos índices de preços reais de alguns produtos básicos da América Latina e Caribe – 2005 - 2008 3. Moldura Toda tabela deve ter moldura, inscrita no centro, para estruturar os dados numéricos e termos necessários à sua compreensão. Essa estruturação deve ser feita com, no mínimo, três traços horizontais paralelos, em que o primeiro é para separar o topo, o segundo para separar o cabeçalho e o terceiro, o rodapé. Ilustração dos elementos de uma tabela: 25 Numeração e título da tabela Cabeçalho da coluna indicadora Cabeçalho da coluna numérica 1 Cabeçalho da coluna numérica 2 Indicador de linha Células com dados numéricos Indicador de linha Células com dados numéricos Indicador de linha Células com dados numéricos Fonte: Nota geral: Chamada/Nota específica Obs: As três linhas horizontais mais escuras constituem a moldura da tabela. Quando, em uma tabela, houver necessidade de se destacar parte do cabeçalho ou parte dos dados numéricos, estes devem ser estruturados com um ou mais traços verticais paralelos adicionais. Tabela 7 – Preço médio de produto segundo o Índice Nacional de Preços ao Consumidor – INPC, na Região Metropolitana de Belém – Jun/Dez 2000/Jun/Dez 2008 Produto Unidade de medida Preço médio (R$) 2000 2008 Junho Dezembro Junho Dezembro Açucar Kg Alface Unidade Tomate Kg Fonte: IBGE, Diretoria de Pesquisas de Índices de Preços, Sistema Nacional de Índices de Preço ao Consumidor. A moldura de uma tabela não deve ter traços verticais que a delimitem à esquerda e à direita. Quando delimitada passa a ser um quadro. 4. Cabeçalho Toda tabela deve ter um cabeçalho, inscrito no espaço do cabeçalho, para indicar, complementarmente ao título, o conteúdo das colunas. No cabeçalho são listadas/denominadas as variáveis que compõem cada uma das colunas que integram uma tabela, qualificando o conteúdo de todas elas (colunas), o que deve ser feito com palavras ou com notações, de forma clara e concisa. O IBGE recomenda que a indicação com palavras seja feita por extenso, sem abreviações. 5. Indicador de linha Toda tabela deve ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao título, o conteúdo das linhas. 26 A indicação do conteúdo das linhas deve ser feita com palavras ou com notações, de forma clara e concisa. O IBGE recomenda que a indicação com palavras seja feita por extenso, sem abreviações. 6. Unidade de medida Uma tabela deve ter unidade de medida, inscrita no espaço do cabeçalho ou nas colunas indicadoras, sempre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica dos dados numéricos. Ex: (m) ou (metro); (t) ou (tonelada); (R$ 1.000) ou (1.000 Reais); (hab/km 2 ) ou (habitantes por quilometro quadrado); (l/s) ou (litros por segundo); (%) ou (percentual); (Kg/ha) ou (quilogramas por hectare); (m 3 /s) ou (metros cúbicos por segundo) etc. (1.000 t) – indica dados numéricos em toneladas que foram divididos por 1.000. (R$ 1.000) - indica dados numéricos em Reais que foram divididos por 1.000. (%) - indica dados numéricos proporcionais a 100. 7. Dado numérico Toda tabela deve ter dados numéricos, inscritos em células, para informar a quantificação de um fato específico observado e a informação dessa quantificação deve ser dada em algarismos arábicos. 8. Sinal convencional Segundo o IBGE, uma tabela deve ter sinal convencional, inscrito em uma célula, sempre que houver necessidade de se substituir um dado numérico. Por exemplo: a) – Dado numérico igual a zero não resultante de arredondamento; b) .. Não se aplica dado numérico; c) ... Dado numérico não disponível. Não se tem acesso ao dado; d) x Dado numérico omitido afim de evitar a individualização da informação; e) ? Quando temos dúvidas quanto à exatidão de determinado valor; f) 0; 0,0 ou 0,00 etc. Dado igual a zero resultante de arredondamento de um dado numérico originalmente positivo; g) -0; -0,0 ou -0,00 etc. Dado igual a zero resultante de arredondamento de um dado numérico originalmente negativo. 27 9. Chamada Uma tabela deve ter chamada, inscrita em qualquer de seus espaços, sempre que houver necessidade de se remeter algum de seus elementos a uma nota específica. A remissiva atribuída a algum dos elementos de uma tabela deve ser feita com algarismos arábicos em destaque: entre parênteses, entre colchetes, exponencial. E quando houver mais de uma chamada na mesma tabela, estas devem ser distribuídas sucessivamente, de cima para baixo e da esquerda para a direita, em ordem crescente de numeração. 10. Fonte Toda tabela deve ter fonte, inscrita a partir da primeira linha do seu rodapé, para identificar o responsável (pessoa física ou jurídica) ou responsáveis pelos dados numéricos. Esta identificação deve ser feita com palavras, preferencialmente por extenso, e precedida da palavra Fonte ou Fontes. É recomendado que, em tabelas com dados numéricos extraídos de um documento, a identificação da fonte indique a referência bibliográfica do documento. No caso de publicação que contenha tabelas com dados numéricos de uma única fonte, já identificada na própria publicação, é dispensável a apresentação da fonte nas tabelas. 11. Nota geral Uma tabela deve ter nota geral, inscrita no seu rodapé, logo após a fonte, sempre que houver necessidade de se esclarecer o seu conteúdo geral. Esse esclarecimento deve ser feito de forma clara e concisa e ser precedido da palavra Nota ou Notas. 12. Nota específica Uma tabela deve ter nota específica, inscrita no seu rodapé, logo após a nota geral, quando esta existir, sempre que houver necessidade de se esclarecer algum elemento específico da tabela. Esse esclarecimento deve ser feito de forma clara e concisa, sendo precedido da respectiva chamada. Quando uma tabela contiver mais de uma nota específica, estas devem ser distribuídas obedecendo à ordem de numeração das chamadas, separando-se um das outras por um ponto. 28 Apresentação de períodos de tempo A apresentação de pontos no tempo deve obedecer a Norma ABNT – NB 113 – Normas para datar. 1. Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus pontos inicial e final, ligados por um hífen ( - ). Ex: 2004 – 2008 → apresenta dados numéricos para os anos de 2004, 2005, 2006, 2007 e 2008. MAR 2009 – JUN 2009 → apresenta dados numéricos para os meses de março, abril, maio e junho de 2009. 1º trimestre 2008 – 3º trimestre 2008 → apresenta dados numéricos para o 1º, 2º e 3º trimestres de 2008. 2. Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por seus pontos inicial e final, ligados por uma barra ( / ). Ex: 2005/2008 → apresenta dados numéricos para os anos de 2005 e 2008. 30.05.2009/06.06.2009 → apresenta dados numéricos para os dias 30 de maio e 6 de junho de 2009, não sendo apresentados dados numéricos de pelo menos um dos dias desta série temporal. 1º semestre 2007 / 1º semestre 2009 → apresenta dados numéricos para o 1º semestre de 2007 e para o 1º semestre de 2009, não sendo apresentados dados numéricos de pelo menos um dos semestres desta série temporal. No caso de uma série temporal não consecutiva que contenha um reduzido número de pontos, esta série pode ser apresentada por todos os seus pontos, separados por vírgula. Ex: 2004, 2006, 2008 → apresenta dados numéricos para os anos de 2004, 2006 e 2008. MAR 2007, MAR 2008, MAR 2009 → apresenta dados numéricos para o mês de março dos anos 2007, 2008 e 2009. Quando uma tabela contiver dados numéricos de um período anual diferente do ano civil (jan-dez), isto deve ser indicado no título, em nota geral ou nota específica. 29 Ex: Tabela 4 - Evolução anual do saldo de emprego formal, por região – Ceará e RMF – 2000 – 2008 Fonte: MTE/CAGED. (1) Dados referentes a jan-set/08. Apresentação de classe de frequência Toda classe de frequência deve ser apresentada, em uma tabela, sem ambigüidade, por extenso ou com notação. Toda classe de frequência que inclui o extremo inferior do intervalo (w) e exclui o extremo superior (z) deve ser apresentada de uma das seguintes formas: a) w a menos de z b) w |― z Ex: Tabela 2.5 – Estabelecimentos comerciais segundo o número de empregados – Ceará e RMF – 2008 Fonte: Fictícia. Toda classe de frequência que exclui o extremo inferior do intervalo (w) e inclui o extremo superior (z) deve ser apresentada de uma das seguintes formas: a) mais de w a z b) w ―| z Ano Ceará RMF 2000 17.779 11.504 2001 17.081 10.251 2002 30.831 13.547 2003 18.645 14.773 2004 31.240 22.636 2005 30.875 25.110 2006 33.560 21.969 2007 39.722 30.056 2008 1 38.655 30.685 Nº Empregados Ceará RMF 1 |― 10 2.000 1.200 10 |― 20 1.500 1.000 20 |― 30 1.000 800 30 |― 50 500 340 50 |― 100 400 300 100 e mais 350 200 30 Ex: Tabela 6 – Estoque de emprego segundo a jornada semanal de trabalho dos comerciários – RMF - 2008 Fonte: Fictícia Nota: Em 1.000 empregados. Toda classe de frequência que inclui ambos os extremos ao intervalo (w e z) deve ser apresentada de uma das seguintes formas: a) w a z b) w |―| z Tabela 6 – Pessoas ocupadas de 10 anos ou mais de idade, segundo o tempo de permanência no trabalho, por gênero – RMF - 2007 Fonte: IBGE, PNAD 2007. Nota: Números referentes ao trabalho principal. É recomendado que as classes inicial e final de uma distribuição de frequência, em uma tabela, sejam fechadas, evitando-se as expressões até z, menos de z, w ou mais e mais de w. Jornada Ceará RMF 0 ―| 10 250 150 10 ―| 20 600 450 20 ―| 30 800 600 30 ―| 40 1.500 1.000 40 ―| 48 2.000 1.200 Mais de 48 350 280 Tempo de permanência Gênero Homens Mulheres Até 5 meses 93.862 89.158 6 a 11 meses 65.581 53.224 1 ano 101.961 96.793 2 a 4 anos 203.046 176.510 5 a 9 anos 146.197 107.346 10 anos ou mais 234.214 170.461 Total 844.861 693.492 31 Diagramação de uma tabela Toda tabela deve ser elaborada de forma a ser apresentada em uma única página. Toda tabela que ultrapassar, em número de linhas e/ou de colunas, as dimensõesde uma página deve ser apresentada em duas ou mais partes. Toda tabela que ultrapassar a dimensão de uma página em número de linhas e tiver poucas colunas, pode ter o centro apresentado em duas ou mais partes, lado a lado, na mesma página, separando-se as partes por um traço vertical duplo e repetindo-se o cabeçalho. Tabela 1 – Crescimento populacional dos municípios do Ceará – 2000 - 2007 Fonte: IBGE. Toda tabela que ultrapassar a dimensão de uma página em número de colunas e tiver poucas linhas, pode ter o centro apresentado em duas ou mais partes, uma abaixo da outra, na mesma página, separando-se as partes por um traço horizontal duplo e repetindo-se o cabeçalho das colunas indicadoras e os indicadores de linha. Município Taxa (%) 6 7 8 9 10 Município Taxa (%) 1 2 3 4 5 32 Tabela 8 – Pessoas residentes em domicílios particulares, segundo o estado conjugal, por Microrregião – Estado do Ceará – 2000 Fonte: IBGE. Toda tabela que ultrapassar as dimensões de uma página deve obedecer ao que se segue: a) cada página deve ter o conteúdo do topo e o cabeçalho da tabela ou o cabeçalho da parte; b) cada página deve ter uma das seguintes indicações: continua, para a primeira; conclusão, para a última e continuação, para as demais. c) Cada página deve ter colunas indicadoras e seus respectivos cabeçalhos; d) O traço horizontal da moldura que separa o rodapé deve ser apresentado somente na página que contenha a última linha da tabela; e) O conteúdo do rodapé só deve ser apresentado na página de conclusão. Exercícios: 1. Segundo o CAGED, Registro Administrativo do Ministério do Trabalho e Emprego, os números mensais de empregos gerados no Ceará e na RMF, em jan-abr/08 e jan- abr/09, foram os seguintes: Estado do Ceará Jan2008 = -4.905 fev2008 = -1.543 mar2008 = 2.973 abr2008 = 885 Jan2009 = -6.861 fev2009 = -473 mar2009 = 1.372 abr2009 = 3.230 Microrregião Casado Solteiro Separado 1 2 3 4 5 Microrregião Desquitado Viúvo Total 6 7 8 9 10 33 RMF Jan2008 = -1.025 fev2008 = 1.232 mar2008 = 3.622 abr2008 = 2.234 Jan2009 = -2.983 fev2009 = 1.270 mar2009 = 430 abr2009 = 2.503 a) Dispor esses números em uma tabela, observando todas as exigências requeridas pelas normas de tabulação. b) Quais as principais conclusões a que se pode chegar sobre a evolução do emprego formal no estado e na RMF nos primeiros meses do ano? 2. Segundo a Pesquisa Mensal do Comércio (IBGE), as taxas de variação mensal do volume de vendas no comércio varejista de três estados brasileiros foram as seguintes: Bahia: Nov2008 = 7,7 dez2008 = 3,9 jan2009 = 2,8 fev2009 = 4,0 mar2009 = 1,3 Ceará: Nov2008 = 6,5 dez2008 = 6,4 jan2009 = 4,3 fev2009 = 8,5 mar2009 = 12,0 Pernambuco: Nov2008 = 3,1 dez2008 = -0,4 jan2009 = 4,1 fev2009 = 0,5 mar2009 = -0,6 a) Dispor esses números em uma tabela, observando todas as exigências requeridas pelas normas de tabulação. b) Quais as principais conclusões a que se pode chegar sobre a evolução do emprego formal no estado e na RMF nos primeiros meses do ano? 3. A Relação Anual de Informações Sociais, do Ministério do Trabalho e Emprego, apresenta números do total de empregos formais existentes no país. Em 2008 e 2009, estes números foram os seguintes. Brasil: 39.441.566 e 41.207.546; Sudeste: 20.386.019 e 21.098.135; Nordeste: 6.408.699 e 6.859.911; Sul: 6.802.842 e 7.078.443 C. Oeste: 3.223.987 e 3.417.517; Norte: 2.620.019 e 2.753.540 Elaborar uma tabela contendo todos os valores trabalhados no exercício, com todos os elementos exigidos pelas normas estatísticas. Qual foi a participação de cada região no total de empregos do país, em cada ano? Qual foi a taxa de crescimento do emprego de cada região nesse período? Onde ele cresceu mais rápido? Pode-se afirmar que o emprego no Nordeste cresceu duas vezes mais rápido do que no Sudeste? Por que? Pode-se afirmar que, em termos do emprego formal, o Centro Oeste tem uma participação inferior a da região Norte? 34 SÉRIES ESTATÍSTICAS Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Assim, numa série estatística observamos a existência de três elementos: o tempo, o local e a espécie. De acordo como variem os elementos da série estatística, ela pode ser classificada em histórica, geográfica e específica. 1. Séries históricas, temporais ou cronológicas Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Tabela 4 - Evolução anual do saldo de emprego formal, na RMF – 2000 – 2009 Fonte: MTE/CAGED. Fato (saldo de emprego): constante. Local (RMF): constante. Tempo (anos): variando de 2000 a 2009. Por isso a série e temporal. Tabela 7.3 – População residente no Estado do Ceará – 2001 – 2008 (Em 1.000 pessoas) Fonte: IBGE - PNAD 2001 – 2007. Fato (população residente): constante. Local (Estado do Ceará): constante. Tempo (anos): variando de 2001 a 2008. Por isso a série e temporal. Ano RMF 2000 11.504 2001 10.251 2002 13.547 2003 14.773 2004 22.636 2005 25.110 2006 21.969 2007 30.056 2008 37.259 2009 46.733 Ano População 2001 7.646 2002 7.763 2003 7.880 2004 7.999 2005 8.117 2006 8.238 2007 8.358 2008 8.472 35 2. Séries geográficas, espaciais ou territoriais Descrevem os valores da variável, em determinado instante, discriminando segundo regiões. Tabela 2.5 – População desocupada, por áreas selecionadas - 2007 Fonte: IBGE - PNAD 2007. Fato (população desocupada); constante. Tempo (2007): constante. Local: variando entre estado, área metropolitana e não metropolitana. Por isso a série e geográfica. Tabela 4.5 - Saldo de emprego formal, por região – Brasil - Jan-mar/09 Fonte: Ministério do Trabalho e Emprego – CAGED. 3. Séries específicas ou categóricas Descrevem os valores da variável,em determinado tempo e local, discriminando segundo especificações ou categorias. Tabela 3 – Empregos formais gerados, por setor de atividade – Estado do Ceará – 1977 – 1999 Fonte: Ministério do Trabalho e Emprego – CAGED. Predomina a discriminação por categorias ou especificações. Região Pop. Desocupada Estado do Ceará 285.672 Área metropolitana de Fortaleza 197.180 Área não-metropolitana 88.492 Região Saldo de emprego Norte -21.399 Nordeste -81.223 Sudeste -31.316 Sul 34.995 Centro-Oeste 41.192 Brasil -57.751 Setor de atividade 1997-1999 Extrativa Mineral 253 Ind. Transformação 9.517 Serv. Ind. Útil. Pública -1.686 Construção Civil -2.713 Comércio 842 Serviços -1.488 Administração Pública -1.629 Agropecuária -645 Outros -57 Total 2.394 36 4. Séries conjugadas (Tabelas de dupla entrada) Em várias ocasiões, há a necessidade de apresentar, em uma única tabela, a variação de valores de mais de mais de uma variável (conjugação de duas ou mais séries). Assim, temos uma tabela de dupla entrada. Em tabelas de dupla entrada são criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). São séries que permitem variar simultaneamente o tempo, o lugar e o fato, havendo duas ou mais ordens de clasificação: uma horizontal outra vertical. Podem existir séries (tabelas) compostas de três ou mais entradas. Ex: Tabela 5.7 – Evolução da arrecadação do ICMS – Nordeste - 2007/2008 Fonte: CONFAZ (Elaboração IPEA). Série geográfica e temporal. Tabela 4.2 – Estoque de emprego formal, no Ceará, por setor de atividade, no biênio 2006 - 2007 Fonte: Ministério do Trabalho e Emprego – RAIS. Série específica e temporal. Estado 2007 2008 Variação (%) Maranhão 2.003.109 2.350.325 17,33 Piauí 1.176.108 1.402.557 19,25 Ceará 3.917.618 4.719.283 20,46 R. G. do Norte 2.006.233 2.052.737 2,32 Paraíba 1.677.914 1.927.355 14,87 Pernambuco 5.415.683 3.928.998 -27,45 Alagoas 1.401.858 1.614.352 15,16 Sergipe 1.204.150 1.340.654 11,34 Bahia 8.940.621 10.238.561 14,52 Nordeste 27.743.294 29.574.824 6,60 Setor de Atividade 2006 2007 Var. Abs. Var. Rel. Ext. Mineral 2.359 2.448 89 3,77% Ind. Transformação 195.288 208.149 12.861 6,59% Serv. Ind. Útil. Pub. 8.232 6.776 -1.456 -17,69% Construção Civil 34.666 38.020 3.354 9,68% Comércio 141.237 155.512 14.275 10,11% Serviços 277.858 285.363 7.505 2,70% Adm. Pública 307.475 339.048 31.573 10,27% Agropecuária 22.375 24.076 1.701 7,60% Total 989.490 1.059.392 69.902 7,06% 37 Tabela 4 - Indicadores trimestrais de volume de vendas do comércio varejista – Brasil – 2007/2008 Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Serviços e Comércio 1. As taxas trimestrais têm como referencia igual trimestre do ano anterior e a taxa anual, os 12 meses do ano anterior. Série específica e temporal. Exemplos diversos para análise e discussão: Tabela 12 – Indicadores macroeconômicos selecionados, no quadriênio 2003 – 2006 - Estado do Ceará Fonte: IBGE e IPECE. Nota: PIB a preços de mercado inclui os impostos líquidos de subsídios. Já o Valor Adicionado exclui os impostos. (1) PIB em R$ milhões. (2) VA em R$ mil. Atividades Taxa Anual 2007 Taxas de desempenho de 2008 1 1º Tri 2º Tri 3º Tri 4º Tri Taxa Anual Comércio varejista 9,1 11,8 9,3 10,2 6,0 9,1 Combustíveis e lubrificantes 5,1 5,2 11,3 13,4 7,5 9,3 Hipermercados, supermercados 6,8 8,5 3,2 4,5 5,2 5,3 Tecidos, vestuário e calçados 10,6 13,3 10,4 7,3 -5,4 4,9 Móveis e eletrodomésticos 15,4 17,3 19,6 17,9 7,7 15,1 Artigos farmacêuticos, médicos etc. 9,0 13,2 12,3 13,5 13,9 13,3 Material escritório, informática etc. 29,5 29,2 32,3 38,6 32,9 33,5 Livros, jornais, revistas e papelaria 7,1 11,5 11,4 9,3 12,0 11,1 Outros artigos de uso doméstico 22,7 28,3 15,7 17,8 6,5 15,6 Indicadores Macroeconômicos 2003 2004 2005 2006 PIB (Valor corrente preços de mercado) 1 32.565 36.866 40.935 46.310 Taxa de crescimento (%) 1,5 5,1 2,8 8,0 Taxa acumulada (%) (2002=100) 1,5 6,7 9,7 18,5 Valor Adicionado (preços básicos) 2 28.668 32.415 36.236 40.597 Taxa de crescimento (%) 1,6 4,8 2,7 7,9 Taxa acumulada (%) (2002=100) 1,6 6,5 9,4 18,0 PIB Per capita (R$) 4.145 4.622 5.055 5.636 38 Tabela 1 – Variação de volume das vendas do comércio varejista ampliado, por unidade da Federação – Brasil – Out. – Dez./08 Fonte: IBGE – PMC. Número-índices são coeficientes frequentemente utilizados para representar os valores observados em vários períodos sucessivos, em que um deles é considerado como base=100. Os números-índices são expressos em termos percentuais e se constituem em uma maneira muito cômoda de se comparar valores estatísticos. Acima de 100 significa crescimento, abaixo significa que houve uma queda. Em algumas situações, a base considerada é a média de alguns valores da série. Exemplificando: Índice do Custo de Vida, Índice de Expectativa das Famílias, Índice Nacional de Preços ao Consumidor etc. 39 Tabela 1.8 – Índice de Confiança da Indústria1 – Brasil – Fev/08 e Nov/08-Fev/09 Discriminação Fev/08 Nov/08 Dez/08 Jan/09 Fev/09 Índice de Confiança da Indústria 113,7 83,9 74,7 75,3 76,3 Índice de Situação Atual 117,0 85,3 76,1 78,1 77,4 Nível de demanda global 115,7 75,2 66,6 72,0 67,7 Nível de estoques 97,6 84,3 80,4 78,2 81,6 Situação dos negócios 123,3 84,5 69,9 72,9 71,3 Índice de Expectativas 110,5 82,5 73,3 72,5 75,2 Situação dos negócios 149,7 95,6 87,7 77,0 85,7 Emprego 118,4 95,6 83,0 82,6 83,4 Produção física 129,3 102,7 90,9 98,3 99,3 Fonte: Fundação Getúlio Vargas – FGV. 1. A média dos últimos 10 anos corresponde a 100. Tabela 5.2 - Taxas de desemprego total, por região metropolitana - Dez/08-Mar/09 Fonte: Fundação SEADE/DIEESE, STDS, IDT. 1. O resultado metropolitano não inclui a RMF. Tabela 5 – Proporção de ocupados no comércio com 16 a 24 anos que estudam e a jornada média semanal dos jovens comerciários – Regiões Metropolitanas e Distrito Federal – 2008 Fonte: DIEESE/Seade/MTE – FAT e parceiros regionais. Pesquisa de Emprego e Desemprego - PED. Obs.: Exclusive os ocupados no comércio que não trabalharam na semana. Região Dez08 Jan09 Fev09 Mar09 Porto Alegre 9,8 10,0 10,4 11,7 São Paulo 11,8 12,5 13,5 14,9 Distrito
Compartilhar