Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA BÁSICA Professor: Narcelio de Araújo Pereira narcelioap@yahoo.com.br 2016 2 SUMÁRIO INTRODUÇÃO ..................................................................................................... 03 UNIDADE 1: A NATUREZA DA ESTATÍSTICA ............................................ 05 UNIDADE 2: POPULAÇÃO E AMOSTRA ....................................................... 12 UNIDADE 3: SÉRIES ESTATÍSTICAS.............................................................. 20 UNIDADE 4: GRÁFICOS .................................................................................... 32 UNIDADE 5: DISTRIBUIÇÃO DE FREQUENCIA ......................................... 49 UNIDADE 6: MEDIDAS DE POSIÇÃO ............................................................. 69 UNIDADE 7: MEDIDAS DE DISPERSÃO OU VARIABILIDADE ............... 97 UNIDADE 8: PROBABILIDADE ..................................................................... 112 UNIDADE 9: DISTRIBUIÇÃO BINOMIAL E NORMAL ............................ 122 UNIDADE 10: CORRELAÇÃO E REGRESSÃO ........................................... 148 REFERENCIAS ................................................................................................... 164 ANEXOS ............................................................................................................... 165 3 INTRODUÇÃO Na antiguidade os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas". Na idade média as informações eram tabuladas com finalidades tributárias e bélicas. No século XVI surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos. No século XVIII a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar "O estudo de como se chegar a conclusão sobre uma população, partindo da observação de partes dessa população (amostra)". Ao longo do século XX, os métodos estatísticos foram desenvolvidos como uma mistura de ciência, tecnologia e lógica para a solução e investigação de problemas em várias áreas do conhecimento humano (Stigler, 1986). Ela foi reconhecida como um campo da ciência neste período, mas sua história tem início bem anterior a 1900. A estatística moderna é uma tecnologia quantitativa para a ciência experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretação de experiências e de observações de fenômenos da natureza e da sociedade. A estatística não é uma caixa-preta, nem bola de cristal, nem mágica. Tampouco é um conjunto de técnicas úteis para algumas áreas isoladas ou restritas da ciência. Por exemplo, ao contrário do que alguns imaginam, a estatística não é um ramo da matemática onde se investigam os processos de obtenção, organização e análise de dados sobre uma determinada população. A estatística também não se limita a um conjunto de elementos numéricos relativos a um fato social, nem a números, tabelas e gráficos usados para o resumo, à organização e apresentação dos dados de uma pesquisa, embora este seja um aspecto da estatística que pode ser facilmente percebido no cotidiano (basta abrir os jornais e revistas para ver o "bombardeio" de estatísticas). Ela é uma ciência multidisciplinar: um mesmo programa de computador que permite a análise estatística de dados de um físico poderia também ser usado por um economista, agrônomo, químico, geólogo, matemático, biólogo, sociólogo, psicólogo e cientista político. Mesmo que as interpretações dessas análises sejam diferentes por causa das diferenças entre as áreas do conhecimento, os conceitos empregados, as limitações das técnicas e as consequências dessas interpretações são essencialmente as mesmas. 4 Segundo Rao (1999), a estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas. 5 I - A NATUREZA DA ESTATÍSTICA A palavra estatística formou-se da mesma raiz latina da palavra Estado (Organização Política): status; porque, originalmente, as estatísticas eram colhidas para as finalidades relacionadas com o Estado (com objetivos militares, tributários, recenseamentos, entre outros). PANORAMA HISTÓRICO Todas as ciências têm suas raízes na história do homem. A Matemática, que é considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico. A estatística, ramo da matemática aplicada, teve origem semelhante. Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíram equitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de "estatísticas". Na idade média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu objetivo com as ciências. As tabelas tornam-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a estatística deixa de ser uma simples catalogação de dados numéricos para se tornar o estudo de como se chegar a conclusão sobre uma população, partindo da observação de partes dessa população (amostra). Atualmente, o público leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errôneos quanto a validade das conclusões estatísticas: ou crê em sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, quer teórica quer prática, ou a conhecem muito superficialmente. Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus processos e técnicas, têm contribuído para a organização dos negócios e recursos do mundo moderno. 6 MÉTODO ESTATÍSTICO O Método Científico Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos. Podemos então dizer que: Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja, ou seja, é um meio mais eficaz para atingir determinada meta. Dos métodos científicos, vamos destacar o Método experimental e o Método estatístico. O Método Experimental - É o método preferido pela física, Química, etc. Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. O Método Estatístico Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. Contudo, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível. Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico. Método estatístico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 7 A ESTATÍSTICA Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos. Podemos dizer, então, que: A Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A Estatística Descritiva se encarrega de fazer a coleta, organização e descrição dos dados. A Estatística Indutiva ou Inferencial se encarrega de fazer a análise e interpretação dos dados. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério da educação, estatísticas dos acidentes de tráfego etc.), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação. Fases do Método estatístico: Podemos distinguir no método estatístico as seguintes fases: 1 – Coleta de Dados Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. A coleta de dados pode ser direta ou indireta. 8 1.1 – Direta: Quando ela é feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico, etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: Contínua (registro): quando feita continuamente, tal como a de nascimentos, óbitos e a frequência dos alunos às aulas; Periódica: quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas; recenseamento demográfico, censo industrial; Ocasional: quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. 1.2 – Indireta: Quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, podemos citar a pesquisa sobre mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 2 – Crítica dos Dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crítica dos dados se divide em: externa e interna Crítica externa – quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas. Crítica interna – quando visa observar os elementos originais dos dados da coleta. 9 3 – Apuração dos Dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. Pode ser manual, eletromecânica ou eletrônica. 4 – Exposição ou Apresentação dos Dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma de tabelas (unidade 3) e gráficos (unidade 4), pois tornam mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas de posição (unidade 6) e medidas de dispersão (unidade 7). 5 – Análise dos Resultados Como já dissemos, o objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as etapas anteriores (estatística descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. A ESTATÍSTICA NAS EMPRESAS No mundo atual, a empresa é uma das vigas-mestras da economia dos povos. A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazo. A estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas. 10 Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantiro bom uso do tempo, da energia e do material e, ainda, para controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origens. O homem de hoje, em suas múltiplas atividades, lança mão de processos e técnicas estatísticas, e só estudando-os evitaremos o erro das generalizações apressadas a respeito de tabelas e gráficos apresentados em jornais, revistas e televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. 11 EXERCÍCIOS 1. Complete: O método experimental é o mais usado por ciências como: ____________________. 2. As ciências humanas e sociais, para obter os dados que buscam, lançam mão de que método? 3. O que é Estatística? 4. Cite as fases do método estatístico. 5. Para você, o que é coletar dados? 6. Para que serve a crítica dos dados? 7. O que é apurar dados? 8. Como podem ser apresentados ou expostos os dados? 9. As conclusões, as inferências pertencem a que parte da Estatística? 10. Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária. 11. O método estatístico tem como um de seus fins: a) Estudar os fenômenos estatísticos. b) Estudar qualidades concretas dos indivíduos que formam grupos. c) Determinar qualidades abstratas dos indivíduos que formam grupos. d) Determinar qualidades abstratas de grupos de indivíduos. e) Estudar fenômenos numéricos. 12 II – POPULAÇÃO E AMOSTRA 1 – VARIÁVEL A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: - para um fenômeno “sexo” são dois os resultados possíveis: masculino e feminino; - para o fenômeno “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0,1,2,3,....,n; - para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável: é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Uma variável é qualquer característica de um elemento observado (pessoa, objeto ou animal). Algumas variáveis, como sexo e designação de emprego, simplesmente enquadram os indivíduos em categorias. Outras, como altura e renda anual, tomam valores numéricos com os quais podemos fazer cálculos. Uma variável pode ser: qualitativa ou quantitativa Qualitativa: quando seus valores são expressos por atributos; ex.: sexo (masculino ou feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.; Quantitativa: quando seus valores são expressos em números; ex.: salários dos operários, idade, altura, etc. Divide-se em discreta e contínua: Discreta ou descontínua: seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex.: número de alunos de uma escola que pode assumir qualquer um dos valores do conjunto N = {1, 2, 3, ..., 58,...}, mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Contínua: resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: peso dos alunos de uma escola, pois um aluno 13 tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg, dependendo da precisão da medida. De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas. Designamos as variáveis por letras latinas, em geral, as últimas: x, y, z. Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um dado fenômeno. Fazendo uso da letra x para indicar a variável relativa ao fenômeno considerado, temos: x ϵ {2, 3, 5, 8} Exercício resolvido: 1. Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas): a) Cor dos olhos – Qualitativa b) Índice de liquidez nas indústrias Cearenses – Quantitativa contínua c) Produção de café no Brasil – Quantitativa contínua d) Número de defeitos em aparelhos de TV – Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa – Quantitativa contínua f) O ponto obtido em cada jogada de um dado – quantitativa discreta Resolva: 1. Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas): a) Cor dos cabelos b) Número de filhos c) Número de peças produzidas por hora d) Diâmetro de uma peça e) Número de volumes de uma biblioteca f) produção de algodão em um ano 2 – POPULAÇÃO E AMOSTRA Dois conceitos devem estar bem claros: o de população e o de amostra, pois é deles que são extraídos os dados que dão origem às diversas relações estatísticas, como a média, o desvio-padrão, etc., e que, em última análise, possibilitam descreve-las sob os mais diversos aspectos. 14 População: coleção completa de todos os elementos que são objeto de um estudo; conjunto de entes portadores de, pelo menos, uma característica comum. A população estatística também é conhecida como universo estatístico. Exemplo: pessoas que possuem automóvel. Amostras: são subconjuntos finitos representativos de uma dada população. Exemplo: pessoas que possuem automóvel da marca Fiat. Censo: É a contagem geral de todos os integrantes da mesma espécie, (população) de determinada área geográfica, seja uma cidade, uma região ou um país. A amostra deve ser representativa da população da qual foi extraída, ser parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois princípios básicos: Deve ser suficientemente grande; Seus constituintes devem ter sido selecionados ao acaso. 3 – AMOSTRAGEM Conceito: é uma técnica especial para recolher amostras que garante, tanto quanto possível, o acaso na escolha. É o processo criterioso de escolha da amostra, constituindo a parte inicial de qualquer estudo estatístico. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito importante, pois, como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população. Veremos, a seguir, três das principais técnicas de amostragem. 3.1 – Amostragem casual ou aleatória simples Esta técnica de amostragem é equivalente a um sorteio lotérico: Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando- se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, K números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: 15 Numeramos os alunos de 01 a 90 (população); Colocamos os noventa números, em pedaços iguais de um mesmo papel, dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, 9 números que representarão a amostra. Neste caso, 10% desta população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela – Tabela de Números Aleatórios -, construída de modo que os dez algarismos (de 0 a 9)são distribuídos ao acaso nas linhas e colunas (ver anexo). Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice versa), verticalmente (de cima para baixo ou vice versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. Assim, para o nosso exemplo, considerando a 18ª linha, tomamos os números de dois algarismos (tantos algarismos quantos formam o maior número da população), obtendo: 63 08 66 01 46 22 33 01 54 51 13 47 81 Evidentemente, será abandonado um numeral que já tenha aparecido. Temos, então: 63 08 66 01 46 22 33 54 51 Medindo as alturas dos alunos correspondentes aos nove números sorteados, obtemos uma amostra de 10% das estaturas dos noventa alunos. 3.2 – Amostragem proporcional estratificada Muitas vezes a população se divide em subpopulações – estratos Como é provável, que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência de estratos, obtém elementos da amostra proporcional ao número de elementos desses estratos. 16 Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do exemplo anterior, supondo que dos 90 alunos, temos 54 meninos e 36 meninas. São, portanto, dois estratos, (sexo masculino e sexo feminino). Temos: SEXO POPULAÇÃO 10 % AMOSTRA MASCULINO 54 10 x 54 = 5,4 100 5 FEMININO 36 10 x 36 = 3,6 100 4 TOTAL 90 10 x 90 = 9 100 9 Resolva: 1. Pesquise o peso de seus colegas de classe (incluindo o seu) e retire uma amostra de 30% da população. Sugestão: Use a tabela de Tabela de Números Aleatórios (5ª e 6ª colunas, de baixo para cima). 2. Pesquise a estatura de seus colegas de classe (incluindo o seu) e retire uma amostra de 15% da população. Sugestão: Use a tabela de Tabela de Números Aleatórios (25ª linha, da esquerda para a direita). 3 – Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. Obtenha uma amostra de 40 alunos e preencha o quadro a seguir. 17 3.3 – Amostragem sistemática Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os números de uma rua, uma linha de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma amostra formada por 20 casas para uma pesquisa de opinião. Neste caso, podemos usar o seguinte procedimento: Como 500/20 = 25, escolhemos por sorteio casual um número de 01 a 25; Este número indicará a primeira casa da amostra, vamos supor a casa de número 6; Os demais elementos da amostra seriam considerados de 25 em 25; Assim, as demais casas da amostra seriam as casas de números 31 (6+25), 56 (31+25), 81 (56+25), etc. EXERCÍCIOS 1 – Uma escola abriga 824 alunos. Obtenha uma amostra correspondente a 1% da população. Sugestão: Use a 8ª coluna, a partir da 1ª linha, da Tabela de Números Aleatórios (de cima para baixo). 2 – Em uma escola há oitenta alunos. Obtenha uma amostra de doze alunos. Sugestão: Use a Tabela de Números Aleatórios (escolha a linha e a coluna). 3 – Identifique o tipo de amostragem utilizada em cada situação: simples ao acaso, sistemática ou proporcional estratificada. a) Dentre 240 pessoas escaladas para um sorteio de júri, 120 são brancas, 80 são negras e 40 são morenas. b) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas da fila. c) O sorteio de um livro dentre os 40 alunos de Estatística de uma turma do IFCE. 18 4 – Uma empresa tem 3.414 colaboradores repartidos nos seguintes departamentos: Administração (914), Transporte (348), Produção (1401) e Outros (751). Deseja-se extrair uma amostra entre os colaboradores para verificar o grau de satisfação em relação à qualidade da refeição servida no refeitório. Retire uma amostra de: a) 10% colaboradores? b) 854 colaboradores desta empresa. 5 – O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. 6 – Uma amostra de 32 elementos foi retirada de uma população de 2432 elementos. Na ordenação geral, qual dos elementos abaixo pertence à amostra, sabendo-se que o elemento de ordem 1420 a ela pertence? 72º; 290º; 725º; 2025º; 1648º; 1120º. 7 – Uma população se encontra dividida em quatro estratos, com tamanhos 90N1 , 120N2 , 60N3 e 480N4 . Ao se realizar uma amostragem proporcional estratificada, doze elementos compõem a amostra do primeiro estrato. Qual o número de elementos desta amostra dos outros estratos? 8 – Uma cidade X apresenta o seguinte quadro relativo às suas escolas de ensino fundamental: ESCOLAS Nº DE ESTUDANTES MASCULINO FEMININO A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 876 955 Obtenha uma amostra proporcional estratificada de 120 estudantes. 19 9 – Uma Grande Faculdade coletou as seguintes informações sobre seus estudantes de graduação: CURSO HOMENS MULHERES 18 a 25 anos Acima de 26 anos 18 a 25 anos Acima de 26 anos Contabilidade 55 75 38 41 Finanças 35 39 60 39 Marketing 69 50 51 52 Administração 40 46 28 68 Estatística 50 53 56 28 Computação 60 77 48 42 Total 309 340 281 270 Retire uma amostra proporcional estratificada de 20% dos alunos. 20 III - SÉRIES ESTATÍSTICAS TABELAS Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. Depois dos dados organizados, faz-se necessário que essas informações sejam apresentadas em formato de tabelas, pois irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. TABELA: é um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. Uma tabela compõe-se de: corpo, cabeçalho, colunaindicadora, linhas, casa ou célula e título. Deste modo, uma tabela deve apresentar o seguinte esquema de representação: 1. Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo; 2. Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas; 3. Coluna indicadora: parte da tabela que especifica o conteúdo das linhas; 4. Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; 5. Casa ou célula: cruzamento de uma coluna com uma linha, destinado a um só número (nunca deve ficar em branco); 6. Título: designação do fato observado, local e época, localizado no topo da tabela. Há ainda que se considerar os elementos complementares, que são a fonte, as notas e as chamadas, colocadas, de preferência, no seu rodapé. Rodapé: espaço reservado, em seguida ao fecho da tabela, para inserção de notas de natureza informativa; Fonte: entidade responsável pelo levantamento dos dados ou pela elaboração da tabela; Notas: são informações de natureza geral, destinada a conceituar ou esclarecer o conteúdo das tabelas, ou indicar a metodologia adotada; 21 Chamadas: informações de natureza específica sobre determinada parte da tabela, destinada a conceituar ou esclarecer dados. De acordo com as normas da Fundação IBGE, nas casas ou células da tabela devemos colocar: Um traço horizontal (-) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito; Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; .....); Obs.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos. SÉRIES ESTATÍSTICAS Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Dividem-se em séries homógradas e conjugadas. Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. 22 a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica, cronológica, marcha ou evolutiva. Preços Médios do Frango em São Paulo – 2003 a 2008 ANOS PREÇO (R$) 2003 2,56 2004 2005 2006 2007 2008 2,64 2,67 2,53 3,20 3,64 b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. Duração Média dos Estudos Superiores - 1994 PAÍSES Nº DE ANOS Itália 7,5 Alemanha 7,0 França 7,0 Holanda 5,9 Inglaterra Menos de 4 Fonte: Revista Veja. c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. Rebanhos Brasileiros - 2006 ESPÉCIES QUANTIDADE Bovinos 205.886.244 Bubalinos 1.156.870 Aves 821.541.630 Suínos 35.173.824 Ovinos 16.019.170 Caprinos 10.401.449 Fonte: IBGE. 23 Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Séries conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfico-temporal. Terminais Telefônicos em Serviço 1991 - 93 FILIAIS 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro-Oeste 713.357 778.925 884.822 Fonte: Ministério das Comunicações. 24 Resolva: 1 – Classifique as séries 25 2 – Procure exemplos de séries estatísticas em jornais e revistas e copie-os, classificando essas séries. 3 - Considere a série abaixo: Vendas de Automóveis no 1º bimestre de 2015 em São Paulo MARCA VENDAS (mil und.) FIAT 17 VW 23 GM 12 TOTAL 52 a) Classifique a série; b) Represente esta série através de gráfico de setores. 4 – Considere a série abaixo: Vendas no Ano de 2014 (em mil unidades) FILIAIS JAN FEV MAR SÃO PAULO 10 15 7 FORTALEZA 8 5 4 RIO DE JANEIRO 12 13 10 TOTAL 30 33 21 a) Classifique a série; b) Represente esta série através de gráfico de colunas; c) Represente esta série através de gráfico de barras; 5 – Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t, oriundas da Arábia Saudita; 10.547.889 t, dos Estados Unidos; e 561.024 t, do Japão. Confeccione a série correspondente e classifique-a, sabendo que os dados acima foram fornecidos pelo Ministério da Fazenda. 26 6 - Complete-a com uma coluna de percentagens com uma casa decimal e faça a compensação, se necessário. DADOS ABSOLUTOS E DADOS RELATIVOS Dados absolutos: são dados resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida. A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. Dados relativos: são os resultados de comparações por quocientes (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. 27 1 – Percentagens Considere a série: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 2014 NÍVEL Nº. DE ALUNOS Fundamental 19286 Ensino médio 1681 Superior 234 TOTAL 21201 Dados fictícios. Calculemos as percentagens dos alunos de cada nível: Fundamental – 19286 x 100 = 90,96 = 91,0 21201 Ensino médio – 1681 x 100 = 7,92 = 7,9 21201 Superior – 234 x 100 = 1,10 = 1,1 21201 Com esses dados, podemos formar uma nova coluna na série em estudo: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 2014 NÍVEL Nº. DE ALUNOS % Fundamental 19286 91,0 Ensino médio 1681 7,9 Superior 234 1,1 TOTAL 21201 100 Dados fictícios. Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão no ensino fundamental, 8 aproximadamente estão no ensino médio e 1 aproximadamente está matriculado no ensino superior. O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo. 28 Resolva: 1 - Complete a tabela abaixo ESCOLAS Nº. DE ALUNOS DADOS RELATIVOS POR 1 POR 100 A 175 0,098 9,8 B 222 C 202 D 362 E 280 F 540 TOTAL 1781 1,000 100,0 2 – ÍndicesOs índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: Índice cefálico = diâmetro transversal do crânio x 100 diâmetro longitudinal do crânio Quociente intelectual = idade mental x 100 idade cronológica Densidade demográfica = população total Superfície (área) Índice econômicos: Produção per capta = valor total da produção população Consumo per capta = consumo do bem população Renda per capta = renda____ população 29 Receita per capta = receita__ população 3 – Coeficientes Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrências). São exemplos de coeficientes: Coeficiente de natalidade = número de nascimentos população total Coeficiente de mortalidade = número de óbitos__ população total Coeficiente educacionais: Coeficiente de evasão escolar = nº. de alunos evadidos__ nº. inicial de matrículas Coeficiente de aproveitamento escolar = nº. de alunos aprovados nº. final de matrículas Coeficiente de recuperação escolar = nº. de alunos recuperados_ nº. de alunos em recuperação 4 – Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1000 etc.) para tornar o resultado mais inteligível. São exemplos de taxas: Taxa de natalidade = Coeficiente de natalidade X 1000 Taxa de mortalidade = Coeficiente de mortalidade X 1000 Taxa de evasão escolar = Coeficiente de evasão escolar X 100 30 Exercício Resolvido: 1 – O estado A apresentou 733.986 matriculados na 1ª série, no início do ano de 2012, e 683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e 412.457 matriculados. Qual o Estado que apresentou maior evasão escolar? A: TEE = (733.986 – 683.816) x 100 = 6,8% 733.986 B: TEE = (436.127 – 412.457) x 100 = 5,4% 436.127 O Estado que apresentou maior evasão escolar foi A. EXERCÍCIOS 1 – Considere a série estatística: SÉRIES ALUNOS MATRIC. % 1º 546 2º 328 3º 280 4º 120 TOTAL 1274 Complete-a, determinando as percentagens com uma casa decimal e fazendo a compensação, se necessário. 2 – Uma escola apresentava, no final do ano, o seguinte quadro: SÉRIES MATRICULAS JANEIRO DEZEMBRO 1º 480 475 2º 458 456 3º 436 430 4º 420 420 TOTAL 1794 1781 a) Calcule a taxa de evasão por série b) Calcule a taxa de evasão da escola 31 3 – Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE): População: 15.957,6 mil habitantes; Superfície: 586.624 Km2; Nascimentos: 292.036; Óbitos: 99.281. Calcule: a) O índice da densidade demográfica; b) A taxa de natalidade; c) A taxa de mortalidade. 32 IV - GRÁFICOS ESTATÍSTICOS 1- Conceito: O gráfico é um método de representação de dados estatísticos em forma visual, por meio de figuras geométricas. Devem corresponder, mas nunca substituir as tabelas estatísticas. É uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais à compreensão que as séries. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica deve obedecer a certos requisitos fundamentais como: Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como traços desnecessários que possam levar o observador a uma análise morosa ou com erros. Deve proporcionar que o observador analise rapidamente o fenômeno apresentado; Clareza – deve proporcionar que o observador tenha uma correta leitura dos valores representativos do fenômeno; Veracidade – deve expressar a verdade sobre o fenômeno em estudo. Uso indevido de Gráficos: Podem trazer uma ideia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas. 2 - Classificação dos gráficos: Os principais gráficos são os Diagramas, Estereogramas, Pictogramas e Cartogramas. 2.1 - Diagramas: São gráficos geométricos dispostos, no máximo, em duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano. São os mais usados na representação de séries estatísticas. Eles podem ser em linhas, em barras horizontais, em barras verticais (colunas), em setores (pizza), e polar. 33 Gráficos em linhas ou lineares O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y). Para exemplificar considere a série: Determinamos, graficamente, todos os pontos da série, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que irá nos dar uma poligonal, que é o gráfico em linha ou em curva correspondente a série do exemplo. 34 São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenos é denominada de área de excesso. Gráficos em colunas ou barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Exemplo: Gráfico em colunas 35 Exemplo: Gráfico em barras 36 NOTAS: Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais; A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica; A distância entre as colunas (ou barras),por questões estéticas, não deverá ser menor que a metade nem maior que os dois terços da largura (ou da altura) dos retângulos. Gráficos em barras ou colunas múltiplas Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 37 Gráficos em setores Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Obs.: As séries temporais geralmente não são representadas por este tipo de gráfico. 38 Gráfico Polar: É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia, a arrecadação da Zona Azul durante a semana, o consumo de energia elétrica durante o mês ou o ano, o número de passageiros de uma linha de ônibus ao longo da semana, etc. O gráfico polar faz uso do sistema de coordenadas polares. Exemplo: Dada a série: PRECIPITAÇÃO PLUVIOMÉTRICA MUNICÍPIO DE PORTO ALEGRE – 1995 MESES PRECIPITAÇÃO (mm) Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 174,8 36,9 83,9 462,7 418,1 418,4 538,7 323,8 39,7 66,1 83,3 201,2 FONTE: IBGE Traçamos uma circunferência de raio arbitrário (damos preferência ao raio de comprimento proporcional à média dos valores da série. Neste caso, Média = 237,3); Construímos uma semirreta partindo de 0 (polo) e com uma escala (eixo polar); Dividimos a circunferência em tantos arcos quantas forem as unidades temporais; Traçamos, a partir do centro 0 (polo), semirretas passando pelos pontos da divisão; 39 Marcamos os valores correspondentes da variável, iniciando pela semirreta horizontal (eixo polar); Ligamos os pontos encontrados com segmentos de reta; Se pretendemos fechar a poligonal obtida, empregamos uma linha interrompida. Assim, para nosso exemplo, temos: PRECIPITAÇÃO PLUVIOMÉTRICA DO MUNICÍPIO DE PORTO ALEGRE - 1995 0 200 400 600 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro FONTE: IBGE 2.2 - Estereogramas: São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. 2.3 - Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser autoexplicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo: 40 41 POPULAÇÃO DO BRASIL 1950 - 1980 ANOS HABITANTES (milhares) 1950 1960 1970 1980 51.944 70.191 93.139 119.071 FONTE: IBGE POPULAÇÃO DO BRASIL 1950 – 1980 1950 1960 1970 1980 Cada símbolo representa 10.000.000 de habitantes FONTE: IBGE Na verdade, o gráfico referente à tabela acima é essencialmente um gráfico em barras; porém, as figuras o tornam mais atrativo, o que, provavelmente, despertará a atenção do leitor para o seu exame. Na confecção de gráficos pictóricos temos que utilizar muita criatividade, procurando obter uma otimização na união da arte com a técnica. 2.4 - Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a. representar os dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados. b. representar dados relativos (densidade) - neste caso, lançamos mão, em geral, de hachuras ou cores. 42 43 EXERCÍCIOS 1 – Represente a série abaixo usando o gráfico em linha: COMÉRCIO EXTERIOR BRASIL – 1984 - 93 ANOS QUANTIDADE (1000t) EXPORTAÇÃO IMPORTAÇÃO 84 141.737 53.988 85 146.351 48.870 86 133.832 60.597 87 142.378 61.975 88 169.666 58.095 89 177.033 57.293 90 168.095 57.184 91 165.974 63.278 92 167.295 68.059 93 182.561 77.813 Fonte: Min. Indústria, Comércio e Turismo. 2 – Represente as tabelas usando o gráfico em colunas: a) ENTREGA DE GASOLINA PARA CONSUMO BRASIL 1988 - 91 ANOS VOLUME (1000m3) 88 9.267,7 89 9.723,1 90 10.121,3 91 12.345,4 Fonte: IBGE. b) PRODUÇÃO BRASILEIRA DE PETRÓLEO 1991 - 93 ANOS QUANT. (1000m3) 91 36.180,4 92 36.410,5 93 37.164,3 Fonte: Petrobrás. 44 3 – Represente as tabelas usando o gráfico em barras: a) PRODUÇÃO DE OVOS NO BRASIL - 1992 REGIÕES QUANT. (1000dúzias) Norte 57.297 Nordeste 414.804 Sudeste 984.659 Sul 615.978 Centro-Oeste 126.345 Fonte: IBGE. b) PRODUÇÃO DE VEÍCULOS DE AUTOPROPUSÃO BRASIL 1993 TIPOS QUANTIDADE Automóveis 1.100.278 Comerciais leves 224.387 Comerciais pesados 66.771 Fonte: ANFAVEA. 4 – Represente as tabelas usando o gráfico de setores: a) ÁREA TERRESTRE BRASIL – 1992 REGIÕES RELATIVA (%) Norte 45,25 Nordeste 18,28 Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Fonte: IBGE. b) PRODUÇÃO BRASILEIRA DE FERRO-GUSA -1993 ESTADO PRODUÇÃO (1000t) Minas Gerais 12.888 Espírito Santo 3.174 Rio de Janeiro 5.008 São Paulo 2.912 Fonte: Instituo Brasileiro de Siderurgia. 45 5 – Represente as tabelas usando o gráfico em colunas múltiplas: PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO BRASIL 1990 - 91 ANOS NATUREZA PRÓPRIOS (%) ALUGADOS (%) CEDIDOS (%) 90 62,7 22,9 14,4 91 70,3 16,5 13,2 Fonte: IBGE. 6 – Segundo o IBGE, no censo realizado no ano de 2000 tínhamos as seguintes populações para os Municípios de São Paulo, Rio de Janeiro, Salvador e Fortaleza (região metropolitana), em milhões de habitantes: São Paulo – 10,4; Rio de Janeiro – 5,8; Salvador – 3,0 e Fortaleza – 2,7. Já no censo de 2010 a população desses Municípios era de: São Paulo – 19,6; Rio de Janeiro – 6,4; Salvador – 3,7 e Fortaleza – 3,3. Baseado nestes dados elabore uma série estatística que contemple os censos populacionais de 2000 e 2010 desses quatro municípios e responda: a) Qual a classificação desta série; b) Represente esta sérieatravés de um gráfico de colunas. 7 – O índice de confiabilidade na economia é um número entre 0 e 100 que mede a confiança dos empresários na economia brasileira. Os gráficos ilustram os valores desses índices para grandes e médios empresários, de outubro de 2002 a outubro de 2003, em dados trimestrais: 46 Analise a veracidade das afirmações seguintes, escrevendo V para verdadeiro e F para falso, acerca dos índices de confiabilidade na economia brasileira dos grandes e médios empresários, representados no gráfico anterior. O crescimento e decrescimento citados nas afirmações são relativos ao trimestre anterior. a) ( ) O índice dos médios empresários sempre cresceu, de janeiro a outubro de 2003. b) ( ) Quando o índice dos médios empresários cresceu, ocorreu o mesmo com o índice dos grandes empresários. c) ( ) Quando o índice dos grandes empresários cresceu, o índice dos médios empresários decresceu. d) ( ) O índice dos grandes empresários sempre foi superior ao índice dos médios empresários. e) ( ) Em outubro, o crescimento percentual do índice dos grandes empresários foi igual ao dos médios empresários. 8 – O gráfico indica o resultado de uma pesquisa sobre o número de acidentes ocorridos com motoristas de taxi em uma determinada cidade, no período de um ano. Com base nos dados apresentados no gráfico, e considerando que quaisquer dois motoristas não estão envolvidos num mesmo acidente, dê o somatório das opções corretas: (1) Cinco motoristas sofreram pelo menos quatro acidentes. (2) 30% dos motoristas sofreram exatamente dois acidentes. (4) A média de acidentes por motorista foi igual a três. (8) número total de acidentes ocorridos foi igual a 72. (16) O número total de acidentes ocorridos foi igual a 100. (32) Dezoito motoristas sofreram entre dois e cinco acidentes. (64) Trinta e um motoristas sofreram no máximo dois acidentes. (128) 50% dos motoristas sofreram pelo menos dois acidentes. 47 9 - Considerando os conhecimentos sobre o espaço agrário brasileiro e os dados apresentados no gráfico, o somatório das opções corretas, no período indicado é: 01 - Ocorreu um aumento da produtividade agrícola devido à significativa mecanização de algumas lavouras, como a da soja. 02 - Verificou-se um incremento na produção de grãos proporcionalmente à incorporação de novas terras produtivas. 04 - No período de 90 a 96 a produção teve um aumento absoluto maior do que no período de 96 a 02. 08 - Registrou-se elevada produção de grãos em virtude do uso intensivo de mão-de- obra pelas empresas rurais. 16 - No período de 90 a 96 a produção teve um aumento relativo menor do que no período de 96 a 02. 32 - Houve um salto na produção de grãos, a partir de 91, em decorrência do total de exportações feitas por pequenos agricultores. 64 - Constataram-se ganhos tanto na produção quanto na produtividade agrícola resultante da efetiva reforma agrária executada. 48 10 - Um novo "boom" desponta nas estatísticas dos últimos vestibulares. Desde o surgimento de Dolly, a polêmica ovelha clonada a partir da célula de um animal adulto, a carreira de ciências biológicas recebe cada vez mais candidatos e esta área firma-se como a ciência do próximo milênio. O gráfico a seguir ilustra o número de inscritos nos últimos quatro vestibulares que disputaram as vagas oferecidas pela Universidade de São Paulo (USP) e pelas Universidades Federais do Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS). Com base nessas informações, julgue os itens e dê o somatório das opções corretas: 01 - De 1997 a 1998, o crescimento percentual do número de inscritos na USP foi maior que o da UFRGS. 02 - Todos os segmentos de reta apresentados no gráfico têm inclinação positiva. 04 - Durante todo período analisado, a UFMG foi a universidade que apresentou o maior crescimento percentual, mas não o maior crescimento absoluto. 08 - Em números absolutos a UFMG foi a que apresentou maior crescimento de 1996 a 1999. 16 - Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano. 32 - Os crescimentos percentuais anuais na USP aumentaram a cada ano. 64 - Considerando a série numérica formada pelos números de inscritos em ciências biológicas nestas Universidades nos últimos quatro vestibulares, constatamos que se trata de uma série conjugada geográfica-temporal. 49 V - DISTRIBUIÇÃO DE FREQUENCIA Vamos considerar, neste capítulo, em particular, a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas, como é o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salários recebidos pelos operários de uma fábrica, etc. 1 – Tabela Primitiva e Rol Considere a estatura de quarenta alunos, que compõem uma amostra dos alunos do IFCE, resultando a seguinte tabela de valores: ESTATURAS DE 40 ALUNOS DO IFCE 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 A esse tipo de tabela, onde os elementos não foram numericamente organizados, denominamos de tabela primitiva, ou seja, Tabela primitiva ou dados brutos é uma tabela ou relação de elementos que não foram numericamente organizados. Assim, conhecidos os valores de uma variável, é difícil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Em razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação tão simples como a de saber o valor máximo e mínimo requer certo exame dos dados da tabela. ROL: é a tabela ou relação obtida após a ordenação dos dados, em ordem crescente ou decrescente. Para o exemplo acima temos: ESTATURAS DE 40 ALUNOS DO IFCE 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 Essa classificação dos dados proporciona algumas vantagens concretas com relação à sua forma original: - É possível visualizar de forma ampla as variações de consumo; - Os valores extremos são percebidos de imediato; - É possível observar a tendência de concentração dos valores. 50 Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular ocupa no grupo. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. Apesar de o rol propiciar ao analista mais informações e com menor esforço de concentração do que os dados brutos, ainda assim persiste o problema de a análise ter que se basear nas 40 observações. O problema se agravará quando o número de dados for muito grande. 2 – Distribuição de Frequência É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada muito mais facilmentequando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Logo podemos definir o termo frequência. Frequência: é a quantidade que fica relacionada a um determinado valor da variável. Distribuição de frequência sem intervalos de classe: é a simples condensação dos dados conforme as repetições de seus valores. 51 Veja para o nosso exemplo: VARIÁVEL FREQUENCIA 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 158 2 160 5 161 162 4 2 163 2 164 3 165 1 166 1 167 1 168 2 169 1 170 1 172 1 173 1 TOTAL 40 Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Assim, se um dos intervalos for, por exemplo, 154 |---- 158, em vez de dizermos que a estatura de um aluno é de 154 cm; de quatro alunos, 155 cm; de três alunos, 156 cm; e de um aluno, 157 cm, diremos que nove alunos têm estaturas entre 154 cm, inclusive, e 158 cm. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar de intervalos de classes. Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. 52 ESTATURAS DE 40 ALUNOS DO IFCE CLASSES FREQUENCIAS 150 |---- 154 4 154 |---- 158 9 158 |---- 162 11 162 |---- 166 8 166 |---- 170 5 170 |---- 174 3 Total 40 Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Assim, na tabela de distribuição de frequência sem classes, podemos verificar, facilmente, que quatro alunos têm 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. Já na distribuição de frequência com classes não podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que onze alunos têm estatura compreendida entre 158 e 162 cm. Nota: Quando os dados estão organizados em uma distribuição de frequência, são comumente denominados dados agrupados. Foram vistas as seguintes formas de apresentação dos dados: ROL (dados isolados); Agrupamento simples (sem classes); Agrupamentos em classes. Mas há ainda outra técnica alternativa de apresentação e organização de dados: o Diagrama de Ramos e Folhas. A obtenção do diagrama é rápida e fácil. No diagrama de ramos e folhas, cada dado é separado em duas partes: Ramo: é a parte da esquerda e Folhas: é a parte da direita. Em seguida as folhas são colocadas em seus respectivos ramos. Veja o exemplo: Vamos considerar o número de alunos presentes em 20 palestras. 68 82 75 43 59 80 69 60 73 54 51 93 70 32 63 61 76 87 65 71 Como todos os dados possuem dois algarismos, podemos dividir cada dado em algarismo da dezena e da unidade. Portanto, o algarismo da dezena será o ramo e a unidade será a folha. Vamos usar o dado 68 como exemplo: ramo 6 8 folha 53 Colocamos todos os ramos distintos em uma coluna, ou seja, verticalmente um abaixo do outro, em ordem crescente, e traçamos uma linha vertical, como representado abaixo nas etapas (a, b, c, d) da construção do diagrama de ramos e folhas. Em (a) colocamos apenas os ramos distintos; em (b) colocamos a primeira folha (8) do dado 68; em (c) colocamos a folha correspondente ao dado 82 e, finalmente em (d) apresentamos o resultado final do diagrama com todos os dados. 3 3 3 3 2 4 4 4 4 3 5 5 5 5 9 4 1 6 6 8 6 8 6 8 9 0 3 1 5 7 7 7 7 5 3 0 6 1 8 8 8 2 8 2 0 7 9 9 9 9 3 (a) (b) (c) (d) Observe que o número de folhas deve ser igual ao número de dados. 3 – Elementos de uma Distribuição de Frequência com Intervalos de Classe: Os valores exemplificados a seguir são referentes a Distribuição de frequências com das estaturas de 40 alunos do IFCE. 3.1 – Classe As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k. (onde K é o número total de classes da distribuição). No exemplo, a distribuição é formada por seis classes, então temos k = 6 e o intervalo de classe 154 |---- 158 define a 2ª classe, ou seja, i = 2. 3.2 – Limites de classe Classe de frequência ou, simplesmente, classes são os intervalos de variação da variável. Limites de classe são os extremos de cada classe. 54 O menor número é o limite inferior da classe (li) e o maior número, limite superior da classe (Li). Na terceira classe, por exemplo, temos: 158 |---- 162, l3 = 158 e L3 = 162. Nota: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo |---- (inclusão de li e exclusão de Li). Assim, o indivíduo com uma estatura de 158 cm está incluso na terceira classe (i = 3) e não na segunda. O quarto intervalo 162 |---- 166, por exemplo, pode ser também ser representado desta maneira: [162,166[. 3.3 – Amplitude do intervalo de classe Ela é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi. Assim: Na distribuição de frequência com classes o hi será igual em todas as classes, como mostrado a seguir: h1 = 154 - 150 = 4 h2 = 158 - 154 = 4 ....... h6 = 174 - 170 = 4 3.4 – Amplitude total da distribuição Amplitude do intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). AT = Lmax - lmin. hi = Li - li 55 No exemplo, temos AT = 174 – 150 = 24 cm Nota: É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação: Temos: 3.5 – Amplitude amostral Em nosso exemplo AA = 173 - 150 = 23 cm. Obs.: AT sempre será maior que AA. 3.6 – Ponto médio da classe Para obtermos o ponto médio de uma classe, calculamos a média aritmética dos limites da classe: No intervalo da 2ª classe 154 |---- 158 o ponto médio x2 é calculado: x2 = (l2 + L2)/2 = (154 + 158)/2 = 156 cm Obs.: O ponto médio da classe é o valor que a representa para efeito de cálculos de medidas de posição e dispersão ou variabilidade. 3.7 – Frequência simples ou absoluta AT = k h Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra (obtidos através do ROL). AA = Xmax - Xmin Ponto médio da classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. xi = li + Li 2 Frequência simples ou frequência absoluta ou simplesmente, frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. 24 = 6 4 56 A frequência simples é simbolizada por fi (lemos f índice i ou frequência da classe i). Assim, considerando o exemplo abaixo, temos: ESTATURAS DE 40 ALUNOS DO IFCE ESTATURA (cm) FREQUÊNCIA 150 |---- 154 4 154 |---- 158 9 158 |---- 162 11 162 |---- 166 8 166 |---- 170 5170 |---- 174 3 TOTAL 40 f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3. A soma das frequências é sempre igual ao total de elementos da amostra. Atividade 1: As notas obtidas por 50 alunos de uma classe foram: 1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9. a) Complete a distribuição de frequência abaixo: i Notas xi fi 1 0 |---- 2 2 2 |---- 4 3 4 |---- 6 4 6 |---- 8 5 8 |---- 10 Total 50 b) Agora, responda: 1. Qual a amplitude amostral? 2. Qual a amplitude da distribuição? 3. Qual o número de classes da distribuição? 4. Qual o limite inferior da quarta classe? 5. Qual o limite superior da classe de ordem 2? 6. Qual a amplitude do segundo intervalo de classe? 7. Qual a frequência da terceira classe? 57 c) Complete: 1. h3 = ....... 2. n = ........ 3. l1 = ........ 4. L3 = ........ 5. x2 = ........ 6. f5 = ........ 4 – Tipos de Frequências A soma das frequências simples é igual ao número total de dados da distribuição. Σ fi = n A soma das frequências relativas é igual a 1 ou 100 %. Logo, para o exemplo da página 36 a frequência da terceira classe é: fr3 = f3/n ; fr3 = 11/40 = 0,275 ou 27,5% Nota: O propósito das frequências relativas é o de permitir a análise ou facilitar as comparações. Assim, no exemplo, a frequência acumulada correspondente à terceira classe é: F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24 O que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe). Frequência simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe. Frequências relativas (fri) ou fi (%) são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. Frequência acumulada de uma classe (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe: Fk = f1 + f2 + f3 + ...... + fK 58 Assim, no exemplo, para a terceira classe, temos: Fr3 = F3 / Σ fi = 24/40 = 0,600 ou 60,0% Atividade 2: Complete o quadro com as frequências que se pede. CLASSE xi fi Fi fi (%) Fi (%) 50 |---- 54 52 7 54 |---- 58 56 10 58 |---- 62 60 13 62 |---- 66 64 11 66 |---- 70 68 9 70 |---- 74 72 6 Total -- 56 -- 100,0 -- Sendo xi = ponto médio de classe; fi = frequência simples; Fi = frequência Acumulada; fi (%) = frequência percentual e Fi (%) = frequência percentual acumulada. Frequência acumulada relativa (Fri) ou Fi (%) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição. Fri = Fi / Σ fi 59 5 - Método Prático para Construção de uma Distribuição de Frequências com Classes: 1º - Organize os dados brutos através do ROL. 2º - Calcule a amplitude amostral AA. Para o exemplo da página 45, temos: AA = 173 - 150 = 23 3º - Calcule o número de classes através da: a) Regra de Sturges: i = 1 + 3,3.log n n i = nº de classes 3 ---- 5 3 6 ---- 11 4 12 ---- 22 5 23 ---- 46 6 47 ---- 90 7 91 ---- 181 8 182---- 362 9 b) Raiz quadrada de n. (usa-se somente a parte inteira do número quando a raiz não for exata). Obs.: Qualquer regra para determinação do nº de classes da tabela não nos leva a uma decisão final; esta vai depender na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados. No nosso exemplo: n = 40 dados, então, a regra de Sturges sugere a adoção de 6 classes e pela regra da raiz quadrada também o uso de 6 classes. Dependendo do n, o número de classes pode ser diferente quando usamos os dois métodos. Por exemplo, para n igual a 100 teremos 8 classes pela regra de Sturges e 10 classes para a regra da raiz de n. 4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe h > AA / i. No nosso exemplo: AA / i = 23/6 = 3,83. Obs.: Como h > AA / i é um valor ligeiramente superior para haver folga na última classe. Utilizaremos então h = 4 (mesmo número de casas decimais dos dados originais). 5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com frequência = 0 (zero). 60 No nosso exemplo: o menor nº da amostra = 150 + h = 154, logo a primeira classe será representada por 150 |---- 154. As classes seguintes respeitarão o mesmo procedimento. O primeiro elemento da classe seguinte sempre será formado pelo último elemento da classe anterior. Resolva: 1. Complete a distribuição abaixo, determinando as frequências simples: xi fi Fi 2 2 3 9 4 21 5 29 6 34 Total 34 -- EXERCÍCIOS 1 - Suponha que o ponto médio das classes de uma distribuição de frequência de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e 82%. a) Encontre a amplitude da classe; b) Os limites (inferior e superior) de cada classe. 2 - Imagine que em uma região durante um dia de inverno foram medidas 150 temperaturas mínimas (em oC) em pontos próximos. Suponha que estas temperaturas variaram entre 5,18 ºC a 7,44 ºC. Determine um conjunto de intervalos de classe que seja razoável para esse conjunto de dados. 3 – Conhecidas as notas de 50 alunos, obtenha uma distribuição de frequência tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 84 - 68 - 33 - 52 - 47 - 73 - 68 - 61 - 73 - 77 - 74 - 71 - 81 - 91 - 65 - 55 - 57 - 35 - 85 - 88 - 59 - 80 - 41 - 50 - 53 - 65 - 76 - 85 - 73 - 60 - 67 - 41 - 78 - 56 - 94 - 35 - 45 - 55 - 64 - 74 - 65 - 94 - 66 - 48 - 39 - 69 - 89 - 98 - 42 - 54. 4 – Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6, 5, 2, 6, 4, 3, 6, 2, 6, 5, 1, 6, 3, 3, 5, 1, 3, 6, 3, 4, 5, 4, 3, 1, 3, 5, 4, 4, 2, 6, 2, 2, 5, 2, 5, 1, 3, 6, 5, 1, 5, 6, 2, 4, 6, 1, 5, 2, 4, 3. Forme uma distribuição de frequência sem intervalos de classes. 61 5 – Considere os dados da quantidade de gordura no leite (em %), n = 49 3,66 - 3,66 - 3,72 - 3,74 - 3,74 - 3,77 - 3,81 - 3,88 - 3,89 - 3,91 - 3,96 - 3,96 - 3,97 - 3,97 - 4,00 - 4,00 - 4,02 - 4,03 - 4,05 - 4,06 - 4,08 - 4,10 - 4,10 - 4,15 - 4,16 - 4,20 - 4,20 - 4,23 4,24 - 4,25 - 4,27 - 4,28 - 4,29 - 4,32 - 4,32 - 4,33 - 4,38 - 4,38 - 4,38 - 4,40 - 4,41 - 4,42 - 4,49 - 4,60 - 4,67 - 4,70 - 4,71 - 4,81 - 4,82. Use os dados da amostra para fazer uma Distribuição de frequências com classes, calculando as frequências simples e acumuladas, absolutas e relativas. 6 - Na Tabela, identifique a amplitude dos intervalos de classe e os pontos médios de cada classe. Classes Frequência (fi) [0 – 6[ 39 [6 – 12[ 41 [12 – 18[ 38 [18 – 24[ 40 [24 – 30[ 42 Total 200 Construa a tabela de frequências relativas, percentual e acumulada. 7 - A tabela abaixo apresenta a distribuição de frequência dos salários mensais em reais, de 65 empregados da companhia P & R. Salários (R$) Nº. de Empregados 5.000 |--- 6.000 8 6.000 |--- 7.000 10 7.000 |--- 8.000 16 8.000 |--- 9.000 14 9.000 |--- 10.000 10 10.000 |--- 11.000 5 11.000 |--- 12.000 2 Total 65 Determinar: a) O limite inferior da 6ª classe; b) O limite superior da 4ª classe; c) O ponto médio da 3ª classe; d) A amplitude do 5º intervalo
Compartilhar