Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTATÍSTICA APLICADA ESTATÍSTICA APLICADA Graduação 2 ESTATÍSTICA APLICADA © Departamento de Ensino a Distância - Universidade Salgado de Oliveira Todos os direitos reservados. Nenhuma parte desta publicação pode ser reproduzida, arquivada ou transmitida de nenhuma forma ou por nenhum meio sem permissão expressa e por escrito da Associação Salgado de Oliveira de Educação e Cultura, mantenedora da Universidade Salgado de Oliveira (UNIVERSO). A 923 e AUGUSTO, Adriana Santos. Estatística. / Adriana Santos Augusto. Edição revisada por Simara da Costa Guimarães. São Gonçalo, RJ: EaD/ UNIVERSO, 2007. 108 p. 21,0 X 28,0 cm. 1. Estatística. I. Título. CDD 519.5 DIREÇÃO SUPERIOR Chanceler Joaquim de Oliveira Reitora Marlene Salgado de Oliveira Pró-Reitor de Planejamento e Finanças Wellington Salgado de Oliveira Pró-Reitor de Organização e Desenvolvimento Jefferson Salgado de Oliveira Pró-Reitor Administrativo Wallace Salgado de Oliveira Pró-Reitora Acadêmica Jaina dos Santos Mello Ferreira Pró-Reitor de Extensão Manuel de Souza Esteves Pró-Reitor de Pós-Graduação e Pesquisa Marcio Barros Dutra Pró-Reitor de Graduação Tecnológica Marcílio Ribeiro Borges DEPARTAMENTO DE ENSINO A DISTÂNCIA Diretora Claudia Antunes Ruas Guimarães FICHA TÉCNICA Texto: Adriana Santos Augusto Revisão: Lívia Antunes Maria Faria e Walter P. Valverde Júnior Projeto Gráfico e Editoração: Antonia da Silva Machado Supervisão de Materiais Instrucionais: Janaina Gonçalves de Jesus Ilustração: Daniel Mattos Capa: Willian José Mendes da Silva Supervisão: Ademir Nunes Corrêa Impressão: Departamento Gráfico Tiragem: 500 exemplares Coordenação Geral: Departamento de Ensino a Distância Rua Marechal Deodoro 217, Centro, Niterói, RJ, CEP 24020-420 ead@universo.edu.br www.universo.edu.br 3 ESTATÍSTICA APLICADA APRESENTAÇÃO Você acaba de receber o Livro de Estudo da disciplina Estatística Aplicada. Este livro foi elaborado página a página pensando em você e nas suas necessidades. Por isso, leia-o sempre e reflita sobre cada assunto. O estudo constante lhe garantirá maior segurança e aprendizado. Não esqueça de se organizar! Reserve um horário para leituras complementares, fazer seus exercícios, garantindo assim um ótimo desempenho. Desejamos que você tenha um excelente estudo e alcance o sucesso! 4 ESTATÍSTICA APLICADA 5 ESTATÍSTICA APLICADA PALAVRA DA REITORA Acompanhando as necessidades de um mundo cada vez mais complexo, exigente e necessitado de aprendizagem contínua, a Universidade Salgado de Oliveira (UNIVERSO) apresenta a UNIVERSO Virtual, que reúne os diferentes segmentos do ensino a distância na universidade. Nosso programa foi desenvolvido segundo as diretrizes do MEC e baseado em experiências do gênero bem- sucedidas mundialmente. São inúmeras as vantagens de se estudar a distância e somente por meio dessa modalidade de ensino são sanadas as dificuldades de tempo e espaço presentes nos dias de hoje. O aluno tem a possibilidade de administrar seu próprio tempo e gerenciar seu estudo de acordo com sua disponibilidade, tornando-se responsável pela própria aprendizagem. O ensino a distância complementa os estudos presenciais à medida que permite que alunos e professores, fisicamente distanciados, possam estar a todo momento ligados por ferramentas de interação presentes na Internet através de nossa plataforma. Além disso, nosso material didático foi desenvolvido por professores especializados nessa modalidade de ensino, em que a clareza e objetividade são fundamentais para a perfeita compreensão dos conteúdos. A UNIVERSO tem uma história de sucesso no que diz respeito à educação a distância. Nossa experiência nos remete ao final da década de 80, com o bem-sucedido projeto Novo Saber. Hoje, oferece uma estrutura em constante processo de atualização, ampliando as possibilidades de acesso a cursos de atualização, graduação ou pós-graduação. Reafirmando seu compromisso com a excelência no ensino e compartilhando as novas tendências em educação, a UNIVERSO convida seu alunado a conhecer o programa e usufruir das vantagens que o estudar a distância proporciona. Seja bem-vindo à UNIVERSO Virtual! Professora Marlene Salgado de Oliveira Reitora 6 ESTATÍSTICA APLICADA 7 ESTATÍSTICA APLICADA SUMÁRIO 1. Apresentação da disciplina. ..................................................................................... 09 2. Plano da disciplina. ................................................................................................. 11 3. Unidade 1 - Elementos da estatística descritiva. ....................................................... 13 4. Unidade 2 - Representação gráfica........................................................................... 33 5. Unidade 3 - Medidas de tendência central. ............................................................... 39 6. Unidade 4 - Medidas de dispersão. .......................................................................... 49 7. Unidade 5 - Noções de amostragem. ........................................................................ 57 8. Unidade 6 - Cálculo das probabilidades. ................................................................... 65 9. Unidade 7 - Distribuição de probabilidade. ................................................................ 73 10. Unidade 8 - Correlação e regressão. ........................................................................ 83 11. Considerações finais ............................................................................................... 95 12. Conhecendo o autor ............................................................................................... 97 13. Referências ............................................................................................................ 99 14. Anexos ................................................................................................................... 101 8 ESTATÍSTICA APLICADA ESTATÍSTICA APLICADA 9 APRESENTAÇÃO DA DISCIPLINA Caro aluno, Seja bem-vindo à disciplina Estatística Aplicada. Muitos falam em estatística, mas poucos sabem o que é e para que ela serve. A estatística é um ramo da matemática aplicada que desempenha um papel fundamental para a compreensão da realidade. Ela nos fornece métodos para coleta, organização, análise e interpretação de dados para posterior utilização dos mesmos em tomada de decisões. Na Antigüidade, assim como hoje, os povos mantinham um registro permanente do número de habitantes, nascimentos e óbitos. O que faziam ainda não tinha nome. A palavra ESTATÍSTICA surgiu na Idade Média, quando as informações eram tabuladas com finalidades bélicas e tributárias, ou seja, sua importância maior era servir ao Estado, daí o nome. A estatística será de grande utilidade para você, pois é uma ferramenta indispensável não só nos negócios, mas em todas as ciências, afinal de contas, você poderia imaginar o mundo de hoje sem registros numéricos? Já se deu conta da facilidade com que “projetamos” o futuro muito antes de ele acontecer? E isso acontece em todos os ramos da nossa vida. Assim, desejamos que você realize um ótimo estudo e, lembre-se: a aprendizagem é infinita! Utilize nossas referências bibliográficas para aprofundar e engrandecer seus conhecimentos sobre os assuntos aqui estudados, pois isso lhe acrescentará muito, não só como aluno, mas também como profissional e cidadão. Tenha um excelente estudo! Sucesso! 10 ESTATÍSTICA APLICADA 11 ESTATÍSTICA APLICADA PLANO DA DISCIPLINA A disciplina Estatística possui objetivos próprios no que diz respeito ao processo ensino- aprendizagem, desenvolvendo competências e habilidades necessárias à formação de futuros profissionais que atuarão na sociedade contemporânea. São objetivos gerais da disciplina: capacitar o aluno para o uso da metodologia estatística mediante aplicação de técnicas de análise estatística de dados, deprojeção e metodologia de tomada de decisão; utilizar os conceitos e o conteúdo prático dos Métodos Quantitativos aplicados para o desenvolvimento de trabalhos pedagógico-científicos e proporcionar melhor aplicabilidade interdisciplinar durante o exercício do curso. O conteúdo programático foi divido em oito unidades que abordarão desde os Elementos da Estatística Descritiva até a Correlação e Regressão. Seguiremos, agora com a apresentação de cada unidade: Unidade 1 – Elementos da Estatística Descritiva Objetivo: identificar conceitos básicos da disciplina; compreender o que é exatamente a estatística e para que ela serve; interpretar um levantamento estatístico; conhecer as séries estatísticas; trabalhar os dados estatístico através da montagem de uma distribuição de freqüências. Unidade 2 – Representação Gráfica Objetivo: construir e analisar os gráficos que você tanto conhece e que fazem parte da sua vida cotidiana. Unidade 3 – Medidas de Tendência Central Objetivo: compreender as medidas de tendência central e calculá-las para dados não agrupados e dados agrupados em classes de freqüências. Unidade 4 - Medidas de Disperção Objetivo: compreender as medidas de dispersão, calcular essas medidas para dados não agrupados e dados agrupados em classes de freqüências. Unidade 5 - Noções de Amostragem Objetivo: conhecer mais sobre o cálculo e os tipos de amostra e os métodos probabilísticos. Unidade 6 - Cálculo das Probabilidades Objetivo: caracterizar os experimentos aleatórios; calcular as possibilidades de acontecimento de tais experimentos, a chance de um evento ocorrer ou não, ou seja, a probabilidade de sucesso ou insucesso. Unidade 7- Distribuição de Probabilidade Objetivo: identificar e calcular problemas relacionados à contagem – Distribuição Binomial; identificar e calcular problemas relacionados a espaços amostrais contínuos e às variáveis contínuas – Distribuição Normal. Unidade 8 – Correlação e Regressão Objetivo: ajustar uma reta a um conjunto de dados e determinar a equação da reta que constitui o melhor ajuste; calcular e classificar o grau de correlação existente entre duas variáveis. 12 ESTATÍSTICA APLICADA ESTATÍSTICA APLICADA 13 U N ID A D E 1 ELEMENTOS DA ESTATÍSTICA DESCRITIVA Nesta primeira unidade, estudaremos o que é o método estatístico, bem como as suas fases. Aprenderemos as definições de variável, população e amostra, assim como algumas técnicas para o cálculo de uma amostra. Também iremos estudar as séries estatísticas e a distribuição de freqüências. OBJETIVOS DA UNIDADE: • Identificar conceitos básicos da disciplina. • Compreender o que é exatamente a estatística e para que ela serve. • Interpretar um levantamento estatístico. • Conhecer as séries estatísticas. • Trabalhar os dados estatístico através da montagem de uma distribuição de freqüências. PLANO DA UNIDADE: • Conceitos básicos da Estatística. • Séries estatísticas. • Distribuição de freqüências. Bem-vindo à primeira unidade de estudo UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 14 CONCEITOS BÁSICOS Estatísticas são feitas todos os dias em jornais e revistas, algumas vezes por órgãos que não conhecemos e que não sabemos se são confiáveis ou não. O dia-a-dia de um cidadão está cheio de “armadilhas” espalhadas na mídia de modo a levá-lo a percorrer caminhos nem sempre corretos. Para não cair nessas “armadilhas”, a primeira coisa que devemos saber é distinguir os dois tipos de estatística - a que envolve a contagem pura e simples, como o censo da população, feito de tempos em tempos pelo IBGE e a calculada por amostragem, como, por exemplo, as pesquisas sobre a intenção de voto. A decisão quanto à metodologia a ser utilizada, se recenseamento ou amostra, vai depender principalmente dos custos e do tempo para apuração dos dados. É óbvio que o ideal seria consultar toda a população, porém isso custa caro e nem sempre os recursos existentes são suficientes para isso. Por isso, normalmente utiliza- se a pesquisa amostral. Deve-se saber também que há algumas regras básicas empregadas na “contabilidade” e na generalização dos dados obtidos. A coleta, a organização, a descrição, o cálculo, a análise e interpretação dos coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto que a análise e a interpretação dos dados amostrais, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, que se fundamenta na teoria da probabilidade e é muito útil na análise de jogos, entre outros. Por exemplo, não é preciso provar todas as caixas de bombom produzidas numa fábrica para se saber se o chocolate é bom. A amostragem nos permite mensurar o que queremos apenas sobre uma parcela pequena de determinada “população”, denominada amostra e utilizar essa informação para fazer inferência sobre toda a população. Método Estatístico Método: é o meio mais eficaz para atingir determinada meta. Dos métodos científicos destacamos o método experimental e o método estatístico. • Método Experimental: consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Em laboratório é fácil mantermos constantes, por exemplo, a pressão e variarmos a temperatura para estudar o efeito dessa variação . • Método Estatístico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex.: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? É um método muito usado nas ciências sociais, pois seria impossível, no momento da pesquisa, manter constantes a ESTATÍSTICA APLICADA 15 uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. Fases do Método Estatístico • Definição do Problema O que exatamente se pretende pesquisar? Ou seja, é preciso definir corretamente o problema. • Planejamento Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censo? Amostragem? Qual é o cronograma de atividades? Quais são os custos envolvidos no processo? • Coleta É o registro de dados com um objetivo determinado. A coleta de dados pode ser Direta ou Indireta. • Coleta Direta: é feita pelo próprio pesquisador (censo) ou através de registros permanentes quando é obtida diretamente da fonte. Ex: empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta direta de dados pode ser classificada quanto ao fator tempo em contínua, periódica ou ocasional. • Coleta Contínua: quando é feita continuamente. Ex.: registros de nascimento, óbitos, casamentos; • Coleta Periódica: quando é feita em intervalos constantes de tempo. Ex.: censo (de 10 em 10 anos); • Coleta Ocasional: quando é feita a fim de atender a uma emergência. Ex.: coleta de dados epidemiológicos. • Coleta Indireta: é feita por deduções a partir de dados que são conhecidos, conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização. Quanto aos dados coletados, ou seja, a matéria-prima sobre a qual iremos aplicar os métodos estatísticos, eles podem ser primários ou secundários. • Dados primários:quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. • Dados secundários: quando são publicados por outra organização. UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 16 Quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. Trabalhar com fontes primárias é sempre mais seguro! • Crítica Os dados coletados devem ser cuidadosamente criticados para evitar erros que possam vir a alterar os resultados. Ex.: numa pesquisa feita numa academia perguntou-se o peso dos atletas. Resposta: 765 kg.É obvio que houve algum tipo de erro na coleta do dado, este deve ser, então, descartado. • Apuração É a organização dos dados obtidos na coleta, através de sua contagem e agrupamento. • Apresentação dos Dados Há duas formas de apresentação. A apresentação tabular segundo regras práticas fixadas pelo Conselho Nacional de Estatística e a apresentação gráfica dos dados. Uma não exclui a outra. • Análise dos Resultados Esta é a última fase do método estatístico. Refere-se ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Nesta etapa obteremos conclusões sobre o todo (população), a partir das informações fornecidas pela parte que representa o todo (amostra). População ou Universo Estatístico É o conjunto total de elementos portadores de pelo menos uma característica em comum. Ex.: o universo dos alunos de uma escola. Variáveis Variável é o conjunto de resultados possíveis de um fenômeno. Ex.: sexo, cor da pele, idade...Pode ser classificada de variável quantitativa ou variável qualitativa. • Variável Qualitativa: quando seu valores são expressos por atributos: sexo, cor da pele,etc. • Variável Quantitativa: quando os dados são de caráter quantitativo, e o conjunto dos resultados possui uma estrutura numérica, se divide em variável discreta e variável contínua. • Variável Discreta ou Descontínua: seus valores são expressos geralmente através de números inteiros não- negativos. Resulta normalmente de contagens. Ex: número de filhos de um casal - pode assumir valores como 0; 1; 2; 3;..., mas nunca valores como: 1,5; 3,72; etc. EXEMPLIFICANDO ESTATÍSTICA APLICADA 17 • Variável Contínua: pode assumir qualquer valor entre dois limites, ou seja, assume valores em um intervalo real. Resulta normalmente de uma mensuração, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: temperatura. Normalmente as medições dão origem a variáveis contínuas e as contagens a variáveis discretas. Amostragem Amostra é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre essa população. É um subconjunto finito de uma população. Uma amostra deve ser cuidadosamente planejada a fim de garantir a menor margem de erro na pesquisa. A margem de erro é um intervalo controlado dentro do qual podem variar os resultados finais. Nenhum levantamento estatístico feito por amostragem é perfeito, ou melhor dizendo, um estudo bem planejado não elimina o erro, apenas o limita. Para selecionar uma amostra é preciso levar em conta as características de distribuição física da população, ou seja, algumas áreas têm uma população maior que outras. É preciso levantar os dados em proporção à densidade populacional das regiões. Por exemplo, se o objeto de estudo é o tipo de programa de TV mais assistido, não adianta fazer o estudo apenas em uma turma de escola de educação infantil, pois o resultado obviamente seria desenho animado. Crianças não costumam assistir a telejornais ou a filmes da madrugada. Se a pesquisa fosse feita dessa forma, o resultado não estaria correto. Assim, no caso de uma população ser composta de 35% de crianças, 40% de adultos e os outros 25% de idosos, uma amostra dessa população também deve conter crianças, adultos e idosos na mesma proporção. Amostragem Casual ou Aleatória Simples É o processo mais utilizado. Equivale a um sorteio lotérico. Pode ser realizada da seguinte forma: numera-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, n números dessa seqüência, que corresponderão aos elementos pertencentes da amostra. Obter uma amostra de 10% dos 580 alunos de uma escola: 1º - numeramos os alunos de 1 a 580. 2º - escrevemos os números dos alunos de 1 a 580 em pedaços iguais de papel, colocamos na urna e após mistura, retiramos, um a um, cinqüenta e oito números que formarão a amostra. Quando o número de elementos da amostra é muito grande como neste caso, esse tipo de sorteio é muito trabalhoso. Então, utiliza-se uma tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. EXEMPLIFICANDO UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 18 Amostragem Proporcional Estratificada: Quando a população se divide em estratos (subconjuntos da população), é imprescindível que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. Vamos obter uma amostra proporcional estratificada, de 10%, dos pacientes internados em um SPA. Supondo que sejam 106 mulheres e 54 homens. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos: Numeramos, então, os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a 160, mulheres e procedemos o sorteio casual com urna ou tabela de números aleatórios, que será vista na unidade VII. No caso da tabela acima, estamos selecionando uma amostra composta por pessoas, portanto não podemos selecionar 5,4 pessoas do sexo masculino. Devemos, então, “arredondar” o número 5,4 para um número inteiro, ou seja, 5. Dúvidas no arredondamento? Existem duas formas de representar um número quando não podemos representá-lo com todos os seus dígitos, o truncamento e o arredondamento. O truncamento - Truncar um número é “quebrá-lo” de acordo com o número de dígitos que queremos representar. Representar os números abaixo com apenas dois dígitos. 27,283 27 27,575 27 27,897 27 Em todos os casos o número será representado da mesma forma, não importando o tamanho do erro. EXEMPLIFICANDO EXEMPLIFICANDO Erro- Toda vez que um nú- mero não é representado com todos os seus algaris- mos, estamos cometendo um erro. Por exemplo: ao apro- ximarmos o número 2,7 para 3 estamos aumentando esse número em 0,3 (erro!), ou então, ao aproximarmos o número 2,2 para 2 estamos diminuindo esse número em 0,2 (erro!). O erro cometido deve ser o menor possível!!! ESTATÍSTICA APLICADA 19 Arredondamento - Para arredondar um número, devemos seguir a seguinte regra: Observe o primeiro algarismo que será “descartado”. Se esse algarismo for 0, 1, 2, 3 ou 4 mantemos a mesma ordem. Se esse algarismo for 5, 6, 7, 8 ou 9, aumentamos a ordem em 1. Arredondar os números abaixo para duas casas decimais. 2,232 2,23 2,235 2,24 Amostragem Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de sorteio. Suponhamos um prédio com 200 apartamentos, dos quais desejamos obter uma amostra formada por 20 apartamentos para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 200/20 = 10, escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 10 em 10. Assim, suponhamos que o número sorteado fosse 6, a amostra seria: 6o apartamento, 16o apartamento, 26o apartamento, etc. Até aqui, vimos como se faz um levantamento estatístico, o que é e para que serve. Vimos ainda como é selecionada uma amostra e qual a importância desta. Veremos agora o que são séries estatísticas. Vamos, então, passo a passo. Você sabe o que é uma tabela? TABELA - É um quadro que resume um conjunto de observações organizados segundo linhas e colunas. Veja o exemplo de tabela abaixo: EXEMPLIFICANDO EXEMPLIFICANDO UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 20 Ex.: Equipamentos existentes, disponíveis ao SUS, por tipo, segundo as grandes regiões – Brasil - 2002 • O lado direito e esquerdo de uma tabela oficial deve ser aberto. • Na construção das tabelas, devemos colocar: • um traço horizontal ( - ) quando o valor for zero; • três pontos ( ... ) quando não tivermos os dados; • zero ( 0 ) quando o valor for muito pequeno em relação à unidade utilizada; • um ponto de interrogação quando nãotivermos certeza quanto à exatidão de determinado valor. Agora que você já sabe o que é uma tabela e como construí-la vamos conhecer as séries estatísticas. SÉRIE ESTATÍSTICA É uma tabela que apresenta um conjunto de dados estatísticos em função da época, local ou espécie. TIPOS DE SÉRIES ESTATÍSITICAS SÉRIES HOMÓGRADAS São as séries em que a variável estudada é discreta, ou seja, não contínua. Pode ser temporal, geográfica ou específica. Série Temporal: o que está em estudo é o fator tempo. O local e a espécie são elementos fixos. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS Fonte: dados fictícios. Série Geográfica: o que está em estudo é o fator geográfico. A época e a espécie são elementos fixos. ESTATÍSTICA APLICADA 21 ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS – 2004 Fonte: dados fictícios. Série Específica: a variável em estudo é o fator ou a espécie. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS – 2004 Fonte: dados fictícios. SÉRIES CONJUGADAS OU TABELAS DE DUPLA ENTRADA: apresentam duas ou mais séries em uma mesma tabela, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica temporal. ARTE E COMÉRCIO LTDA UNIDADES EXPORTADAS Fonte: dados fictícios. Conhecidas as séries estatísticas, vamos estudar agora a distribuição de freqüências, em que aprenderemos a organizar os dados coletados através ou não da amostra, faremos também uma breve revisão de como calcular porcentagem. Vamos em frente! Mas, afinal, o que é uma distribuição de freqüências? A distribuição de freqüências é um tipo de tabela que condensa uma série de dados de acordo com a repetição de seus valores (freqüências). UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 22 1. Dados brutos ou Tabela primitiva Trata-se de uma relação de elementos ou tabela que não foram numericamente organizados. São os dados coletados sem nenhuma arrumação. Apenas olhando para os números, é difícil ter uma idéia do comportamento da amostra. Não sabemos, por exemplo, quem é o menor, quem é o maior, quais são os números que mais se repetem, etc. EX.: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31 2. ROL Se olharmos no dicionário veremos como definição que o rol é a relação obtida após a ordenação dos dados (crescente ou decrescente). Ordenando os dados podemos ter uma idéia melhor do comportamento da amostra. Percebemos, desta forma, os dados que mais se repetem, os que aparecem menos, quem é o menor deles e quem é o maior, etc. EX.: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40 3. Os tipos de distribuição de freqüência Distribuição de freqüência SEM INTERVALOS DE CLASSE Essa distribuição é usada quando o número de dados diferentes que aparecem é pequeno. Trata-se de uma simples condensação dos dados, conforme as repetições de seu valores. No exemplo dado, ao invés de escrevermos o número 21 três vezes, escrevemos apenas uma e indicamos que ele se repete três vezes, ou seja, a freqüência do número 21 é igual a três. EX.: Distribuição de Freqüência COM INTERVALOS DE CLASSE Quando o tamanho da amostra é grande, com vários números diferentes se repetindo, uma tabela de distribuição de freqüências como a vista acima seria muito longa (comprida). Dessa forma, agrupamos os valores em vários intervalos de classe, diminuindo o tamanho da tabela. Tabela Primitiva ESTATÍSTICA APLICADA 23 No exemplo dado, temos: Como você já deve ter percebido, a Estatística utiliza alguns nomes que talvez lhe sejam desconhecidos. Mas, a partir de agora, com certeza, você os aprenderá. Afinal de contas, é para isto que estamos aqui: para ensinar e também aprender! NOMECLATURAS CLASSE (i) É cada um dos intervalos de variação da variável analisada. Ex.: na tabela anterior, a 3ª classe, simbolizada por i = 3, varia de 29 até 33, ou seja, (29 33). O símbolo significa intervalo aberto à direita e fechado à esquerda, ou seja, nessa classe estão contidos os valores de 29 (inclusive) até 33 (exclusive). Por exemplo, dado o número 33 do ROL, este não pertence a classe 3 e sim a classe 4 representada por 33 37. Sempre utilizaremos o intervalo fechado à esquerda e aberto à direita. 4.2. LIMITES DE CLASSE Os limites de classe são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ). No intervalo 29 33, l3 = 29 e L3 = 33. 4.3. AMPLITUDES Aqui, podemos citar a amplitude do intervalo de classe, a amplitude amostral e amplitude total da distribuição. Vejamos, então, cada uma delas. AMPLITUDE DO INTERVALO DE CLASSE (hi) É calculado após conhecermos o valor de i (nº de classes) e o valor de AA (amplitude amostral). hi = Se a distribuição por classes já estiver construída, nesse caso, hi = Li - li, ou seja, a diferença entre os limites de cada classe. Ex.: na tabela anterior. h1 = 25-21=4 h2 = 29-25=4 h3 = 33-29=4 h4 = 37-33=4 h5 = 41-37=4 UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 24 Na distribuição de freqüência com classe, devemos sempre que possível ter hi igual em todas as classes. AMPLITUDE AMOSTRAL (AA = Xmáx - Xmin) Trata-se da diferença entre o valor máximo e o valor mínimo da amostra (ROL). No nosso exemplo: AA=40-21=19. AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT = L(max) - l(min)) É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. EX.: na tabela anterior, AT = 41 - 21= 20. Obs.: AT sempre será maior ou igual a AA. PONTO MÉDIO DE CLASSE O ponto médio de classe é o ponto que divide o intervalo de classe em duas partes iguais. EX.: considere a 3ª classe da tabela em 29 33, o ponto médio x3 = (29+33)/2 = 31. O ponto médio será de suma importância para o cálculo da média, pois, como dito anteriormente, na tabela organizada com intervalos de classe, não sabemos mais, exatamente, quais são os valores representados em cada intervalo. Assim, consideraremos esses valores como sendo o ponto médio dos intervalos para que o erro seja o menor possível. Cálculo do número de intervalos de classe Podemos calcular o número de intervalos de classe de duas formas: pela Regra de Sturges ou pela raiz quadrada de n. Regra de Sturges - Número de Classes Para determinar o número de classes ideal de uma distribuição, utiliza- se a Regra de Sturges, de acordo com o tamanho da amostra. i 1 + 3,3 log.n Onde n é o número de elementos da relação de dados brutos. Para o exemplo dado, temos: i 1 + 3,3 log20 = 5,29 5. DICA ESTATÍSTICA APLICADA 25 Se você não possui uma calculadora científica para calcular o valor do logaritmo de n, busque nos anexos os respectivos valores. Regra da Raiz Quadrada de n - Número de Classes Para determinar o número de classes ideal de uma distribuição, utiliza- se a regra da Raiz Quadrada de n, de acordo com o tamanho da amostra. i n Onde n é o número de elementos da relação de dados brutos. Para o exemplo dado, temos: i 20 = 4,47 4. Valores da raiz de n encontram-se previamente calculados nos anexos. Se i=4 deve-se calcular o novo hi. Ex.: na tabela anterior. h1= 26-21=5 h2= 31-26=5 h3= 36-31=5 h4= 41-36=5 Na tabela de distribuição de freqüências sem intervalo de classes tínhamos um total de treze linhas com dados obtidos, já na tabela com intervalos de classe, apenas 5 ou 4 de acordo com a regra que for utilizada. Apesar de ser uma tabela mais “legível”, a precisão dos valores se perde um pouco, pois não sabemos mais quais são exatamente os sete números que aparecem no primeiro intervalo de classe, por exemplo. Mesmo assim, é a tabela mais usada, pois num levantamento de grande porte, seria inviável e incompreensível trabalharmos com os inúmeros valores que aparecem. DICA DICA UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 26 Para a construção de uma tabela de distribuição de freqüências com intervalos de classe, é muito importante o cálculodo número de intervalos de classe ou pela regra de Sturges ou pela raiz quadrada de n. Qualquer regra para determinação do número de intervalos de classes não determina com exatidão o valor de i, mas dá ao pesquisador uma noção do tamanho da tabela. Cabe ao pesquisador decidir com quantos intervalos de classe irá trabalhar. Na verdade, o número de intervalos de classe vai depender do tipo de dado que está sendo trabalhado. Por exemplo, se os dados referirem- se às notas de uma prova, talvez seja conveniente que os arrumemos em intervalos de 1 em 1 para que possamos ter uma idéia do número de alunos aprovados (nota maior que sete), o número de alunos em recuperação (nota entre quatro e sete) e o número de alunos reprovados (nota inferior a quatro). Para construção de uma Distribuição de Freqüências c/ intervalos de Classes devemos seguir os seguintes passos (roteiro): 1º passo - Organize os dados brutos em um ROL. Dados Brutos: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31 Rol: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40 2º passo - Calcule a amplitude amostral AA (maior valor da amostra menos o menor). AA = 40 - 21 = 19 3º passo - Calcule o número de classes através da “Regra de Sturges” ou da raiz quadrada de n. i 1 + 3,3 log20 = 5,29 5 ou i n = 20 =4,47 4 O número de intervalos de classe pode ser diferente se calculado por uma regra ou por outra. Cabe ao pesquisador definir o número de intervalos de classe com que irá trabalhar. ESTATÍSTICA APLICADA 27 4º passo - Calcule a amplitude dos intervalos de classe (amplitude amostral dividida pelo número de intervalos de classe). hi = AA/i = 19/5 = 3,8 4 No caso de termos que arredondar o valor de hi, este deve ser arredondado sempre para mais para que haja folga na última classe, no contrário corre-se o risco de a tabela montada não incluir o último valor, e nenhum valor pode ser descartado. 5º passo - Montemos, então, a tabela. O menor número da amostra será o limite inferior do 1º intervalo de classe e de h em h, no nosso exemplo, de 4 em 4, montamos, então, os limites de todos os intervalos de classe. O primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe anterior. 6o passo - Agora é só marcar quantos números temos em cada intervalo de classe. A maneira mais simples de fazer é através de marcações da seguinte forma: lemos o primeiro número e identificamos qual a classe a que ele pertence. Identificada a classe, riscamos o número e o marcamos na classe a que ele pertence. Agora é só apagar a coluna de marcação e está pronta a tabela! UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 28 DADOS ABSOLUTOS E DADOS RELATIVOS Os dados absolutos são os resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida. Já os dados relativos são razões que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Os dados relativos são de fácil compreensão. Como o nome mesmo diz, relativo, em relação a. Porcentagem As porcentagens são partes proporcionais calculadas sobre cem unidades. O emprego da porcentagem é de suma importância quando o intuito é destacar a participação da parte no todo. Exemplo: Considere a série: Clínica A - 2005 Número de Pacientes Atendidos no Mês de Março por Setor Fonte: Dados Fictícios. Porcentagens dos pacientes atendidos em cada setor: Pediatria: Alergologia: Radiologia: Podemos inserir esses dados na nossa tabela através de uma nova coluna: Clínica A - 2005 Número de pacientes atendidos no mês de março por setor Fonte: Dados Fictícios. ESTATÍSTICA APLICADA 29 TIPOS DE FREQÜÊNCIAS • Freqüência Simples ou Absoluta (fi) - É o número de observações correspondentes a uma classe ou a um valor. • Freqüência Simples Relativa (fri) - É o número de observações de um valor ou de uma classe, em relação ao número total de observações. Em porcentagens temos: Obs.: a soma das freqüências relativas é sempre igual a 1 ou 100%. Devido a erros de arredondamento pode acontecer de o somatório das freqüências relativas dar diferente de 1 ou 100%. Por exemplo: Se isso acontecer, devemos retirar ou acrescentar a diferença no intervalo de maior freqüência, pois dessa forma cometeremos um erro menor do que cometeríamos se alterássemos o intervalo de menor freqüência. O ideal é trabalharmos com pelo menos 4 casas após a vírgula. Freqüências Acumuladas (Fi.) É a soma das freqüências anteriores até a classe ou valor inclusive. Na tabela mais a frente, quantas pessoas tiraram nota até o limite superior do intervalo? Freqüência Acumulada Relativa (Fri) Trata-se da freqüência acumulada de uma classe dividida pela freqüência total. Podemos, ainda, representá-la em valores percentuais multiplicando a freqüência acumulada relativa por 100. No exemplo abaixo, qual o percentual das notas até o limite superior do intervalo? Exemplo: notas de um teste de estatística aplicado em uma turma do curso de Nutrição. No exemplo abaixo, temos as freqüências simples (absoluta - fi ; relativa - fri e relativa percentual - fri %). UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 30 No exemplo a seguir, temos as freqüências acumuladas (acumuladas – Fi; acumulada relativa – Fri e acumulada relativa percentual – Fri%). No exemplo seguinte, vamos calcular também para completarmos o cálculo da distribuição de freqüências, o ponto médio – xi. NOTAS DE UM TESTE DE ESTATÍSTICA APLICADO EM UMA TURMA DO CURSO DE NUTRIÇÃO. Onde: fi Freqüência simples absoluta. xi Ponto médio de uma classe. fri Freqüência relativa. Fi Freqüência acumulada. Fri Freqüência acumulada relativa. ESTATÍSTICA APLICADA 31 Chegamos ao fim da unidade 1, onde estudamos os elementos da Estatística descritiva. Espero que você tenha gostado .Vamos em frente. É HORA DE SE AVALIAR! Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Na próxima unidade estudaremos os gráficos Estatísticos. Vamos lá. UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA 32 ESTATÍSTICA APLICADA 33 U N ID A D E 2 REPRESENTAÇÃO GRÁFICA Esta é uma unidade importante para o entendimento da estatística, pois grande parte dos dados estatísticos são apresentados através de gráficos. Nela aprenderemos a montar e a interpretar alguns dos gráficos mais utilizados e os gráficos estatísticos específicos. Esperamos que vocês gostem. OBJETIVO DA UNIDADE: Construir e analisar os gráficos que você tanto conhece e que fazem parte da sua vida cotidiana. PLANO DA UNIDADE: • Gráfico em linha Curva. • Gráficos em barra vertical. • Gráficos em barra horizontal. • Gráficos de setores. • Cartogramas. • Histograma. • Polígono de Freqüência. • Ogivograma. • Ogiva de Galton. Bons estudos! UNIDADE 2 - REPRESENTAÇÃO GRÁFICA 34 Os gráficos são representações visuais dos dados estatísticos e não substituem as tabelas. Devem corresponder aos dados de uma forma simples, clara e objetiva. Muito cuidado com os gráficos, pois se mal elaborados podem trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Por falar gráficos, quais você conhece? Você sabe qual é a funcionalidade deles? Vejamos então. Alguns Tipos de Gráficos GRÁFICO EM LINHA OU CURVA Estes gráficos são freqüentemente usados para a representação de séries cronológicas com um grande número de períodos. Nos dão uma visualização clara da variação dos dados existentes nas séries. Também são ideais quando há necessidade de se representarem várias séries em um mesmo gráfico. Gráficos em barrasverticais (coluna). DICA ESTATÍSTICA APLICADA 35 GRÁFICOS EM BARRAS HORIZONTAIS Quando as legendas são longas usa-se de preferência os gráficos em barras horizontais. Os retângulos (barras) têm a mesma base e as alturas são proporcionais aos respectivos dados. GRÁFICOS EM SETORES Estes gráficos são construídos em uma circunferência e empregados sempre que desejamos ressaltar a participação do dado no total. O total é representado pelos 360 graus de um círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que seus ângulos são respectivamente proporcionais aos dados da série. Devemos evitar o gráfico de setores quando tivermos mais de sete dados. As séries temporais, geralmente, não são representadas por este tipo de gráfico. IMPORTANTE DICA UNIDADE 2 - REPRESENTAÇÃO GRÁFICA 36 CARTOGRAMAS São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. HISTOGRAMA É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. É o gráfico que melhor representa uma distribuição de freqüências com intervalos de classe ( este assunto será abordado na unidade 3). No eixo horizontal (eixo x), representamos as classes da distribuição e no eixo vertical (eixo y), representamos as freqüências. A área de um histograma é proporcional à soma das freqüências simples ou absolutas. O histograma assemelha-se ao gráfico de colunas, a diferença é que não há espaçamento entre as colunas. IMPORTANTE ESTATÍSTICA APLICADA 37 POLÍGONO DE FREQÜÊNCIA É um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última da distribuição. OGIVOGRAMA É o gráfico de freqüências acumuladas. Ele é construído da mesma forma que o histograma, porém no eixo vertical (eixo y), representaremos as freqüências acumuladas. OGIVA DE GALTON A Ogiva de Galton ou polígono de freqüência acumulada é um gráfico de linhas traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. 10 20 30 40 50 60 UNIDADE 2 - REPRESENTAÇÃO GRÁFICA 38 É HORA DE SE AVALIAR! Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Nessa unidade, vimos os principais e os mais importantes gráficos estatísticos. Com uma ferramenta computacional é muito simples representar dados graficamente. Na próxima unidade veremos as medidas de tendência central. ESTATÍSTICA APLICADA 39 U N ID A D E 3 MEDIDAS DE TENDÊNCIA CENTRAL Estudaremos aqui três tipos de medidas de tendência central: média aritmética, moda e mediana. Essas medidas servem para visualizarmos a distribuição de freqüências no eixo de variação da variável estudada. OBJETIVOS DA UNIDADE: Compreender as medidas de tendência central e calculá-las para dados não agrupados e dados agrupados em classes de freqüências. PLANO DA UNIDADE: • Média Aritmética. • Moda. • Mediana. Bons estudos! UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL 40 As Medidas de Posição ou Tendência Central são denominadas dessa forma devido aos dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. As outras medidas de posição são as separatrizes, que englobam a própria mediana, os decis, os quartis e os percentis. MÉDIA ARITMÉTICA A Média Aritmética ( ) é a medida de posição que possui maior estabilidade e é igual ao quociente entre a soma dos valores da variável e o número total de observações. Veja, abaixo, a fórmula: Em que xi são os valores da variável e n o número de observações. Para dados não agrupados a Média Aritmética Simples ( ) é calculada da seguinte forma: EXEMPLIFICANDO Ex.: Um aluno de determinada instituição de ensino tirou as seguintes notas em estatística: 7, 10 e 6. Sabendo-se que a nota final desse aluno é calculada através da média aritmética das três avaliações feitas no período, temos como média final do aluno: x1 = 7; x2 = 10 e x3 = 6 Em relação aos dados agrupados sem intervalos de classe, consideremos a distribuição relativa a 38 crianças pacientes de uma clínica pediátrica com idades entre 0 e 4 anos. As freqüências representam quantas vezes ocorreu determinada idade, por exemplo, ao invés de escrevermos 0,0,1,1,1,1,1,1 etc., atribuímos a ESTATÍSTICA APLICADA 41 freqüência, logo, a idade 0 (zero) ocorre duas vezes; a idade 1 ocorre seis vezes e assim por diante. As freqüências funcionam como fatores de ponderação. A média aritmética, nesse caso, é a média aritmética ponderada, ou seja, em vez de somarmos o número 0 duas vezes, o número 1 seis vezes, o número 2 doze vezes e assim por diante, ponderamos os valores da variável com suas respectivas freqüências. Esta ponderação é dada pela fórmula: Obs.: = n, ou seja, a soma das freqüências é igual a n. = 38, n = 38. A idade média das crianças atendidas na clínica será . Agora, vejamos os dados agrupados com intervalos de classe. Observe a seguir as notas de 50 alunos de uma turma de estatística: Neste caso não temos como saber se os sete alunos da primeira classe tiveram notas, por exemplo, zero ou 1,9. Então, para diminuirmos o erro cometido com o agrupamento, utilizamos como valor representativo de cada intervalo o seu ponto médio (xi). Utilizamos, então, a mesma fórmula, sendo que xi agora não é mais o valor da variável e sim o ponto médio de cada classe. A média aritmética é calculada, então, da seguinte forma: UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL 42 Em que é o ponto médio da classe. No nosso exemplo: , , , , . Outros tipos de médias menos usados são as médias geométrica, harmônica, quadrática, cúbica e biquadrática. IMPORTANTE A média aritmética para a população é denotada por . Você já ouviu falar em moda? Não, não é bem dessa moda que vamos falar! É a Moda na Estatística. Vamos estudar sobre ela, agora? MODA (M O ) A Moda é o valor que mais aparece em uma série de valores. Você deve estar se perguntando: Como assim o valor que mais aparece? É isso mesmo! EXEMPLIFICANDO Por exemplo: o número de calçado mais vendido em uma sapataria é a moda. Até os vendedores ambulantes, mesmo sem saber, utilizam-se da moda. De uma maneira grosseira, podemos nos lembrar daquilo que está na moda, ou seja, daquilo que mais aparece. Viu como é simples? Podemos calcular a Moda para diversos tipos de dados. Veja como fazer isso: Moda para dados não agrupados A moda de uma distribuição para dados não agrupados é fácil de ser vista, é só procurarmos o valor que mais aparece. Uma distribuição pode ter nenhuma (amodal), uma (unimodal), duas (bimodal) ou mais modas. Exemplos: · Na série {6, 7, 9, 11, 11, 11, 12, 12} a moda é igual a 11. A distribuição é unimodal; · A série {2, 5, 7, 11,12} não possui um número que apareça mais que os outros. A série é amodal; EXEMPLIFICANDO ESTATÍSTICA APLICADA 43 · A série {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal; · Em outros casos, pode haver três ou mais valores que mais se repetem. Nesse caso, a série tem três ou mais modas. Moda para dados agrupados sem intervalos de classe Uma vez agrupados osdados, a moda é o valor da variável de maior freqüência. Ex.: Manequim de roupa feminina mais vendida em uma loja de departamentos: Resposta: 38 é o manequim modal, pois é o de maior freqüência. Moda para dados agrupados com intervalos de classe Classe modal é a classe que apresenta a maior freqüência. Nesse caso, a moda está compreendida entre os limites da classe modal. O método mais simples para o cálculo consiste em tomarmos o ponto médio da classe modal como sendo a própria moda. A este valor chamamos de moda bruta. Em que l* é o limite inferior da classe modal e L* o limite superior da classe modal. Ex.: Como podemos calcular o peso modal da tabela abaixo? Resposta: A classe modal é 50|— 55, pois é a de maior freqüência. l2 = 50 e L2 = 55 EXEMPLIFICANDO EXEMPLIFICANDO UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL 44 Mo = kg IMPORTANTE Não temos como saber o real valor da moda, pois não conhecemos mais os valores que estão compreendidos em um determinado intervalo. Portanto, este valor é apenas estimado. Você conhece a fórmula de Czuber? Pois, então conhecerá agora. Fórmula de CZUBER (processo mais elaborado) Em que: li é o limite inferior da classe modal. D1 = f * - f(ant) D2 = f * - f(post) h* é a amplitude da classe modal. f* é a freqüência simples da classe modal. f(ant) é a freqüência simples da classe anterior à classe modal. f(post) é a freqüência simples da classe posterior à classe modal. Para o cálculo do peso modal da tabela anterior temos: Passemos a estudar, agora, a mediana para dados não-agrupados, agrupados sem intervalos de classe e agrupados em classes. MEDIANA (M D ) A mediana de um conjunto de valores previamente ordenados. É o valor situado bem no meio do conjunto de valores de tal forma a separá-los em dois subconjuntos de mesmo número de elementos. ESTATÍSTICA APLICADA 45 Mediana para dados não-agrupados · Quando o número de valores for ímpar: Ex.: Dada uma série de valores {7, 2, 8, 13, 11, 7, 15, 12, 1} o primeiro passo a ser dado é a construção do rol: {1, 2, 7, 7, 8, 11, 12, 13, 15}. O valor que divide a série em duas partes iguais é o 8, logo a mediana Md = 8. Na prática, o valor mediano é dado por , ou seja, a mediana será o quinto elemento da série ordenada, que é 8. Md = 8 · Quando o número de valores for par: Ex.: Calcular a mediana da série {1, 2, 0, 0, 2, 4, 4, 3, 6, 4, 5, 6} Rol - {0, 0, 1, 2, 2, 3, 4, 4, 4, 5, 6, 6} - Md Temos, aqui, duas observações a serem feitas, por isso preste bastante atenção: · A mediana coincidirá com um dos elementos da série quando o número de elementos for ímpar. Quando o número de elementos da série for par, a mediana nunca coincidirá com um dos elementos da série. Neste caso, a mediana será sempre a média aritmética dos 2 elementos centrais da série; · A média aritmética, a mediana e a moda de uma série de valores não têm, necessariamente, o mesmo valor. Mediana para dados agrupados sem intervalos de classe Neste caso, basta identificarmos a freqüência acumulada (Fi) igual ou imediatamente superior à . A mediana será o valor da variável que corresponder a essa freqüência acumulada. Ex.: Veja a tabela a seguir: =, logo a mediana será Md = 3. EXEMPLIFICANDO EXEMPLIFICANDO EXEMPLIFICANDO = UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL 46 Mediana para dados agrupados em classes Para esse tipo de dado é preciso determinar a classe da mediana, que será aquela que corresponder à freqüência acumulada igual ou imediatamente superior à . A mediana é dada pela fórmula: Em que: li é o limite inferior da classe mediana. F(ant) é a freqüência acumulada anterior à classe mediana. f* é a freqüência simples da classe mediana. h* é a amplitude do intervalo da classe mediana. Exemplo: IMPORTANTE Neste caso a mediana é estimada, pois não temos todos os valores da distribuição. Qual é a medida que devemos usar? Todas as médias são valores que estão compreendidos entre o menor e o maior valor observado. Todas são igualmente importantes, portanto uma não deve prevalecer sobre a outra. Devemos saber que: EXEMPLIFICANDO ESTATÍSTICA APLICADA 47 · A média aritmética é a mais empregada apenas pelo fato de ser mais simples o seu cálculo e mais compreensível o seu resultado. É a medida de posição que possui a maior estabilidade; · A moda será utilizada quando a medida de posição for o valor mais típico da distribuição. É uma medida de rápida obtenção; · Quando desejamos obter o ponto que divide a distribuição em duas partes iguais, quando há valores extremos que afetam de maneira acentuada a média aritmética ou quando a variável em estudo é salário, usamos a mediana. A média aritmética de uma série de valores, por exemplo, é influenciável pelos seus extremos, enquanto que a mediana depende da posição e não dos valores dos elementos na série ordenada. É por isso que, no caso de séries com extremos muito distantes, usamos mais a mediana do que a média aritmética, para que não haja influência dos extremos. Ex.: Na série { 8, 9, 10, 15, 18}, a média = 12 e a mediana = 10. Já na série { 6, 8, 10, 11, 75 }, a média = 22 e a mediana = 10. A média do segundo conjunto de valores é maior do que a do primeiro por influência do valor extremo (75), porém, nas duas séries, a mediana é a mesma, ou seja, não adianta analisarmos apenas as médias aritméticas de uma série de valores, é preciso analisar também a mediana. É HORA DE SE AVALIAR! Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Vimos nesta unidade as medidas de tendência central. A média de um conjunto de valores ou de uma distribuição de classes é fundamental dentro do estudo da Estatística. Ela é um dos principais parâmetros de estudo e pesquisas. Na próxima unidade, veremos as medidas de dispersão – o cálculo dessas medidas nos permite a verificação de quão representativa é a média de uma distribuição em relação a todas as suas observações. EXEMPLIFICANDO UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL 48 ESTATÍSTICA APLICADA 49 U N ID A D E 4 MEDIDAS DE DISPERSÃO Estudaremos aqui as medidas de dispersão. Elas permitem calcular a dispersão (como os dados estão espalhados) existente entre os dados observados, estejam eles agrupados ou não, em relação à média aritmética. OBJETIVOS DA UNIDADE: Compreender as medidas de dispersão, calcular essas medidas, para dados não agrupados e dados agrupados em classes de freqüências. PLANO DA UNIDADE: • Amplitude total. • Variância. • Desvio padrão. • Coeficiente de variação. Bons estudos! UNIDADE 4 - MEDIDAS DE DISPERSÃO 50 A média aritmética, a moda e a mediana são valores representativos do todo, portanto a obtenção desses valores se faz fundamental no estudo de um conjunto de valores. Porém, para analisarmos um fenômeno estatístico, não basta obtermos apenas medidas de posição ou gráficos estatísticos. Para uma análise mais profunda, devemos saber como esses dados estão distribuídos no todo. As medidas de variabilidade ou dispersão nos dão exatamente isso. Elas fazem uma descrição de como os dados estão espalhados no todo. Existem diversas medidas de dispersão, porém, em nossa disciplina, estudaremos quatro delas, que são: · Amplitude total; · Variância; · Desvio padrão; · Coeficiente de variação; Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável: X = {20, 20, 20, 20, 20} Y = {05, 15, 20, 30 ,30} Z = {01, 01, 03, 05, 90} Os três conjuntos apresentam a mesma média aritmética , porém é fácil notar que o primeiro conjunto de valores é mais homogêneo que os outros dois, pois todos os valores sãoiguais. Já o segundo é mais homogêneo que o terceiro, pois este é o mais disperso de todos. Portanto não adianta dois ou mais conjuntos de valores terem a mesma média aritmética, algumas outras análises se fazem necessárias. AMPLITUDE TOTAL (AT) Amplitude Total (AT) é a diferença entre o limite superior da última classe e o limite inferior da primeira classe, ou seja, é a diferença entre os valores extremos de um conjunto de dados . Trata-se da única medida de dispersão que não tem a média como ponto de referência. A amplitude total é instável, pois só leva em consideração os valores extremos dos conjuntos de dados, descuidando do conjunto de valores intermediários, por isso é pouco utilizada. Uma de suas utilizações é na hora de decidirmos por uma distribuição de freqüência com ou sem intervalos de classes. Fazemos uso da amplitude total quando queremos determinar a amplitude da temperatura em um dia, por exemplo, medida de cálculo rápido sem muita exatidão. EXEMPLIFICANDO ESTATÍSTICA APLICADA 51 Ex.: Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25, 25, 27, 27, 48, 60 e 70 a amplitude amostral será: Agrupando os dados sem intervalos de classe: Com intervalos de classe: VARIÂNCIA (S2) A variância mede o grau de variabilidade em torno da média. É a média aritmética dos quadrados dos desvios (cada valor menos a média). Diferente da amplitude total que se deixa influenciar pelos extremos, a variância leva em consideração todos os valores da variável em estudo. Ela baseia-se nos desvios em torno da média. EXEMPLIFICANDO UNIDADE 4 - MEDIDAS DE DISPERSÃO 52 Variância Amostral · Para dados isolados: = cada valor observado. = média dos valores observados. n = tamanho da amostra. · Para dados agrupados: IMPORTANTE No denominador da fórmula da variância trabalhamos sempre com n-1 graus de liberdade para diminuir o erro do cálculo da variância com agrupamento da distribuição. Em que: = cada valor observado, no caso de dados agrupados com intervalos de classe, é o ponto médio do intervalo de classe. = média dos valores observados. = somatório das freqüências (n). fi = freqüência de cada classe. Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas clínicas de saúde A e B, temos: Clínica A EXEMPLIFICANDO i ESTATÍSTICA APLICADA 53 Clínica B Podemos observar que a variância da Clínica A é bem menor do que a variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso significa que os dados referentes às idades dos pacientes atendidos na primeira clínica são mais homogêneos, ou seja, mais concentrados em torno da média que os da segunda clínica, que são mais dispersos. DESVIO PADRÃO O desvio padrão é a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo e o seu resultado está na mesma unidade de medida da variável, diferente da variância, que é uma medida quadrática. Quanto maior o desvio padrão mais heterogêneos são os dados. O desvio é um indicador de variabilidade bastante estável. Ele baseia-se nos desvios em torno da média aritmética. É a média quadrática dos desvios, isto é, a raiz quadrada da variância. No nosso exemplo temos: Propriedades do desvio padrão · 1ª = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera; · 2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante. EXEMPLIFICANDO UNIDADE 4 - MEDIDAS DE DISPERSÃO 54 COEFICIENTE DE VARIAÇÃO DE PEARSON - CVP O desvio padrão tem algumas limitações. Um desvio padrão de 5 unidades, por exemplo, pode ser considerado pequeno para uma série de valores cujo valor médio é 500, porém, se a média for igual a 15, essa relação muda completamente. IMPORTANTE Outra questão a ser considerada é que o fato de o desvio padrão ser expresso na mesma unidade dos dados, o que não nos permite comparar duas ou mais séries de valores expressas em unidades diferentes. Para contornar essas dificuldades e limitações, utilizamos o coeficiente de variação CV. O coeficiente de variação é uma medida de dispersão relativa, ou seja, é admensional, é a relação entre o desvio padrão e uma medida de tendência central. Portanto, existem diversos tipos de coeficientes de variação. Aqui, estudaremos apenas um: o coeficiente de variação de Pearson. OBS.: O CV pode ser expresso em decimal ou em porcentagem. Ex.: Consideremos os pesos e as alturas de um grupo de jovens atletas de uma escola de ensino fundamental da baixada fluminense: qual das medidas (Estatura ou Peso) possui maior homogeneidade? Apenas através do desvio padrão não podemos dizer nada, pois este só pode ser comparado no caso de dados com a mesma unidade de medida. Teremos, então, que calcular o CVP da Estatura e o CVP do Peso. O menor resultado será o de menor dispersão ou variabilidade, ou seja, o de maior homogeneidade. Comparando os CVP, concluímos que as estaturas apresentam maior homogeneidade que os pesos. Se levarmos em consideração o coeficiente de variação das duas variáveis, podemos afirmar que a média dos dados é EXEMPLIFICANDO ESTATÍSTICA APLICADA 55 representativa, pois o CV é bem pequeno, tanto para estaturas quanto para os pesos. Estudamos nesta unidade as medidas de dispersão. O cálculo do desvio padrão é de grande importância no estudo da Estatística. Por ser um valor que se encontra na mesma unidade da variável, fica fácil seu entendimento. Ele mostra, em valores, o afastamento das observações em relação à média aritmética. Quando precisamos trabalhar variáveis diferentes, podemos compará-las através do coeficiente de variação. O estudo da dispersão ou afastamento dos dados é muito importante na nossa disciplina. É HORA DE SE AVALIAR! Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Veremos, na próxima unidade, como calcular uma amostra. UNIDADE 4 - MEDIDAS DE DISPERSÃO 56 ESTATÍSTICA APLICADA 57 U N ID A D E 5 NOÇÕES DE AMOSTRAGEM Esta unidade talvez seja uma das mais importantes da nossa disciplina, pois, num levantamento estatístico, a amostra deve ser representativa da realidade, se isso não ocorrer, não poderemos tirar nenhuma conclusão do comportamento de toda a população. Aqui aprenderemos mais um pouco sobre o cálculo de amostra e como poderemos confiar em seus resultados. OBJETIVO DA UNIDADE: Conhecer mais sobre o cálculo e os tipos de amostra e os métodos probabilísticos. PLANO DA UNIDADE: • Amostragem Casual ou Aleatória Simples. • Amostragem por Conglomerados. • Amostragem Acidental. • Amostragem Intencional. • Amostragem por Quotas. • Amostragem Estratificada. Bons estudos! UNIDADE 5 - NOÇÕES DE AMOSTRAGEM 58 CONCEITOS BÁSICOS Nem sempre a realização de um censo é possível, ou seja, obter informações referentes a todos os elementos de uma população torna-se, muitas vezes, praticamente impossível. Limitações de tempo e custo justificam o uso de técnicas amostrais. Amostra é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a mesma. É um subconjunto finito de uma população. Uma amostra deve ser cuidadosamente planejada a fim de garantir a menor margem de erro na pesquisa. Para selecionar uma amostra é preciso levar em conta as características de distribuição física da população, ou seja, algumas áreas têm uma população maior que outras. É preciso levantar os dados em proporção à densidade populacional das regiões. EXEMPLIFICANDO Por exemplo,se o objeto de estudo é o tipo de programa de TV mais assistido, não adianta fazer o estudo apenas em uma turma de escola de educação infantil, pois o resultado obviamente seria desenho animado. Crianças não costumam assistir a telejornais ou filmes da madrugada. Se a pesquisa fosse feita dessa forma, o resultado não estaria correto. Assim, no caso de uma população ser composta de 35% de crianças, 40% de adultos e os outros 25% de idosos, uma amostra dessa população também deve conter crianças, adultos e idosos na mesma proporção. Tipos de amostragem Existem basicamente dois métodos para composição da amostra: o método probabilístico e o não-probabilístico ou intencional. Métodos probabilísticos Neste método, faz-se necessário que cada elemento da população possua determinada probabilidade de ser selecionado, ou seja, se o tamanho da população for N, a probabilidade de cada elemento ser selecionado será . Esse método garante que cada elemento da população tenha a mesma chance de ser selecionado como elemento da amostra. Assim, podemos garantir cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra. Amostragem casual ou aleatória simples A amostragem casual ou aleatória simples é o processo mais utilizado. Equivale a um sorteio lotérico. Ela pode ser realizada da seguinte forma: numera-se a população de 1 a n e sorteiam-se, a seguir, por meio de um dispositivo aleatório qualquer, n números dessa seqüência, que corresponderão aos elementos pertencentes à amostra. A margem de erro é um interva- lo controlado dentro do qual podem variar os resultados fi- nais. Um estudo bem planejado é capaz de reduzir o erro de amostragem. ESTATÍSTICA APLICADA 59 Obs.: Quando o número de elementos da amostra é muito grande como, por exemplo, neste caso, tal tipo de sorteio é muito trabalhoso. Neste caso, utiliza-se uma tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 sejam distribuídos ao acaso nas linhas e colunas. Tabela de números aleatórios Exemplo: Uma determinada universidade possui 7000 alunos. Pretende-se fazer uma pesquisa para verificar como vai a saúde dos alunos. Serão selecionados, aleatoriamente, 5% dos alunos. Deslocar um funcionário para escrever 7000 números de matrícula em um pedaço de papel e depois sortear 350 pedaços é algo praticamente inviável e desnecessário. Então, a amostra é sorteada com o uso de uma tabela de números aleatórios da seguinte forma: os números de matrícula existentes possuem 4 dígitos, escolhemos 4 linhas ou colunas da tabela e selecionamos os números que correspondem a alunos matriculados na instituição. Os números que não correspondem são descartados. Se selecionarmos, por exemplo, as 4 primeiras colunas teremos como números selecionados 5772, 2880, 7454, 9120, 0425, 1205, 5254 ... Estas são, então, as matrículas selecionadas, caso existam. Amostragem proporcional estratificada Quando a população se divide em estratos (subconjuntos da população) é imprescindível que o sorteio dos elementos da amostra leve em consideração tais estratos. Daí, obteremos os elementos da amostra proporcional ao número de elementos desses estratos. EXEMPLIFICANDO UNIDADE 5 - NOÇÕES DE AMOSTRAGEM 60 Ex.: Vamos obter uma amostra de 10% dos pacientes internados em um SPA, supondo que sejam 106 mulheres e 54 homens. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos: Numeramos os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a 160, mulheres e, fazemos o sorteio casual com urna ou tabela de números aleatórios. Amostragem sistemática Quando os elementos da população já se acham ordenados, não há necessidade de sorteio. Neste caso, calcula-se o número de elementos da amostra e divide-se o número de elementos da população pelo de elementos da amostra (x), assim, escolhemos os elementos ordenados de x em x. Ex.: Imaginemos um prédio com 200 apartamentos dos quais desejamos obter uma amostra formada por 20 apartamentos para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 200/20 = 10. Escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam, periodicamente, considerados de 10 em 10. Assim, suponhamos que o número sorteado fosse 6, a amostra seria: 6º. apartamento, 16º. apartamento, 26º. apartamento etc. Amostragem por conglomerados (ou agrupamentos) Algumas populações não permitem ou dificultam extremamente a identificação de seus elementos. Não obstante, pode ser relativamente fácil identificar alguns subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode ser colhida e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc. Ex.: Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados. MÉTODOS NÃO-PROBABILÍSTICOS São amostragens nas quais há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população. EXEMPLIFICANDO EXEMPLIFICANDO ESTATÍSTICA APLICADA 61 AMOSTRAGEM ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Ela é geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Ex.: Pesquisas de opinião em praças públicas, ruas de grandes cidades. AMOSTRAGEM INTENCIONAL De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Ex.: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. AMOSTRAGEM POR COTAS Trata-se de um dos métodos de amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. Ele abrange três fases: primeiramente classifica a população, ou seja, verifica o que é relevante para a característica a ser estudada; em segundo lugar ele determina a proporção da população para cada característica com base no que se conhece sobre a população; em terceiro e último lugar, o pesquisador fixa cotas para cada entrevistador de modo que a amostra total observada contenha a proporção da população determinada na fase anterior. Ex.: Numa pesquisa sobre programa de TV mais assistido, provavelmente, será interessante dividirmos a população em homens e mulheres, cidade e campo, idade, renda média, faixas etárias etc. CÁLCULO PARA O DIMENSIONAMENTO DA AMOSTRA Para se dimensionar uma amostra, devemos saber: · A população é finita ou infinita? · Por exemplo: A população constituída por todos os brinquedos produzidos em um dia de trabalho em uma fábrica é finita, enquanto que a população constituída por todos os resultados (cara e coroa) em sucessivos lances de uma moeda é infinita. · A variável estudada é discreta ou contínua? · Variável Discreta ou Descontínua: seus valores são expressos, geralmente, através de números inteiros não negativos. Resulta normalmente de contagens. Ex.: Número de filhos de um casal - pode assumir valores como 0; 1; 2; 3... mas nunca valores como: 1,5; 3,72 etc. UNIDADE 5 - NOÇÕES DE AMOSTRAGEM 62 · Variável Contínua: pode assumir qualquer valor entredois limites, ou seja, assume valores em um intervalo real. Resulta, normalmente, de uma mensuração, ou seja, podem assumir, teoricamente, qualquer valor entre dois l imites. Ex.: Temperatura. Normalmente, as medições dão origem a variáveis contínuas e as contagens a variáveis discretas. · O erro amostral – expresso na unidade da variável estudada; O erro amostral é a máxima diferença que o pesquisador admite entre a média da população ( ) e a média da amostra ( ). · O desvio padrão da população – expresso na unidade da variável; O desvio padrão da população pode ser determinado através de estudos anteriormente feitos ou de suposições sobre o assunto. · A abscissa da curva normal padrão (Z) para um determinado nível de confiança. Normalmente utilizamos os níveis de confiança: Para 95% Z=1,96 99% Z=2,58 Fórmulas para o cálculo da amostra Em que: · Z é a abscissa da curva normal padrão. · é o desvio padrão da população. · N é o tamanho da população. · d é o erro amostral. · é a estimativa da proporção verificada em pesquisa anterior. Por exemplo: se a variável analisada for a proporção de crianças míopes de uma determinada cidade e em uma pesquisa anterior essa proporção foi de 20%, então, = 0,20. Quando se tratar de um trabalho original e o pesquisador não dispuser de nenhum valor, faz-se =50% = 0,50. · Obs. 1: Quando a população for infinita, usaremos as fórmulas e para variáveis contínuas e discretas, respectivamente. Quando ESTATÍSTICA APLICADA 63 a população for finita, poderemos usar estas mesmas fórmulas, porém fazendo uma pequena correção depois com a fórmula . Obs. 2: Quando o pesquisador não dispõe de uma pesquisa inicial e, portanto, não tem o valor do desvio padrão, ele toma aleatoriamente 30 indivíduos desta população e calcula o desvio padrão. Ex.: Uma pesquisa de opinião sobre a relação universidade e comunidade será realizada com a participação dos alunos e professores do curso de estatística. É necessário dimensionar a amostra, tendo em vista a impossibilidade de realização de um senso. Sabe-se que uma mesma pesquisa foi feita no ano anterior e registrou 30% de satisfação da população em relação ao trabalho que a universidade desenvolve com a comunidade. Qual será o número de indivíduos que farão parte desta amostra se a comunidade é de aproximadamente 8000 pessoas? Considere o nível de confiança de 95% e o erro de amostragem de 5%. Solução: Considerando que os dados são discretos, usaremos a fórmula e corrigiremos depois com a fórmula . Em que: amostra inicial. n = amostra corrigida. = valor obtido do trabalho anterior. Probabilidade de sucesso estimado. = 1 – 0,30 = 0,70 d = precisão (erro de amostragem). z = nível de confiança – abscissa da curva normal para 95% z = 1,96 O valor da amostra inicial é: A amostra corrigida é: Resultado: A amostra calculada terá 311 indivíduos. EXEMPLIFICANDO UNIDADE 5 - NOÇÕES DE AMOSTRAGEM 64 É HORA DE SE AVALIAR! Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Vimos, nesta unidade, vários processos para o cálculo de n (tamanho da amostra). Em uma pesquisa, o tamanho da amostra deve ser cuidado somente e calculado, pois do contrário, pode comprometer todo um trabalho. Na próxima unidade vamos estudar o cálculo das Probabilidades. ESTATÍSTICA APLICADA 65 U N ID A D E 6 CÁLCULO DAS PROBABILIDADES Todas as vezes que se estudam fenômenos de observação, cumpri-se distinguir o próprio fenômeno e o modelo matemático (determinístico ou probabilístico), que melhor o explica. Os fenômenos estudados pela estatística, são fenômenos que estão sujeitos ao acaso (fenômenos aleatórios), porque mesmo em condições normais de experimentação variam de uma observação para outra. Para fenômenos aleatórios adotar-se-á um modelo matemático probabilístico chamado de: Cálculo das Probabilidades. Este é o objeto de estudo de nossa unidade. OBJETIVO DA UNIDADE: Caracterizar os experimentos aleatórios calcular as possibilidades de acontecimento de tais experimentos, a chance de um evento ocorrer ou não, ou seja, a probabilidade de sucesso ou insucesso. PLANO DA UNIDADE: • Caracterização de um experimento aleatório • Espaço amostral • Evento • Eventos mutuamente exclusivos • Definição de Probabilidade • Principais teoremas • Probabilidades finitas dos espaços amostrais finitos • Espaços amostrais finitos equiprováveis • Probabilidade condicional • Teorema do produto • Independência estatística Bons estudos! UNIDADE 6 - CÁLCULO DAS PROBABILIDADES 66 CARACTERIZAÇÃO DE UM EXPERIMENTO ALEATÓRIO A fim de se entender melhor a caracterização dos experimentos, convém observar o que há de comum nos seguintes experimentos: Retirar uma carta de um baralho de 52 cartas e observar o seu naipe. Retirar com ou sem reposição, bolas de uma urna, que contém 5 bolas brancas e 6 pretas. Jogar um dado e observar o número mostrado na face de cima. A análise desses experimentos revela: a) cada experimento poderá ser repetido indefinidamente sob as mesmas condições; b) não se conhece um particular valor do experimento a priori, porém podem- se descrever todos os possíveis resultados – as probabilidades. c) quando o experimento for repetido um grande número de vezes, surgirá uma regularidade, isto é, haverá uma estabilidade da fração f = r/n (freqüência relativa), em que n é o número de repetições e r o número de sucesso de um particular resultado estabelecido antes da realização. Como veremos adiante, a característica (c) é de fundamental importância para a avaliação da probabilidade de certo evento. ESPAÇO AMOSTRAL Para cada experimento , define espaço amostral S o conjunto de todos os possíveis resultados desse experimento. a) Jogar um dado e observar o número da face de cima. S = {1, 2, 3, 4, 5, 6} b) jogar duas moedas e observar o resultado. S = {(ca, ca); (ca, co); (co, ca); (co, co)}, onde ca = cara e co = coroa. Obs: S poderá ser um conjunto finito ou infinito enumerável. Trataremos de conjuntos finitos. o símbolo significa ex- perimento. EXEMPLIFICANDO ESTATÍSTICA APLICADA 67 EVENTO É um conjunto de resultados do experimento, isto é, um subconjunto de S. Inclusive e o próprio S. Usando as operações com conjuntos, podemos formar novos eventos. Assim: · É o evento que ocorre se pelo menos um deles ocorrer. · É o evento que ocorre se ambos ocorrerem simultaneamente. · É o evento que ocorre se A não ocorre. a) jogar três moedas e observar o resultado. S = {(ca, ca, ca); (ca, ca, co); (ca, co, ca); (co, ca, ca); ( co, co, ca); (co, ca, co); (ca, co, co); (co, co, co)} A = Evento ocorrer pelo menos duas caras. A = {(ca, ca, ca); (ca, ca, co); (ca, co, ca) ; (co, ca, ca)} b) lançar um dado e observar o número da face de cima. S = {1, 2, 3, 4, 5, 6} B = Evento ocorrer número par. B = {2, 4, 6} Sendo S um espaço amostral finito com n elementos, pode-se verificar que o número total de eventos extraído de S é 2n. EVENTOS MUTUAMENTE EXCLUSIVOS Dois eventos A e B são ditos mutuamente exclusivos se A e B não puderem ocorrer simultaneamente, isto é, . jogar um dado e observar o resultado S = {1, 2, 3, 4, 5, 6} A ocorrer número par – {2, 4, 6} B ocorrer número ímpar – {1, 3, 5} Eventos mutuamente exclusivos ou disjuntos. DEFINIÇÃO DE PROBABILIDADE Dado um experimento aleatório e S o espaço amostral, a probabilidade de um evento, Pr(A) é uma função definida em S, que associado a cada evento um número real, satisfaz os seguintes axiomas: · · Pr(S) = 1 · EXEMPLIFICANDO EXEMPLIFICANDO UNIDADE 6 - CÁLCULO DAS PROBABILIDADES
Compartilhar