Baixe o app para aproveitar ainda mais
Prévia do material em texto
Autores: Prof. Alan Rodrigo Navia Profa. Alessandra Carvalho Teixeira Colaboradoras: Profa. Amarilis Tudella Profa. Christiane Mazur Doi Noções de Estatística Professores conteudistas: Alan Rodrigo Navia / Alessandra Carvalho Teixeira Alan Rodrigo Navia É graduado em Materiais, Processos e Componentes Eletrônicos pela Fatec-SP. Possui mestrado em Engenharia Eletrônica pela Poli-USP, na área de Circuitos Integrados. Exerceu as seguintes funções no mercado de trabalho: pesquisador em Engenharia na Swiss Group, analista estatístico na Amcham, especialista em sistemas pleno no Carrefour e atualmente é coordenador de sistemas no Grupo Renac. Academicamente, lecionou na Fundação Santo André no curso de Engenharia, foi auxiliar docente do curso de Engenharia Eletrônica na Poli-USP e leciona há quase dez anos na Universidade Paulista (UNIP). Suas principais áreas de atuação na docência são: estatística, banco de dados e programação de computadores e matemática. Alessandra Carvalho Teixeira Fez mestrado e doutorado em Ensino de Ciências e Matemática pela Universidade Cruzeiro do Sul. É licenciada em Matemática com ênfase em Ciências da Computação pelo Centro Universitário São Camilo, licenciada em Pedagogia pela Universidade São Bernardo, especialista em Modelagem Matemática pela Universidade Federal do ABC (UFABC). Atua na Educação Básica como professora de matemática dos anos finais do Ensino Fundamental e do Ensino Médio da rede pública do estado de São Paulo desde 1995. Já foi diretora e coordenadora pedagógica na rede estadual de ensino e professora de matemática para os anos finais do Ensino Fundamental no Centro de Mídias do Estado de São Paulo – CMSP, em 2020, por meio de aulas ao vivo. Hoje é coordenadora da área de ensino de ciências e matemática numa escola da rede estadual, coordenadora de estágio dos cursos de Matemática e Física EaD na UNIP, orientadora de trabalho de conclusão de curso das turmas de Pedagogia e Matemática da UNIP Interativa. Suas linhas de pesquisa são: avaliação em larga escala, currículo, didática da matemática. © Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem permissão escrita da Universidade Paulista. U511.71 – 21 Dados Internacionais de Catalogação na Publicação (CIP) F325e Navia, Alan Rodrigo Noções de Estatística / Alan Rodrigo Navia, Alessandra Carvalho Teixeira. – São Paulo: Editora Sol, 2021. 132 p., il. Notas: este volume está publicado nos Cadernos de Estudos e Pesquisas da UNIP, Série Didática, ISSN 1517-9230 1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Teixeira, Alessandra Carvalho. II. Título. CDU 519.2 Prof. Dr. João Carlos Di Genio Reitor Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Pós-Graduação e Pesquisa Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação Unip Interativa – EaD Profa. Elisabete Brihy Prof. Marcello Vannini Prof. Dr. Luiz Felipe Scabar Prof. Ivan Daliberto Frugoli Material Didático – EaD Comissão editorial: Dra. Angélica L. Carlini (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Deise Alcantara Carreiro – Comissão de Qualificação e Avaliação de Cursos Projeto gráfico: Prof. Alexandre Ponzetto Revisão: Giovanna Cestari Vitor Andrade Sumário Noções de Estatística APRESENTAÇÃO ......................................................................................................................................................7 INTRODUÇÃO ...........................................................................................................................................................8 Unidade I 1 CONCEITOS FUNDAMENTAIS .........................................................................................................................9 1.1 Conceitos iniciais .....................................................................................................................................9 1.2 Dados ......................................................................................................................................................... 10 1.3 População versus amostra ................................................................................................................ 12 1.4 Amostragem ........................................................................................................................................... 13 2 DISTRIBUIÇÃO DE FREQUÊNCIA ................................................................................................................ 17 2.1 Conceitos básicos ................................................................................................................................. 17 2.2 Elementos de uma distribuição de frequência ......................................................................... 21 2.2.1 Classe (i) ...................................................................................................................................................... 21 2.2.2 Limites de classe (li ou Li) .................................................................................................................... 21 2.2.3 Amplitude de classe (hi) ....................................................................................................................... 22 2.2.4 Amplitude amostral (AA) ..................................................................................................................... 22 2.2.5 Ponto médio de classe (xi) ................................................................................................................... 22 2.3 Tipos de frequências ............................................................................................................................ 23 2.3.1 Frequência absoluta ou simples (fi) ................................................................................................. 23 2.3.2 Frequência relativa (fri) ........................................................................................................................ 23 2.3.3 Frequência acumulada (Fi) .................................................................................................................. 24 2.4 Construção de distribuições de frequências ............................................................................. 24 2.4.1 Distribuição sem intervalo .................................................................................................................. 24 2.4.2 Distribuição com intervalo .................................................................................................................. 25 2.5 Representações gráficas .................................................................................................................... 28 2.5.1 Histograma (gráfico de colunas) ...................................................................................................... 28 2.5.2 Polígono de frequências (gráfico cartesiano) .............................................................................. 28 2.5.3 Gráfico em colunas ................................................................................................................................ 29 2.5.4 Gráfico em barras ................................................................................................................................... 30 2.5.5 Gráfico em linhas .................................................................................................................................... 30 2.5.6 Gráfico em setores .................................................................................................................................31 2.5.7 Diagrama de dispersão ......................................................................................................................... 32 3 MEDIDAS DE TENDÊNCIA CENTRAL ......................................................................................................... 35 3.1 Média (x) ................................................................................................................................................. 35 3.1.1 Dados não agrupados ........................................................................................................................... 35 3.1.2 Distribuição de frequências sem intervalo ................................................................................... 36 3.1.3 Distribuição de frequências com intervalo .................................................................................. 36 3.2 Moda (Mo) ............................................................................................................................................... 38 3.2.1 Dados não agrupados ........................................................................................................................... 38 3.2.2 Distribuição de frequências sem intervalo ................................................................................... 39 3.2.3 Distribuição de frequências com intervalo .................................................................................. 39 3.3 Mediana (Md) ......................................................................................................................................... 41 3.3.1 Dados não agrupados ........................................................................................................................... 41 3.3.2 Distribuição de frequências sem intervalo ................................................................................... 42 3.3.3 Distribuição de frequências com intervalo .................................................................................. 43 4 MEDIDAS DE DISPERSÃO ............................................................................................................................. 47 4.1 Introdução ............................................................................................................................................... 47 4.2 Variância (s2) .......................................................................................................................................... 48 4.2.1 Dados não agrupados ........................................................................................................................... 48 4.2.2 Distribuição de frequências sem intervalo ................................................................................... 50 4.2.3 Distribuição de frequências com intervalo .................................................................................. 51 4.3 Desvio-padrão (s) ................................................................................................................................ 53 4.3.1 Dados não agrupados ........................................................................................................................... 53 4.3.2 Distribuição de frequências sem intervalo ................................................................................... 53 4.3.3 Distribuição de frequências com intervalo .................................................................................. 54 4.4 Coeficiente de variação (CV) ............................................................................................................ 55 Unidade II 5 CONCEITOS BÁSICOS DE PROBABILIDADE ............................................................................................ 66 5.1 Conceitos fundamentais ................................................................................................................... 66 5.2 Eventos complementares ................................................................................................................. 71 5.3 Eventos independentes ...................................................................................................................... 72 5.4 Eventos mutuamente exclusivos ................................................................................................... 74 5.4.1 Exercício resolvido .................................................................................................................................. 76 6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES ................................................................................... 79 6.1 Conceitos fundamentais ................................................................................................................... 79 6.1.1 Exercícios resolvidos .............................................................................................................................. 84 7 CORRELAÇÃO LINEAR .................................................................................................................................... 91 7.1 Conceito de diagrama de dispersão .............................................................................................. 91 8 COEFICIENTE DE PEARSON .......................................................................................................................... 93 8.1 Exercícios resolvidos ....................................................................................................................................... 99 7 APRESENTAÇÃO A palavra estatística é muito conhecida por todos nós, por mais que não saibamos exatamente o que é e como utilizá-la. Ainda que de modo informal, utilizamos diversos conceitos e informações estatísticas para orientar nossa leitura da realidade, permitindo que possamos tomar decisões que dependam dessas informações. Conforme Toledo e Ovalle (1995, p. 13) afirmaram há 25 anos, e perceberemos que ainda vale para os dias atuais: A utilização da Estatística é cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos seus mais diversificados ramos de atuação, as pessoas estão frequentemente expostas à Estatística, utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método proporciona àqueles que dele necessitam. Este livro-texto contempla os temas fundamentais para um curso de introdução à estatística. A grande quantidade de exercícios de aplicação e a preocupação em explicar os métodos de cálculo, passo a passo, de modo a facilitar a apreensão do conteúdo, são os pontos marcantes deste material, que tem como objetivo ensinar os conceitos básicos da estatística. O pré-requisito para acompanhar a obra é a matemática do Ensino Fundamental, a qual, inclusive, é exercitada a todo o momento, nas mais diversas disciplinas e áreas do conhecimento. Os objetivos desta disciplina foram definidos de modo que essa área do conhecimento seja um instrumento de análise da realidade para auxiliar na sua prática profissional. Eles estão listados a seguir: • desenvolver a habilidade de futuros profissionais no decorrer de pesquisas; • mostrar a importância da estatística descritiva em todas as áreas de ensino; • ensinar a utilização de métodos estatísticos como ferramenta de trabalho a partir de coleta, descrição e organização de dados nas diversas áreas de conhecimento, tais como: ciências sociais, ciências humanas, ciências exatas, ciências administrativas e ciências da saúde. Acima de tudo, pretendemos que esta obra possa ser um instrumento de auxílio na compreensão dos conceitos básicos de estatística de maneira mais consistente. 8 INTRODUÇÃO Este livro-texto aborda os assuntos fundamentais da estatística, desde o estudo de uma variável até a introdução ao estudo do comportamento mútuo de duas variáveis. A unidade I cobre os conceitos introdutórios – e importantíssimos – para o entendimento do restante do material,a organização de dados em tabelas de frequência, a obtenção de medidas de tendência central e posição e a determinação de medidas de dispersão e variabilidade. Esses tópicos fazem parte da estatística descritiva (responsável por organizar e descrever os dados coletados). A unidade II aborda os conceitos de probabilidade simples, distribuição normal de probabilidades e determinação da correlação entre duas variáveis por meio do diagrama de dispersão e do coeficiente de Pearson. Procuramos trazer exercícios de aplicação e revisão dos conceitos trabalhados com o intuito de auxiliar o desenvolvimento da aprendizagem. Esperamos que este livro-texto auxilie você, aluno, a entender e aplicar os conceitos básicos de estatística, além de servir como guia para que você os relembre e possa aplicá-los sempre que precisar. 9 NOÇÕES DE ESTATÍSTICA Unidade I 1 CONCEITOS FUNDAMENTAIS 1.1 Conceitos iniciais A palavra estatística tem origem no vocábulo latino status, que significa estado, e foi utilizada para o levantamento de dados por parte do Estado, visando à tomada de decisões. A estatística é a parte da matemática aplicada que se dedica ao estudo e à interpretação de fenômenos coletivos e deles extrai conclusões. Ela fornece métodos para: • coleta de dados, feita normalmente por meio de um questionário ou da observação direta do fenômeno estudado; • organização e descrição dos dados; • análise e interpretação dos dados, visando à tomada de decisões. Observação Dados são informações oriundas de observações, contagens, respostas ou medições. A estatística pode ser aplicada às mais diversas áreas do conhecimento, tais como economia, física, medicina, psicologia, engenharia, pedagogia e serviço social, para tabular e interpretar os resultados de um experimento, e, mais recentemente, para a geração e a interpretação de indicadores. Esses indicadores são largamente utilizados na gestão dos mais diversos segmentos do conhecimento. Para um aluno de qualquer curso superior, a estatística é muito importante para: • organizar e analisar os dados de um experimento científico/observação de um fenômeno em qualquer área do conhecimento; • servir de embasamento para entender analisar e até criar indicadores relevantes em seu trabalho (entendendo que, muitas vezes, o egresso de um curso superior pode levar a assumir um cargo de gerência no seu segmento de formação). 10 Unidade I Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de uma determinada localidade, a taxa de evasão de clientes de uma empresa de telefonia, o índice de contágio da Covid-19 em uma determinada região e os vários indicadores de aprendizado utilizados na educação, por exemplo, a taxa de evasão de alunos de uma escola/faculdade, o rendimento dos alunos por meio dos indicadores notas e faltas, entre outros. A estatística pode ser classificada em: • descritiva: responsável pela coleta, organização e descrição dos dados; • indutiva: responsável pela análise e interpretação de dados. A estatística descritiva pode ser interpretada como uma função, cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados referentes a esses fenômenos e a sua apresentação através de gráficos e tabelas, além do cálculo de coeficientes que permitem descrever resumidamente os fenômenos (TOLEDO; OVALLE, 1995) – e este é o foco do presente livro-texto. 1.2 Dados Conforme definido anteriormente, dados (também denominados por alguns autores como variáveis) são informações obtidas a partir de medições, resultados de pesquisas, contagens e levantamentos em geral. Alguns exemplos de dados são: o número de alunos de uma classe, o número de eleitores que votaram em um determinado candidato em uma eleição, o número de leitos ocupados por infectados pela Covid-19 em um hospital e as notas dos candidatos de um determinado concurso público. Em estatística, os dados podem ser classificados como: • Qualitativos: são dados compostos de qualquer informação não numérica (adjetivos/atributos/ rótulos). Exemplos: estado civil (solteiro, casado, divorciado); cor dos olhos (pretos, verdes, azuis, castanhos); time do coração (Corinthians, Palmeiras, São Paulo, Santos, Cruzeiro); religião praticada (católica, protestante, budista, espírita); tipo sanguíneo (A, B, O) etc. • Quantitativos: são dados compostos de informações numéricas ou contagens e podem ser subdivididos em: — Discretos: são compostos somente por números inteiros e enumeráveis (na maioria das vezes, são oriundos de uma contagem). Exemplos: número de filhos, população de um município, número de escolas particulares em um determinado local, número de visitas em um determinado site na internet etc. — Contínuos: são compostos por números inteiros ou racionais, tanto na representação fracionária como na decimal (na maioria das vezes, são obtidos por meio de uma medição), ou 11 NOÇÕES DE ESTATÍSTICA seja, teoricamente, podem assumir qualquer valor entre dois limites. Exemplos: altura, peso, preço de um determinado produto, área de um terreno, renda mensal de uma família, o tempo gasto em uma viagem nacional, a distância entre dois bairros etc. Dados Qualitativos Quantitativos Discretos Contínuos Figura 1 – Classificação dos dados em estatística Para identificarmos de que tipo é uma variável, podemos fazer algumas perguntas que nos ajudarão nessa identificação: • Este valor representa uma quantidade, um valor numérico? • Se a resposta for sim, é uma variável quantitativa? Se não, é uma variável qualitativa. • Se for quantitativa, pode assumir qualquer valor entre dois limites ou é um número inteiro? Se a resposta for sim sobre assumir qualquer valor entre dois limites, a variável é quantitativa contínua; caso contrário, é uma variável quantitativa discreta. Para exemplificarmos os dados qualitativos e quantitativos, utilizaremos uma pesquisa fictícia. Observe a tabela a seguir: Tabela 1 – Dados qualitativos e quantitativos Estado civil Grau de instrução Número de filhos Salário (x. mínimo) Idade (anos-meses) Casado Ensino Médio 2 19,40 32 10 Solteiro Ensino Superior – 4,00 23 03 Solteiro Ensino Fundamental – 10,53 25 08 Casado Ensino Médio 1 4,56 48 11 Solteiro Ensino Fundamental – 16,22 31 05 Nessa pesquisa, feita com cinco pessoas, duas perguntas apresentaram como respostas dados qualitativos, sendo eles o estado civil e o grau de instrução, pois se referem a informações não numéricas. Em contrapartida, três perguntas foram respondidas com dados quantitativos, sendo que uma delas é quantitativa discreta (número de filhos), pois são valores inteiros (obtidos a partir de uma contagem) 12 Unidade I e duas quantitativas contínuas (salário e idade) por representações decimais (obtidos a partir de uma medição). Exemplo de aplicação Como você faria a classificação das seguintes variáveis? a) Número de páginas desta unidade. b) Peso dos professores de uma escola. c) Tipos de empresas em relação ao serviço prestado. d) Tamanho de empresas (pequena, média e grande). Observação A classificação da variável depende do contexto. Por exemplo: para fins cadastrais, a variável idade poderia ser quantitativa discreta; na pediatria, porém, é contínua, pois os meses também são considerados. 1.3 População versus amostra População é a coleção de todos os resultados, respostas, medições ou contagens que são de interesse e possuem, no mínimo, uma característica comum. Um exemplo são os estudantes de uma instituição de ensino, pois a característica comum é o fato de estudarem na mesma instituição. Os eleitores de um estado da federação também são um exemplo de população. Na maioria das vezes, podemos concluir que é inviável ter acesso a toda a população para a coleta de dados (por limitações monetárias, de tempo etc.). Logo, normalmente é feita a coleta em uma parte, que deve ser muito representativa dessa população. Essa parcela da população é denominada amostra. Em alguns casos,seria impossível entrevistar todos os elementos de uma população, pois levaria muito tempo para concluir o trabalho ou poderia ser financeiramente inviável. Imagine, por exemplo, uma pesquisa com os integrantes de equipes multidisciplinares de todas as empresas privadas do país. Além de demorar para ser concluída, dependendo de como fosse realizada, implicaria questões financeiras inviáveis, bem como a impossibilidade física de examinar toda a população. Desse modo, o ideal seria determinar uma amostra representativa da população para participar dessa pesquisa. Vamos a um exemplo adaptado de Farber e Larson (2015). Imagine que, em determinada pesquisa, perguntou-se a 720 proprietários de pequenas empresas no Estado de São Paulo se eles achavam que a 13 NOÇÕES DE ESTATÍSTICA presença de sua empresa no Facebook tinha valor. 269 dos 720 responderam que sim. Qual a população e a amostra? E como você descreveria o conjunto de dados da amostra? Solução: a população consiste nas respostas de todos os proprietários de pequenas empresas do Estado de São Paulo e a amostra consiste nas respostas dos 720 pequenos empresários pesquisados. O conjunto de dados da amostra equivale aos 269 proprietários que responderam “sim” e 451 que responderam “não”. Amostra, portanto, corresponde ao subconjunto finito e representativo de uma população. Para obter uma boa amostra, utilizamos a técnica da amostragem. 1.4 Amostragem Antes de obter uma amostra, precisamos definir os critérios/técnicas que serão usados para selecionar os elementos que farão parte de sua composição. O tipo de amostra está relacionado à técnica que usamos para obtê-la. Técnicas de amostragem apropriadas devem ser usadas para garantir que as inferências sobre a população sejam válidas. Não podemos nos esquecer de que, quando um estudo é realizado com dados falhos, os resultados apresentados serão questionáveis. As três principais técnicas de amostragem são: • amostragem simples (ou aleatória); • amostragem sistemática; • amostragem estratificada. Na amostragem simples (ou aleatória), todos os elementos da população têm igual chance de pertencer à amostra (normalmente feita por sorteio). Observe como utilizamos essa técnica de amostragem. Vamos obter uma amostra representativa para a pesquisa de estatura de 150 alunos de uma escola, num exemplo adaptado de Crespo (2009). Primeiro, numeramos os alunos de 1 a 150. Escrevemos os números, de 1 a 150, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Depois, agitamos a caixa para misturar bem os pedaços de papel e retiramos, um a um, 15 números, que formarão a amostra, a qual, nesse caso, equivale a 10% da população. Quando precisamos de uma amostra com uma grande quantidade de elementos, utilizamos a Tabela de Números Aleatórios, construída de modo que os dez algarismos (de 0 a 9) são distribuídos ao acaso nas linhas e colunas. 14 Unidade I Já na amostragem sistemática, os itens encontram-se ordenados e numerados, e a coleta dos elementos da amostra é feita periodicamente. Se pensarmos em uma linha de produção, podemos, a cada 100 itens feitos, retirar 10 para pertencer a uma amostra de produção diária. Nesse caso, estaríamos fixando o tamanho da amostra em 10% da população (CRESPO, 2009). Como mais um exemplo, suponhamos uma rua contendo 800 prédios, dos quais desejamos obter uma amostra de 40 prédios. Podemos, nesse caso, usar o seguinte procedimento: como 800 40 20= , escolhemos por sorteio um número de 1 a 20 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 20 em 20. Assim, se o número sorteado fosse 7, tomaríamos, pelo lado esquerdo da rua, o 7º prédio, o 27º prédio, o 47º prédio etc. até voltarmos ao início da rua, pelo lado direito (CRESPO, 2009). Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras são coletadas aleatoriamente de cada estrato. Supondo que dos 150 alunos citados no exemplo de amostragem simples, 84 sejam meninos e 66 sejam meninas, vamos obter a amostra populacional estratificada. Temos dois estratos, sexo masculino e sexo feminino, e queremos uma amostra de 10% da população. Logo, temos: Tabela 2 Sexo População 10% Amostra M 84 10 84 100 840 100 8 4 . ,= = 8 F 66 10 66 100 660 100 6 6 . ,= = 7 Total 150 10 150 100 1500 100 15 . = = 15 Para que possamos identificar o tamanho da amostra a partir de valores decimais, precisamos observar o valor que está após a vírgula (nos décimos, já que queremos um valor inteiro). Se esse valor estiver compreendido entre 0 e 4, como é o caso da amostra masculina (8,4), nós mantemos a parte inteira – que nesse caso é 8. Contudo, se o valor estiver compreendido entre 5 e 9, como é o caso da amostra feminina (6,6), nós arredondamos a parte inteira – no nosso exemplo, de 6,6 para 7, como se vê na tabela. Numeramos os alunos de 1 a 150, sendo que de 1 a 84 temos os meninos e de 85 a 150, as meninas. A partir de então podemos usar o mesmo sistema empregado na amostragem simples, retirando 8 números relacionados aos meninos e 7 relacionados às meninas – lembrando que, para grandes quantidades, devemos usar a tabela de números aleatórios. 15 NOÇÕES DE ESTATÍSTICA Saiba mais Após a leitura deste material, você pode aprofundar os estudos em amostragem para compreender melhor assuntos como tamanho e nível de confiança de amostra lendo o livro a seguir: BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. Exemplo de aplicação 1. Pesquise um exemplo prático para cada tipo de amostragem. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 2. Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas): a) População: alunos de uma escola Variável: cor dos olhos________________________________________ b) População: casais residentes em uma cidade Variável: número de filhos_____________________________________ c) População: as jogadas de um dado Variável: os pontos obtidos em cada jogada________________________ d) População: peças produzidas por certa máquina Variável: número de peças produzidas por hora_____________________ e) População: peças produzidas por certa máquina Variável: diâmetro externo_____________________________________ f) População: casais residentes em uma cidade Variável: sexo dos filhos_______________________________________ 16 Unidade I 3. Uma escola dos anos iniciais do Ensino Fundamental abriga 124 alunos. Obtenha uma amostra representativa correspondendo a 15% da população. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 4. O diretor de uma escola na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. 5. Uma cidade Y apresenta a seguinte tabela relativa às suas escolas dos anos iniciais do Ensino Fundamental: Tabela 3 – Anos iniciais do Ensino Fundamental Escolas Número de estudantes Masculino Feminino A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 876 955 Obtenha uma amostra estratificada de 120 estudantes. ______________________________________________________________________________ ____________________________________________________________________________________________________________________________________________________________ ______________________________________________________________________________ 6. Para estudar o uso de serviços de saúde por mulheres em idade reprodutiva, moradoras de uma grande capital, um pesquisador buscou no Instituto Nacional de Estatística (INE) as subdivisões da idade utilizadas em censos, conhecidas como setores censitários. Como você procederia para tomar uma amostra de mulheres moradoras da capital nesses setores e em idade reprodutiva? ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 17 NOÇÕES DE ESTATÍSTICA 7. Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, às 18h30. Dois dias mais tarde, uma firma de pesquisa de mercados realiza um levantamento telefônico para obter informações sobre os índices de respostas (percentagem de telespectadores que responderam ter visto o comercial) e impressões sobre o comercial. a) Qual é a população desse estudo? __________________________________ b) Qual é a amostra para esse estudo? _________________________________ c) Por que se usaria uma amostra nessa situação? Explique. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 2 DISTRIBUIÇÃO DE FREQUÊNCIA 2.1 Conceitos básicos Para compreender melhor todos os conceitos, vamos utilizar uma amostra como exemplo. A amostra é de quarenta alunos de uma escola qualquer, e a variável a ser estudada é a estatura deles em centímetros. Observe a tabela dos valos das estaturas (em cm) coletados: Tabela 4 – Tabela primitiva das estaturas dos alunos 166 161 163 172 160 160 151 58 162 152 156 162 173 169 158 160 155 161 150 156 155 156 164 168 154 161 163 155 157 167 164 164 160 168 160 153 165 155 170 161 Essa tabela com os dados coletados (dados brutos), sem nenhuma organização, é chamada de tabela primitiva. Para analisar os dados na tabela primitiva para determinar a maior e a menor estatura, será necessário examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande. Se os dados da tabela forem organizados em ordem crescente ou decrescente, será obtida uma nova tabela, chamada rol. 18 Unidade I Tabela 5 – Rol das estaturas dos alunos 150 155 156 160 161 162 164 168 151 155 156 160 161 163 165 169 152 155 157 160 161 163 166 170 153 155 158 160 161 164 167 172 154 156 158 160 162 164 168 173 Examinando o rol, fica fácil determinar a maior e a menor estatura (173 cm e 150 cm, respectivamente), o que permite concluir que a faixa de estaturas é de 150 cm a 173 cm. Inclusive, com uma observação mais cuidadosa do rol, podem ser respondidos outros questionamentos, por exemplo: “qual é a estatura com o maior número de alunos?” (160 cm) e “qual(is) é(são) a(s) estatura(s) inexistente(s) no intervalo de 150 a 173 cm?” (159 e 171 cm). Para responder ao questionamento anterior com mais agilidade, o rol será alocado em uma tabela, em que cada estatura terá um número correspondente de ocorrências (vindo da contagem do rol). Tabela 6 – Tabela de ocorrências das estaturas dos alunos Estatura (cm) Número de ocorrências (fi) 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 158 2 159 0 160 5 161 4 162 2 163 2 164 3 165 1 166 1 167 1 168 2 169 1 19 NOÇÕES DE ESTATÍSTICA Estatura (cm) Número de ocorrências (fi) 170 1 171 0 172 1 173 1 Σfi 40 Onde: fi = frequência número de ocorrências para cada valor de estatura Σfi = soma das frequências Σfi = n n = quantidade de elementos da amostra (n = 40) A tabela de ocorrências para todos os valores das estaturas é chamada de distribuição de frequências. Nesse caso, como foram exibidos todos os valores de estatura, a distribuição é classificada como sem intervalo. A amostra tem a faixa de estaturas de 23 cm (basta subtrair a menor estatura da maior), que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais linhas, o que prejudicaria a rapidez da análise dos dados. Observe outro exemplo. Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma: Tabela 7 – Notas dos 25 alunos 4,0 5,0 7,0 9,0 9,0 4,0 5,0 7,0 9,0 9,0 4,0 5,0 7,0 9,0 9,0 4,0 6,0 8,0 9,0 9,0 4,0 6,0 8,0 9,0 9,0 A partir da organização dos dados em rol, podemos tabular as notas para analisar o desempenho da turma, a fim de que possam ser consultadas de uma forma simplificada e resumida. Vamos, então, elaborar a distribuição de frequência dessas notas por meio de contagem, ou seja, observando o número de vezes que cada uma aparece. 20 Unidade I Tabela 8 – Distribuição de frequências, sem intervalos, para as notas dos alunos Nota Frequência (f)(número de alunos) 4,0 5 5,0 3 6,0 2 7,0 3 8,0 2 9,0 10 Σfi 25 Podemos perceber, observando a distribuição de frequência, que cinco alunos tiraram nota 4; três tiraram nota 5; dois tiraram nota 6 e assim sucessivamente. Também é possível perceber que a maioria dos alunos tirou nota 9. Para gerar uma tabela mais enxuta e de fácil análise, é possível agrupar as estaturas em intervalos. No exemplo, as estaturas serão agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento, não há necessidade de se preocupar com a razão de o agrupamento ser de quatro em quatro, pois adiante será explicado o critério de cálculo utilizado). Essa tabela é chamada de distribuição de frequências com intervalo. Tabela 9 – Distribuição de frequências com intervalo para as estaturas dos alunos Estaturas (cm) fi 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Σfi 40 Onde: Não inclui o valor (utiliza-se o anterior)Inclui o valor É o operador de intervalo Figura 2 Vamos a um exemplo. O quinto intervalo da tabela anterior, que mostra 166 170 é para as estaturas de 166 a 169 cm (note que o valor 170 cm é considerado no sexto). Os valores do rol que 21 NOÇÕES DE ESTATÍSTICA atendem a esse intervalo são: 166, 167, 168 e 169. Esses cinco valores resultam na frequência igual a 5 para o quinto intervalo. A etapa da contagem dos valores do rol para a tabela de frequências deve ser feita com o máximo de cuidado, pois um erro na contagem ocasiona análises equivocadas e valores errados de todas as medidas estatísticas feitas a partir dessa tabela. Em resumo, uma distribuição de frequência é uma tabela que mostra valores ou intervalos dos valores com a contagem da quantidade de vezes em que cada valor ocorre, o que chamamos de frequência f. Saiba mais O modelo de distribuição estudado é o mais utilizado pelos autores, porém existem outros modelos, com outros tipos de intervalo além do . Matematicamente, um intervalo pode ser representado de diversas maneiras, como (, , e ). Para mais informações sobre esse assunto, leia: MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999. 2.2 Elementos de uma distribuição de frequência Todos os conceitos a seguir serão explicados com base na distribuição de frequências, que acabamos de estudar. 2.2.1 Classe (i) É cada intervalo ou cada linha para uma tabela de frequências. O total de classes de uma tabela de frequências é denominado k. Exemplo i = 3 (terceira classe: 158 162) k = 6 2.2.2 Limites de classe (li ou Li) São os extremos de cada classe, onde li é o limite inferior (extremo da esquerda) e Li éo limite superior (extremo da direita) da classe. O índice i apenas indica qual é a classe abordada. 22 Unidade I Exemplo l2 = limite inferior da segunda classe = 154 L5 = limite superior da segunda classe = 170 2.2.3 Amplitude de classe (hi) É a medida do intervalo de classe. hi = Li – li Exemplo h3 = amplitude da terceira classe h3 = L3 – l3 = 162 – 158 = 4 cm Observação Uma distribuição com intervalos sempre terá a mesma amplitude para todas as classes. Note que para todos os intervalos o h é 4. 2.2.4 Amplitude amostral (AA) É a diferença entre o valor máximo e o valor mínimo da amostra. É obtido por meio do rol (tabela 5). AA = Xmax – xmin Exemplo Amplitude amostral para as estaturas dos alunos: AA = 173 – 150 = 23 cm 2.2.5 Ponto médio de classe (xi) É o ponto que divide a classe em duas partes iguais. Será muito utilizado a partir deste ponto do nosso livro-texto. xi li Li= + 2 23 NOÇÕES DE ESTATÍSTICA Exemplo Ponto médio da segunda classe: x cm2 154 158 2 156= + = 2.3 Tipos de frequências 2.3.1 Frequência absoluta ou simples (fi) É o número de ocorrências para cada uma das classes, obtida por meio de contagem no rol. Exemplo f3 = 11 2.3.2 Frequência relativa (fri) É a razão (divisão) da frequência simples com a soma das frequências da classe. Fornece a participação percentual de cada classe em relação à amostra. fri fi fi = Σ Observação Σ fi = n (significa que a soma das frequências é igual ao número de elementos do rol). Σ fri = 1 (significa que a soma das frequências relativas deve ser sempre igual a 1, que indica 100%). Exemplo fr f fi 2 2 9 40 0 225= = = Σ , Isso quer dizer que 22,5% das estaturas estão na segunda classe, pois 0,225 x 100 = 22,5%. 24 Unidade I 2.3.3 Frequência acumulada (Fi) É a soma das frequências até a classe indicada. Exemplo F2 = frequência acumulada da segunda classe = soma das frequências simples até a segunda classe. F2 = 4 + 9 = 13 Finalmente temos a distribuição com as frequências e os pontos médios calculados. Tabela 10 – Distribuição de frequências com intervalo para as estaturas dos alunos, com as frequências acumuladas I Estaturas (cm) fi xi fri Fi 1 150 154 4 152 0,100 4 2 154 158 9 156 0,225 13 3 158 162 11 160 0,275 24 4 162 166 8 164 0,200 32 5 166 170 5 168 0,125 37 6 170 174 3 172 0,075 40 Σfi 40 1,000 Atenção aos seguintes pontos: • Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notação de intervalo e considerando as repetições. • Para facilitar a determinação da coluna xi, basta calcular o ponto médio, a primeira classe (152) e somar a amplitude de classe (4), intervalo por intervalo. • Não é obrigatório, mas é altamente recomendável utilizar duas ou três casas após a vírgula para os valores fri, visando sempre a um percentual preciso por classe. • Note que o último valor de Fi é sempre a soma das frequências. 2.4 Construção de distribuições de frequências 2.4.1 Distribuição sem intervalo A tabela a seguir fornece o rol de uma pesquisa referente ao número de crianças por residência em uma determinada rua de São Paulo (n = 20). 25 NOÇÕES DE ESTATÍSTICA Tabela 11 – Rol do número de crianças por residência 0 1 1 2 3 0 1 1 2 3 1 1 1 2 4 1 1 2 2 4 Análise: esse rol apresenta poucas possibilidades de valores para a variável, mais precisamente de 0 a 4 crianças, e isso permite concluir que a distribuição sem intervalos é a mais indicada. Logo, para construir a distribuição de frequências sem intervalos, não existe nenhum cálculo. A partir do rol, basta colocar em cada classe um dos valores da variável e contar o número de ocorrências para cada classe. Tabela 12 – Distribuição de frequências sem intervalo para o rol do número de crianças por residência Número de crianças fi 0 2 1 9 2 5 3 2 4 2 Σfi 20 2.4.2 Distribuição com intervalo Vamos usar como base o rol das estaturas dos alunos (n = 40), já mostrado e repetido a seguir para fins didáticos: Tabela 13 – Repetição do rol das estaturas dos alunos 150 155 156 160 161 162 164 168 151 155 156 160 161 163 165 169 152 155 157 160 161 163 166 170 153 155 158 160 161 164 167 172 154 156 158 160 162 164 168 173 Análise: este rol apresenta muitas possibilidades de valores para a variável, mais precisamente de 150 cm a 173 cm (o que resultaria em uma distribuição sem intervalo com muitas linhas, como vimos na tabela 5), e isso permite concluir que a distribuição com intervalos é a mais indicada. Logo, para construir a distribuição de frequências com intervalos, é necessário determinar: 26 Unidade I • O número de classes da distribuição (k): k n= Onde o valor de k deve ser sempre arredondado para um valor inteiro. Para o rol das estaturas dos alunos: K = =40 6 32, , arredondando temos 6. Logo k = 6 (a distribuição deverá ter 6 classes). Lembrete Quando precisamos trabalhar com valores arredondados, a técnica mais utilizada é: • quando o algarismo anterior ao da casa decimal que você quer arredondar for maior ou igual a 5, devemos aumentar 1 na casa decimal escolhida (por exemplo, ao arredondar 6,25 para a casa dos décimos, o arredondamento fica 6,3); • quando o algarismo for menor do que 5, devemos manter o valor da casa decimal escolhida para ser arredondada (por exemplo, ao arredondar 6,23 para a casa dos décimos, o arredondamento fica 6,2). • A amplitude de classe (h): h AA k = Em que o valor de h sempre será arredondado para cima. Para o rol das estaturas dos alunos: h = − = =173 150 6 23 6 3 83, , arredondando para cima, temos 4. Logo h = 4 (cada uma das classes terá a amplitude de 4 cm). De posse das duas informações necessárias para montar uma tabela com intervalo (k = 6 e h = 4), realizamos o seguinte procedimento: 27 NOÇÕES DE ESTATÍSTICA Passo 1: colocar o menor valor do rol no limite inferior da primeira classe. Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal de intervalo entre os limites. Tabela 14 – Início da construção de uma distribuição sem intervalo i Estaturas (cm) 1 150 154 Passo 3: repetir o limite superior da classe em foco na classe seguinte. Tabela 15 – Andamento da construção de uma distribuição sem intervalo i Estaturas (cm) 1 150 154 2 154 Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior dessa classe. Colocar o sinal de intervalo entre os limites. Tabela 16 – Andamento da construção de uma distribuição sem intervalo i Estaturas (cm) 1 150 154 2 154 158 Passo 5: repetir os passos 3 e 4 até completar o total de intervalos k calculados (k = 6). Passo 6: determinar as frequências simples (pela contagem no rol) para todas as classes da distribuição. Finalmente, somar as frequências, lembrando que ∑fi deve ser igual a n. Tabela 17 – Distribuição sem intervalo finalizada I Estaturas (cm) fi 1 150├ 154 4 2 154├ 158 9 3 158├ 162 11 4 162├ 166 8 5 166├ 170 5 6 170├ 174 3 ∑fi 40 k = 6 h=4 28 Unidade I Observação Esse é um dos critérios existentes para se construir uma distribuição de frequências com intervalo de classe. Existe também o critério de Sturges, que também é bem conhecido. A principal diferença está no cálculo de k, pois, nesse caso, k é dado por: k = 1 + 3,3 log n 2.5 Representações gráficas Para a distribuição com intervalo, podemos representar os dados utilizando dois tipos de gráfico: o histograma e o polígono de frequências. 2.5.1 Histograma (gráfico de colunas) O histograma é composto da seguinte forma: • no eixo x (horizontal): os limites das classes da variável em estudo; • no eixo y (vertical): as frequências para cada uma das classes; • a altura da barra será proporcional à frequência de cada uma das classes. f 12 9 6 3 0 150 154 158 162 170166 174 estaturas (cm) Figura 3 – Histograma para uma distribuição com intervalo (usando como base a tabela 17) 2.5.2 Polígono de frequências (gráfico cartesiano) A composiçãodo polígono de frequências é feita da seguinte forma: • no eixo x (horizontal): os pontos médios das classes da variável em estudo; 29 NOÇÕES DE ESTATÍSTICA • no eixo y (vertical): as frequências para cada uma das classes; • ligar os pontos (no cruzamento das coordenadas dos eixos x e y). Para fechar o polígono, deve-se: • subtrair a amplitude de classe (no exemplo, h = 4) do ponto médio da primeira classe (l1) para fechar o polígono pela esquerda (no eixo x); • somar a amplitude da classe (h = 4) no ponto médio da última classe da distribuição para fechar o polígono pela direita. f 12 9 6 3 0 150 154 158 162 166 174170 Estaturas (cm) Figura 4 – Polígono de frequências para uma distribuição com intervalo (usando como base a tabela 17) Apresentaremos também outros tipos de representações gráficas, as quais podem ser utilizadas para a distribuição sem intervalo. 2.5.3 Gráfico em colunas Os gráficos em colunas são construídos tendo como eixo horizontal os valores da variável e na vertical a frequência. Assim, as colunas serão tanto mais altas quanto maior a frequência daquela variável. 10 9 5 8 4 7 3 1 6 2 0 0 1 2 Número de crianças Fr eq uê nc ia 3 4 Figura 5 – Gráfico em colunas para uma distribuição sem intervalo (usando como base a tabela 12) 30 Unidade I 2.5.4 Gráfico em barras Diferentes dos gráficos em colunas, os gráficos em barras são construídos tendo como eixo horizontal a frequência e na vertical os valores da variável. 1086420 0 1 2 3 4 Frequência N úm er o de c ria nç as Figura 6 – Gráfico em barras para uma distribuição sem intervalo (usando como base a tabela 12) 2.5.5 Gráfico em linhas Como o próprio nome indica, aqui os dados são representados por pontos unidos por linhas. Esse tipo de gráfico costuma ser usado para controlar alterações dos dados ao longo do tempo, o que facilita a identificação de tendências. 10 7 4 9 6 3 1 8 5 2 0 0 1 Número de crianças Fr eq uê nc ia 2 3 4 Figura 7 – Gráfico em linhas para uma distribuição sem intervalo (tabela 12) 31 NOÇÕES DE ESTATÍSTICA 2.5.6 Gráfico em setores O gráfico de setores, também conhecido como gráfico circular ou gráfico de pizza, costuma ser usado para a representação de valores percentuais, no nosso caso, para a representação da frequência relativa. Tabela 18 – Distribuição de frequências sem intervalo para o rol do número de crianças por residência Número de crianças fi fri (%) 0 2 10 1 9 45 2 5 25 3 2 10 4 2 10 Σfi 20 100 O tamanho de cada setor é estabelecido por meio de uma regra de três simples, lembrando que a circunferência tem 360°, o que corresponde a 100% da frequência relativa. Assim, se usarmos como exemplo a frequência relativa da terceira classe, temos: 100 360 25 100 25 360 9000 100 90 % % . − ° − = → = → = ° x x x x Dessa forma, o setor que representa 25% dos dados tem 90°. 0 1 2 3 4 45% 25% 10% 10% 10% Figura 8 – Gráfico em setores para uma distribuição sem intervalo (tabela 12) 32 Unidade I 2.5.7 Diagrama de dispersão Esse gráfico representa a possível relação entre duas variáveis. Ele é muito usado para indicar a correlação entre as medidas de dispersão. Na figura a seguir, o gráfico representa a relação entre MPG (milhas por galão – ou quilômetros por litro, no Brasil) para dirigir na cidade e potência. MPG Cidade X Potência Horsepower (Potência) M PG C ity (M PG C id ad e) 300150 250100 20050 15 20 25 30 35 40 45 Figura 9 – Diagrama de dispersão Exemplo de aplicação 1. As notas obtidas por 50 alunos de uma classe foram: Tabela 19 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 a) Complete a distribuição de frequência a seguir: 33 NOÇÕES DE ESTATÍSTICA Tabela 20 i Notas fi xi 1 0 2 1 1 2 2 4 3 4 6 4 6 8 5 8 10 Σfi 50 b) Agora, responda: i. Qual é a amplitude amostral? __________________________________ ii. Qual a amplitude da distribuição? _______________________________ iii. Qual é o número de classes da distribuição? _______________________ iv. Qual o limite inferior da quarta classe? ___________________________ v. Qual o limite superior da classe de ordem 2? _______________________ vi. Qual a amplitude do segundo intervalo de classe? ___________________ c) Complete: i. h3 = ____ ii. n = ____ iii. l1 = ____ iv. L3 = ____ v. x2 = ____ vi. f5 = ____ 2. A tabela a seguir traz as notas de um teste de inteligência aplicado a 100 alunos. Use-a para formar uma distribuição de frequência. 34 Unidade I Tabela 21 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 76 80 92 102 73 87 70 85 79 93 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 3. Complete os dados que faltam na distribuição de frequência nas tabelas a seguir: a) Tabela 22 i xi fi fri Fi 1 0 1 0,05 2 1 0,15 4 3 2 4 4 3 0,25 13 5 4 3 0,15 6 5 2 18 7 6 19 8 7 ΣΣ 20 1,00 b) Tabela 23 i Classes xi fi fri Fi 1 0 2 1 4 0,04 2 2 4 8 3 4 6 5 30 0,18 4 7 27 0,27 5 8 10 15 72 6 10 12 83 7 13 10 93 0,10 8 14 16 0,07 Σ 35 NOÇÕES DE ESTATÍSTICA 3 MEDIDAS DE TENDÊNCIA CENTRAL Para analisar um conjunto de dados, muitas vezes é necessário obter um único valor que represente toda a amostra em estudo. Esse valor é usualmente obtido pelas medidas de tendência central. As medidas de tendência central abordadas serão: • a média (x); • a moda (Mo); • a mediana (Md). O cálculo de cada uma das medidas de tendência central será explicado em três abordagens: • dados não agrupados (não alocados em tabelas de frequência); • distribuição de frequência sem intervalo; • distribuição de frequência com intervalo. 3.1 Média (x) A média de um conjunto de dados é a soma dos dados dividida pelo número de elementos do conjunto. 3.1.1 Dados não agrupados x xi n = ∑ Onde: Σ xi é a soma dos valores do conjunto de dados n é o número de elementos do conjunto de dados Exemplo As notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5 e 9,0. A nota média do aluno na disciplina pode ser calculada por: x = + + + = =3 5 5 0 6 5 9 0 4 24 4 6 0 , , , , , 36 Unidade I 3.1.2 Distribuição de frequências sem intervalo x xi fi n = ∑ . Onde: xi.fi é a multiplicação dos valores das classes com as respectivas frequências, classe por classe n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências Exemplo Dada a distribuição sem intervalo da tabela 12, determine o número médio de crianças por residência em uma determinada rua. Para armazenar os valores de xi.fi, uma coluna é criada. Em seguida, os valores da coluna são somados, gerando Σxi.fi. Tabela 24 – Cálculo da média para uma distribuição sem intervalo Número de crianças fi xi.fi 0 2 0 x 2 = 0 1 9 1 x 9 = 9 2 5 2 x 5 = 10 3 2 3 x 2 = 6 4 2 4 x 2 = 8 ΣΣ 20 Σxi.fi = 33 x = =33 20 165, Logo, no bairro citado há em média 1,65 crianças por residência (para efeito de interpretação, aproximadamente 2 crianças por residência). 3.1.3 Distribuição de frequências com intervalo x xi fi n = ∑ . 37 NOÇÕES DE ESTATÍSTICA Onde: xi.fi é a multiplicação dos pontos médios das classes com as respectivas frequências, classe por classe Lembrando que: x li Li= + 2 n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências Exemplo Dada a distribuição com intervalo da tabela 17, determine a estatura média dos alunos que compõem a amostra. O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi que, para uma distribuição com intervalo, é o ponto médio da classe. Tabela 25 – Cálculo da média para uma distribuição com intervalo i Estaturas (cm) fi xi xi.fi 1150 154 4 150 154 2 152 + = 152 x 4 = 608 2 154 158 9 154 158 2 156 + = 156 x 9 = 1404 3 158 162 11 158 162 2 162 + = 160 x 11 = 1760 4 162 166 8 162 166 2 164 + = 164 x 8 = 1312 5 166 170 5 166 170 2 168 + = 168 x 5 = 840 6 170 174 3 170 174 2 172 + = 172 x 3 = 516 Σfi 40 Σwi.fi = 6440 x cm= =6440 40 161 Logo, a estatura média para a amostra de alunos é de 161 cm. 38 Unidade I Observação Uma análise muito simples é comparar os dados com a média. No exemplo anterior, temos estaturas acima e abaixo da média. Logo, a média pode ser um interessante indicador de classificação. Exemplo de aplicação Compare as vendas mensais com uma média histórica para indicar o desempenho de cada vendedor. Observação Além da média que estudamos, muito utilizada como indicador de tendência, existem outros tipos, como: média ponderada, que também indica tendência e considera os valores da variável com pesos diferentes, e a média móvel em um determinado número de valores (tipicamente de 3 a 12), largamente utilizada no cálculo de previsão. 3.2 Moda (Mo) A moda é o valor que ocorre com maior frequência em um conjunto de dados. Serve para indicar as regiões das máximas frequências. 3.2.1 Dados não agrupados Dados os conjuntos a seguir, a moda será determinada analisando-se as maiores frequências. Exemplos: Conjunto 1: 20 30 40 80 10 10 20 30 20 O valor 20 se repete mais vezes que os outros (possui maior frequência). Mo = 20 Conjunto 2: 10 20 30 30 30 40 50 50 50 60 39 NOÇÕES DE ESTATÍSTICA Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas modas (30 e 50). Mo = 30 e Mo = 50 (conjunto bimodal) Conjunto 3: 100 110 124 145 101 200 500 Nenhum valor se repete mais vezes do que os outros valores do conjunto; logo, não existe valor modal (conjunto amodal). 3.2.2 Distribuição de frequências sem intervalo Para determinar a moda em uma distribuição sem intervalo, basta identificar a classe com maior frequência simples (classe modal). A moda será o valor da variável da classe modal. Exemplo Dada a distribuição sem intervalo da tabela 12, determine o valor modal das crianças por residência em uma determinada rua. Tabela 26 – Obtenção da moda para uma distribuição sem intervalo N. de crianças fi 0 2 1 9 2 5 3 2 4 2 ∑ 20 Maior fi na segunda classe (classe modal) O valor da variável para a classe modal é igual a 1; logo, Mo = 1. 3.2.3 Distribuição de frequências com intervalo Para determinar a moda em uma distribuição com intervalo, inicialmente é necessária a classe modal (da mesma forma que na distribuição sem intervalo). Nesse caso, a moda será obtida aplicando-se a fórmula a seguir na classe modal: 40 Unidade I Mo l d d d h* *= + + 1 1 2 . Onde: l* é o limite inferior da classe modal h* é a amplitude da classe modal d1 = f* - fant d2 = f* - fpost f* é a frequência simples da classe modal fant é a frequência simples anterior (acima) à classe modal fpost é a frequência simples posterior (abaixo) à classe modal Existem vários modelos para cálculo da moda. O modelo aqui apresentado é o mais utilizado e chama-se moda de Czuber. Exemplo Dada a distribuição com intervalo da tabela 17, determine a estatura modal dos alunos que compõem a amostra. Tabela 27 – Cálculo da média para uma distribuição com intervalo i Estaturas (cm) fi 1 150├ 154 4 2 154├ 158 9 3 158├ 162 11 4 162├ 166 8 5 166├ 170 5 6 170├ 174 3 ∑fi 40 Maior fi na terceira classe (classe modal) l* = 158 h* = 4 d1 = 11 – 9 = 2 d2 = 11 – 8 = 3 41 NOÇÕES DE ESTATÍSTICA Logo: Mo = + + 158 2 2 3 4. Mo = + = +158 8 5 158 16, Mo = 159,6 cm Observação Assim como nos dados não agrupados, uma distribuição pode ser bimodal, desde que existam duas maiores frequências. Nesse caso, basta calcular as modas para as duas classes modais. Isso vale para mais de duas modas em uma distribuição, ainda que essa ocorrência não seja tão comum. 3.3 Mediana (Md) A mediana é o valor que caracteriza o centro de uma distribuição de frequências. Divide um conjunto ordenado de dados em duas partes iguais de 50% (daí o fato de a mediana ser considerada também uma medida de posição). 3.3.1 Dados não agrupados Dados os conjuntos a seguir, antes de determinar a mediana, é necessário ordenar os dados da amostra. Exemplos: Conjunto ordenado 1: 20 30 50 80 190 210 300 Esta é uma amostra ímpar, pois possui 7 elementos (n = 7). Para amostras ímpares, a mediana é o elemento central da série de dados. Logo, Md = 80 42 Unidade I Conjunto ordenado 2: 100 230 300 500 600 800 Esta é uma amostra par, pois possui 6 elementos (n = 6). Para amostras pares, existem dois elementos centrais na série de dados, então a mediana é a média de ambos. Logo, Md = +300 500 2 Md = 800 2 Md = 400 3.3.2 Distribuição de frequências sem intervalo Para determinar a mediana em uma distribuição sem intervalo, é necessário: Passo 1: determinar as frequências acumuladas (Fi) de todas as classes da distribuição. Passo 2: identificar a classe mediana. Para isso, é necessário calcular uma referência. ∑ fi 2 Passo 3: comparar o valor da referência com cada uma das frequências acumuladas. Se houver uma Fi igual à referência, a classe dessa Fi será a classe mediana. Caso contrário, deverá ser escolhida a Fi superior mais próxima da referência para obter a classe mediana. Passo 4: a mediana é o valor da variável da classe encontrada (classe mediana). Exemplo Dada a distribuição sem intervalo da tabela 28, determine o valor da mediana. ∑ = =fi 2 20 2 10 (referência) 43 NOÇÕES DE ESTATÍSTICA Tabela 28 – Obtenção da mediana para a distribuição sem intervalo Número de crianças fi Fi 0 2 2 1 9 11 2 5 16 3 2 18 4 2 20 ∑ 20 Valor de Fi (11) superior mais próximo da referência (10). Esta é a classe mediana (segunda classe) O valor da variável para a classe mediana é igual a 1; logo, Md = 1. 3.3.3 Distribuição de frequências com intervalo Para determinar a mediana em uma distribuição com intervalo, inicialmente é necessária a classe mediana (da mesma forma que na distribuição sem intervalo, isto é, seguindo os passos 1, 2 e 3). Nesse caso, a mediana será obtida aplicando-se a fórmula a seguir na classe mediana: Md l fi Fant f h* * *= + ∑ − 2 . Onde: I* é o limite inferior da classe mediana ∑ fi 2 é a referência, já calculada anteriormente, para a escolha da classe mediana Fant é a frequência acumulada anterior (acima) à classe mediana f* é a frequência simples da classe mediana h* é a amplitude da classe mediana Exemplo Dada a distribuição com intervalo da tabela 17, determine a estatura mediana dos alunos que compõem a amostra. ∑ = =fi 2 40 2 20 (referência) 44 Unidade I Tabela 29 – Obtenção da mediana para uma distribuição com intervalo i Estaturas (cm) fi Fi 1 150├ 154 4 4 2 154├ 158 9 13 3 158├ 162 11 24 4 162├ 166 8 32 5 166├ 170 5 37 6 170├ 174 3 40 ∑fi 40 Valor de Fi (24) superior mais próximo da referência (20). Esta é a classe mediana (terceira classe) I* = 158 ∑ =fi 2 20 Fant = 17 = 13 + 4 f* = 11 h* = 4 Logo: Md = + −[ ] .158 20 17 11 4 Md = + .158 3 11 4 Md = +158 12 11 Md = 158 + 1,09 Md = 159,09 cm Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos é de 159,09 cm. 45 NOÇÕES DE ESTATÍSTICA Observação Além da mediana, uma medida tanto de tendência quanto de posição, existem outras importantes, como o quartil, o decil e o percentil. O método de obtenção é muito parecido com o da mediana, que tem dois como referências nos cálculos. O quartil, o decil e o percentil, por sua vez, dividem uma série em quatro, dez ou cem partes iguais. Exemplos de aplicação 1. Complete a tabela a seguir e calcule a média aritmética da distribuição: Tabela 30 xi fi xi.fi 1 2 2 2 4 3 6 4 8 5 3 6 1 ΣΣ 2. Complete a tabela a seguir e calcule a média aritmética da distribuição: Tabela 31 i xi fi xi.fi 1 500 8 4000 2 600 10 311 4 16 5 13 6 5 7 1100 1 ΣΣ Σ 46 Unidade I 3. Complete a tabela a seguir e calcule a moda da distribuição: Tabela 32 i Custos (R$) fi 1 450 550 8 2 550 650 10 3 650 750 11 4 750 850 16 5 850 950 13 6 950 1050 5 7 1050 1150 1 ΣΣ Σ 64 4. Complete as tabelas seguintes e calcule a mediana da distribuição: a) Tabela 33 xi fi Fi 2 3 4 7 10 6 12 8 8 30 10 4 Σ b) Tabela 34 xi fi Fi 0 2 2 1 5 2 9 3 7 4 6 5 3 Σ 47 NOÇÕES DE ESTATÍSTICA 4 MEDIDAS DE DISPERSÃO 4.1 Introdução As medidas de dispersão têm como finalidade indicar o quanto os dados apresentam-se dispersos em torno de uma região central, isto é, mostram o grau de variação em uma amostra. As medidas de dispersão abordadas são: • a variância (s2); • a desvio-padrão (s); • o coeficiente de variação (CV). Observação Além das medidas de dispersão estudadas, existem modelos mais simplificados, como a amplitude e o desvio médio, que têm sua importância, porém não são tão utilizados quanto o desvio-padrão. O cálculo de cada uma das medidas será explicado utilizando-se as três abordagens citadas anteriormente. Porém, antes de serem apresentadas as fórmulas e os métodos para o cálculo, é interessante acompanhar, por meio de um exemplo, o significado e a importância do cálculo de dispersão. Exemplo Existem três grupos de pessoas (cada um com oito elementos). A variável em estudo é a idade das pessoas. Grupo 1: 20 20 20 20 20 20 20 20 Grupo 2: 18 18 19 20 20 21 22 22 Grupo 3: 2 5 10 13 20 25 35 50 48 Unidade I Desejamos tirar algumas conclusões sobre os três grupos analisando a principal medida de tendência, a média. x do grupo 1 = 20 20 20 20 20 20 20 20 8 160 8 20 + + + + + + + = = x do grupo 2 = 18 18 19 20 20 21 22 22 8 160 8 20 + + + + + + + = = x do grupo 3 = 2 5 10 13 20 25 35 50 8 160 8 20 + + + + + + + = = Os valores das médias para os três grupos foram iguais, apesar de eles serem totalmente distintos quantos às idades: • No grupo 1, todos os valores coincidem com a média, pois não existem diferenças em relação a ela, logo não existe dispersão. É um grupo formado por pessoas de 20 anos de idade. • No grupo 2, os valores não coincidem exatamente com a média, mas também não se afastam muito dela, logo, existe uma pequena dispersão. É um grupo formado por pessoas com idades próximas de 20 anos. • No grupo 3, a maioria dos valores estão bem afastados da média, logo, existe uma considerável dispersão. É um grupo formado pelas mais diversas idades. Conclusão: apenas utilizando a média, os três grupos apresentavam um perfil de idades igual. No entanto, considerando também a dispersão das idades (afastamento dos valores em relação à média), podemos indicar as diferenças existentes entre os três grupos. 4.2 Variância (s2) É a média dos quadrados das diferenças dos valores em relação à sua média. 4.2.1 Dados não agrupados s xi x n 2 2 = ∑ −( ) Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores 49 NOÇÕES DE ESTATÍSTICA Exemplo As notas que um aluno tirou em uma determinada disciplina durante o ano foram: • 3,5 • 5,0 • 6,5 • 9,0 A variância das notas do aluno na disciplina pode ser calculada por: • Obtenção da média: x = 3 5 5 0 6 5 9 0 4 24 4 6 0 , , , , , + + + = = • Obtenção da variância utilizando uma tabela para organizar os cálculos. Tabela 35 – Tabela para auxiliar na obtenção da variância de dados não agrupados xi xi - x (xi - x)2 3,5 3,5 – 6 = -2,5 (-2,5)2 = 6,25 5,0 5 – 6 = -1 (-1)2 = 1 6,5 6,5 – 6 = 0,5 (0,5)2 = 0,25 9,0 9 – 6 = 3 (3)2 = 9 Σ = 24 Σ(xi - x)2 = 16,5 s2 16 5 4 4 13= =, , Observação O número elevado ao quadrado é o produto do desse número por ele mesmo. Para os cálculos deste livro-texto, uma calculadora com operações básicas (+, -, x e /) e raiz quadrada é mais do que suficiente. 50 Unidade I 4.2.2 Distribuição de frequências sem intervalo s xi x fi n 2 2 = ∑ −( ) . Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Exemplo Dada a distribuição sem intervalo da tabela 12, determine a variância de crianças por residência em uma determinada rua. Obtendo a média: x = 33 20 165= , crianças Lembrete Vimos o conceito de obtenção da média quando falamos sobre distribuição de frequências sem intervalo, no título 3.1.2. Tabela 36 – Cálculo da variância para uma distribuição sem intervalo N. de crianças (xi) fi xi.fi xi - x (xi - x)2 (xi - x)2 . fi 0 2 0.2 = 0 0-1,65=-1,65 (-1,65)2 = 2,72 2,72x2 = 5,44 1 9 1.9 = 9 1-1,65=-0,65 (-0,65)2 = 0,42 0,42x9=3,78 2 5 2.5 = 10 2-1,65=0,35 (0,35)2 = 0,12 0,12x5=0,60 3 2 3.2 = 6 3-1,65=1,35 (1,35)2 = 1,82 1,82x2=3,64 4 2 4.2 = 8 4-1,65=2,35 (2,35)2 = 5,52 5,52x2=11,04 Σ 20 Σxi . fi = 33 Σ(xi - x)2 = 24,5 51 NOÇÕES DE ESTATÍSTICA Logo: s = 24,5 20 =1232 2crian asç Observação Um dos problemas do uso direto da variância é que a unidade e o valor estarão elevados ao quadrado. 4.2.3 Distribuição de frequências com intervalo Considere: s xi x fi n 2 2 = ∑ −( ) . Onde: xi é o ponto médio para cada classe Lembrando que: xi li Li= + 2 Onde: x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Exemplo Dada a distribuição com intervalo da tabela 17, determine a variância das estaturas dos alunos que compõem a amostra. O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi que, para uma distribuição com intervalo, é o ponto médio da classe. 52 Unidade I Tabela 37 – Cálculo da variância para uma distribuição com intervalo a) i Estaturas (cm) fi xi xi.fi 1 150 154 4 150 154 2 152 + = 152 x 4 = 608 2 154 158 9 154 158 2 156 + = 156 x 9 = 1404 3 158 162 11 158 162 2 162 + = 160 x 11 = 1760 4 162 166 8 162 166 2 164 + = 164 x 8 = 1312 5 166 170 5 166 170 2 168 + = 168 x 5 = 840 6 170 174 3 170 174 2 172 + = 172 x 3 = 516 Σfi 40 Σxi . fi = 6440 x = 6440 40 161= cm b) Tabela 38 xi . x (xi . x)2 (xi . x)2 . fi 152 – 161 = -9 (-9)2 = 81 81 x 4 = 324 156 – 161 = -5 (-5)2 = 25 25 x 9 = 225 160 – 161 = -1 (-1)2 = 1 1 x 11 = 11 164 – 161 = 3 (3)2 = 9 9 x 8 = 72 168 – 161 = 7 (7)2 = 49 49 x 5 = 245 172 – 161 = 11 (11)2 = 121 121 x 3 = 363 Σ (xi . x)2 . fi = 1240 Logo: s cm2 2 1240 40 31= = 53 NOÇÕES DE ESTATÍSTICA 4.3 Desvio-padrão (s) É a raiz quadrada da variância. É a medida de dispersão mais utilizada, por ter a mesma unidade que a média, possibilitando uma melhor avaliação da dispersão da amostra. 4.3.1 Dados não agrupados Considere: s xi x n = −( )2 Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do título 4.2.1: s2 16 5 4 4 13= =, , Logo: s = =4 13 2 03, , 4.3.2 Distribuição de frequências sem intervalo Considere: s xi x fi n = −( )2 . Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição 54 Unidade I fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do título 4.2.2: s crian as2 2 24 5 20 123= =, ç Logo: s= 1,23=1,11 crian asç 4.3.3 Distribuição de frequências com intervalo Considere: s xi x fi n = −( )2 . Onde: xi é o ponto médio para cada classe Lembrando que: xi li Li= + 2 x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do título 4.2.3: s cm2 2 1240 40 31= = 55 NOÇÕES DE ESTATÍSTICA Logo: s cm= =31 5 57, 4.4 Coeficiente de variação (CV) É o quociente entre o desvio-padrão e a média. Em outras palavras, é a medida de dispersão relativa, que indicaa variabilidade percentual da amostra em relação à média. O coeficiente de variação é útil para a comparação de variabilidade de dois conjuntos de dados com unidades de medidas diferentes – por exemplo, quando precisamos comparar altura e peso, idade e número de filhos. Quanto menor esse valor, mais homogêneo será o conjunto de dados. CV s x = .100 A unidade do coeficiente de variação é uma porcentagem (%). A fórmula e o método de cálculo são exatamente os mesmos para as três abordagens apresentadas. Vale ressaltar que quanto maior o CV, maior será a variabilidade dos dados do conjunto em relação à sua média. Exemplo Calcular o coeficiente de variação do exemplo abordado no título 4.3.3 (estaturas dos alunos). Como: x = 161 cm s = 5,57 cm Logo: CV %= = =5 57 161 100 557 161 3 46 , . , As estaturas têm uma variabilidade de 3,46% em relação à média. 56 Unidade I Lembrete É vital ressaltar: o coeficiente de variação é usado para comparar dois conjuntos e dados com unidades diferentes. Assim, é útil para a comparação de variabilidade de dois conjuntos de dados com unidades de medida diferentes. Quanto menor esse valor, mais homogêneo será o conjunto de dados. Exemplos de aplicação 1. Calcule o desvio-padrão dos conjuntos de dados a seguir: a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 22, 20 c) -10, -6, 2, 3, 7, 9, 10 2. Calcule os desvios-padrão dos conjuntos de dados a seguir: a) Tabela 39 xi fi 2 1 3 3 4 5 5 8 6 5 7 4 8 2 b) Tabela 40 Classes fi 1,5 1,6 4 1,6 1,7 8 1,7 1,8 12 1,8 1,9 15 1,9 2,0 12 2,0 2,1 8 2,1 2,2 4 57 NOÇÕES DE ESTATÍSTICA 3. Dada a tabela a seguir, que traz a distribuição relativa a cem lançamentos de cinco moedas simultaneamente, calcule o desvio-padrão. Tabela 41 Número de caras fi 0 4 1 14 2 34 3 29 4 16 5 3 4. Calcule o desvio-padrão da distribuição: Tabela 42 Classes fi 2 6 5 6 10 12 10 14 21 14 18 15 18 22 7 5. Em um exame final de matemática, a nota média de um grupo de 150 alunos foi 7,8 e o desvio-padrão 0,80. Em estatística, entretanto, a nota média final foi de 7,3 e o desvio-padrão 0,76. Em que disciplina houve a maior dispersão? 58 Unidade I Resumo Nesta unidade abordamos inicialmente os principais conceitos teóricos para o estudo dos métodos estatísticos. Foi apresentada a definição de estatística, bem como a sua divisão em estatística descritiva e indutiva, ressaltando que o foco deste material é abordar a maior parte da estatística descritiva e o início da indutiva. Conceitos como tipos de dados, que podem ser quantitativos (subdivididos em discretos e contínuos) e qualitativos foram abordados com uma quantidade significativa de exemplos a fim de possibilitar a perfeita compreensão de todas as ideias trabalhadas. Vimos ainda as definições de população e amostra, e foi feita uma breve explicação introdutória de amostragem, na qual foram exibidos seus principais tipos: aleatória, sistemática e estratificada. Estudamos os meios de se armazenarem dados quantitativos, que anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em distribuições de frequências. Aprendemos que existem dois tipos de distribuições de frequências: sem intervalo de classe e com intervalo de classe. Falamos das diferenças e dos métodos para a construção de uma tabela de frequências, com ou sem intervalo. Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos valores do rol, resultam em análise e medidas ou indicadores errados. Na sequência, apresentamos os principais tipos de frequências existentes (simples, relativa e acumulada) e as suas respectivas finalidades. Mostramos também a montagem de gráficos (histograma e polígono de frequências) para distribuições de frequências com intervalo (por serem as mais utilizadas na prática). Além disso, estudamos as três principais medidas de tendência central: a média, a moda e a mediana. As medidas foram analisadas sob três abordagens distintas (dados não agrupados, distribuição de frequência sem intervalo e distribuição de frequência com intervalo), pois os métodos de obtenção das medidas apresentam significativas diferenças para cada abordagem. Vimos que a média de dados não agrupados é a média aritmética, muito utilizada academicamente para verificar o aproveitamento do aluno em uma disciplina. Aprendemos ainda que para a obtenção da média para 59 NOÇÕES DE ESTATÍSTICA distribuição de frequência, devemos levar em conta tanto a frequência quanto o valor da variável. Abordamos a moda, que indica a(s) maior(es) frequência(s) em uma série de dados. Estudamos as três abordagens para a sua obtenção. A mediana, posição que indica o centro de uma série de dados (divide a série em duas partes de 50%) também foi apresentada das três maneiras. No que se refere às medidas de dispersão, estudamos as três principais, novamente sob as três abordagens (dados não agrupados, distribuição sem intervalo e distribuição com intervalo). Aprendemos que a variância, definida pela média dos quadrados das diferenças dos valores em relação à sua média, é importante, porém não muito utilizada, pelo fato de a unidade de grandeza envolvida no cálculo estar elevada ao quadrado. Vimos, entretanto, que o desvio-padrão, cuja definição é a raiz quadrada da variância, é muitíssimo utilizado em várias áreas do conhecimento, para quantificar a dispersão de uma série de dados. Para termos uma noção percentual da dispersão em relação à média, foi apresentado o coeficiente de variação, que é uma medida de dispersão derivada do desvio-padrão e da média dos dados analisados. 60 Unidade I Exercícios Questão 1. Imagine que, na tabela a seguir, tenhamos as frequências absolutas das idades de 132 alunos matriculados no 2º ano do Ensino Médio das escolas situadas em determinada cidade brasileira. Tabela 43 – Idades dos alunos Idade (anos) Frequência absoluta 14 1 15 16 16 77 17 30 18 6 19 1 22 1 132 Com base no exposto e nos seus conhecimentos, analise as afirmativas. I – A figura a seguir representa o gráfico da distribuição percentual das idades do grupo de alunos em estudo. 14 15 16 17 18 19 22 12,1% 58,3% 22,7% 4,5% 0,8% 0,8% 0,8% Figura 10 – Porcentagens – Idades 61 NOÇÕES DE ESTATÍSTICA II – A figura a seguir representa o gráfico da distribuição das frequências absolutas das idades do grupo de alunos em estudo. 2219181716 Idade (anos) Fr eq uê nc ia a bs ol ut a 1514 0 10 20 30 40 50 60 70 80 90 Figura 11 – Frequências absolutas – Idades III – A tabela a seguir representa as frequências relativas das idades do grupo de alunos em estudo. Tabela 44 Idade (anos) Frequência relativa 14 0,008 15 0,121 16 0,583 17 0,227 18 0,045 19 0,008 22 0,008 1 É correto o que se afirma em: A) I, apenas. B) II, apenas. C) III, apenas. D) I e II, apenas. E) I, II e III. Resposta correta: alternativa E. 62 Unidade I Análise da questão Na tabela a seguir, temos os cálculos das frequências relativas e dos percentuais relativos à variável em estudo (idade do aluno). Tabela 45 Idade (anos) Frequência absoluta Frequência relativa Porcentagem 14 1 1/132=0,008 0,008.100%=0,8% 15 16 16/132=0,121 0,121.100%=12,1% 16 77 77/132=0,583 0,583.100%=58,3% 17 30 30/132=0,227 0,227.100%=22,7% 18 6 6/132=0,045 0,045.100%=4,5% 19 1 1/132=0,008 0,008.100%=0,8% 22 1 1/132=0,008 0,008.100%=0,8% 132 1 1.100%=100% Pela análise dos dados presentes na tabela anterior, verificamos que as afirmativas I, II e III são corretas. Questão 2. Laura, assistente social responsável pela creche Infância Feliz, queria saber o número de frutas que as crianças comiam por semana. Para isso, fez um levantamento com as mães das crianças e obteve os resultados mostrados na tabela a seguir: Tabela 46 Nome da criança Número de frutas Alice 3 Bianca 2 Beatriz 3 Catarina 2 Diego 1 Elsa 5 Fábio 1 Gabriela 2 Júlia 3 Laila 2 Lucas 0 Mariana
Compartilhar