Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE Professor Me. Edimar Izidoro Novaes Professora Me. Ivnna Gurniski de Oliveira Professora Me. Renata Cristina de Souza GRADUAÇÃO Unicesumar C397 CENTRO UNIVERSITÁRIO DE MARINGÁ. Núcleo de Educação a Distância; OLIVEIRA, Ivnna Gurniski de; SOUZA, Renata Cristina de; NOVAES, Edimar Izidoro. Estatística e probabilidade. Ivnna Gurniski de Oliveira; Renata Cristina de Souza; Edimar Izidoro Novaes. Maringá-Pr.: UniCesumar, 2016. Reimpresso em 2021. 186 p. “Graduação - EaD”. 1. Estatística. 2. Probabilidade . 3. EaD. I. Título. ISBN 978-85-459-0507-3 CDD - 22 ed. 519 CIP - NBR 12899 - AACR/2 Ficha catalográfica elaborada pelo bibliotecário João Vivaldo de Souza - CRB-8 - 6828 Impresso por: Reitor Wilson de Matos Silva Vice-Reitor Wilson de Matos Silva Filho Pró-Reitor de Administração Wilson de Matos Silva Filho Pró-Reitor Executivo de EAD William Victor Kendrick de Matos Silva Pró-Reitor de Ensino de EAD Janes Fidélis Tomelin Presidente da Mantenedora Cláudio Ferdinandi NEAD - Núcleo de Educação a Distância Diretoria Executiva Chrystiano Minco� James Prestes Tiago Stachon Diretoria de Design Educacional Débora Leite Diretoria de Graduação e Pós-graduação Kátia Coelho Diretoria de Permanência Leonardo Spaine Head de Produção de Conteúdos Celso Luiz Braga de Souza Filho Gerência de Produção de Conteúdo Diogo Ribeiro Garcia Gerência de Projetos Especiais Daniel Fuverki Hey Supervisão do Núcleo de Produção de Materiais Nádila Toledo Supervisão Operacional de Ensino Luiz Arthur Sanglard Coordenador de Conteúdo Ivnna Gurniski de Oliveira Designer Educacional Rossana Costa Giani Projeto Gráfico Jaime de Marchi Junior José Jhonny Coelho Arte Capa Arthur Cantareli Silva Ilustração Capa Bruno Pardinho Editoração Matheus Felipe Davi Ana Carolina Martins Prado Qualidade Textual Daniela Ferreira dos Santos Hellyery Agda G. Silva Kaio Vinicius Cardoso Gomes Ilustração Marcelo Goto Em um mundo global e dinâmico, nós trabalhamos com princípios éticos e profissionalismo, não so- mente para oferecer uma educação de qualidade, mas, acima de tudo, para gerar uma conversão in- tegral das pessoas ao conhecimento. Baseamo-nos em 4 pilares: intelectual, profissional, emocional e espiritual. Iniciamos a Unicesumar em 1990, com dois cursos de graduação e 180 alunos. Hoje, temos mais de 100 mil estudantes espalhados em todo o Brasil: nos quatro campi presenciais (Maringá, Curitiba, Ponta Grossa e Londrina) e em mais de 300 polos EAD no país, com dezenas de cursos de graduação e pós-graduação. Produzimos e revisamos 500 livros e distribuímos mais de 500 mil exemplares por ano. Somos reconhecidos pelo MEC como uma instituição de excelência, com IGC 4 em 7 anos consecutivos. Estamos entre os 10 maiores grupos educacionais do Brasil. A rapidez do mundo moderno exige dos educa- dores soluções inteligentes para as necessidades de todos. Para continuar relevante, a instituição de educação precisa ter pelo menos três virtudes: inovação, coragem e compromisso com a quali- dade. Por isso, desenvolvemos, para os cursos de Engenharia, metodologias ativas, as quais visam reunir o melhor do ensino presencial e a distância. Tudo isso para honrarmos a nossa missão que é promover a educação de qualidade nas diferentes áreas do conhecimento, formando profissionais cidadãos que contribuam para o desenvolvimento de uma sociedade justa e solidária. Vamos juntos! Pró-Reitor de Ensino de EAD Diretoria de Graduação e Pós-graduação Seja bem-vindo(a), caro(a) acadêmico(a)! Você está iniciando um processo de transformação, pois quando investimos em nossa formação, seja ela pessoal ou profissional, nos transformamos e, consequentemente, transformamos também a sociedade na qual estamos inseridos. De que forma o fazemos? Criando oportu- nidades e/ou estabelecendo mudanças capazes de alcançar um nível de desenvolvimento compatível com os desafios que surgem no mundo contemporâneo. O Centro Universitário Cesumar mediante o Núcleo de Educação a Distância, o(a) acompanhará durante todo este processo, pois conforme Freire (1996): “Os homens se educam juntos, na transformação do mundo”. Os materiais produzidos oferecem linguagem dialógica e encontram-se integrados à proposta pedagógica, con- tribuindo no processo educacional, complementando sua formação profissional, desenvolvendo competên- cias e habilidades, e aplicando conceitos teóricos em situação de realidade, de maneira a inseri-lo no mercado de trabalho. Ou seja, estes materiais têm como principal objetivo “provocar uma aproximação entre você e o conteúdo”, desta forma possibilita o desenvolvimento da autonomia em busca dos conhecimentos necessá- rios para a sua formação pessoal e profissional. Portanto, nossa distância nesse processo de cresci- mento e construção do conhecimento deve ser apenas geográfica. Utilize os diversos recursos pedagógicos que o Centro Universitário Cesumar lhe possibilita. Ou seja, acesse regularmente o Studeo, que é o seu Ambiente Virtual de Aprendizagem, interaja nos fóruns e enquetes, assista às aulas ao vivo e participe das dis- cussões. Além disso, lembre-se que existe uma equipe de professores e tutores que se encontra disponível para sanar suas dúvidas e auxiliá-lo(a) em seu processo de aprendizagem, possibilitando-lhe trilhar com tranqui- lidade e segurança sua trajetória acadêmica. A U TO RE S Professora Me. Ivnna Gurniski de Oliveira Mestrado em Ensino de Ciências e Educação Matemática pela Universidade Estadual de Londrina (UEL/2013). Especialista em Docência no Ensino Superior pelo Centro Universitário Cesumar (Unicesumar/2011). Graduação em Licenciatura em Matemática pela Universidade Estadual de Maringá (UEM/2007). Tem experiência como professora de matemática no ensino médio e no ensino superior. Atua também como coordenadora do curso de graduação em licenciatura de matemática no Unicesumar. Professora Me. Renata Cristina de Souza Mestrado em Engenharia Urbana pela Universidade Estadual de Maringá (UEM/2012). Especialista em Gestão Ambiental pela Faculdade Estadual de Ciências e Letras de Campo Mourão (FECILCAM/2005). Graduação em Tecnologia Ambiental pelo Centro Federal de Educação Tecnológica do Paraná (CEFET-PR/2005). Tem experiência em pesquisa na área de Sistema de Gestão de Qualidade, na Área Ambiental, com ênfase em Tecnologias Avançadas de Tratamento, de Efluentes, Gestão e Tratamento de Resíduos Sólidos. Trabalha como professora formadora no curso de Gestão Ambiental, Gestão de Recursos Humanos, Gestão de Negócios Imobiliários e Segurança do Trabalho; professora da pós-graduação EAD no Centro Universitário Cesumar (Unicesumar). Coordenadora do Curso de Tecnologia em Gestão Ambiental e professora no curso de graduação em Administração, da disciplina de Indústria e Meio Ambiente; professora da pós-graduação em Gestão Ambiental na Faculdade Metropolitana de Maringá (FAMMA). Professor Me. Edimar Izidoro Novaes Mestrado em Biometria pelo departamento de Bioestatística da Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP/2014). Especialista em Ensino a Distância pela Faculdade de Apucarana (FAP/2012). Especialista em Educação Matemática pela Universidade Estadual de Londrina (UEL/2010). Graduação em Matemática com Ênfase em Informática pela Faculdade de Apucarana (FAP/2008). Foi coordenador e professor do curso de Matemática da FAP, professor de Física no Colégio Prisma em Arapongas. Atualmente é professor de Estatística do Centro Universitário Cesumar (Unicesumar), professor de Estatística e Matemática na Universidade Estadual do Paraná (UNESPAR) campus de Apucarana, professor de Matemática no colégio Platão e colégio Nossa Senhora da Glória, ambos de Apucarana. SEJA BEM-VINDO(A)! Olá, caro(a) aluno(a)! É com muito prazer que apresentamos a você o livro que fará parte da disciplina de Estatística, que é uma ciência que se dedica ao desenvolvimento e aouso de métodos para a coleta, resumo, organização, apresentação e análise de dados. Um exemplo do uso da estatística está na previsão do tempo de uma região, em ten- dências em uma eleição, a posição dos bancos dos trens em certa linha e até o hábito de lavar as mãos após usar o banheiro. Fazendo uma pequena viagem pelo tempo, em 3000 a. C., registrava-se os primeiros indícios de censos na Babilônia, na China e no Egito. No Velho Testamento, Livro 4° (Nú- meros), registra-se uma instrução de Moisés: “fazer levantamento dos homens de Israel aptos a guerrear” (TOREZANI, 2004, p. 2). A palavra Censo deriva do verbo latino censere, que significa taxar. O objetivo inicial da realização dos censos era buscar informações sobre as populações para orientar a taxação de impostos. Era, portanto, uma atividade que interessava, particularmente, aos governos, ao Estado. Daí deriva a palavra Estatística (de status). Trata-se da ferramenta de trabalho dos estadistas. Em 1805, Guilherme, o Conquistador, determinou que se fizesse, na Inglaterra, um le- vantamento, buscando obter informações sobre posse de terras, sua utilização, seus proprietários, número de empregados, posse de animais etc. para taxação de impostos. No século XVII, John Grant publicou “Aritmética Política”, uma análise sobre nascimentos e óbitos, a partir das chamadas Tábuas de Mortalidade. Já, no século XVIII (1797), surgiu, na Enciclopédia Britânica, o verbete “statistics” pela primeira vez. O termo “Estatística” é usado, hoje, com alguns significados diferentes. Ele pode se referir a: meros registros de eventos que interessem ao administrador em geral; uma simples medida estatística que seja obtida de uma amostra; métodos estatísticos padronizados utilizados em pesquisa por amostragem; ciência estatística em geral, hoje, grandemente desenvolvida e com aplicação disseminada como auxiliar em diferentes áreas do conhe- cimento. De forma simplificada, podemos admitir que a Ciência Estatística tem como objetivo obter informações confiáveis sobre determinado fenômeno de interesse. A Estatística está de forma muito presente na mídia, seja em jornais, revistas ou meios de comunicação. Além disso, uma vez que está diretamente envolvida com pesquisa, é a partir dela que as decisões são tomadas. Podemos dizer que a Estatística é uma ferramenta para qualquer pesquisador na busca pelas respostas aos vários problemas relacionados ao meio em que trabalha. Entretanto, para que ela seja bem utilizada, é necessário conhecer os seus fundamentos, seus princípios e suas ferramentas para que possamos utilizá-la de forma adequada. Esse material foi separado em cinco unidades, sendo iniciado com a importância da Es- tatística básica, passando por contagem, probabilidades e finalizando com medidas de associação. APRESENTAÇÃO ESTATÍSTICA E PROBABILIDADE A unidade I abrangerá a interpretação e construção de tabelas e gráficos, assim como as distribuições de frequências com abordagem para variáveis qualitativas e quantitativas. Logo, na unidade II mostrará as medidas de posição e de dispersão. Essas medidas são, amplamente, empregadas dentro de pesquisas em nível científico e, também, nos problemas mais simples do cotidiano. Já na unidade III abordará o princípio fundamental da contagem e a análise combi- natória, sendo a permutação, o arranjo e a combinação. A unidade IV tratará sobre probabilidades que podem tratar de eventos simples a extremamente complexos. De forma abrangente, elas tratam das chances de deter- minados fenômenos ocorrerem. A importância de se estudar probabilidades está na verificação de que alguns eventos ocorrem com uma facilidade maior que outros e, assim, podemos prever situações futuras sobre esses eventos. Ainda nessa unidade, falaremos das probabilidades de forma geral mostrando des- de os cálculos mais simples, passando por suas propriedades até as probabilidades condicionais e distribuições de probabilidades. As principais distribuições são aque- las que utilizamos com maior frequência, uma vez que existem inúmeros tipos. Es- sas distribuições do comportamento da variável com a qual estamos trabalhando é importante, pois, por meio delas é que determinamos como calcular probabilidades de forma correta. Finalizando o material, a unidade V tratará das medidas de associação, mais especifi- camente, a correlação e a análise de regressão. Essas medidas nos mostram o grau de relação entre duas variáveis. A correlação informa a intensidade da relação e a análise de regressão mostra a quantidade de variação em uma por meio da variação em outra. Esse material está bastante sintetizado focando os pontos principais da Estatística de modo a proporcionar encaminhamentos que possibilitem a compreensão dos conceitos, ao contrário do que muitas vezes é posto em se tratando de estudar Ma- temática e, especificamente, Estatística. A resolução de tarefas é importante desde que você, caro(a) aluno(a), procure fa- zê-la à luz da teoria que ela contempla. Com isso, será necessário, também, muito empenho de sua parte para a realização desse intenso trabalho. No decorrer de suas leituras, procure interagir com os textos, fazer anotações, responder as atividades de estudo, anotar suas dúvidas, ver as indicações de leitura e realizar novas pesquisas sobre os assuntos tratados, pois com certeza não será possível esgotá-los em ape- nas um livro. Desejamos a você um ótimo estudo! Professora Me. Ivnna Gurniski de Oliveira Professora Me. Renata Cristina de Souza Professor Me. Edimar Izidoro Novaes APRESENTAÇÃO SUMÁRIO 09 UNIDADE I CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA 15 Introdução 16 A Importância da Disciplina de Estatística 17 Definições e Conceitos Estatísticos 21 Estatística Descritiva 26 Gráficos 35 Distribuição de FrequÊncia 42 Considerações Finais 48 Referências 49 Gabarito UNIDADE II MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS 55 Introdução 56 Medidas Descritivas 66 Medidas Separatrizes 71 Medidas de Dispersão 80 Considerações Finais 87 Referências 88 Gabarito SUMÁRIO 10 UNIDADE III PRINCÍPIO FUNDAMENTAL DA CONTAGEM E ANÁLISE COMBINATÓRIA 93 Introdução 94 Princípio Fundamental da Contagem 98 Análise Combinatória 105 Considerações Finais 111 Referências 112 Gabarito UNIDADE IV PROBABILIDADES 115 Introdução 116 Probabilidade 126 Probabilidade Condicional 133 Distribuições de Probabilidade 141 Distribuição Discreta e Contínua de Probabilidade 150 Considerações Finais 156 Referências 157 Gabarito SUMÁRIO 11 UNIDADE V CORRELAÇÃO LINEAR E REGRESSÃO 161 Introdução 162 Correlação Linear 162 Coeficiente de Correlação Linear de Pearson 167 Análise de Regressão 168 Regressão Linear Simples 175 Considerações Finais 182 Referências 183 Gabarito 186 CONCLUSÃO U N ID A D E I Professor Me. Edimar Izidoro Novaes Professora Me. Ivnna Gurniski de Oliveira Professora Me. Renata Cristina de Souza CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Objetivos de Aprendizagem ■ Entender o que significa Estatística. ■ Compreender a importância da Estatística. ■ Assimilar os principais conceitos dentro da Estatística. ■ Compreender as principais formas de apresentação de dados estatísticos. ■ Entender a importância dos gráficos e das tabelas. ■ Aprender a construir gráficos e tabelas para variáveis qualitativas e quantitativas. Plano de Estudo A seguir, apresentam-se os tópicos que você estudará nesta unidade: ■ A Importância da Disciplina de Estatística ■ Definições e Conceitos Estatísticos ■ Estatística Descritiva ■ Gráficos ■ Distribuição de Frequência INTRODUÇÃO Caro(a) aluno(a), normalmente, as pessoas imaginam que a Estatística é simples- mente uma coleção de números, ou que tem a ver apenas com censo demográfico, com a construção de tabelas ou de gráficos. Podemos afirmar que a Estatística vai muito além disso e que, na verdade, elaé muito frequente em nossa vida. Como exemplos de aplicações de técnicas estatísticas, temos: a pesquisa elei- toral, a pesquisa de mercado, o controle de qualidade, os índices econômicos, o desenvolvimento de novos medicamentos, as novas técnicas cirúrgicas e de tratamento médico, as sementes mais eficientes, as previsões meteorológicas, as previsões de comportamento do mercado de ações dentre outros, isto é, tudo que se diz cientificamente comprovado, por algum momento, passa por proce- dimentos estatísticos. Portanto, podemos definir Estatística como sendo medidas obtidas por meio de dados coletados em amostras. Também é a ciência que estuda os processos de coleta, de organização, de análise e de interpretação de dados relevantes e refe- rentes a uma área particular de investigação. Você verá que a Estatística permite fazer uma análise de dados em todas as áreas e que fornece ferramentas para que sejamos capazes de transformar dados brutos em informações acessíveis e de fácil compreensão, de modo que possa- mos compará-los com outros resultados ou, ainda, verificar sua adequação com alguma teoria pronta. Abordaremos que a Estatística tem uma base na formação do(a) aluno(a), pois é de extrema importância para o seu desenvolvimento saber observar as tabelas e os gráficos e, usar essa ferramenta para a tomada de decisões. Nesta unidade, serão apresentados conceitos básicos em Estatística, que são subsídios para o desenvolvimento de todo o estudo proposto neste livro. Então, aproveite bem essa unidade, e se lembre de que ela será um subsídio para toda nossa disciplina. Bons estudos! Introdução Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 15 CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E16 A IMPORTÂNCIA DA DISCIPLINA DE ESTATÍSTICA Caro(a) aluno(a), a palavra Estatística deriva do latim “status”, que significa estado. Os primeiros usos da Estatística se deram com base no conhecimento da população em relação às suas riquezas e na coleta de impostos. Posteriormente, foi empregada no manuseio de dados que descreviam aspectos de um Estado ou país, daí a origem da palavra estar relacionada a Estado. A Estatística está presente no dia a dia de qualquer indivíduo, seja na abor- dagem governamental em que somos questionados, como o censo demográfico, ou então quando somos abordados sobre qual candidato votaremos na próxima eleição, quando nasce um indivíduo, ou quando estamos consumindo algum tipo de produto; em todas essas situações, dentre tantas outras, estamos fazendo parte da Estatística. A análise estatística tem, assim, por objetivo a resolução de problemas, bem como a produção de conhecimentos que geram novos problemas e, portanto, podemos dizer que está envolvida diretamente em um processo iterativo, sendo seu principal objetivo auxiliar na tomada de decisão. A Estatística é uma ciência que estuda e pesquisa tanto o levantamento de dados quanto o processamento destes para a quantificação da incerteza existente na resposta para um determinado problema; e a tomada de decisões sob condi- ções de incerteza, sob o menor risco possível. Definições e Conceitos Estatísticos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 17 A importância da Estatística está presente em todos os segmentos ligados à pesquisa, de forma geral e abrangente. A maioria desses órgãos possui depar- tamentos oficiais destinados à realização de estudos estatísticos. A Estatística tornou-se responsável, nos últimos tempos pelo desenvolvimento científico e tec- nológico, sendo que é a partir dela que analisamos dados e tomamos as decisões. Ainda, podemos dizer que ela fornece meios precisos e rigorosos na veri- ficação e na análise dos dados, transformando-os em informações claras e a partir das quais tomamos nossas decisões baseados em comprovações científi- cas, e não em “achismos”. Dentre outros atributos, podemos dizer ainda que o estudo da Estatística jus- tifica-se pela necessidade de desenvolver pesquisas e pela utilização dos resultados buscando a comprovação de alguma hipótese e à solução de algum problema. Ademais, atualmente, as empresas têm procurado admitir profissionais que tenham certo nível de conhecimento em Estatística, pois esse tem resultado em diferença significativa nos processos decisórios. Torna-se fundamental para qual- quer indivíduo ter conhecimentos básicos e saber aplicá-los de maneira coerente, utilizando técnicas estatísticas nos diferentes casos que podem surgir. DEFINIÇÕES E CONCEITOS ESTATÍSTICOS Estatística é uma parte da matemá- tica aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados experimentais buscando tomada de decisões. Quando se fala em estatística tem-se a necessidade de definir, enten- der alguns conceitos importantes que são mencionados a seguir. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E18 POPULAÇÃO O termo população se refere a todos os indivíduos ou todos os objetos do grupo com mesmas características. Exemplos: a totalidade dos habitantes de uma deter- minada região, população de parafusos, livros, árvores etc. AMOSTRA É um subconjunto de uma população. Esse subconjunto pode ou não ser repre- sentativo da população. A amostra pode ser probabilística (aleatória) ou não probabilística. Veja a representação, a seguir, na figura 1. Aleatória (casual) simples Sistemática Estrati�cada Por conglomerados Por cotas Bola de neve Intencional A esmo Amostragem probabilística (aleatória) Amostragem não probabilística (não aleatória) Figura 1 - Tipos de amostragem Fonte: adaptado de Reis ([2016], on-line)1. A amostra probabilística significa que podemos associar aos resultados uma pro- babilidade de que estejam corretos, ou seja, uma medida da confiabilidade das conclusões obtidas. Dentre as probabilísticas, temos: Definições e Conceitos Estatísticos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 19 Amostra Casual Simples É aquela em que todos os elementos da população têm igual probabilidade de pertencer à amostra. Pode ser obtida sorteando os elementos a partir da popu- lação de estudo. Amostra Sistemática É uma forma simplificada da amostragem casual simples, podendo ser utilizada quando os elementos da população se apresentam ordenados, sendo a retirada dos elementos para compor a amostra feita com certa periodicidade. Amostra Estratificada É uma amostra em que a população é separada em grupos ou estratos e, dentro de cada estrato, os indivíduos são sorteados, devendo ser semelhantes entre si dentro de cada estrato. Amostra por Conglomerado É uma amostra em que a população é dividida em diferentes conglomerados, extraindo-se uma amostra apenas dos conglomerados selecionados, e não de toda a população. Se a amostra não for probabilística não há como saber se há 95% ou 0% de probabilidade de que os resultados sejam corretos. Falado sobre os tipos de amostras, agora se tem as Estatísticas que são os tópicos que, junto com os tipos de amostras, compõem todo o trabalho estatístico. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E20 ESTATÍSTICAS São medidas obtidas por meio de dados coletados em amostras. PARÂMETROS São medidas populacionais que podem ser obtidas por um censo ou estimadas por meios de dados amostrais. ESTATÍSTICA DESCRITIVA Parte da estatística que procura somente descrever e analisar certo grupo, sem tirar quaisquerconclusões ou inferências sobre um grupo maior. ESTATÍSTICA INDUTIVA Parte da estatística que utiliza métodos científicos para fazer afirmações e tirar conclusões sobre características ou parâmetros de uma população baseando-se em resultados de uma amostra. VARIÁVEIS É o que está sendo analisado no interior de uma população e que possibilita a geração de dados distintos ao longo dessa mesma população. Podem ser: Estatística Descritiva Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 21 Variáveis Qualitativas Quando seus valores forem expressos por atributos (não numéricos). Podem ser: a. Nominais: Ex.: sexo, estado civil etc. b. Ordinais: Ex.: cultura: ensino fundamental 1, ensino fundamental 2, ensino médio, ensino superior etc. Variáveis Quantitativas São as inerentemente numéricas. Podem ser: a. Contínuas: quando podem assumir qualquer valor em certo intervalo da reta real. Ex.: peso, altura etc. b. Discretas: quando assumem valores pontuais, geralmente de números inteiros. Ex.: número de filhos, números de erros em um livro etc. ESTATÍSTICA DESCRITIVA Caro(a) aluno(a), observe, a seguir, os passos a serem seguidos em um traba- lho estatístico: Crítica dos dados Coleta de dados Apresentação dos dados Tabelas Grá�cos Análise e conclusões Figura 2 – Passos de um trabalho estatístico Fonte: os autores. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E22 COLETA DE DADOS Após a definição do problema a ser estudado e o estabelecimento do planeja- mento da pesquisa (forma pelo qual os dados serão coletados; cronograma das atividades; custos envolvidos, exames das informações disponíveis e delinea- mento da amostra), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estu- dado. Podem ser classificadas como: Quanto ao tempo: a. Contínua: quando realizada permanentemente (nascimento, casamen- tos, óbitos etc.). b. Periódica: quando é feita em intervalos de tempo (censo). c. Ocasional: quando efetuada sem época preestabelecida (epidemias, catástrofe). Estatística Descritiva Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 23 Quanto à forma: a. Direta: quando os dados são obtidos na fonte originária (nascimentos registrados nos cartórios, opiniões obtidas em pesquisa de opinião pública, vendas registradas em notas da empresa etc.). b. Indireta: quando os dados obtidos provêm da coleta direta (pesquisa agrícola obtida em uma secretaria específica do governo ou no Instituto Brasileiro de Geografia e Estatística – IBGE – etc). CRÍTICA DOS DADOS Objetivando a eliminação de erros capazes de provocar futuros enganos de apre- sentação e análise, procede-se a uma revisão crítica dos dados, suprimindo os valores estranhos ao levantamento. Podem ser: a. Crítica Externa: quando visa às causas dos erros por parte do infor- mante, tais como: a distração ou má interpretação das perguntas de um questionário. b. Crítica Interna: quando se observa o material constituído pelos dados coletados. Verificação de cópias e somas de valores anotados. APRESENTAÇÃO DOS DADOS Após a crítica, convém organizarmos os dados de maneira prática e racional, para o melhor entendimento do fenômeno que se está estudando. Sua apresen- tação pode ocorrer por meios de tabelas ou gráficos. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E24 Tabela É uma matriz na qual se registra os dados de um evento. É composta em: a. Cabeçalho: é a apresentação do que a tabela está procurando representar. Deve conter o suficiente para que sejam respondidas as seguintes ques- tões: O quê? Onde? Quando? b. Corpo: é a parte da tabela composta por colunas e subcolunas dentro das quais são colocados os dados apurados. c. Rodapé: parte inferior no qual se registra a fonte dos dados. Exemplos: Tabela Simples: É a representação de valores de uma única variável. Tabela 1 - Vendas de imóveis realizadas pelas maiores imobiliárias da cidade de São Paulo em 1998 IMOBILIÁRIA UNIDADES VENDIDAS Altaplan Lopes Nosso Teto Procasa 5186 4273 4992 3426 TOTAL 17877 Fonte: adaptado de Secovi/SP ([2016], on-line)2. Tabela de dupla entrada ou de contigência É a representação, em uma única tabela, de valores de mais de uma variável, isto é, a conjunção de duas tabelas. Estatística Descritiva Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 25 Tabela 2 - Taxa de desemprego Grande São Paulo – 92/97 MÊS/ANO PORCENTAGEM (%) DEZEMBRO MASCULINO FEMININO 1992 1993 1994 1995 1996 1997 13,0 12,4 10,7 12,0 12,6 14,4 16,3 14,6 15,3 15,1 16,4 19,4 TOTAL 75,1 97,1 Fonte: os autores. Tabela 3 - Média geral dos alunos segundo o sexo. Colégio São Paulo – 1º bimestre - 2001 SEXO MÉDIAS MASCULINO FEMININO TOTAL 40|---50 1 0 1 50|---60 3 0 3 60|---70 14 6 20 70|---80 11 16 27 80|---90 2 8 10 90|--100 0 4 4 TOTAL 31 34 65 Fonte: os autores. Sempre é preciso, antes de fazer teorias, fazer uma análise sobre os dados. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E26 GRÁFICOS Caro(a) aluno(a), a representação gráfica dos dados de um fenômeno tem por finalidade dar uma ideia, a mais imediata possível, dos resultados obtidos, per- mitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista. CARACTERÍSTICAS DO GRÁFICO ■ Simplicidade. ■ Clareza. ■ Veracidade. Gráficos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 27 ELEMENTOS E NORMAS ■ Título: acima do gráfico, completo, claro e conciso. ■ Fonte: abaixo do gráfico. ■ Moldura: para dar efeito estético ao gráfico. ■ Legenda: não deve prejudicar a leitura do gráfico. ■ Desenho: no desenho incluem-se apenas as coordenadas necessárias para guiar a leitura do gráfico. ■ Escala: a escala horizontal deve ser lida da esquerda para a direita e a ver- tical de baixo para cima. ■ Cor: o colorido não deve causar ilusões de ótica. ■ Forma: a altura do gráfico deve ter, aproximadamente, 75 % da largura, de modo que, incluindo o título e o rodapé, a moldura do gráfico assuma mais ou menos, a forma quadrada. TIPOS DE GRÁFICOS ■ Diagramas: construídos com o auxílio de figuras geométricas em duas dimensões. ■ Cartogramas: é a representação sobre cartas geográficas. ■ Esteriogramas: gráficos representados por meio de volumes. ■ Pictogramas: é a representação gráfica por meio de figuras. Os gráficos mais utilizados na Estatística são os diagramas, dentre os quais se destacam: ■ Gráficos em colunas ou em barras: é a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizon- talmente (em barras). CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E28 ■ Gráficos de linhas: é a representação de uma série por meio de uma linha poligonal. ■ Gráfico de setores: é constituído com base em um círculo e é empregado sempre que se deseja ressaltar a participação do dado no total. ■ Gráficos comparativos: é a representação de mais de uma variável em um mesmo gráfico. GRÁFICOS DE DISTRIBUIÇÃO DE FREQUÊNCIA ■ Histogramas ■ Polígonos de Frequência Exemplos:Gráficos de Colunas Gráfico 1 - Estimativas de sub-registro de nascimentos – Brasil – 2002/2012 2002 20,3 18,8 17,6 14,5 15,4 15,5 12,9 12,7 11,5 8,2 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 6,7 Fonte: IBGE (2013, on-line)6. Gráficos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 29 Gráfico de Barras Gráfico 2 - Brasileiros residentes no exterior – 1996 PAIS Nº DE BRASILEIROS África Alemanha Argentina Espanha Estados Unidos Itália Japão Paraguai 3.126 36.096 15.404 10.361 598.526 40.118 201.139 460.846 Fonte: adaptado de Receita Federal ([2016], on-line)3. Gráfico 3 - Brasileiros residentes no exterior 1996 Pa ís es Paraguai Japão Itália Estados Unidos Espanha Argentina Alemanha África Pa ís es 0 700600500400300200 Nº de Brasileiros (1000) 100 Fonte: adaptado de Receita Federal ([2016], on-line)3. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E30 Gráfico de Linhas Gráfico 4 - Taxa de crescimento da população, por década Brasil – anos 40/anos 90 ANOS TAXA DE CRESCIMENTO (%) 40 50 60 70 80 90* 26,2 34,9 32,9 27,7 22,0 14,5 Fonte: adaptado de IBGE ([2016], on-line)⁴. Gráfico 5 - Taxa de crescimento da população por década - Brasil - anos 40/ anos 90 40 15 35 30 25 20 10 5 0 40 50 60 70 80 90 PE RC EN TU A L ANOS Fonte: adaptado de IBGE ([2016], on-line)⁴. Gráficos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 31 Gráfico de Setores Gráfico 6 - Primeiro atendimento que os moradores de Apucarana procuram em caso de doenças – 2000 4,17% 60,33%16,49% 10,51% 8,51% Posto de Saúde/PAM Médico ou Hospital Particular Convênio de Saúde Trata por conta própria Outras Fonte: os autores. Os diversos tipos de gráficos sempre têm o mesmo objetivo: mostrar os da- dos de forma resumida. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E32 Gráficos Comparativos Gráfico 7 - Migração rural, em milhões, por década, em alguns Estados Brasileiros - Anos 70 e 80 ESTADOS ANOS 70 80 BAHIA RIO GRANDE DO SUL PARANÁ MINAS GERAIS 0,7 1,4 2,4 2,4 1,0 1,1 1,5 1,6 Fonte: adaptado de Abep ([2016], on-line)5. Gráfico 8 - Migração rural em alguns Estados Brasileiros – Anos 70 e 80 2,5 2 1,5 1 0,5 0 BA Estados M ilh õe s RS PR MG Anos 70 Anos 80 Fonte: adaptado de Abep ([2016], on-line)5. Gráficos Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 33 Histograma Gráfico 9 - Média geral dos alunos COLÉGIO SÃO PAULO – 1º BIMESTRE - 2001 MÉDIAS Nº DE ALUNOS 40|--- 50 1 50|--- 60 3 60|--- 70 20 70|--- 80 27 80|--- 90 10 90|---100 4 TOTAL 65 Fonte: os autores. Gráfico 10 - Média geral dos alunos - Colégio São Paulo - 2001 30 25 20 15 10 5 0 40 50 60 Médias N º d e A lu no s 8070 90 100 Fonte: os autores. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E34 Polígono de Frequência Gráfico 11 - Média geral dos alunos COLÉGIO SÃO PAULO – 1º BIMESTRE - 2001 MÉDIAS Nº DE ALUNOS 40|--- 50 1 50|--- 60 3 60|--- 70 20 70|--- 80 27 80|--- 90 10 90|---100 4 TOTAL 65 Fonte: os autores. Gráfico 12 - Média Geral dos Alunos - Colégio São Paulo 2001 30 25 20 15 10 5 0 40 50 60 Médias N º d e A lu no s 8070 90 100 Fonte: os autores. Caro(a) aluno(a), a interpretação adequada de um gráfico ou tabela é fundamen- tal para o entendimento da pesquisa. Ler o título de forma minuciosa e observar valores máximos, mínimos e suas variações são pontos fundamentais para uma interpretação adequada. ©shutterstock Distribuição de FrequÊncia Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 35 DISTRIBUIÇÃO DE FREQUÊNCIA Para se fazer a representação de dados de informações, é possível usar a distribuição de frequência. Sua utilidade é a de poder representar grande quantidade de informação em poucas classes, linhas, quando se usa a distribuição de frequência contínua e até mesmo a discreta. Os conceitos necessários que envolvem a distribuição e fre- quência são: Conceito: é uma série estatística específica no qual os dados se encontram dispostos em classes ou categorias, juntamente com as frequências correspondentes. Dados Brutos: são os dados coletados que ainda não foram numericamente organizados. Exemplo: Idade dos alunos. Rol: é o conjunto de dados brutos ordenados de forma crescente ou decrescente. Para variáveis quantitativas contínuas ou discretas, com elevado número de valores diferentes, a distribuição de frequências apropriadas é apresentar os dados em classes de valores. Para esse procedimento, primeiramente, precisamos determinar o número de classes. Uma classe é uma linha da distribuição de frequências. Podemos fazer gráficos utilizando o Excel, esses gráficos são gerados a partir de dados apresentados em tabelas que, por sua vez, estão inseridas dentro de planilhas eletrônicas. O interessante de se gerar gráficos a partir de plani- lhas eletrônicas é que ao se alterar os valores contidos na planilha, o gráfico correspondente a esses dados, é automaticamente atualizado. A Microsoft Excel possui um assistente para facilitar a geração de gráficos, no qual divide este processo em quatro etapas subsequentes, apresentan- do a cada etapa apenas as opções, diretamente, relacionadas e necessárias para a conclusão do gráfico. Fonte: os autores. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E36 NÚMEROS DE CLASSES Não há regras absolutas para a escolha do número de classes, geralmente entre 5 e 20 classes serão satisfatórias para a maior parte dos conjuntos de dados. Uma regra prática razoável é: ≈K número de observações Usar um número pequeno de classes poderia concentrar a maioria das observa- ções em uma ou duas classes. Se for usado um número grande de classes, muitas delas terão frequências iguais à zero. AMPLITUDE TOTAL E AMPLITUDE DAS CLASSES Para determinar a variação dos dados dentro de cada classe será preciso encon- trar a amplitude total: AT= maior valor – menor valor (Xmáx – Xmín) Com o valor de AT, a variação de cada classe que chamaremos de amplitude das classes (AC ou h) é determinada pela relação: AC = AT K Portanto AC ou h é a divisão entre a amplitude total (AT) pelo número das clas- ses (K). Distribuição de FrequÊncia Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 37 CONSTRUÇÃO DAS CLASSES O menor valor da classe é denominado limite inferior (Li) e o maior valor da classe, limite superior (Ls). Para obtenção da primeira classe, tomar como Li o menor valor. Ao Li somar o valor da AC (ou h) e assim se obtém o Ls. Para construção da segunda classe, repetir o Ls da primeira classe, sendo que este na segunda classe passa a ser o Li. A este valor adicionar o valor de AC (ou h) e se obtém o Ls. Para a terceira classe, repetir o procedimento. O Ls da segunda classe é repetido na terceira classe e se torna o Li. A esse Li adicionar o valor de AC e se obtém o Ls. Esse definido procedimento deve ser repetido até que se obtenha o número de clas- ses. O Ls da última classe deve, obrigatoriamente, ultrapassar o maior valor do conjunto de dados. PONTO MÉDIO DAS CLASSES O ponto médio de uma classe é dado por: 2 LsLi +Xi = Caro(a) aluno(a), veremos na próxima unidade,que o ponto médio de uma classe é utilizado para calcular a média aritmética ponderada para um conjunto de dados agrupados. Exemplo: Em uma pesquisa, foram coletados dados referentes aos clientes que pro- curam uma determinada imobiliária para a compra de um imóvel residencial: CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E38 Tabela 4: Clientes e visitas a imóveis para a compra CLIENTES QUANTIDADE DE IMÓVEIS VISITADOS 1 7 2 16 3 24 4 2 5 24 6 11 7 34 8 44 9 13 10 4 11 6 Fonte: os autores. Vamos construir a tabela de frequência para a quantidade de imóveis visitados. Para isso, precisamos determinar: ■ O número de classes (k), dado pela raiz quadrada do número de observações. K = n = ≈≈ 3 classes11 3,31 ■ A amplitude total (AT), dada pela diferença entre o maior e o menor valor observado. =AT 44 - 2 = 42. ■ A amplitude das classes (h), dada pela razão entre a amplitude total e o número de classes. AT = = k 42 14 3 h = Distribuição de FrequÊncia Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 39 Conhecendo os valores de k, AT e h, montamos as classes da tabela da seguinte forma: ■ Primeira classe: o limite inferior (Li ) é dado pelo menor valor da plani- lha de dados referente ao número de imóveis visitados, neste caso, Li = 2. A este valor somamos a amplitude das classes (h = 14) e obtemos o limite superior da primeira classe, Ls = 2 + 14 = 16. ■ Segunda classe: o limite superior da primeira classe se torna o limite inferior da segunda classe, isto é, Li = 16. A este valor somamos a ampli- tude das classes (h = 14) e obtemos o limite superior da segunda classe, Ls = 16 + 14 = 30. ■ Terceira classe: o limite superior da segunda classe se torna o limite infe- rior da terceira classe, isto é, Li = 30. A este valor somamos a amplitude das classes (h = 14), e obtemos o limite superior da segunda classe, Ls = 30 + 14 = 44. Assim, montamos as três classes, abrangendo todos os valores da planilha de dados. Conhecendo os limites inferior e superior de cada classe, calculamos o ponto médio de cada classe como: 2 LsLi +Xi = Para as colunas de frequências, temos que a frequência absoluta é dada pela contagem do número de valores encontrados dentro dos limites das classes; a fre- quência relativa será a razão da frequência absoluta da classe pelo número total de investimentos; a frequência percentual será a frequência relativa multiplicada por cem e a frequência acumulada será a soma da frequência absoluta das classes. Portanto, a tabela de distribuição de frequência será: Tabela 5 - Distribuição de frequências para a quantidade de imóveis visitados por clientes de uma imobiliária para efetuar uma compra Classes Fi Fr Fr% Fac, Xi 2 |---- 16 6 0,545 54,5 6 9 16 |---- 30 3 0,273 27,3 9 23 30 |----| 44 2 0,182 18,2 11 37 Total 11 1 100 - - Fonte: os autores. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E40 Observe que, na primeira classe da tabela, temos o intervalo 2|---16 e, na terceira classe, temos o intervalo 30|---|44, vamos entender o que significa essa repre- sentação de intervalos: ■ Li|---Ls: o limite inferior está incluído na contagem da frequência abso- luta da classe e o limite superior não. ■ Li---| Ls: o limite superior está incluído na contagem da frequência abso- luta da classe e o limite inferior não. ■ Li |---| Ls: os limites inferior e superior estão incluídos na contagem da frequência absoluta da classe. ■ Li---Ls: os limites inferior e superior não estão incluídos na contagem da frequência absoluta da classe. Na Tabela 5 se observa outra coluna representada por “Xi”; esta é chamada de ponto médio da classe, obtido da seguinte maneira: 2 LsLi +Xi = De acordo com a tabela, os pontos médios foram dados da seguinte maneira: X1 = = 9 2 162 + X2 = = 23 2 3016 + X3 = = 37 2 4430 + Outro exemplo: os dados relacionados a seguir referem-se a uma pesquisa reali- zada a respeito do sexo e da idade, em anos, de um grupo de estudantes de uma Instituição de Ensino Superior (IES). Distribuição de FrequÊncia Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 41 Tabela 6 - Pesquisa realizada em um grupo de estudantes em uma IES INDIVÍDUO SEXO IDADE (ANOS) 1 Masculino 34 2 Feminino 32 3 Feminino 47 4 Feminino 17 5 Masculino 21 6 Masculino 25 7 Masculino 34 8 Feminino 39 9 Masculino 52 10 Masculino 41 11 Masculino 22 Fonte: os autores. Logo, para a variável idade, temos: = 11,7 12 3 1752 − AC = ≈ Tabela 7 - Distribuição de frequências para a idade de um grupo de estudantes Classes Fi Fr Fr% Fac Xi 17|---29 4 0,364 36,4 4 23 29|---41 4 0,364 36,4 8 35 41|---53 3 0,272 27,2 11 47 Total 11 1,000 100,0 - - Fonte: os autores. Note que o número 41 apareceu na planilha de dados. Optamos por colocá-lo na classe em que ele representa o Li na tabela anterior. CONCEITOS E IMPORTÂNCIA DA ESTATÍSTICA Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IU N I D A D E42 CONSIDERAÇÕES FINAIS Prezado(a) aluno(a), nesta unidade, tratamos da necessidade de que a apresenta- ção dos dados seja feita de forma precisa. As duas formas vistas, nesta unidade, foram tabelas e gráficos. Enfatizamos que o uso correto das formas de apresen- tação dos dados é fundamental para o sucesso da pesquisa. Vimos que os gráficos são formas de sintetizar as informações coletadas. São importantes para dispormos as informações de forma clara e para que consiga- mos enxergar o que aconteceu na nossa pesquisa. Conhecemos os diversos tipos de gráficos, por exemplo, os tipos mais comuns, como os de barras e colunas, os de linha, de setores ou pizza, histograma e polígono de frequência. De forma geral, os gráficos demonstram dados quanti- tativos associados a alguma variável qualitativa. Todos os gráficos têm o mesmo objetivo, que é o de demonstrar de forma clara e rápida os dados da pesquisa. A escolha do tipo adequado fica a critério do pesquisador ou a critério do obje- tivo da pesquisa estudada. Nessa etapa, o interesse maior consiste em tirar conclusões que auxiliem o pesquisador a resolver seu problema. Portanto, além da organização e da tabu- lação dos dados, as tabelas e os gráficos nos apresentam de uma forma clara, sucinta e objetiva os resultados de uma pesquisa, para tirarmos conclusões e nos ajudarem na tomada de decisões. Também observamos que podemos construir gráficos e tabelas por meio de programas computacionais, por exemplo, a Microsoft Excel, que é uma pla- nilha de dados que dispõe de ferramentas para construção de gráficos, a partir de tabelas. Esse programa é fácil de usar, tem inúmeras ferramentas que podem ser úteis ao gestor. Esperamos que você, caro(a) aluno(a), tenha compreendido essa unidade, porque ela é de extrema importância aos futuros profissionais, pois tabelas e gráficos estão presentes no nosso cotidiano. Assim, cabe a nós entendê-los, inter- pretá-los e avaliar os dados que nos são apresentados.. 43 1. Defina Estatística, Estatística Descritiva e Estatística Inferencial. 2. Apresente os conceitos para os termos a seguir relacionados e dê um exemplo para cada um deles: ■ População. ■ Amostra. ■ Estimação. ■ Variáveis. 3. Explique os principais tipos de amostras. 4. As notas dos alunos do 2º ano de Comércio Exterior de uma determinada insti- tuição de ensino, no 1º Bimestre de 2004, estão relacionadas a seguir: 25 25 25 27 28 30 35 35 37 39 39 43 43 44 45 46 46 48 49 49 49 50 50 50 50 50 55 55 55 58 63 63 64 65 65 65 67 67 68 69 70 70 70 70 73 73 73 74 74 76 82 82 82 84 84 84 87 87 87 88 89 90 90 90 93 93 9395 95 95 Fonte: os autores. Organizando os dados em uma distribuição de frequência contínua, determine e interprete: a. A frequência absoluta da 1ª classe. b. A frequência absoluta acumulada da 3ª classe. c. A frequência relativa da 4ª classe. 44 5. Considere a seguinte planilha de dados quanto às topologias de rede de compu- tadores na resposta do tempo ao usuário: INFORMAÇÃO TOPOLOGIA TEMPO DE RESPOSTA 1 C1 6,0 2 C2 7,0 3 C3 5,0 4 C1 6,3 5 C2 6,8 6 C2 7,2 7 C1 6,0 8 C2 6,7 9 C1 5,7 10 C2 6,5 11 C3 6,4 12 C1 5,7 13 C3 7,2 14 C3 6,8 15 C3 6,5 16 C2 7,5 a. Construa uma tabela de distribuição de frequências para Topologia. b. Construa um gráfico de setores para Topologia. c. Construa uma tabela de distribuição de frequências para a variável tempo de resposta em quatro classes. d. Demonstre um histograma para a variável tempo de resposta. e. Demonstre um polígono de frequências para a variável tempo de resposta. 45 6. A patrulha rodoviária escolheu um ponto nas imediações da cidade para instalar um radar e verificou a velocidade em km/h de uma amostra de 50 carros que passaram por esse ponto. 40 45 45 48 50 50 51 52 52 53 55 55 55 55 55 60 60 63 63 63 64 64 64 65 65 65 65 65 65 65 65 66 66 66 67 68 68 68 70 70 70 71 71 74 75 76 76 77 80 81 Fonte: os autores. Ao organizar os dados da tabela em uma distribuição de frequência contínua, quan- tas classes a distribuição terá? E qual será a amplitude das classes? 7. Os pesos de um grupo de alunos da escola X, em Curitiba, no ano de 2003 estão relacionados a seguir: 45 45 46 47 49 49 49 49 50 50 51 51 53 54 54 57 59 59 60 60 60 60 60 60 62 62 65 65 65 65 66 66 67 67 68 70 70 70 70 70 73 73 75 76 77 78 78 78 78 78 84 85 85 85 87 88 88 89 90 90 Com base nos pesos desses alunos, qual é a interpretação da frequência relativa da terceira classe? 8. Comente as vantagens de apresentar resultados de pesquisa por meio de tabe- las e gráficos. 46 Arredondamento de Números Em trabalhos relacionados à área de Estatística, de Matemática, além de outras situações que estão relacionadas com o nosso dia a dia, utilizamos o arredondamento de núme- ros. Muitas vezes, é conveniente suprimir unidades inferiores às de determinada ordem. Essa técnica é denominada arredondamento de dados ou valores, que é mais compre- ensível para entendimento de quem terá essa informação. Quem determina o arredondamento de dados é a Resolução nº 886/66 do IBGE. De acor- do com o número de casas após a vírgula, podemos classificar os números em: a. Decimais: uma casa após a vírgula – 0,1; 0,3; 3,2; 5,4. b. Centesimais: duas casas após a vírgula – 0,12; 2,14; 5,23; 7,89; 15,24. c. Milesimais: três casas após a vírgula – 45,123; 56,789; 1,002. As regras para o arredondamento de dados são: Se o Algarismo a ser suprimido for: a. Menor que 5: basta suprimi-lo. Ex.: 5,052 (Para um número centesimal) – 5,05 Ex.: 213,123 (Para um número decimal) – 213,1 Ex.: 77, 5342 (Para um número milesimal) – 77,534 b. Maior que 5: basta suprimi-lo, acrescentando uma unidade ao algarismo que o precede. Ex.: 5,057 (Para um número centesimal) – 5,06 Ex.: 213,173 (Para um número decimal) – 213,2 Ex.: 77, 5348 (Para um número milesimal) – 77,535 c. Igual que 5: basta suprimi-lo, acrescentando uma unidade ao algarismo que pre- cede. Ex.: 5,055 (Para um número centesimal) – 5,06 Ex.: 34,954 (Para um número decimal) – 35,0 Ex.: 34,654 (Para um número decimal) – 34,7 Fonte: adaptado de Portal Educação (2013, on-line)6. Material Complementar MATERIAL COMPLEMENTAR Estatística Básica Autor: Geraldo Luciano Toledo e Ivo Izidoro Ovalle. Editora: Atlas Ano: 2010 Sinopse: esse livro contém a matéria fundamental para estudos subsequentes no campo da estatística inferencial, além disso, aborda os tópicos mais importantes da estatística básica. subsequentes no campo da estatística inferencial, além disso, aborda REFERÊNCIASREFERÊNCIAS TOREZANI, W. Apostila de Estatística I. Vila Velha: Faculdade Univila, 2004. Referências On-Line 1Em: <http://www.inf.ufsc.br/~marcelo/Cap7.pdf>. Acesso em: 20 set. 2016. 2Em: <http://www.secovi.com.br/pesquisa-mensal-do-mercado-imobiliario/>. Acesso em: 20 set. 2016. 3Em: <http://normas.receita.fazenda.gov.br/>. Acesso em: 20 set. 2016. ⁴Em: <http://www.ibge.gov.br/home/presidencia/noticias/29092003estatisticase- cxxhtml.shtm>. Acesso em: 20 set. 2016. ⁵Em: <http://www.abep.nepo.unicamp.br/>. Acesso em: 20 set. 2016. ⁶Em: <http://www.portaleducacao.com.br/educacao/artigos/30568/regras-de-ar- redondamento>. Acesso em: 20 set. 2016. ⁷Em: <http://www.ibge.gov.br/home/presidencia/noticias/imprensa/ppts/0000001 586431219201343361992738.pdf>. Acesso em: 30 set. 2016. 48 REFERÊNCIAS 49 GABARITO 1. A Estatística pode ser definida como uma parte da matemática que se preocupa em coletar, organizar, descrever, analisar e interpretar um conjunto de dados. A estatística descritiva se preocupa em descrever os dados. A estatística inferencial se preocupa com a análise dos dados e sua interpreta- ção. Ela analisa os dados com base na amostra e, então, estende as conclusões desta amostra à população. 2. População: conjunto de elementos que possuem alguma característica em co- mum. Amostra: parte da população, devendo ser representativa dela. Estimação: obtenção de valores de uma amostra. Variáveis: características tomadas em uma população ou amostra, por exemplo: sexo, idade, região de procedência, peso etc. 3. Amostra Casual Simples: é aquela em que todos os elementos da população têm igual probabilidade de pertencer à amostra. Pode ser obtida sorteando os ele- mentos a partir da população de estudo. Amostra Sistemática: é uma forma simplificada da amostragem casual simples, podendo ser utilizada quando os elementos da população se apresentam orde- nados, sendo a retirada dos elementos para compor a amostra feita com certa periodicidade. Amostra Estratificada: é uma amostra em que a população é separada em gru- pos ou estratos e, dentro de cada estrato, os indivíduos são sorteados, devendo ser semelhantes entre si dentro de cada estrato. Amostra por Conglomerado: é uma amostra em que a população é dividida em diferentes conglomerados, extraindo-se uma amostra apenas dos conglomera- dos selecionados, e não de toda a população. 4. a) 6 alunos têm nota maior ou igual 25 e menor que 34 pontos. b) 26 alunos têm nota maior ou igual a 25 e menor que 52 pontos. c) 5,7% dos alunos têm nota maior ou igual a 52 e menor que 61 pontos. GABARITO 5. a) Tabela - Distribuição de frequências para a variável topologia Topologia Fi Fr% Fac C1 5 31,25 5 C2 6 37,50 11 C3 5 31,25 16 Total 16 100,00 - Fonte: os autores. b) Gráfico - Porcentagem de clientes para a variável topologia C1 C2 C3 31,25% 37,50% 31,25% Fonte: os autores. c) Tabela - Distribuição de frequências para a variável tempo de resposta AC = 4 0,55,7 − = 0,63 Tempo Fi Fr% Fac Xi 5,00 |--5,63 1 6,25 1 5,32 5,63--6,26 4 25,00 5 5,95 6,26--6,89 7 43,75 12 6,58 6,89--7,52 4 25,00 16 7,21 Total 16 100,00 - - Fonte: os autores. GABARITO 51 d) Gráfico: Porcentagem de clientes para a variável tempo de resposta ao usuário 0 5 10 15 20 25 30 35 40 45 50 6,25 % d e cl ie nt es 25 5,00 | --5,63 5,63 | --6,26 Classes 6,26 | --6,89 6,89 | --7,52 25 43,75 Fonte: os autores. Gráfico - Porcentagem de clientes para a variável tempo de resposta 0 5,32 5,95 6,58 7,21 5 10 15 20 25 30 35 40 45 50 Ponto médio das classes % d e cl ie nt es Fonte: os autores. 6. 7 classes com amplitude igual a 6. 7. 11 alunos da escola X em Curitiba no ano de 2003 têm peso maior ou igual a 57 e menor que 63 quilos. 8. Representar os dados por meio de tabelas e gráficos, possibilita que os dados se- jam apresentados de forma resumida, que ocorra uma visualização mais rápida e fácil para o leitor e com isso um melhor entendimento dos dados, ficando mais fácil de saber o que está ocorrendocom os dados coletados. U N ID A D E II Professor Me. Edimar Izidoro Novaes Professora Me. Ivnna Gurniski De Oliveira Professora Me. Renata Cristina de Souza MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Objetivos de Aprendizagem ■ Compreender as principais medidas estatísticas de posição, dispersão e separatrizes. ■ Entender a aplicação das medidas estatísticas de posição, dispersão e separatrizes. Plano de Estudo A seguir, apresentam-se os tópicos que você estudará nesta unidade: ■ Medidas Descritivas ■ Medidas Separatrizes ■ Medidas de Dispersão INTRODUÇÃO Olá, caro(a) aluno(a)! Quando estamos realizando uma pesquisa, podemos fazer a apresentação dos dados por meio de gráficos, tabelas ou fazendo o uso de medidas que resumem as informações obtidas na coleta dos dados, chama- das medidas descritivas. Nesta unidade, estudaremos as medidas de posição e de dispersão utiliza- das para descrever dados quantitativos. Essas medidas são muito importantes na representação dos dados. As medidas de posição ou de tendência central mostram o centro de uma distribuição de dados, dando-nos uma noção do que está ocorrendo com eles. Por meio dessas medidas, podemos localizar a maior concentração de valores em uma distribuição, ou seja, se ela localiza-se no início, no meio ou no centro, ou ainda, se há uma distribuição por igual. As medidas de tendência centrais mais importantes são a média aritmética, a mediana e a moda. Vale salientar, que temos outras medidas de posição que são as separatrizes, que englobam: a própria mediana, os quartis e os percentis. Já as medidas de dispersão são utilizadas para avaliar o grau de variabilidade do conjunto de dados, mostrando se o mesmo é homogêneo ou heterogêneo. Essas medidas servem para analisar o quanto os dados são semelhantes, des- crevem o quanto os dados distanciam do valor central, portanto, as medidas de dispersão servem também para avaliar o grau de representação da média. As medidas de dispersão mais utilizadas são: a amplitude total, a variância, o des- vio padrão e o coeficiente de variação. Assim, para descrevermos um conjunto de dados, é de bom grado sempre termos uma medida de posição e uma de dispersão para representá-lo. A de posição, para dizer o que está ocorrendo com a pesquisa e a de dispersão, para dizer se há alta ou baixa variabilidade. Nesta unidade, vamos estudar as principais medidas de posição e medidas de dispersão utilizadas nas pesquisas para descrever e representar o conjunto de dados. Vamos em frente. Bons estudos! Introdução Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 55 MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E56 MEDIDAS DESCRITIVAS Caro(a) aluno(a), para sumarizar as informações de um conjunto de observa- ções, muitas vezes, é necessário utilizar medidas que resumem em um só número certas características. Assim, temos as medidas de posição, de dispersão, de assi- metria e de curtose. Se as medidas são calculadas para dados a partir de uma amostra, são chamadas de estatísticas da amostra; se são calculadas a partir de uma população, são chamadas de parâmetros da população. As principais medidas de posição e as principais medidas separatrizes são: Média Aritmética Mediana Moda Mediana Quartis Decis Percentis Medidas de Posição Medidas de tendência central Separatrizes Medidas Descritivas Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 57 As principais medidas de dispersão são: Amplitude Total Variância Desvio - Padrão Coe�ciente de Variação Medidas de Dispersão MEDIDAS DE POSIÇÃO As medidas de posição servem para representar o ponto central de equilíbrio de um conjunto de observações ordenadas segundo suas grandezas. Dentre as medidas de posição, destacamos: média, mediana e moda, sendo que a medida a ser escolhida para representar coerentemente os dados depende das caracte- rísticas deles. MÉDIA ARITMÉTICA A média de uma variável é a medida mais importante e mais simples de ser cal- culada. Essa fornece uma medida de posição central. Se os dados são de uma amostra, a média é denotada por x ; se os dados são de uma população, a média é denotada pela letra grega µ . A média de um conjunto de dados é encontrada somando seus valores e dividindo pelo número de observações. Seja x1x2,...,xn, um conjunto de dados a média será dada por: População Amostra N x ì N 1i i∑ == n x x n 1i i∑ == MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E58 Exemplo: Suponha que estamos estudando a idade de cinco indivíduos de uma família. As idades observadas foram: 5, 10, 12, 35, 38. Logo, a idade média dessa família é: �= = + � +⋯+� � �1 2 ��1 i ∑�i=_ � = = 5 205+10+12+35+38� Exemplo: Calcule a média para a quantidade de atendimentos realizados em um mês pelos corretores de uma imobiliária: 18, 19, 20, 21, 21, 22, 24, 34, 35, 37 R: 25,1 MÉDIA ARITMÉTICA PONDERADA Existem situações em que não temos todos os dados disponíveis ou então temos “pesos” diferentes para os dados considerados. Nesses casos, utilizamos o que chamamos de média aritmética ponderada para obtermos a média, cujas fórmu- las para População e para Amostra são dadas da seguinte maneira: População Amostra N xF ì ii.∑= n xF x ii.∑= Se a situação for de dados agrupados, a média é obtida a partir de uma ponde- ração em que os pesos são as frequências absolutas (Fi) de cada classe e xi é o ponto médio da classe i. Observe o exemplo a seguir: Medidas Descritivas Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 59 Tabela 1 - Distribuição de frequências para a quantidade de imóveis visitados por clientes de uma imobiliária para efetuar uma compra Classes Fi Fr Fr% Fac Xi 2 |---- 16 6 0,545 54,5 6 9 16 |---- 30 3 0,273 27,3 9 23 30 |----| 44 2 0,182 18,2 11 37 Total 11 1 100 - - Fonte: os autores. A média ponderada será dada por: 91,17 11 37) x (223) x 3(9) x(6 x = ++ = imóveis visitados Exemplo: Calcule a média ponderada para a seguinte situação: Tabela 2 - Distribuição de frequências para a idade dos clientes de uma imobiliária para efetuar uma compra Classes Fi Fr Fr% Fac Xi 17 |---- 29 4 0,364 36,4 4 23 29 |---- 41 4 0,364 36,4 8 35 41 |----| 53 3 0,273 27,3 11 47 Total 11 1 100 - - Fonte: os autores. Resposta: 33,91 Existem situações em que os dados não estão agrupados, mas existem “pesos” diferentes para cada um deles. Vejamos um exemplo: A média da nota bimestral dos alunos do Centro Universitário Cesumar (Unicesumar) é composta pela nota de uma prova (com peso 8) e pela nota dos tra- balhos (com peso 2). Calcule a média bimestral do aluno que tirou as seguintes notas: Prova: 7 (peso 8) Trabalho: 9 (peso 2) MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E60 A média será dada por: = + + = 28 9) x (27) x (8 x 7,4 Exercício: Calcule as médias ponderadas das notas bimestrais dos alunos a seguir: Tabela 3 - Médias bimestrais dos alunos da Escola X ALUNO PROVA TRABALHO João 5,0 3,0 Antônio 7,0 4,0 *Considere que o peso da prova seja igual a 9,0 e o peso do trabalho seja igual a 1,0. Fonte: os autores. Resposta: 4,8 e 6,7 A média é a medida mais importante dentro de um conjunto de dados e possui algumas propriedades importantes. São elas: 1. Amédia é única em um conjunto de dados. 2. A média é afetada por valores extremamente pequenos ou grandes. 3. A média depende de todos os valores observados. Assim, qualquer modi- ficação nos dados fará que a média fique alterada. 4. A soma das diferenças dos valores observados em relação à média é zero: =−∑ )x(x i 0 A propriedade 2 é importante, pois, em um conjunto de dados muito heterogê- neo, a média torna-se uma medida não apropriada para representar os dados, devendo o pesquisador optar por uma outra medida. A propriedade 4 é importante na definição de variância, uma medida de dis- persão que veremos ainda nesta unidade. Medidas Descritivas Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 61 MODA Chamamos de moda o valor que aparece com maior frequência em um con- junto de dados. Para o caso de valores individuais, a moda pode ser determinada observando-se o rol dos dados. Exemplos: Observe as notas da prova de estatística da turma de Negócios Imobiliários: 4; 5; 6; 6; 6; 6; 7; 7; 7; 8. A moda é 6, pois esse é o valor que ocorreu com maior frequência. Essa sequência é unimodal, pois tem apenas uma moda. Veja essa outra sequência: 4; 5; 5; 5; 6; 7; 7; 7; 8; 9. Nesta existem duas modas (5 e 7), ela é bimodal. Essa outra: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10. Não existe moda, nenhum valor aparece com maior frequência, é amodal ou antimodal. A ideia de média está sempre relacionada com a soma dos valores de um determinado conjunto de medidas, dividindo-se o resultado da soma pela quantidade dos valores que foram somados. Tal ação é o que se define como média aritmética simples, que estamos acostumados a aplicar nas estimati- vas que fazemos diariamente. Não faltam brincadeiras em relação a esse tipo de cálculo quando, ironica- mente, calculamos a média salarial de, por exemplo, determinada empre- sa, somando o maior salário com o menor e dividindo por dois. A média aritmética simples produz a média ponderada em função da repetição das medidas. Geralmente, a média ponderada é apresentada com regras pré-es- tabelecidas para os seus pesos, dando a aparência de que se trata de outra fórmula, muito diferente da média aritmética. Fonte: os autores. MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E62 Quando os dados estão agrupados em classes, primeiramente é necessário identificar a classe modal que apresenta a maior frequência e calcular, então, a moda da seguinte maneira: )F(F)F(F )Fh(F I 1ii1ii 1ii i +− − −+− − +Mo = Em que: i é a ordem da classe modal. li é o limite inferior da classe modal. h é a amplitude da classe modal. Fi é a frequência absoluta da classe modal. Fi-1 é a frequência absoluta da classe anterior à classe modal. Fi+1 é a frequência absoluta da classe posterior à classe modal. Se o conjunto de dados apresentar todos seus elementos com a mesma frequência absoluta, não existirá a Moda. Se ocorrer várias frequências iguais, então, teremos uma distribuição com mais de uma moda. A Moda tem o atributo de não ser afetada pelos valores extremos no conjunto de dados. Exemplo: Tabela 4 - Teor de oxigênio (mg/L) em vários rios da região Norte do Brasil Classes Fi Fr Fr% Fac Xi 0,5|---0,8 4 0,2500 25,00 4 0,65 0,8|---1,1 4 0,2500 25,00 8 0,95 1,1|---1,4 7 0,4375 43,75 15 1,25 1,4|---1,7 1 0,0625 6,25 16 1,55 Total 16 1,0000 100,00 - - Fonte: os autores. Para isso, devemos determinar a classe modal que é a classe com a maior frequ- ência absoluta, nesse caso, é a terceira classe, pois essa possui o maior valor de Fi . Determinada a classe modal, vamos calcular a moda por meio da fórmula para dados agrupados. Assim, Medidas Descritivas Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 63 )F(F)F(F )Fh(F I 1ii1ii 1ii i +− − −+− − +Mo = = 1,1 + = 1,2 1) - (74) - (7 4) - (7 . 0,3 + Portanto, a moda para o conjunto de dados da Tabela 13 é 1,2 mg/L. Exemplo: Calcular a Moda para o seguinte conjunto de dados: Tabela 5 - Distribuição de frequências para a idade de um grupo de estudantes Classes Fi Fr Fr% Fac Xi 17 |----29 4 0,364 36,4 4 18 29 |----41 4 0,364 36,4 8 35 41 |----|53 3 0,273 27,3 11 47 Total 11 1 100 - - Fonte: os autores. )F(F)F(F )Fh(F I 1ii1ii 1ii i +− − −+− − +Mo = = 29 + = 29 anos 3) - (44) - (4 4) - (4 . 12 + Resposta: 29 anos MEDIANA Corresponde ao valor central ou à média aritmética dos dois valores centrais de um conjunto de observações organizadas em ordem crescente. Ou seja, 50% das observações são inferiores à mediana e 50% superiores. Exemplo: Uma pesquisa em uma empresa apresentou os seguintes dados relacionados ao tempo de trabalho de seus funcionários: 5, 13, 12, 3, 15, 17, 8, 15, 6, 16, 9. Para encontrarmos a mediana, primeiramente, devemos ordenar os dados bru- tos transformando-os em um rol, ou seja, organizando os dados: 3, 5, 6, 8, 9, 12,13, 15, 15, 16, 17 MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E64 Identificamos a posição da mediana, após verificar que o conjunto de dados é ímpar, pois n = 11 elementos. Utilizamos a fórmula: Se n for ímpar: Md = 2 1n + , portanto: 2 111+ = 2 12 = 6. Nesse caso, a mediana é o 6º elemento do conjunto de dados. Depois localiza- mos o elemento central, no caso 12, pois à esquerda dele temos 5 elementos e à direita também. Assim temos: Md = 12. 3, 5, 6, 8, 9, 12, 13, 15, 15, 16, 17 Quando o rol tiver número par de elementos, a mediana será a média aritmética entre os dois elementos centrais. Vejamos, por exemplo, um rol com 10 elemen- tos (número par de elementos): 3, 5, 6, 8, 9, 13, 14, 15, 15, 16. 2 13 9 + Md = = 11 Assim, considerando n o número de elementos da série, o valor mediano será dado pelo termo de ordem dado pelas seguintes fórmulas: Se n for ímpar: Md = 2 1n + Se n for par: Md = 2 1.1 2 n 2 n ++ (média entre dois números) Exemplo: Calcule a mediana para as notas dos alunos nas duas situações seguintes: ■ 6.0, 4.5, 5.0, 7.0, 6.5; ■ 4.8, 6.3, 8.9, 9.5, 6.0, 7,8; Resposta: 6.0 e 7.05 Medidas Descritivas Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 65 Para os dados agrupados em distribuição de frequências em classes tem-se: i 1ac i F )Fh(p I − − +Md = Em que: li é o limite inferior da classe da mediana. h é a amplitude da classe da mediana. p indica a posição da mediana, onde p = n2 , sendo n o número total de elementos. Fac-1 é a frequência acumulada da classe anterior a da mediana. Fi é a frequência absoluta da classe da mediana. Exemplo: Vamos encontrar a mediana para o seguinte conjunto de dados: Tabela 6 - Distribuição de frequências de indivíduos que acessam certo site quanto ao número de acessos Classes Fi Fr Fr% Fac Xi 10|---29 4 0,364 36,4 4 19,5 29|---48 6 0,545 54,5 10 38,5 48|---67 1 0,091 9,1 11 57,5 Total 11 1,000 100,0 - - Fonte: os autores. Primeiramente, devemos determinar em qual classe a mediana está, para isso, calculamos o valor de p. 2 11p = = 5,5 ≈ 6 Quando o valor de p for decimal, sempre aproximamos seu valor para “cima”. Para saber qual é a classe da mediana, devemos olhar na coluna da frequência acumulada, de modo que p ≤ Fac. Logo, a mediana está na 2ª classe, pois 6 ≤ 10 e corresponde à: i 1ac i F )Fh(p I − − +Md = == 6 )46(19 29 − + 35,3 acessos. MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E66 Exemplo: Calcule a mediana para aseguinte situação: Tabela 7 - Distribuição de frequências para a idade dos clientes de uma imobiliária para efetuar uma compra Classes Fi Fr Fr% Fac Xi 17 |---- 29 4 0,364 36,4 4 23 29 |---- 41 4 0,364 36,4 8 35 41 |----| 53 3 0,273 27,3 11 47 Total 11 1 100 - - Fonte: os autores. Md = = = 35 acessos i 1ai i F )Fh(p I − − + 4 )46.(12 29 − + Resposta: 35 MEDIDAS SEPARATRIZES Caro(a) aluno(a), as separatrizes são os valores que dividem as séries em par- tes iguais. As principais medidas separatrizes são: a mediana (já estudada) e os quartis, os decis e os percentis. Para qualquer assunto que trate de dados numéricos, sempre trabalhamos com uma medida de posição. Normalmente, usamos a média, que é a medi- da mais conhecida. Observe também como essas medidas são importantes no seu cotidiano. Medidas Separatrizes Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 67 QUARTIS Chamamos de quartis os valores que dividem a distribuição em 4 partes iguais, e podem ser obtidos da seguinte maneira: Temos três quartis: ■ Primeiro quartil (Q1): é o valor que tem 25% dos dados a sua esquerda e o restante (75%) à direita. ■ Segundo quartil (Q2): tem 50% dos dados de cada lado, coincide com a mediana. ■ Terceiro quartil (Q3): tem 75% dos dados à sua esquerda e 25% à direita. Fórmulas: 1º Quartil (Q1) P=0,25(n +1) 2º Quartil (Q2) P=0,50(n +1) 3º Quartil (Q3) P=0,75(n +1) DECIS Chamamos de decis os valores que dividem uma série em dez partes iguais. Portanto, temos nove decis, o primeiro tem 10% dos dados a sua esquerda e 90% a sua direita, o segundo tem 20% dos dados a sua esquerda e 80% a sua direita e assim por diante até o nono decil, que tem 90% dos dados a sua esquerda e 10% a sua direita. 1º Decil (D1) P=0,10(n +1) 2º Decil (D2) P=0,20(n +1) 3º Decil (D3) P=0,30(n +1) 4º Decil (D4) P=0,40(n +1) 5º Decil (D5) P=0,50(n +1) 6º Decil (D6) P=0,60(n +1) 7º Decil (D7) P=0,70(n +1) 8º Decil (D8) P=0,80(n +1) 9º Decil (D9) P=0,90(n +1) MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E68 PERCENTIS Chamamos de percentis os noventa e nove valores que separam uma série em 100 partes iguais. O cálculo dos percentis está relacionado com percentagem. No quadro a seguir são mostrados alguns percentis: 5º Percentil (P5) P=0,05(n +1) 25º Percentil (P25) P=0,25(n +1) 50º Percentil (P50) P=0,50(n +1) 75º Percentil (P75) P=0,75(n +1) 90º Percentil (P90) P=0,90(n +1) Em que, a letra n nas fórmulas de calcular a posição dos quartis, dos decis e dos percentis representa o número total de elementos da amostra. Quando o valor de p for inteiro temos que a medida separatriz está na posi- ção de número p, caso contrário, o cálculo das medidas separatrizes, para os dados em rol, é dado por: kS = +iX ( p – i ) ( Xi +1 – Xi ) Em que: Sk é a medida separatriz a ser utilizada, pode ser os quartis, os decis ou os percentis. Xi e Xi+1 são as posições dos dados no rol. p é a posição da medida separatriz adotada. i é a parte inteira de p. Calcule o 3º quartil (Q3) e o 90º percentil (P90) para a idade média de um grupo de indivíduos que têm as seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33, 38. Primeiramente, verifique se os dados do rol estão ordenados, caso não este- jam ordenados coloque-os em ordem crescente. Em seguida, calcule a posição do dado e, por fim, substitua os valores numéricos na fórmula: kS = +iX ( p – i ) ( Xi +1 – Xi ) Medidas Separatrizes Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 69 ■ Para o (Q3) tem-se: p = 0,75(13+1)=10,5 k = 10 Assim, Q3 = X10 + (p – k) (X11 – X10) Q3 = 27 + (10,5 – 10) (30 – 27) Q3 = 27 + (0,5 . 3) Q3 = 28,5 anos. Portanto, pode-se afirmar que 75% dos indivíduos têm idade inferior a 28,5 anos. ■ Para o (P90) tem-se: p = 0,90(13+1)=12,6 k = 12 Assim, P90 = X12 + (p – k) (X13 – X12) P90 = 33 + (12,6 – 12) (38 – 33) P90 = 33 + (0,6 . 5) P90 = 36 anos. Portanto, 90% dos indivíduos têm idade inferior a 36 anos. Para os dados agrupados, o cálculo das medidas separatrizes é dado por: kS F Fph I aci )( 1−−+= i Em que: Sk é a medida separatriz a ser utilizada, pode ser os quartis, os decis ou os percentis. li é o limite inferior da classe da separatriz. h é a amplitude da classe da separatriz. p é a posição da medida separatriz adotada. Sendo que para os quartis p = nk 4 , k = 1,2,3; para os decis p = nk 10 , k = 1,2,...,9; para os percentis p = nk 100 , k = 1,2,...,99; onde n é a quantidade de elementos da amostra. Fac-1 é a frequência acumulada da classe anterior a da separatriz. Fi é a frequência absoluta da classe da separatriz. MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E70 Exemplo: Vamos determinar o Q3 e o D7 para o seguinte conjunto de dados: Tabela 8 - Teor de oxigênio (mg/L) em vários rios da região Norte do Brasil Classes Fi Fr Fr% Fac Xi 0,5|---0,8 4 0,2500 25,00 4 0,65 0,8|---1,1 4 0,2500 25,00 8 0,95 1,1|---1,4 7 0,4375 43,75 15 1,25 1,4|---1,7 1 0,0625 6,25 16 1,55 Total 16 1,0000 100,00 - - Fonte: os autores. ■ Para o Q3 : Primeiro, vamos determinar a posição da medida e, em seguida, determinar qual é a sua classe. p = == nk 4 4 1216.3 Para saber qual é a classe do devemos olhar na coluna da frequência acumulada, de modo que . Logo, o está na 3ª classe, pois e corresponde à: Q = =+ 7 1,1 1, 270,3 (12-8) 3 Portanto, pode-se afirmar que 75% dos rios da região norte do Brasil têm teor de oxigênio inferior a 1,27 mg/L. ■ Para o D7 : Primeiro, vamos determinar a posição da medida e, em seguida, determinar qual é a sua classe. p = == nk 10 10 11,216.7 Medidas de Dispersão Re pr od uç ão p ro ib id a. A rt . 1 84 d o Có di go P en al e L ei 9 .6 10 d e 19 d e fe ve re iro d e 19 98 . 71 Para saber qual é a classe do D7 devemos olhar na coluna da frequência acumulada, de modo que p ≤ Fac. Logo, o D7 está na 3ª classe, pois 11,2 ≤ 15 e corresponde à: Q = =+ 7 1,1 1, 240,3 (11,2-8) 3 Portanto, pode-se afirmar que 70% dos rios da região norte do Brasil têm teor de oxigênio inferior a 1,24 mg/L. MEDIDAS DE DISPERSÃO Caro(a) aluno(a), as medidas de dispersão mostram a variabilidade de um con- junto de observações em relação à região central. Essas medidas indicam se um conjunto de dados é homogêneo ou heterogêneo. Além disso, mostram se a medida de tendência central escolhida representa bem o conjunto de dados que está sendo trabalhado pelo pesquisador. Vejamos um exemplo: Considere as idades de três grupos de pessoas A, B e C: A: 15; 15; 15; 15; 15 B: 13; 14; 15; 16; 17 C: 5; 10; 15; 20; 25 A média aritmética do conjunto A é 15, do B é 15 e do C também é 15. A média aritmética é a mesma para os três conjuntos acima, porém, o grau de homogeneidade entre eles é muito diferente, ou seja, a variação dos seus ele- mentos em relação à média é bem distinta. O conjunto A não tem dispersão, o B tem certo grau de variabilidade e o conjunto C tem grande variabilidade. Por isso, devemos estudar as medidas de dispersão, pois conjuntos de dados dife- rentes podem ter médias iguais, porém, isso não indica que são iguais, uma vez que a variabilidade entre eles pode ser diferente. MEDIDAS DESCRITIVAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Reprodução proibida. A rt. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998. IIU N I D A D E72 AMPLITUDE TOTAL A amplitude total de um conjunto de dados é a diferença entre o maior e o menor valor. Essa medida nos diz pouco, pois embora fácil de ser calculada, é baseada em somente duas observações, sendo altamente influenciada
Compartilhar