Baixe o app para aproveitar ainda mais
Prévia do material em texto
Ricardo Saraiva Diniz Análise e Interpretação de Dados 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Ricardo Saraiva Diniz ANÁLISE E INTERPRETAÇÃO DE DADOS Belo Horizonte Janeiro de 2016 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 COPYRIGHT © 2016 GRUPO ĂNIMA EDUCAÇÃO Todos os direitos reservados ao: Grupo Ănima Educação Todos os direitos reservados e protegidos pela Lei 9.610/98. Nenhuma parte deste livro, sem prévia autorização por escrito da detentora dos direitos, poderá ser reproduzida ou transmitida, sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravações ou quaisquer outros. Edição Grupo Ănima Educação Vice Presidência Arthur Sperandeo de Macedo Coordenação de Produção Gislene Garcia Nora de Oliveira Ilustração e Capa Alexandre de Souza Paz Monsserrate Leonardo Antonio Aguiar Equipe EaD 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Conheça o Autor Ricardo Saraiva Diniz é licenciado em Matemática, Especialista em Educação Matemática e em Gestão Educacional e Mestre em Educação e Sociedade. É professor há mais de 20 anos, tendo experiência nos Ensinos Fundamental, Médio, Superior e em Pós-Graduação. Também trabalhou em cursinhos pré-vestibular e preparatórios para concursos. Atua no Ensino Superior desde 2002. Atualmente, é professor do Centro Universitário UNA, desde 2011, onde leciona as Disciplinas Estatística, Métodos Quantitativos, Matemática Financeira e Matemática Básica. É professor da disciplina Estatística, na modalidade EAD, desde 2012. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Na disciplina Análise e Interpretação de Dados, vamos compreender a importância da estatística como ferramenta fundamental na coleta, análise e interpretação dos dados. Também é responsabilidade da disciplina fazer a apresentação dos dados coletados, tanto por meio de tabelas quanto de gráficos. É preciso compreender que existe variabilidade (pouca ou muita) em tudo. Portanto, é função da Estatística fornecer ferramentas para que seja possível conviver com esta variabilidade. Assim, ela investiga a regularidade nos dados oriundos das pesquisas. Apresentação da disciplina 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 UNIDADE 1 002 Introdução ao estudo da Estatística 003 O que é estatística 004 Por que estudar estatística? 005 O método estatístico 006 As fases do método estatístico 007 O conceito de variáveis 008 Dados versus informações 011 A notação Sigma 012 O arredondamento de dados 013 A notação por meio de índices 015 Definição de população e amostra 015 Tipos de amostragem 018 REFERÊNCIAS 126 UNIDADE 2 030 Organização, Tabulação e Apresentação dos Dados 031 A tabela e o Rol 033 Distribuição de frequência e elementos da distribuição de frequências 034 Dados absolutos e dados relativos 035 A distribuição de frequência 037 Histograma 047 Diagrama ou gráfico de colunas 050 Diagrama ou gráfico de barras 052 Diagrama ou gráfico de setores 053 Diagrama ou gráfico de ogiva 055 Gráficos pictóricos ou pictogramas 056 UNIDADE 4 104 Medidas de dispersão e de variabilidade 105 Amplitude total 106 Desvio médio absoluto (DMA) 108 Variância (s2), desvio padrão (s) e coeficiente de variação (CV) 111 UNIDADE 3 066 Medidas de tendência central e medidas separatrizes 067 Média aritmética ( ) 071 Mediana (Md) 078 Moda (Mo) 084 As medidas separatrizes: quartis e percentis 087 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Introdução à Estatística • O que é estatística • Por que estudar estatística? • O método estatístico • As fases do método estatístico • O conceito de variáveis • Dados versus informações • A notação Sigma • O arredondamento de dados • A notação por meio de índices • Definição de população e amostra • Tipos de amostragem Introdução Nesta unidade, serão apresentados conceitos fundamentais e elementares referentes à Estatística, sua importância e aplicações nas diferentes áreas do conhecimento e, de forma especial, no processo de tomada de decisões, já que é uma ferramenta importante para solucionar questões que necessitem do uso de técnicas estatísticas. Ao longo desta unidade, você entenderá que a Estatística tem como principal objetivo coletar e analisar dados para extrair deles informações relevantes. Por meio da Estatística, é possível analisar e classificar as variáveis que servirão de referência para a seleção de diferentes procedimentos para a organização e análise dos dados. Além disso, vamos estudar as técnicas de amostragem, que garantem processo de escolha da amostra, e tem como objetivo principal resumir as informações a respeito da população. Como se trata de uma introdução, alguns conceitos necessários para a melhor compreensão da Estatística serão revisitados ao longo das demais unidades, como a notação por meio de índices, as regras de arredondamento e a notação sigma. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 5083 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 4 O que é Estatística De acordo com Larson e Farber (2010), a Estatística “é a ciência que coleta, analisa e interpreta dados para a tomada de decisões. ” (LARSON e FARBER, 2010, p. 3). Assim, por meio da estatística, é possível, por exemplo, entender o desempenho de uma empresa ao longo dos anos, identificar que a população brasileira tem crescido em um ritmo menor do que há 30 anos, ou mesmo para mostrar o aproveitamento dos times de futebol em diferentes tipos de campeonatos. Atualmente todo o acompanhamento da administração pública é feito por meio de análises estatísticas. O PIB, as taxas de inflação, de desemprego, a falta de saneamento básico, o nível de escolaridade são definidos por meio de análises solicitadas pelo governo com o objetivo de auxiliar a definição de políticas públicas que auxiliem o desenvolvimento do país. Ainda de acordo com o conceito de Estatística apresentado, de forma mais ampla, podemos destacar o papel importante desta ciência nas diversas situações cotidianas. De posse de um conjunto de dados numéricos, é fundamental que os mesmos sejam analisados para extrair as informações mais importantes. Por exemplo, para indicar a venda média de determinado produto da empresa durante um ano será utilizada a média aritmética, que representará a média das vendas dos produtos dos 12 meses em um único valor. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 5 Por que estudar Estatística? A Estatística é a ciência que permite entender e lidar com a noção de variabilidade. Nos dias atuais a Estatística é ferramenta imprescindível para qualquer profissional que precisa avaliar informações para tomar decisões diárias com maior grau de certeza. Um administrador ou gestor recorrem à Estatística para organizar, dirigir e controlar as organizações. É possível perceber a importância da Estatística também no poder público. Os governos têm institutos oficiais próprios para a realização de estudos estatísticos, com o objetivo de analisar a sua população de diferentes prismas, como índice de analfabetismo, riqueza da população, percentual de famílias sem saneamento básico, entre outros. No Brasil, temos o Instituto Brasileiro de Geografia e Estatísticas (IBGE). A Estatística é a ciência que permite entender e lidar com a noção de variabilidade. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 6 O método estatístico O método estatístico tem como objetivo principal fornecer embasamento teórico e prático para tratar as informações oriundas de uma pesquisa de forma adequada e assim fornecer o suporte necessário para auxiliar a tomada de decisão a respeito do que está sendo estudado. O primeiro passo fundamental é compreender a pergunta de pesquisa que necessita ser respondida, ou seja, o que realmente precisa ser estudado. Nesse contexto, o método estatístico compreende duas partes: o cálculo do tamanho da amostra e a análise estatística que são utilizados para responder as perguntas da pesquisa. Outra situação na qual a estatística está envolvida diretamente é nas técnicas de amostragem, pois com alguma frequência é necessário utilizar técnicas matemáticas para determinar uma amostra representativa. Estas técnicas serão abordadas ainda nesta unidade. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 7 Fases do método estatístico A estatística oferece meios para seja possível coletar, organizar, descrever, analisar e interpretar dados. Após todo esse processo, você (ou qualquer pesquisador) terá em mãos resultados que podem ser utilizados em várias situações, seja para planejamento, tomadas de decisões ou formulação de soluções. É importante destacar que grandes empresas sempre utilizam o método estatístico, com o objetivo de minimizar riscos no momento de definir um novo investimento. É fato que as empresas atuais exigem de seus administradores e estrategistas a tomada de decisões, cada vez com maior grau de precisão, sem espaço para erros. Logo, o domínio de conceitos de estatística facilita o trabalho desses profissionais no que se refere a organizar, dirigir e controlar a empresa. Nesse contexto, é fundamental que os administradores conheçam as novas demandas e a nova realidade social do país, os recursos financeiros disponíveis, o que pensam seus colaboradores, os atuais consumidores e os mercados que podem se abrir. Portanto, o método estatístico compreende todos os meios que permitem a organização das informações para atingir determinado objetivo. De acordo com Tiboni (2010), passos da metodologia estatística ou fases do método estatístico são: A estatística oferece meios para seja possível coletar, organizar, descrever, analisar e interpretar dados. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 8 FIGURA 1 - Passos do Método Estatístico Fonte: Tiboni, 2010, p. 2. O conceito de variáveis As variáveis são as características que podem ser analisadas (ou estudadas, ou mesmo medidas) em cada indivíduo da população, ou seja, é um conjunto de resultados possíveis de um fenômeno qualquer. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 9 Veja a tabela abaixo, que apresenta algumas informações a respeito dos veículos que estão à venda em uma concessionária de seminovos: TABELA 1 – Informações sobre veículos à venda Fonte: Do autor Ford Ka Fox MODELO ANO Gol Pálio 2006 11990 53 Pago PREÇO (EM REAIS) CILINDRADAS (EM CV) SITUAÇÃO DO IPVA 2008 20090 56 Pago 2004 17900 106 A pagar 2005 16990 60 Pago Portanto, na população representada pelos veículos disponíveis para venda em uma concessionária, é possível identificar variáveis como: modelo, ano, preço, cilindradas e situação do IPVA. A variável pode ser classificada de duas formas distintas: • qualitativa: quando a informação é referente à determinada categoria, ou é expressa por uma qualidade ou atributo. Na tabela do exemplo acima, as variáveis “modelo” e “situação do IPVA” são qualitativas. Outros exemplos de variável qualitativa são: cor preferida, sexo, estado civil, bairro onde mora, cantor favorito, nome, animal de estimação. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 5083 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 10 Para identificar uma variável qualitativa, basta verificar a resposta dada a pergunta. Se a resposta for expressa por meio de “palavras”, a variável analisada é qualitativa. • quantitativa: quando é possível fazer comparações e operações matemáticas, ou seja, quando os valores são expressos por números. Ainda recorrendo ao exemplo do quadro com informações a respeito dos veículos a venda, as variáveis, “ano”, “preço” e “cilindradas” são exemplos de variáveis quantitativas, pois permitem comparação. Assim, variável “ano” permite comparar qual carro é mais novo. Para identificar uma variável quantitativa, basta verificar a resposta dada a pergunta. Se a resposta for expressa por meio de “valores numéricos”, a variável analisada é quantitativa. Contudo, é preciso destacar que nem sempre a variável representada por meio de números é quantitativa. Por exemplo, o RA (Registro Acadêmico) de um aluno não é uma variável quantitativa, já que representa o aluno. Outro exemplo de variável numérica que não é considerada quantitativa é no seguinte tipo de pesquisa: “O prefeito da cidade está desempenhando bem as suas funções”. Classifique a afirmação considerando: • (1) concordo totalmente; • (2) concordo parcialmente; • (3) discordo totalmente. Neste caso, os números apresentam atributos, não representando variável quantitativa. A variável quantitativa pode ser classificada como discreta ou contínua. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 11 A discreta é aquela que resulta de contagens e é apresentada através de números inteiros. Exemplos: idade, número de viagens que você fez em um ano, número de televisores de uma residência, entre outros. Já a variável contínua é aquela que pode assumir inúmeros valores numéricos entre dois limites, ou seja, pode assumir valores decimais, isto é, se não for possível ser representada por um número inteiro. A altura de uma pessoa e o seu peso são exemplos de variável contínua. Uma variável quantitativa discreta passa a ser classificada como contínua caso seja representada com maior precisão. Exemplo: a pessoa diz que seu peso é 68 kg, mas a balança indica 68,2. No primeiro caso é uma variável discreta, mas no segundo caso é contínua. Dados versus Informações É muito comum lermos e ouvirmos a respeito de dados e informações. Segundo Bruni (2007) “o objeto de trabalho da estatística é formado pelo conjunto de dados que serão analisados” (BRUNI, 2007, p. 4), ou seja, os dados são muito importantes para a estatística. O dado é o elemento que representa eventos ocorridos, por exemplo, na empresa. Em um estudo a respeito das idades dos funcionários de uma empresa, a idade de cada um dos funcionários corresponde a um dado. Em um estudo a respeito das idades dos funcionários de uma empresa, a idade de cada um dos funcionários corresponde a um dado. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 12 Contudo, o dado, por si só, não tem importante significado e não permite qualquer compreensão. Já a informação é a organização dos dados de modo que estes tenham significado e possam ser compreendidos. Ou seja, quando começo a analisar as idades dos funcionários levantados no exemplo e identifico que a idade média dos funcionários é 28 anos, podemos fazer análises a respeito desses dados e possivelmente tomar alguma decisão acerca das considerações extraídas das análises efetuadas. Ao longo de todo o livro, vamos fazer referência aos dados com frequência e por várias vezes vamos utilizá-los para obter informações relevantes. A notação sigma De acordo com Bruni (2007), a notação sigma (Σ) é bastante comum em Estatística. Se considerarmos o seguinte conjunto de dados {3, 7, 9, 12} , a soma do conjunto pode ser representada por Σx e significa: Σx = 3 + 7 + 9 + 12 = 31 Por outro lado, se pretendemos calcular a soma dos números elevados ao quadrado, podemos utilizar a notação Σx2. No caso do nosso conjunto de dados, teremos: Σx2 = 32 + 72 + 92 + 122 = 9 + 49 + 81 + 144 = 283 Já a informação é a organização dos dados de modo que estes tenham significado e possam ser compreendidos. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 13 A soma dos números ao quadrado é diferente da soma elevada ao quadrado dos números, ou seja: Σx2 ≠ (Σx)2 No exemplo Σx2 = 283 enquanto (Σx)2 = (31)2 = 961 O arredondamento de dados Muitas vezes, tanto em Estatística como em outras áreas do conhecimento ou mesmo em situações do dia a dia, quando trabalhamos com números, é comum utilizarmos algumas técnicas de arredondamento. Vamos às regras: Se o algarismo a ser eliminado for maior ou igual a 5, acrescentamos uma unidade ao primeiro algarismo que está situado à sua esquerda. Considere o valor numérico 25,637867: • para arredondar para duas casas decimais, o primeiro algarismo a ser eliminado é 7, logo vamos acrescentar uma unidade ao algarismo 3, então temos: 25,64; • para arredondar para três casas decimais, o primeiro algarismo a ser eliminado é 8 e vamos acrescentar uma unidade ao algarismo 7, logo teremos: 25,638; • se o arredondamento for com quatro casas decimais, o primeiro algarismo a ser eliminado é 6, portanto vamos acrescentar uma unidade ao algarismo 8 e temos: 25,6379; Se o algarismo a ser eliminado for maior ou igual a 5, acrescentamos uma unidade ao primeiro algarismo que está situado à sua esquerda. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 14 • caso de arredondamento para número inteiro, o primeiro algarismo a ser eliminado é o 6, então vamos acrescentar uma unidade ao algarismo 5 e vai ficar 26. No caso de o algarismo a ser eliminado for menor do que 5, o algarismo da esquerda não é alterado. Considere o valor numérico 154,273148: • para arredondar com duas casas decimais, o primeiro algarismo a ser eliminado é 3, logo não vamos acrescentar uma unidade ao algarismo 7, então: 154,27; • para arredondar com três casas decimais, o primeiro algarismo a ser eliminado é 1 e vamos manter o algarismo 3, logo: 154,273; • já se o arredondamento for com quatro casas decimais, o primeiro algarismo a ser eliminado é 4, portanto não vamos acrescentar uma unidade ao algarismo 1, assim temos: 154,2731. • Em caso de arredondamento para número inteiro, o primeiro algarismo a ser eliminado é o 2, então vamos manter o algarismo 4 e vai ficar 154. No caso de números decimais, não existe regra para a quantidade de casas decimais a serem utilizadas, mas devemos utilizar o maior número de casas decimais possível, de modo a diminuir o erro. No caso de o algarismo a ser eliminado for menor do que 5, o algarismo da esquerda não é alterado.42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 15 A notação por meio de índices O símbolo xi representa qualquer um dos n valores x1, x2, x3, x4, .... xn, que podem ser assumidos pela variável x. A letra i que acompanha a variável x é chamada índice e pode representar qualquer um dos números 1, 2, 3, ..., n. Vale destacar que pode ser utilizada qualquer outra letra no lugar de i. Você vai encontrar a notação por índice muitas vezes nas fórmulas. Definição de população e amostra O termo população é utilizado para denominar todos os indivíduos objetos do grupo analisado, ou seja, é o conjunto dos elementos que formam o universo do que está sendo estudado. Vale destacar que a população pode ser formada por pessoas, objetos, animais, equipamentos à venda, entre outros. Já amostra pode ser definida como um conjunto de elementos retirados da população em estudo. Devemos destacar que apesar da amostra ser constituída por uma parte da população que está sendo estudada, é possível determinar com certa precisão os dados que representam a população. Já amostra pode ser definida como um conjunto de elementos retirados da população em estudo. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 16 Eleitores brasileiros 25 tipos de salgados diferentes oferecidos por um buffet 2025 eleitores entrevistados por um instituto de pesquisa. 10 tipos de salgados diferentes experimentados por um potencial cliente. POPULAÇÃO AMOSTRA Contribuintes que fazem a declaração de imposto de renda para a receita federal. Contribuintes que são escolhidos pela receita para a “malha fina”. Observe, abaixo, o esquema que representa a relação entre amostra e população: FIGURA 2 – Amostra x População Fonte: Do autor. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 17 A amostra é utilizada quando não é possível pesquisar todos os elementos da população. Então, a pergunta a ser respondida é: “quando devemos estudar amostras e não toda a população? ” As respostas a esta pergunta são várias, dentre elas destacamos o alto custo. Estudar toda a população pode ser muito caro, por isso se opta pela amostra dessa população. Imagine entrevistar 2.000 alunos de uma faculdade por meio de questionário impresso? Se limitar o número para 200 alunos serão utilizados apenas 10% dos questionários. Outro motivo é a dificuldade em estudar toda a população. O IBGE faz o censo demográfico a cada dez anos porque, além do alto custo desse levantamento, há muita dificuldade de conseguir entrevistar todas as residências do país. Em muitas casas, não se encontra ninguém, em outras, as pessoas não querem receber os pesquisadores, o que é cada vez mais comum por causa da insegurança. Por isso, o IBGE realiza anualmente a Pesquisa Nacional por Amostra de Domicílios (PNAD), que entrevista apenas uma parte dos domicílios do país. É importante destacar também o fato de o processo de pesquisa destruir o elemento pesquisado, ou seja, para saber o peso que uma cadeira suporta, por exemplo, colocamos peso nela até que ela não suporte mais e se quebre. Se isso for feito com todas as cadeiras produzidas por uma fábrica, não haverá cadeiras para serem vendidas. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 18 Tipos de amostragem A amostragem é o mecanismo que utilizamos para coletar dados. É o processo de escolha da amostra e tem como objetivo maior resumir as informações a respeito da população. Contudo, torna- se necessário cuidado para que a amostra de fato represente a população. Caso essa condição seja atingida, as conclusões acerca da amostra podem ser generalizadas para toda a população. Essa situação pode ser representada pela situação a seguir: FIGURA 3 – População x amostra Fonte: Do autor. Trabalhar com a população é mais caro e demanda mais tempo, enquanto que com a amostra é mais barato e mais rápido. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 19 Para garantir que os resultados das pesquisas com amostras sejam realmente representativos, a escolha dos elementos que farão parte da pesquisa deve ser muito criteriosa, de modo a garantir que os entrevistados tenham características socioeconômicas, culturais e religiosas próximas das da população a qual os resultados da pesquisa serão estendidos. Além disso, é preciso garantir que cada um dos elementos da população tenha a mesma chance de ser escolhido, pois, desse modo, garantimos que a amostra representa efetivamente a população. É preciso determinar um número mínimo de elementos para compor a amostra, mas não há regra fixa para determinar o tamanho da amostra. Contudo, uma boa dica é que em populações pequenas ou médias, o tamanho da amostra não deve ser menor que 10% do total de elementos da população. Existem algumas técnicas para a determinação da amostragem, das quais destacam-se: a casual ou aleatória simples; a proporcional estratificada e a sistemática. A amostragem casual ou aleatória simples é utilizada quando se quer medir qualquer elemento pertencente à população estudada deve ter a mesma chance de ser selecionado. Como o nome indica, a escolha da amostra deve ser aleatória, por meio de sorteio. Assim, listamos ou numeramos todos os elementos da população a ser analisada, e então selecionamos a amostra por meio de sorteio. Como esse processo pode ser trabalhoso, costumamos utilizar tabelas que já existem para essa finalidade, chamadas de tabelas de números aleatórios. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 20 Na técnica de amostragem proporcional estratificada, a população é considerada como estrato, ou seja, é dividida em subconjuntos da população, de modo que cada subconjunto tenha características comuns entre os seus elementos. É utilizada quando todos os elementos da população podem ser divididos em grupos homogêneos em relação à característica que se quer medir. Assim, conhecendo-se o tamanho da população, calcula-se a “fração de amostragem” e a amostra será proporcional aos estratos da população. Uma empresa de informática tem 460 funcionários, dos quais 278 são do sexo feminino e 182 masculino. Considerando a variável sexo para estratificar essa população, foi selecionada uma amostra proporcional estratificadade 50 funcionários. Calcule a proporção de funcionários de cada sexo contida na amostra. Para manter a proporcionalidade, utilizaremos uma regra de três simples: 460 → 278 SEXO FEMININO SEXO MASCULINO 460 → 182 50 → x50 → x x = 19,782 20x = 30,217 ≅ 30 Nas amostras em que se trabalha com valores inteiros, então é preciso utilizar os critérios de arredondamento, já abordados acima. Não faz sentido trabalhar com uma amostra de 30,217 mulheres, por exemplo. ~ = ~ = 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 21 Ou seja, deverão fazer parte da pesquisa 30 mulheres e 20 homens. Observe a proporcionalidade: Isso indica que a amostra selecionada é proporcional a quantidade de funcionários de cada sexo. A amostragem sistemática é um método que oferece procedimento para a amostragem aleatória, utilizado para situações onde os elementos da população já estão ordenados. Como selecionar os elementos de uma amostra sistemática de uma população? Basta seguir os passos a seguir: I (intervalo de seleção) I = onde N é o tamanho da população e n o tamanho da amostra (n < N) m → posição do 1º elemento da amostra, obtido por sorteio (é importante destacar que m deve ser um número menor ou igual a I) m + I → posição do 2º elemento da amostra m + 2I → posição do 3º elemento da amostra (...) m + (n – 1).I → posição do último elemento da amostra 278 460 = 0,6043 ~ = 0,60 e 30 50 = 0,60 182 460 = 0,3956 0,4 e 20 50 = 0,40~ = N n 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 22 • Uma empresa tem um banco de dados com 4 000 clientes cadastrados, e decidiu fazer uma pesquisa com esses clientes para saber quais produtos novos eles querem. Para tal, será escolhida uma amostra sistemática de 500 clientes. a. Determine os números dos quatro primeiros clientes que participarão da pesquisa, sabendo que o primeiro cliente (obtido por sorteio) seja o de número 7. b. Qual o número do último cliente selecionado? Resposta: N = 4 000 e n = 500, logo = = 8, ou seja a cada 8 clientes um será escolhido para 4 0 0 0 500 participar da pesquisa. O 1º elemento da amostra: 7 (determinado por sorteio, e é menor que I); o 2º elemento da amostra: m + I = 7 + 8 = 15; o 3º elemento da amostra: m + 2I = 7 + 2.8 = 7 + 16 = 23; o 4º elemento da amostra: m + 3I = 7 + 3.8 = 7 + 24 = 31. c. O último elemento da amostra: m + (n – 1).I = 7 + (500 – 1) . 8 = 7 + 499 . 8 = 7 + 3992 = 3 999 • Uma faculdade tem 3 500 alunos e pretende fazer uma pesquisa com uma amostra sistemática de 310 alunos. a. Sabendo que o primeiro aluno sorteado é de número 10, determine os cinco primeiros alunos que participarão da pesquisa. b. Qual o número do último aluno selecionado? 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 23 Resposta: N = 3 500 e n = 310, portanto: I = = 11,29 3 5 0 0 310 a. 1º elemento: 10 (que é menor que I); 2º elemento: 10 + 11,29 = 21,29 = 21; 3º elemento: 10 + 2. 11,29 = 10 + 22,58 = 32,58 = 33; 4º elemento: 10 + 3. 11,29 = 10 + 33,87 = 43,87 = 44; 5º elemento: 10 + 4. 11,29 = 10 + 45,16 = 55,16 = 55. b. o último elemento: 10 + (310 – 1) . 11,29 = 10 + 309 . 11,29 = 10 + 3 488,61 = 3 498,61 = 3 499 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 24 Para que você possa treinar, faça os exercícios referentes a essa unidade: 1. Qual a importância da “Estatística Descritiva” no processo de análise dos dados estatísticos? 2. Em uma grande comunidade do Norte do Brasil, deseja-se fazer uma pesquisa da porcentagem de pessoas que contraíram uma doença contagiosa. Nessa situação, os pesquisadores devem utilizar o censo ou amostragem? Por que? 3. Foi tomada uma amostra de um grupo de estudantes de certo curso de graduação para verificar o conhecimento destes estudantes sobre o conteúdo de uma determinada disciplina. Os estudantes foram selecionados ao acaso, prestaram um exame e obtiveram as notas indicadas na tabela a seguir, onde é também indicado o sexo do estudante. Sexo Estudante Nota A 46 48 52 5751 6760 6560 6865 68 7574 747370 7070 77 D O PH JC G I KB NFE L M TSQ R FM FM MMMMM M MF FFFFFF F F a. Quais as variáveis obtidas? b. Quais são os tipos (qualitativa ou quantitativa) destas variáveis? c. Para esta situação, descreva qual é a população? Qual é a amostra? 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 25 4. Em uma pesquisa, o pesquisador decidiu fazer as perguntas relacionadas a seguir. PERGUNTAS RESPOSTAS a. Qual é o seu nome? e. Qual o seu salário mensal? d. Qual o seu gênero? c. Você tem filhos? b. Quantos anos você tem? h. Você mora com quantas pessoas? g. Você é casado? f. Em que cidade você nasceu? i. Classifique a afirmação: “O Brasil é o país mais democrático da América Latina” Agora classifique as variáveis, formadas a partir das respostas fornecidas às perguntas, em quantitativas ou qualitativas: ( ) sim ( ) não ( ) F ( ) M ( ) sim ( ) não ( 1 ) Concordo totalmente ( 2 ) Concordo parcialmente ( 3 ) Discordo totalmente 5. Classifique as variáveis em quantitativas discretas, quantitativas contínuas ou qualitativas: a. altura b. peso c. religião d. cidade natal e. estado civil f. número de carros emplacados g. bairro onde mora h. volume i. número de funcionários j. marcas de eletrodomésticos 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 26 6. Com o objetivo de divulgar um de seus produtos, determinada indústria entrevistou 700 pessoas para saber qual veículo de informação (jornal, rádio, revista e televisão) era mais utilizado por elas. Dentre os entrevistados, 97 preferiam jornal, 300 rádio, 63 preferiam revista e 240 televisão. Considerando a variável número de entrevistados para estratificar essa população, foi selecionada uma amostra proporcional estratificada de 90 entrevistados. Calcule a quantidade de entrevistados contida na amostra de acordo com o veículo de informação. 7. A cartela de clientes que fazem aplicações em poupança de um banco tem 8 200 clientes. O banco pretende fazer uma campanha com parte desses clientes para oferecer uma nova opçãode rendimento seguro como a poupança, mas que renda mais ao cliente. Decidiu que os 400 clientes que deverão participar da pesquisa serão escolhidos por meio de amostra sistemática. Sabendo que o primeiro cliente a participar (definido por sorteio) é o de número 15, determine os números dos próximos 6 clientes selecionados, e também o número do último cliente: RESPOSTAS: 1. A Estatística Descritiva tem como principal função resumir os dados e informações investigadas, com o objetivo de expô- los mais facilmente. É a parte mais conhecida da estatística, representada pelas médias, índices e gráficos presentes nas notícias que circulam pelos jornais, revistas, televisão, sites etc. 2. Amostragem, pois como se trata de uma grande população, analisar o número de pessoas contagiadas levaria muito tempo e seria de alto custo. Além disso, como são muitas variáveis a serem consideradas, o que pode modificar a população original e invalidar o censo. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 27 3. a. As variáveis são sexo e nota. b. Qualitativa: sexo; Quantitativa: nota. c. População: estudantes de um curso de graduação; Amostra: os 20 alunos que foram selecionados para a pesquisa. 4. • Qualitativa: letras a, c, d, f, g, i. • Quantitativa: letras b, e, h. 5. a. Quantitativa Contínua b. Quantitativa Contínua c. Qualitativa d Qualitativa e Qualitativa f. Quantitativa Discreta g. Qualitativa h. Quantitativa Contínua i. Quantitativa Discreta j. Qualitativa 6. Jornal: 12 Rádio: 39 Revista: 8 Televisão: 31 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 28 7. • 36 ; 56, 77 ; 97; 118; 138. • último elemento: 8 195. Revisão Ao longo da Unidade, foram apresentados conceitos relacionados à Estatística e relembramos alguns conceitos matemáticos elementares para a compreensão da disciplina. Veja o esquema abaixo : 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 1 29 Para que você aprofunde seus estudos em Estatística, nos conceitos importantes abordados nesta unidade e nas técnicas de amostragem apresentadas, disponibilizo, abaixo, dois títulos de livros de autores de grande repercussão, que aprofundam esses temas e trazem mais exercícios para você praticar. Vale destacar que eles trazem linguagem diferente da que foi utilizada aqui, pois são mais acadêmicos. Além disso, nos exemplos, os autores não trazem tantos detalhes de resolução, mas essas fontes são ótimos materiais de consulta. • STENVENSON, Willian J. Estatística aplicada à administração. São Paulo: Harbra, 2001. • TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Organização, Tabulação e Apresentação dos Dados • A tabela e o Rol • Distribuição de frequência e elementos da distribuição de frequências • Dados absolutos e dados relativos • A distribuição de frequência • Histograma • Diagrama ou gráfico de colunas • Diagrama ou gráfico de barras • Diagrama ou gráfico de setores • Diagrama ou gráfico de ogiva • Gráficos pictóricos ou pictogramas Introdução A pesquisa estatística envolve uma série de processos e etapas e dentre elas temos a organização, a tabulação e a apresentação dos dados obtidos. Sem passar por qualquer tipo de manipulação, os dados não representam relevância para o objeto de estudo. Para eles, damos o nome de dados brutos. Nesta unidade, você conhecerá os métodos de organização de dados a partir das variáveis quantitativas e qualitativas, e entenderá que a origem dos dados obtidos é que define o tipo de organização que deverá ser feita: em tabelas ou gráficos. As tabelas são utilizadas para organizar dados de variáveis quantitativas que se repetem várias vezes. Nesse caso, os números são organizados a partir de sua frequência, que pode ser relativa ou absoluta. O número de vezes que determinado dado foi citado representa a frequência absoluta, já a frequência relativa é determinada pela relação entre a frequência absoluta da variável e a somatória dos dados citados. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 Segundo Bruni (2007, p. 23), a apresentação gráfica é “uma das mais simples formas de transmissão das informações contidas em diferentes conjuntos de dados”. Para facilitar a compreensão, os dados devem revelar suas principais características e apresentar o resultado da pesquisa de forma clara e eficiente (TRIOLA, 2013). 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 33 A tabela e o rol A organização dos dados brutos, que podem ser qualitativos ou quantitativos, em ordem crescente ou decrescente, segundo Spiegel & Stephens (2009), é chamada de rol. Este tipo de organização permite identificar com maior clareza as informações no conjunto de dados, tal como o maior valor, o menor valor, os dados que se repetem etc. A organização dos dados brutos, ou seja, aqueles que ainda não foram numericamente organizados, é chamada de tabela primitiva. O conjunto de dados brutos a seguir representa a quantidade de unidades produzidas por uma pequena empresa durante os doze meses de um ano, que produz de acordo com a demanda do mercado: TABELA 1 – Tabela primitiva (dados brutos) Fonte: Elaborado pelo autor. 500 453 485 398 510 489 389 485 523 503 411 470 A organização em rol facilita a identificação das informações no conjunto de dados, tal como o maior valor, o menor valor, os dados que se repetem etc.: TABELA 2 – Organização dos dados em rol Fonte: Elaborado pelo autor. 389 485 398 489 411 500 453 503 470 510 485 523 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 34 Distribuição de frequências e elementos da distribuição de frequências A distribuição de frequências é uma forma pela qual podemos descreveros dados estatísticos resultantes de variáveis quantitativas ou qualitativas. Segundo Bruni (2007) “o objetivo maior da construção de tabelas de frequência envolve facilitar a extração de informações das diferentes bases de dados analisados” (BRUNI, 2007, p. 9). Os dados das variáveis quantitativas basicamente são organizados e classificados de duas formas diferentes: sem intervalos de classes e em intervalos de classes. Já quando os dados são de origem qualitativa, os dados são organizados sem intervalos de classes. A distribuição de frequências deve conter as seguintes colunas: • variável estatística (xi): é a coluna inicial da distribuição, onde registraremos os diferentes valores, de acordo com o que está sendo estudado. Também chamado de rol, é a ordenação dos valores obtidos segundo algum critério, geralmente em ordem crescente ou decrescente, ou em ordem alfabética quando se referir a dados qualitativos; • frequência absoluta (fi): essa coluna indica a quantidade de vezes que cada elemento aparece na amostra, ou a quantidade de elementos que pertencem a uma classe; • frequência relativa (fri): essa coluna se caracteriza pela representação da frequência absoluta em porcentagem, em relação ao total de dados. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 35 • frequência absoluta acumulada (Fi): nessa coluna, os valores são obtidos adicionando a cada frequência absoluta os valores das frequências anteriores; • frequência relativa acumulada (Fri): os valores dessa coluna são obtidos adicionando a cada frequência relativa os valores das frequências anteriores. Dados absolutos e dados relativos Os dados absolutos são aqueles obtidos diretamente por meio da pesquisa, sem qualquer manipulação. Por exemplo: quando a amostra é referente a um grupo de “20 funcionários do setor de vendas da empresa”, esse número é um dado absoluto. Já quando utilizamos os dados absolutos para fazer qualquer comparação por meio de uma razão (divisão), estamos trabalhando com dados relativos. Os dados relativos podem ser apresentados por coeficientes ou porcentagens. Assim, no exemplo dos 20 funcionários do setor de vendas da empresa, se o comparamos por meio de uma razão com o total de funcionários desta empresa, que são 160, temos os dados relativos, veja: nº de funcionários do setor de vendas nº de funcionários da empresa = 20 160 = 0,125 que é um coeficiente Se multiplicarmos o coeficiente 0,125 por 100 temos a representação relativa por meio de porcentagem: 0,125 x 100 = 12,5% Os dados absolutos são aqueles obtidos diretamente por meio da pesquisa, sem qualquer manipulação. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 36 Os dados absolutos e relativos são muito utilizados, por exemplo, na imprensa, quando querem facilitar a compreensão por parte da população. Geralmente, utilizam as expressões do tipo “em números absolutos” e “em números relativos”. Outro exemplo seria a seguinte situação: uma loja de departamentos instalou um painel onde convida os clientes a realizarem a avaliação da satisfação sobre o atendimento recebido assim que deixa a loja. Ao final de um dia, o resultado é: TABELA 3 – Grau de satisfação dos clientes da loja de departamentos Fonte: Elaborado pelo autor Muito satisfeito 5 GRAU DE SATISFAÇÃO QUANTIDADE DE CLIENTES (QUANTIDADE ABSOLUTA) Satisfeito 38 Pouco satisfeito 12 Insatisfeito 10 TOTAL 65 Observe que a quantidade de clientes que participou da pesquisa é a quantidade absoluta. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 37 A seguir, os dados absolutos (quantidade de clientes) são representados em coeficiente e em porcentagem: Muito satisfeito 5 GRAU DE SATISFAÇÃO QUANTIDADE DE CLIENTES Satisfeito 38 Pouco satisfeito 12 Insatisfeito 10 TOTAL 65 TABELA 4 – Distribuição de frequências COEFICIENTE PORCENTAGEM 5 65 = 0,076923 38 65 = 0,584615 12 65 = 0,184615 10 65 = 0,153846 0,999999 = 1 0,076923 x 100 = 7,6923% 0,584615 x 100 = 58,4615% 0,184615 x 100 = 18,4615% 0,584615 x 100 = 15,3846% 99,9999% = 100% Fonte: Elaborado pelo autor A distribuição de frequências 1ª) A organização e classificação de dados de variáveis quantitativas não agrupadas em intervalos de classe: utilizamos esta situação quando os dados da variável estatística se repetem mais vezes, permitindo o agrupamento desses dados de acordo com a quantidade de vezes que aparecem no conjunto de dados. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 38 Exemplo 1: O quadro a seguir apresenta as notas dos 35 alunos de uma turma em avaliação da disciplina Fundamentos e Metodologia da Matemática II, cujo valor foi 20,0 créditos: TABELA 5 – Classificação de dados de variáveis quantitativas (notas dos alunos) não agrupadas em intervalos de classe 7,0 18,0 13,0 15,0 12,0 12,0 15,0 10,0 3,0 12,0 15,0 11,0 12,0 11,0 10,0 12,0 13,0 12,0 18,0 10,0 17,0 11,0 18,0 10,0 11,0 16,0 17,0 16,0 12,0 7,0 15,0 13,0 10,0 10,0 15,0 Fonte: Elaborado pelo autor Com base nesses dados, vamos construir a distribuição de frequências e, em seguida responder às seguintes questões: a) quantos alunos conseguiram nota menor que 12,0 nessa avaliação? b) considerando que a média nessa avaliação é 12,0, qual a porcentagem de alunos que conseguiu alcançar ou superar a média? 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 39 Vamos à resposta: A variável estatística (xi) é representada pela “nota dos alunos”. Precisamos organizar os dados em ordem crescente, ou seja, o rol: TABELA 6– Classificação de dados de variáveis quantitativas (notas dos alunos) não agrupadas em intervalos de classe 3,0 11,0 7,0 12,0 7,0 12,0 10,0 12,0 10,0 12,0 10,0 12,0 15,0 15,0 15,0 15,0 16,0 16,0 10,0 12,0 17,0 10,0 12,0 17,0 10,0 13,0 17,0 11,0 13,0 18,0 11,0 13,0 18,0 Fonte: Elaborado pelo autor 11,0 15,0 18,0 Com os dados em rol, é possível identificar que a menor nota é 3,0 e a maior, é 18,0. Veja agora a distribuição de frequências completa com todas as colunas: TABELA 7 - Áreas de atuação da gestão de pessoas xi (Variável estatística) 3,0 fi (Freq absoluta) fri (%) (Freq relativa) Fi (Freq absoluta acumulada) Fri (%) (Freq relativa acumulada) 1 1 1/35 x 100 = 2,857 2,857 7,0 2 1 + 2 = 3 2/35 x 100 = 5,714 2,857 + 5,714 = 8,571 10,0 6 3 + 6 = 9 6/35 x 100 = 17,143 8,571+ 17,143 = 25,714 11,0 4 9 + 4 = 13 4/35 x 100 = 11,429 25,714 + 11,429 = 37,143 12,0 7 13 + 7 = 20 7/35 x 100 = 20,0 37,143 + 20 = 57,143 13,0 3 20 +3 = 23 3/35 x 100 = 8,571 57,143 + 8,571 = 65,714 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 40 15,0 5 23 + 5 = 28 5/35 x 100 = 14,286 65,714 + 14,286 = 80 16,0 2 28 + 2 = 30 2/35 x 100 = 5,714 80 + 5,714 = 85,714 17,0 2 30 + 2 = 32 85,714 + 5,714 = 91,428 18,0 3 32 + 3 = 35 3/35 x 100 = 8,571 91,428 + 8,571 = 100 Σ 35 100,0 2/35 x 100 = 5,714 Fonte: Elaborado pelo autor Observe que consideramos 3 casas decimais e utilizamos as regras de arredondamento, já que a maioria das divisões gera dízimas. Com os dados organizados, é mais fácil conseguir qualquer informação a respeito do conjunto de dados e responder às perguntas que foram feitas no início deste tópico: a. Quantos alunos conseguiram nota menor que 12,0 nessa avaliação? Para responder a essa pergunta, basta consultar a coluna Fi. A nota menor,12,0, só vai até o 11,0, logo são 13 alunos (confira na 4ª coluna da tabela 7); 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 41 b. Considerando que a média nessa avaliação é 12,0, qual a porcentagem de alunos que conseguiu alcançar ou superar a média? Nesse caso, vamos consultar a coluna Fri. Basta tirar do total (100%) a porcentagem das notas menores que 12,0 (37,143%). Consulte a 5ª coluna da tabela 7). Então: 100 – 37,143 = 62,857 % Exemplo 2: Os números da tabela a seguir representam a quantidade de um determinado aparelho de barbear, vendida diariamente (durante um mês) por uma rede de departamentos. Vale ressaltar que a rede possui 5 filiais na cidade e não abre aos domingos. TABELA 8 – Classificação quantidade de aparelho de barbear vendidos 14 11 12 12 11 14 13 10 14 13 13 15 14 12 11 14 15 13 13 14 16 11 17 Fonte: Elaborado pelo autor 12 14 Com base nos dados da tabela, vamos construir a tabela de distribuição de frequências e responder às seguintes questões: a) qual a porcentagem de dias em que as vendas superaram 14 aparelhos elétricos? b) qual a quantidade de dias em que as vendas não chegaram a atingir 13 unidades desse aparelho elétrico? 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 42 Vamos à resposta: A variável estatística (xi) é representada pela “quantidade de venda diária”. Precisamos organizar os dados em ordem crescente, ou seja, o rol: TABELA 9 – Classificação quantidade de aparelho de barbear vendidos, organizados em rol 10 14 11 14 11 14 11 14 11 14 12 14 12 15 12 15 12 13 13 13 13 13 13 14 Fonte: Elaborado pelo autor Com os dados em rol, é possível identificar que a menor quantidade vendida é 10 e a maior, 17. Veja agora a distribuição de frequências completa com todas as colunas: xi 10 fi fri (%) Fi Fri (%) 1 11/25 x 100 = 4 4 11 4 1 + 4 = 54/25 x 100 = 16 4 + 16 = 20 12 4 5 + 4 = 94/25 x 100 = 16 20 + 16 = 36 13 5 9 + 5 = 145/25 x 100 = 20 36 + 20 = 56 14 7 14 + 7 = 217/25 x 100 = 28 15 2 21 + 2 = 232/25 x 100 = 8 TABELA 10 – Distribuição de frequências (aparelho de barbear vendidos) 56 + 28 = 84 84 + 8 = 92 16 1 23 + 1 = 241/25 x 100 = 4 92 + 4 = 96 17 1 24 + 1 = 251/25 x 100 = 4 96 + 4 = 100 Σ 25 100,0 Fonte: Elaborado pelo autor 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 43 Com os dados organizados, é mais fácil conseguir qualquer informação a respeito do conjunto de dados e responder às perguntas que foram feitas no início deste exemplo: a. Qual a porcentagem de dias em que as vendas superaram 14 aparelhos elétricos? Resposta: Para responder a essa pergunta, basta tirar do total (100%) os dias em que as vendas foram de 14 ou menos (84%): 100 – 84 = 16%. b. Qual a quantidade de dias em que as vendas não chegaram a atingir 13 unidades desse aparelho elétrico? Resposta: Nesse caso, queremos a quantidade de dias em que as vendas foram menores que 13, ou seja, até 12. Logo, conferindo na 4ª coluna, temos o resultado de 9 dias. Para contar quantas vezes cada dado da variável estatística aparece, risque cada dado contado para você não se perder e ganhar tempo. 2ª) Organização e classificação de dados de variáveis qualitativas: Após a coleta, os dados qualitativos necessitam ser organizados e classificados. Neste caso, também vamos utilizar a tabela de distribuição de frequência, mas, em geral, apenas a frequência absoluta e a frequência relativa. Foi realizada uma pesquisa com os compradores de refrigerantes em um supermercado no período de um dia. Cada comprador informou qual o refrigerante havia adquirido. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 44 Durante um dia inteiro, um supermercado entrevistou seus clientes e perguntou qual refrigerante ele havia comprado. Veja a tabela dos dados da amostra: TABELA 11: Dados de uma amostra de compras de refrigerantes em um supermercado. Coca Cola Pepsi Twist Coca Cola Pepsi Twist Guaraná Guaraná Coca Cola Guaraná Coca Cola Pepsi Twist Coca Cola Pepsi Twist Sprite Guaraná Coca Cola Coca Cola Coca Cola Guaraná Sprite Guaraná Sprite Coca Cola Coca Cola Guaraná Coca Cola Coca Cola Pepsi Twist Pepsi Twist Coca Cola Coca Cola Coca Cola Coca Cola Coca Cola Coca Cola Guaraná Guaraná Coca Cola Guaraná Guaraná Coca Cola Coca Cola Guaraná Guaraná Coca Cola Sprite Pepsi Twist Sprite Coca Cola Pepsi Twist Guaraná Fonte: Elaborado pelo autor Com base nesse levantamento, construir a tabela de frequências. Vamos determinar quantas pessoas foram entrevistadas e determinar a marca mais comprada. Vamos à resposta: Consideramos que xi marca de refrigerante comprada 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 45 É preciso organizar os dados da variável estatística segundo algum critério. Nesse caso, vamos utilizar a ordem alfabética: TABELA 12 – Distribuição de frequências (refrigerantes) xi Coca Cola fi fri (%) 22 22/50 x 100 = 44 Guaraná 14 14/50 x 100 = 28 Pepsi Twist 8 8/50 x 100 = 16 Sprite 6 6/50 x 100 = 12 Σ 50 100 Fonte: Elaborado pelo autor Ao analisar os dados organizados, é possível responder às perguntas supracitadas. Foram entrevistadas 50 pessoas e a marca mais comprada foi a Coca cola. 3ª) Organização e classificação de dados de variáveis quantitativas agrupadas em intervalos de classe: em muitas situações, os dados coletados de variáveis quantitativas aparecem muitas vezes com poucas repetições, o que inviabilizaa organização dos mesmos em tabelas como na primeira situação descrita acima, quando a organização e classificação dos dados de variáveis quantitativas não são agrupadas em intervalos de classe. Quando isso acontecer, é preciso agrupar os valores coletados em classes. Esse tipo de organização de dados é bastante prática, já que evita tabelas muito extensas e com um número alto de dados repetidos, o que facilita a análise. Mas, apesar disso, a qualidade da análise será inferior, haja vista que os dados agrupados em classes perdem sua individualidade sendo mais difícil saber quais dados foram coletados. A tabela 13, apresenta a organização em classes; a construção das frequências segue o mesmo padrão de quando não está em classes. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 46 A matemática possui meios para a determinação de classes (conteúdo mais avançado), vale destacar que podemos utilizar o “bom senso” para a determinação dessas classes de modo mais adequado, de acordo com os dados que foram coletados. É importante registrar que a classe 5,0 |--- 7,5 indica que o valor 5,0 pertence a essa classe, mas que o valor 7,5 não faz parte dessa classe, e sim da próxima classe. xi 7,5 |--- 10,0 fi fri (%) Fi Fri (%) 4 4 11,11 4 4 + 4 = 8 11,11 + 11,11 = 22,22 15 8 + 15 = 23 5 23 + 5 = 28 6 28 + 6 = 34 2 34 + 2 = 36 36 100 Fonte: Elaborado pelo autor 5,0 |--- 7,5 10,0 |--- 12,5 12,5 |--- 15,0 Σ 15,0 |--- 17,5 17,5 |--- 20,0 4 36 = 0,1111 x 100 = 11,11 4 36 = 0,1111 x 100 = 11,11 15 36 = 0,4167 x 100 = 41,67 5 36 = 0,1389 x 100 = 13,89 6 36 = 0,1667 x 100 = 16,67 2 36 = 0,0556 x 100 = 5,56 22,22 + 41,67 = 63,89 63,89 + 13,89 = 77,78 77,78 + 16,67 = 94,45 94,45 + 5,56 = 100 A seguir, vamos abordar os principais tipos de gráficos que podem ser utilizados para apresentar um conjunto de dados organizados: TABELA 13 – Distribuição de frequências 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 47 O Histograma O histograma é um dos mais simples e eficientes gráficos utilizados para apresentar dados, e representa as frequências simples ou relativas. É um diagrama de colunas onde cada retângulo se relaciona com a distribuição de frequências. Tiboni (2010) destaca que a diferença entre o histograma e o gráfico de coluna é que no primeiro não há separação entre os retângulos para facilitar a visualização dos dados. O histograma é utilizado para analisar a forma de distribuição dos dados, e é basicamente uma versão gráfica de uma distribuição de frequências. em geral, no o eixo das abscissas (ou eixo horizontal) representamos a variável estatística e no eixo das ordenadas (ou eixo vertical) representamos a frequência absoluta ou relativa, de acordo com o que se pretende destacar Veja alguns dos exemplos organizados na distribuição de frequências em histogramas: Lembra-se do exemplo da tabela 9 que representa a distribuição de frequências das notas dos 35 alunos de uma turma em avaliação da disciplina Fundamentos e Metodologia da Matemática II, cujo valor foi 20,0 créditos? Vamos representá-la por meio de um histograma. Lembrando que a variável estatística (xi) é a “nota dos alunos” e a frequência (fi) indica quantos alunos tiraram a referida nota. O histograma é um dos mais simples e eficientes gráficos utilizados para apresentar dados, e representa as frequências simples ou relativas. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 48 TABELA 14 – Notas dos alunos na disciplina Fundamentos e Metodologia da Matemática II xi fi 3,0 1 7,0 2 10,0 6 11,0 4 12,0 7 13,0 3 15,0 5 16,0 17,0 18,0 2 2 3 Fonte: Elaborado pelo autor Veja a representação no histograma: FIGURA 1 – Histograma Fonte: Elaborado pelo autor Veja agora um histograma para variável qualitativa: Vamos retomar a tabela com as marcas de refrigerantes, já utilizada anteriormente. Cada comprador informou qual o refrigerante havia adquirido. A tabela organizada ficou da seguinte maneira: A variável estatística é marca de refrigerante comprada e a frequência absoluta indica quantos clientes compraram cada marca. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 49 TABELA 10 – Marca de refrigerante comprada xi Coca Cola fi 22 Guaraná 14 Pepsi Twist 8 Sprite 6 Fonte: Elaborado pelo autor Veja o histograma: FIGURA 2 – Histograma Fonte: Elaborado pelo autor 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 50 Diagrama ou Gráfico de Colunas O Diagrama ou Gráfico de Colunas tem características bem próximas ao histograma, a diferença é que no gráfico, as colunas verticais apresentam uma distância de uma para a outra. Esse tipo de gráfico pode ser construído tanto com a frequência absoluta quanto com a frequência relativa. Utiliza-se um ou o outro de acordo com, o que é mais relevante para a sua análise. FIGURA 3 – Número de veículos roubados em uma capital Fonte: Elaborado pelo autor 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 51 TABELA 11 – Alunos pesquisados por curso A tabela 11 mostra a quantidade de alunos por curso de uma faculdade mineira. Curso f1 Administração 8 Engenharia Civil 12 Engenharia de Produção 9 Gestão Comerical 5 Gestão Financeira 6 Gestão de Qualidade 4 Processos Gerenciais 14 Σ 58 Veja o gráfico (figura 4) com a mesma informação: FIGURA 4 – Gráfico de colunas Fonte: Elaborado pelo autor Q U AN TI DA DE D E AL U N O S Fonte: Elaborado pelo autor 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 52 Diagrama ou Gráfico de Barras Segundo Bruni (2007), O diagrama ou gráfico de barras também possui características próximas ao histograma, mas seu maior objetivo é apresentar as frequências na forma de barras horizontais. Assim, como o gráfico de coluna, o gráfico de barras é separado entre si e também pode ser construído tanto com a frequência absoluta quanto com a frequência relativa. FIGURA 5 – Gráfico Cor Preferida Fonte: Elaborado pelo autor 42 1126 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 53 Agora, com os mesmos dados utilizados no gráfico de colunas (figura 5), vamos construir um gráfico de barras. FIGURA 6 – Gráfico de barras Fonte: Elaborado pelo autor Diagrama ou Gráfico de Setores Popularmente chamado de gráfico de pizza, o gráfico de setores representa as frequências absolutas ou relativas pela forma de setores de círculo. Sua aplicação, geralmente, se dá “quando todos os dados analisados correspondem ao universo de observações” (BRUNI, 2007, p. 30), ou seja, quando correspondem ao todo. O gráfico de setores deve ser evitado quando os dados são distribuídos ao longo do tempo, e também deve ser evitado quando há muitos elementos na variável estatística. Cu rs os 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 54 Vamos retomar a tabela dos alunos que participaram de pesquisa no campus, por curso. TABELA 12 – Alunos pesquisados por curso Curso f1 Administração 8 Engenharia Civil 12 Engenharia de Produção 9 Gestão Comerical 5 Gestão Financeira 6 Gestão de Qualidade 4 Processos Gerenciais 14 Σ 58 Fonte: Elaborado pelo autor A figura 7 mostra o gráfico de setores resultante da tabela 6. FIGURA 7 – Gráfico de Setores Fonte: Elaborado pelo autor A visualização dos dados neste tipo de gráfico é mais simples. Mesmo sem olhar os valores na tabela, é possível comparar facilmente o curso que teve maior participação dos alunos na pesquisa. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 55 Diagrama ou Gráfico de ogiva Também chamado de gráfico de linha ou polígono de frequência, o diagrama ou gráfico de ogiva representa as frequências apresentadas no histograma. TABELA 13 – Notas dos alunos na disciplina Estatística Fonte: Elaborado pelo autor xi 7,5 |--- 10,0 fi 4 4 15 5 6 2 5,0 |--- 7,5 10,0 |--- 12,5 12,5 |--- 15,0 15,0 |--- 17,5 17,5 |--- 20,0 Observe o resultado: FIGURA 8 – Gráfico de Ogiva Fonte: Elaborado pelo autor 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 56 Gráfico pictórico ou pictograma É um modelo de gráfico muito interessante que utiliza figuras relacionadas ao assunto com o objetivo de dar relevância e para chamar a atenção do leitor. É preciso destacar que os símbolos devem ser autoexplicativos e devem ser expressos por uma quantidade maior de símbolos para valores maiores que o símbolo básico, e o contrário, em caso de valores menores. FIGURA 12 – Gráfico pictórico ou pictograma Fonte: www.shutterstock.com Neste caso, o tema central de que trata o gráfico são as crianças, por isso são utilizadas imagens de crianças. Apesar dos gráficos serem muito utilizados por agilizarem o processo para analisar um conjunto de dados, em determinadas situações, os gráficos podem transmitir conteúdo que pode não ser verdadeiro. Um dos principais motivos para levar a esse erro acontece quando há excesso de figuras e pouca informação. As figuras acabam por deixar em segundo plano a informação que se deseja apresentar. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 57 Para que você possa treinar, faça os exercícios referentes a essa unidade: 1. Com o objetivo de divulgar um de seus produtos, determinada indústria entrevistou 600 pessoas para saber qual veículo de informação (internet, rádio, revista e televisão) era mais utilizado por elas. Dentre os entrevistados, 210 preferiam internet, 276 gostavam mais de rádio, 42 preferiam revista e 72 televisão. Construa uma tabela relacionando os quatro veículos de informação e a distribuição de frequências: 2. Dada a distribuição de frequência abaixo: xi 3 4 5 6 7 8 fi 5 2 8 3 12 10 Determine: a) Σ fi: b) as frequências relativas c) as frequências absolutas acumuladas 3. Foi realizada uma pesquisa com 40 pessoas que procuravam um carro popular usado para comprar. A pesquisa foi encomendada por um centro de vendas localizado em Belo Horizonte, e apresentou os seguintes resultados: 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 58 TABELA 14 – Modelos mais citados na pesquisa Uno Pálio Uno Corsa Sedan Pálio Gol Uno Uno Pálio Gol Uno Gol Ford Ka Ford Ka Gol Uno Ford Ka Uno Pálio Uno Ford Ka Pálio Ford Ka Pálio Uno Gol Uno Corsa Sedan Gol Gol Gol Pálio Pálio Pálio Gol Ford Ka Uno Uno Gol Corsa Sedan Fonte: Elaborado pelo autor A partir desse levantamento, construa uma tabela com as frequências e o histograma. Determine o carro mais procurado e também o menos procurado. 4. (Enem, 2011) O gráfico da figura abaixo representa a relação entre o tamanho e a totalidade dos imóveis rurais no Brasil. Que característica da estrutura fundiária brasileira está evidente no gráfico apresentado? 1,3% 53% 15,2% 30,5% 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 59 a. A concentração de terras nas mãos de poucos. b. A existência de poucas terras agricultáveis. c. O domínio territorial dos minifúndios. d. A primazia da agricultura familiar. e. A debilidade dos plantations modernos. 5. (ENEM 2011) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 279 internautas responderam à enquete, como mostra o gráfico. Analisando os dados do gráfico, quantos internautas responderam “NÃO” à enquete? a. menos de 23. b. mais de 23 e menos de 25. c. mais de 50 e menos de 75. d. mais de 100 e menos de 190. e. mais de 200. 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 42 11 26 50 83 1 ANÁLISE E INTERPRETAÇÃO DE DADOS unidade 2 60 6. (ENEM 2011) O termo agronegócios não se refere apenas à agricultura e à pecuária, pois as atividades ligadas a essa
Compartilhar