Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE SÃO JUDAS FACULDADE DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE CURSO DE PSICOLOGIA EEssttaattííssttiiccaa DDeessccrriittiivvaa ee PPrroobbaabbiilliiddaaddee:: MMaatteerriiaall ddee AAppooiioo PPRROOFFAA.. DDRRAA.. CCLLÁÁUUDDIIAA BBOORRIIMM DDAA SSIILLVVAA São Paulo 2016 2 SUMÁRIO Plano de Ensino da Disciplina .................................................................................................................. p.3 Cronograma para realização do trabalho semestral .................................................................................. p.5 Capítulo 1 - Alguns conceitos estatísticos básicos ................................................................................... p.6 Tarefa 1 do Trabalho Semestral .......................................................................................... p.8 Tarefa 2 do Trabalho Semestral............................................................................................ p.10 Capítulo 2 - Alguns cálculos básicos ........................................................................................................ p. 11 Capítulo 3 - Gráfico e Tabela de distribuição de frequência (TDF) para uma variável qualitativa......... p. 13 Exercício................................................................................................................................... p.15 Tarefa 3 do Trabalho Semestral............................................................................................ p.16 Capítulo 4 - Gráfico e Tabela de distribuição de frequência (TDF) para duas variáveis qualitativas p. 17 Exercício ............................................................................................................................. ..... p. 21 Tarefa 4 do Trabalho Semestral............................................................................................ p. 23 Capítulo 5 - Outros gráficos ..................................................................................................................... p. 24 Capítulo 6 - Construção de Gráfico em planilha eletrônica (Microsoft Excel) ........................................ p. 28 Exercícios Complementares dos capítulos 3, 4 e 5 (com gabarito) ......................................... p. 29 Capítulo 7 - Gráfico e Tabela de distribuição de frequência para variável quantitativa .......................... p. 36 Exercícios ................................................................................................................................ p. 50 Tarefa 5 do Trabalho Semestral........................................................................................... p. 53 Exercícios Complementares do capítulo 7 (com gabarito)..................................................... p. 54 Capítulo 8 - Média, Variância, Desvio Padrão e Coeficiente de Variação .............................................. p. 62 Exercícios............................................................................................................................. .... p. 80 Tarefa 6 do Trabalho Semestral........................................................................................... p. 85 Tarefa 7 do Trabalho Semestral........................................................................................... p. 85 Exercícios Complementares do capítulo 8 (com gabarito)....................................................... p. 86 Capítulo 9 - Mediana, Quartis e Outros Percentis .................................................................................... p. 99 Exercícios ................................................................................................................................ p. 109 Tarefa 8 do Trabalho Semestral.......................................................................................... p. 113 Exercícios Complementares do capítulo 9 (com gabarito).................................................... p. 114 Esclarecimentos sobre a elaboração do Relatório Final .......................................................................... p. 121 Modelo do Relatório Final (trabalho final) .......................................................................................... p. 123 Capítulo 10 - Probabilidade ..................................................................................................................... p. 129 Exercícios ............................................................................................................................... p. 133 Exercícios ............................................................................................................................... p. 136 Exercícios ............................................................................................................................... p. 141 Exercícios Complementares do capítulo 10 (com gabarito)..................................................... p. 143 3 PLANO DE ENSINO DA DISCIPLINA EMENTA: Análise Exploratória de Dados. Introdução à Probabilidade. Aplicação do Método Estatístico. OBJETIVO GERAL: Utilizar a Estatística para produzir e consumir criticamente informações estatísticas. CONTEÚDO PROGRAMÁTICO 1) Representação de dados em tabelas e gráficos. 2) Medidas de tendência central 3) Medidas de dispersão 4) Percentil 5) Definição clássica e frequentista de probabilidade. 6) Teorema da soma e do produto. 7) Probabilidade condicional e independência de eventos. METODOLOGIA 1) Aulas expositivas. 2) Exercícios de aplicação em sala de aula. 3) Orientação para a realização de Análise de dados por meio de realização de pesquisa de campo. 4) Os alunos terão a sua disposição material de apoio desenvolvido pela professora para o acompanhamento das aulas e para a análise da pesquisa de campo, com informações sobre o uso de ferramentas estatísticas disponíveis em planilhas eletrônicas. AVALIAÇÃO 1) Avaliação Final (AF) - nota entre 0 e 9 pontos a serem distribuídos da seguinte maneira: a) Análise de Dados da pesquisa de campo - nota entre 0 e 3 pontos. (respeitar cronograma) b) Prova Oficial - nota entre 0 e 5 pontos c) Prova Integrada - nota entre 0 e 1 ponto (a ser confirmada) 2) Projeto Integrador (PCOMP) - nota entre 0 e 1 ponto (a ser atribuída pelo professor da disciplina de Projeto) 4 3) ADAPTI ingressante - nota que será adicionada automaticamente pelo sistema à medida que o aluno concluir as disciplinas no site. Quando da conclusão do ADAPTI, será somado 0,5 ponto na nota de cada disciplina do semestre. BIBLIOGRAFIA BÁSICA: BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. rev. ampl. Florianópolis: UFSC, 2003. 340p. DANCEY, Christine; REIDY, John. Estatística sem Matemática para Psicologia. Tradução de Lori Viali. 5. ed. Porto Alegre: Penso Editora, 2013. 608 p. Disponível em: http://integrada.minhabiblioteca.com.br/books/9788565848114/page/3 LEVIN, Jack; FOX, James Alan; FORDE, David R. Estatística para Ciências Humanas. Tradução de Jorge Ritter. 11. ed. São Paulo: Pearson Education do Brasil, 2012. 458 p. Disponível em: http://usjt.bv3.digitalpages.com.br/users/publications/9788581430812/pages/-14 BIBLIOGRAFIA COMPLEMENTAR: BLAIR, R. Clifford; TAYLOR, Richard A. Bioestatística para Ciências da Saúde. Tradução de Daniel Vieira. São Paulo: Pearson Education do Brasil, 2013. 470 p. Disponivel em: http://usjt.bv3.digitalpages.com.br/users/publications/9788581431710/pages/-18 BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística básica. 8. ed. São Paulo, SP: Saraiva, 2013. 558 p. Disponível em: http://integrada.minhabiblioteca.com.br/#/books/9788502208001/pages/82842788 MOORE, David S.; NOTZ, Willian I.; A FLINGER,Michael. A Estatística Básica e sua Prática. Tradução e Revisão Técnica de Ana Maria Lima de Farias e Vera Regina Lima de Farias e Flores. 6. ed. Rio de Janeiro: Ltc, 2014. Disponível em: http://integrada.minhabiblioteca.com.br/#/books/978-85-216-2630-5/recent RODRIGUES, Maisa. Bioestatística. São Paulo: Pearson Education do Brasil, 2014. 184 p. Disponível em: http://usjt.bv3.digitalpages.com.br/users/publications/9788543005386/pages/-10 TRIOLA, Mario F. Introdução à Estatística: Atualização da Tecnologia. Tradução e Revisão Técnica de Ana Maria Lima de Farias e Vera Regina Lima de Farias e Flores. 11. ed. Rio de Janeiro: LTC, 2013.708 p. Disponível em: http://integrada.minhabiblioteca.com.br/books/978-85- 216-2296-3/page/IV http://usjt.bv3.digitalpages.com.br/users/publications/9788581430812/pages/-14 http://usjt.bv3.digitalpages.com.br/users/publications/9788581431710/pages/-18 http://integrada.minhabiblioteca.com.br/#/books/978-85-216-2630-5/recent 5 Cronograma do Trabalho Semestral: Análise de Dados Tarefa Data limite para entrega Nota 1 A depender da data de matrícula --- 2 A depender da data de matrícula --- 3 Segunda semana de Março 0,25 4 Terceira semana de Março 0,25 5 Turma do Matutino: última semana de Março Turma do noturno: Primeira semana de Abril 0,5 6 Segunda semana de Abril 0,5 7 Quarta semana de Abril 0,5 8 Primeira semana de Maio 0,5 Relatório Final + Anexos Terceira semana de Maio 0,5 6 1. Alguns conceitos estatísticos básicos Estatística: Ciência que estuda a organização, descrição, análise e interpretação de dados (informações). População: conjunto de indivíduos que apresentam, pelo menos, uma característica em comum. Amostra: um sub conjunto da população. Dados Brutos: são as informações obtidas em um questionário (ou entrevista ou ainda qualquer outro instrumento de pesquisa) que ainda não foram organizadas. Banco de Dados: é a organização dos dados brutos em uma planilha, onde cada linha contém as informações de um participante e cada coluna representa cada pergunta respondida pelo participante (cada variável). Banco de dados de uma pesquisa sobre preferências de filmes id genero idade No de filhos tipo filme 1 2 18 1 0 2 2 18 3 0 3 2 19 4 0 4 2 18 3 0 5 2 22 3 0 6 2 23 1 0 7 1 21 1 0 8 1 31 2 2 Códigos 1 = masculino 2 = feminino Códigos 1 = ação 2 = terror 3 = romance 4 = comédia 5 = outros Rol: é o arranjo dos dados brutos em ordem crescente ou decrescente. Variável: Características que podem ser observadas ( ou medidas) em cada elemento da população, sob as mesmas condições. Variável qualitativa: admite como resposta uma qualidade. Exemplo 1. Pergunta de um questionário: Você gostou do atendimento prestado pelos empregados do hotel? As respostas possíveis são SIM e NÃO. Este tipo de variável qualitativa é denominada nominal, onde as possibilidades de resposta são mutuamente exclusivas. 7 Exemplo 2: Outra pergunta de um questionário: Assinale com um ‘X’ uma das opções a seguir que melhor expressa sua opinião sobre o transporte público na cidade de São Paulo. ( ) excelente ( ) bom ( ) regular ( ) ruim ( ) péssimo. Este tipo de variável qualitativa é denominada ordinal, pois as possibilidades de resposta podem ser ordenadas. Variável quantitativa: Admite como resposta um número. Exemplo 3: Quantas namoradas você já teve? A resposta será UM NÚMERO. Este tipo de variável quantitativa é denominada discreta, pois só é possível um número inteiro como resposta. Exemplo 4: Qual sua idade? A resposta será UM NÚMERO. Este tipo de variável quantitativa é denominada contínua, pois é possível estabelecer a idade de maneira detalhada ( em anos, meses, dias, horas, minutos, segundos,....) A compreensão da classificação do tipo de variável permite a escolha adequada da descrição e análise estatística a serem realizadas (gráfico, medidas, testes de hipótese, etc). 8 TAREFA 1 DA PESQUISA DE CAMPO (TRABALHO DO SEMESTRE) Em um grupo de 5 ou 6 alunos, escolher um tema para pesquisar. Com base neste tema, elabore 3 perguntas que podem ser classificadas como variável qualitativa nominal e 2 perguntas que podem ser classificadas como variável qualitativa ordinal e 3 perguntas que podem ser classificadas como variável quantitativa. Veja o exemplo a seguir: Tema: Uso do celular Pergunta 1- variável qualitativa nominal = Gênero ( ) masculino ( ) feminino Pergunta 2 - variável quantitativa = Idade: _______ anos Pergunta 3 - variável qualitativa nominal = Seu celular é ( ) pré-pago ( ) pós-pago Pergunta 4 - variável qualitativa ordinal = Você se considera dependente do celular? ( ) muito ( ) mais ou menos ( ) não Pergunta 5 - variável qualitativa nominal = Seu celular tem acesso à internet? ( ) sim ( ) não Pergunta 6 - variável quantitativa = Quantas mensagens (sms) passa por dia? Pergunta 7 - variável quantitativa = Quantas mensagens (WhatsApp) passa por dia? TAREFA 1 DA PESQUISA DE CAMPO = QUESTIONÁRIO Agora é com você e seu grupo. Elabore 6 perguntas (pergunta 3 até pergunta 8) sobre o tema que seu grupo escolheu. Tema= Pergunta 1 - variável qualitativa nominal = Gênero ( ) masculino ( ) feminino Pergunta 2 - variável quantitativa = Idade: __________ anos Pergunta 3- variável qualitativa nominal = Pergunta 4- variável qualitativa nominal = Pergunta 5- variável qualitativa ordinal = Pergunta 6 - variável qualitativa ordinal = Pergunta 7 - variável quantitativa = Pergunta 8 - variável quantitativa = Lembre-se que a finalidade da pesquisa é a aprendizagem de Estatística. Por isso, evite temas polêmicos e perguntas que possam constranger o participante da pesquisa (seu colega de classe). Após a definição das perguntas, digite-as de maneira a tornar claro para os participantes da pesquisa como devem responder. Para isto, se necessário, escreva um pequeno texto explicativo. Veja um modelo na próxima página. A coleta de dados (pesquisa) só poderá ser realizada APÓS A AVALIAÇÃO DA PROFESSORA. 9 Tema: Paleta Mexicana O grupo de trabalho do primeiro ano de Psicologia tem o interesse de conhecer as preferências e opiniões dos alunos sobre a paleta mexicana. Se você já experimentou este tipo de sorvete, solicitamos a gentileza de responder as perguntas abaixo. Se você ainda não experimentou, solicitamos que devolva o questionário aos pesquisadores, sem respondê-lo. Agradecemos pela atenção! 1) Qual a sua idade? ______ 2) Qual é o seu gênero? ( ) Masculino ( ) Feminino 3) Quantas Paletas Mexicanas você consegue comer em um dia? ______ paletas 4) Quanto você paga por uma Paleta Mexicana? R$ _______ 5) Você considera o preço da Paleta Mexicana justo? ( ) Sim ( ) Mais ou menos ( ) Não 6) Qual desses sabores você mais gosta? ( ) morango com leite condensado ( ) caipirinha ( ) paçoca ( ) outros. Especifique: _____ 7) Você gostou da Paleta Mexicana? ( ) sim ( ) não 10 TAREFA 2 DA PESQUISA DE CAMPO = BANCO DE DADOS Depois da avaliação da professora sobre o questionário que seu grupo elaborou, você deve fazer a pesquisa de campo, ou seja, entrevistar entre 30 e 40 pessoas DE SUA SALA DE AULA. Para isto, 1) Imprima entre 30 e 40 questionários e entregue para os colegas de sua sala, solicitando a gentileza de responder. 2) Após receber os questionários respondidos pelos colegas, numere-os de 01 a 30 (ou 40), que corresponderá à identificação de cada pessoa (ID). 3) Digite a resposta de cada um dos participantes em uma planilha de Excel, elaborando assim o banco de dados (nome da planilha deve ser BD). Veja o exemplo abaixo 4) No mesmo arquivodo banco de dados (em Excel), mas em uma nova planilha (que deverá ser nomeada de QUEST) copie o questionário. 5) No mesmo arquivo do banco de dados (em Excel), mas em uma nova planilha (que deverá ser nomeada de GRUPO), digite o nome de cada um dos componentes do grupo). 6)Nomeie o arquivo com o sobrenome de algum colega do grupo, underline turma. Exemplo: Carvalho_1BPSN. 7) Envie o arquivo para mim até a data estipulada. Meu email é prof.cborim@usjt.br Exemplo de um banco de dados Id (Número do questionário genero idade dependência Acesso internet N SMS N WhatsApp Conta celular 1 2 18 1 1 1 20 50 2 2 18 1 2 1 3 29 3 2 19 1 3 1 22 5 4 2 18 1 3 2 30 -- 5 2 22 2 3 2 12 -- 6 2 23 1 3 2 15 -- 7 1 21 1 2 1 22 19 8 1 31 2 2 2 10 --- 1 = masculino 2 = feminino 1= pré- pago 2 = pós- pago 1 = muito 2 = mais ou menos 3 = não 1 = sim 2 = não 11 2. Alguns cálculos básicos 2.1 Arredondamento: Em Estatística usamos muitos cálculos que geralmente produzem resultados com infinitas casas decimais e, por esse motivo, faz-se necessário arredondarmos o valor obtido. Neste tema temos duas perguntas a fazer: a) Como arredondar? REGRA DE ARREDONDAMENTO Para arredondar, siga os passos a seguir: a1) escolha o número de casas decimais que deseja usar. Por exemplo, 2 casas decimais. a2) olhe a casa decimal seguinte da que deseja usar. No exemplo, olhe a 3 a casa decimal. a3) se o número que estiver na casa decimal seguinte (no exemplo, 3 a casa decimal) for 0, 1, 2,3 e 4, mantenha o número como está. Se o número que estiver na casa decimal seguinte (no exemplo, 3 a casa decimal) for 5, 6, 7, 8 e 9, adicione 1 na última casa decimal escolhida (no exemplo, 2 a casa decimal). Exemplos com 2 casas decimais: 25, 364 25,36 25, 365 25, 37 25,366 25,37 Exemplos com 1 casa decimal: 7,83 7,8 7,85 7,9 7,99 8,0 Exemplos com dízima periódica: 5,333... ou 3,5 5,3 5,444... ou 4,5 5,4 5,666... ou 6,5 5,7 OBS: SEMPRE ARREDONDE! b) Quantas casas decimais usar? Esta pergunta é a mais difícil de responder. O número de casas decimais vai depender da magnitude da variável, do tipo de estatística que se está fazendo e de alguns outros motivos. Por isso, PERGUNTE SEMPRE PARA A PROFESSORA QUANTAS CASAS DECIMAIS DEVE USAR, ATÉ QUE VOCÊ OBTENHA AUTONOMIA PARA ESTA DECISÃO. NÃO SE ESQUEÇA DE USAR SEMPRE A REGRA DE ARREDONDAMENTO. 12 2.2 Cálculo de porcentagem Para calcular porcentagem você pode usar a regra de três ou simplesmente o cálculo Parte/Todo. Vejamos o exemplo: Suponha que em uma pesquisa, tenham participado 20 homens e 30 mulheres. Calcule a porcentagem de homens e mulheres. Não importa se você vai usar a regra de três ou Parte/todo. Sempre use a Regra de Arredondamento!!! Por regra de três: 50 pessoas equivale a 100% 20 homens equivale a x. homens de %40 50 2000 1002050 x x 50 pessoas equivale a 100% 30 mulheres equivale a x. mulheres de %60 50 3000 1003050 x x Por Parte/Todo 100 Todo Parte Porcentagem de homens = %40100 50 20 Porcentagem de mulheres = %60100 50 30 13 3. Gráfico e Tabela de distribuição de frequência (TDF) para uma variável qualitativa Para se construir gráficos em Estatística, manualmente ou em software, faz-se necessário organizar as informações em uma tabela. 3.1 Tabela de Distribuição de frequência (TDF) é a organização dos dados de acordo com as ocorrências dos diferentes resultados observados. Como exemplo, vamos imaginar que foi realizada uma pesquisa de satisfação dos hóspedes de um hotel e abaixo encontra-se uma das questões: Exemplo 1: Você ficou satisfeito com o atendimento? ( ) sim ( ) não Para verificar como foi a avaliação do hotel, o gerente deverá “tabular” os dados, ou seja, para cada questão ele deverá “contar” o número de respostas em cada alternativa. A partir desta contagem é possível elaborar a tabela de distribuição de frequência (TDF), como se vê na Tabela 1. Tabela 1 Número e Porcentagem de hóspedes satisfeitos (ou não) com o atendimento Você ficou satisfeito? Frequência ( f ) Porcentagem ( % ) Sim 250 83,33 Não 50 16,67 Total 300 100,00 Toda tabela deve obedecer as normas de publicação da APA. Resumidamente, deve: a) Ter uma designação. Neste exemplo: Tabela 1. Esse número é sequencial. Portanto, as próximas tabelas serão Tabela 2, Tabela 3 e assim sucessivamente. b) Ter um nome. Neste exemplo: Número e Porcentagem de hóspedes satisfeitos (ou não) com o atendimento. Esse nome deve estar na linha seguinte à da designação, em itálico. c) A designação e o nome devem ser apresentados acima da tabela. d) Ter um cabeçalho, que está apresentado na primeira linha da tabela. e) Ter o cabeçalho e o rodapé delimitados por linhas (bordas) horizontais. Nenhuma outra borda é permitida. Este tipo de tabela permite elaborar os gráficos de barras simples (horizontal ou vertical) e também o gráfico de setores (pizza). 3.2 Gráfico de setores (pizza). O número total de elementos da amostra é representado pelo círculo completo. É necessário calcular quantos graus do círculo correspondem à cada categoria de resposta. Para a Tabela 1, os cálculos são os seguintes: 300 pessoas equivale a 360 graus no círculo 250 pessoas equivale a x graus no círculo? 14 0 50 100 150 200 250 300 satisfeitos insatisfeitos f Com a utilização de regra de três, você obtém que 250 entrevistados equivale a 300 graus e portanto, 50 equivale a 60 graus no círculo. Figura 1. Número de hóspedes satisfeitos (ou não). Todo gráfico deve obedecer as normas de publicação da APA. Resumidamente, deve: a) Ter uma designação, em itálico. Neste exemplo: Figura 1. Esse número é sequencial. Portanto, os próximos gráficos serão Figura 2, Figura 3 e assim sucessivamente. b) Ter um nome, que deve ser colocado logo após o ponto final da designação, sem itálico. Neste exemplo: Número de hóspedes satisfeitos (ou não). c) A designação e o nome são apresentados abaixo do gráfico. d) Ter legenda SOMENTE quando necessário. Neste exemplo, a legenda explica o que representa a “fatia branca” e o que representa a “fatia cinza”. Recomenda-se o uso do gráfico de setores quando o número de categorias (satisfeitos e insatisfeitos) é pequeno (até 4 ou 5 categorias). Quando há muitas categorias, recomenda-se o uso do gráfico de barras. 3.3 Gráfico de barras simples. Esse gráfico pode ser utilizado para diversas estatísticas. Quando a variável é qualitativa, como o exemplo da Tabela 1, um dos eixos do sistema cartesiano deve conter as categorias da variável (satisfeito / insatisfeito) e o outro eixo deve conter a estatística que está sendo apresentada (neste exemplo, frequência ou porcentagem). Para a construção do gráfico de barras, é necessário elaborar adequadamente a escala. Neste exemplo, a escala foi construída em intervalos de 50. A escala é responsável pela fidedignidade da informação. Elabore-a adequadamente. O gráfico de barras pode ser apresentado com barras verticais (Figura 2) ou com barras horizontais (Figura 3). Figura 2. Gráfico de barras verticais Figura 3. Gráfico de barras horizontais 250 50 satisfeitos insatisfeitos 0 50 100 150 200 250 300 satisfeitos insatisfeitos f 15 Exercício 1) (adaptada do ENADE 2005 - Formação Geral) Nos dias atuais, as novas tecnologias se desenvolvem de forma acelerada e a Internet ganha papel importante na dinâmica do cotidiano daspessoas e da economia mundial. No entanto, as conquistas tecnológicas, ainda que representem avanços, promovem consequências ameaçadoras. Apresente uma conclusão que pode ser extraída das figuras 4 e 5. Interpretação: ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ Figura 4. Número de internautas em cada pais em 2004 Figura 5. Número relativo de internautas em cada pais em 2003 16 TAREFA 3 DA PESQUISA DE CAMPO = Tabela e gráficos simples para variável qualitativa Seu grupo tem 5 variáveis qualitativas (3 nominais e 2 ordinais). Para cada variável qualitativa, elabore um gráfico OU uma tabela. Procure variar em sua escolha, ou seja, utilize tabela para umas variáveis e gráficos para outras. Deve-se: 1) Digitar as tabelas em word, seguindo as normas aqui explicadas. 2) Os gráficos devem ser feitos em Excel, seguindo as normas aqui explicadas. 3) Tanto as tabelas quanto os gráficos devem ser seguidos da interpretação. Leia atentamente as recomendações: 1) Para a tabela de distribuição de frequência, não esqueça de inserir uma coluna com a porcentagem também. 2) Para as variáveis que você escolheu utilizar gráfico, por enquanto só pode ser um gráfico de barras simples ou gráfico de setores. A escolha pelo gráfico deve seguir o conteúdo do Capítulo 3 deste material. 3) Entregar a Tarefa 3 impressa para a professora, na data estipulada. Certifique-se com seu grupo que vocês fizeram completamente a tarefa e seguiram todas as recomendações. A partir desta tarefa, será atribuída uma nota que comporá a nota final do trabalho. Para lembrar, verifique se sua Tabela: 1) tem número e título. 2) tem formatação correta (somente linhas para separar cabeçalho e linha de total) 3) tem frequência e porcentagem 4) tem interpretação Para lembrar, verifique se seu Gráfico: 1) tem número e título. 2) tem legenda (somente para o gráfico de setores) 3) tem escala adequada (somente para gráfico de barras) 4) tem interpretação (é a mesma da tabela - não precisa repetir) 17 4. Gráfico e Tabela de distribuição de frequência (TDF) para duas variáveis qualitativas Geralmente, uma pesquisa contém muitas questões. Suponha que a pesquisa do hotel tivesse mais uma questão, como apresentado no exemplo a seguir. Exemplo: Você ficou satisfeito com o atendimento? ( ) sim ( ) não É a primeira vez que você se hospeda neste hotel? ( ) sim ( ) não. Suponha também que o gerente não queira apenas o resultado de cada questão isoladamente, mas queira saber se existe diferença na opinião dos hóspedes que já são clientes, comparados com os hóspedes que ficaram no hotel pela primeira vez. Ou seja, o objetivo aqui é comparar a satisfação dos clientes novos e dos clientes antigos. Para a obtenção destes resultados é necessário que a tabela de distribuição de frequência seja elaborada da seguinte maneira: a) Contar todos os hóspedes já clientes que ficaram satisfeitos; b) Contar todos os hóspedes já clientes que não ficaram satisfeitos; c) Contar todos os hóspedes novos que ficaram satisfeitos; d) Contar todos os hóspedes novos que não ficaram satisfeitos. A partir desta contagem, é possível elaborar a tabela de contingência ( conhecida também como tabela de dupla entrada), que apresenta a distribuição conjunta das duas variáveis qualitativas. Tabela 2 Distribuição da frequência da satisfação do atendimento dos hóspedes novos e antigos. Você ficou satisfeito? Primeira vez que se hospeda? Total Sim Não Sim 80 170 250 Não 20 30 50 Total 100 200 300 É possível observar que há três totais na Tabela 2 (totais das linhas, totais das colunas e total geral da pesquisa). O total da linha corresponde ao total de hóspedes que ficaram satisfeitos (250) e total de hóspedes que não ficaram satisfeitos (50). Podemos calcular a porcentagem levando em consideração os totais da linha quando o interesse é comparar o grupo de hóspedes satisfeitos e insatisfeitos. O total da coluna corresponde ao total de hóspedes que se hospedaram pela primeira vez (100) e o total de hóspedes já clientes (200). Podemos calcular a porcentagem levando em consideração os totais da coluna quando o interesse é comparar o grupo de hóspedes novos e hóspedes já clientes, que é o caso do gerente desse hotel (veja texto salientado na página anterior). Nesta situação, o interesse é comparar a opinião de hóspedes novos e hóspedes já clientes (totais das colunas). A Tabela 3 apresenta a forma adequada (e mais recomendada) para apresentar uma tabela de contingência e as Figuras 6 e 7 representam os gráficos de barras múltiplas com frequência e porcentagem, respectivamente. 18 Tabela 3 Distribuição da frequência e porcentagem dos hóspedes novos e antigos de acordo com a satisfação do atendimento. Você ficou satisfeito? Primeira vez que se hospeda? Total Sim Não Sim 80 (80%) 170 (85%) 250 (83%) Não 20 (20%) 30 (15%) 50 (17%) Total 100 (100%) 200 (100%) 300 (100%) Para interpretar esse gráfico, você deve ler os eixos e as legendas, para então fazer a comparação dos grupos. Uma das interpretações corretas aqui é: Independente de ser hóspede novo ou antigo, a maioria deles ficou satisfeito com o atendimento (veja que a barra azul é maior em ambos os grupos). Vamos supor que o interesse fosse comparar a opinião de hóspedes satisfeitos e insatisfeitos (totais das linhas). Então, o foco está na comparação dos grupos satisfeitos e insatisfeitos. A Tabela 4 apresenta a forma adequada (e mais recomendada) para apresentar uma tabela de contingência e as Figuras 8 e 9 representam os gráficos de barras múltiplas com frequência e porcentagem, respectivamente. Tabela 4 Distribuição da frequência e porcentagem dos tipos de hóspedes de acordo com a satisfação do atendimento. Você ficou satisfeito? Primeira vez que se hospeda? Total Sim Não Sim 80 (32%) 170 (68%) 250 (100%) Não 20 (40%) 30 (60%) 50 (100%) Total 100 (33%) 200 (77%) 300 (100%) Figura 6. Distribuição da frequência dos hóspedes novos e já clientes de acordo com a satisfação do atendimento Figura 7. Distribuição da porcentagem de hóspedes novos e já clientes de acordo com a satisfação do atendimento 19 Para interpretar a Figura 8, em que está representada a frequência, você deve fazer a comparação dos grupos levando em consideração que o número de clientes satisfeitos é muito maior (as barras azul e vermelha na categoria satisfeito são muito maiores que na categoria insatisfeito. Uma das interpretações corretas aqui é: A maioria dos clientes, independente de serem novos ou já antigos, ficou satisfeito com o atendimento. Dos clientes insatisfeitos, que foram poucos, a maioria é cliente antigo. Para interpretar a Figura 9, em que está representada porcentagem, você deve ter muito cuidado. Veja que não é possível observar que há muito mais clientes satisfeitos. E como esta diferença é muito grande (clientes satisfeitos = 250 e insatisfeitos = 50), esta representação torna-se inadequada. Por esse motivo, não há interpretação correta. Logo, ao elaborarmos uma tabela de contingência, devemos ter em mente que grupos queremos comparar. Daí, devemos decidir sobre a estratégia a ser usada para o cálculo da porcentagem (linha ou coluna) e qual a melhor maneira para representar essacomparação no gráfico de barras múltiplas. Quando o número de categorias da variável qualitativa é muito grande, é recomendado elaborar o gráfico de barras empilhadas. Neste gráfico, cada coluna é a composição (soma) das frequências (ou porcentagem) de todas as categorias da variável. Usando o mesmo exemplo acima, vamos representar a situação em que o gerente do hotel pretende comparar o número de hóspedes novos com clientes antigos. As Figuras 10 e 11 representam os gráficos de barras empilhadas com frequência e porcentagem, respectivamente. Figura 8. Distribuição da frequência dos tipos de hóspedes de acordo com a satisfação do atendimento Figura 9. Distribuição da porcentagem dos tipos de hóspedes de acordo com a satisfação do atendimento 20 A interpretação é similar à feita nas Figuras 6 e 7. Figura 10. Distribuição da frequência dos tipos de hóspedes de acordo com a satisfação do atendimento Figura 11. Distribuição da porcentagem dos tipos de hóspedes de acordo com a satisfação do atendimento 21 Exercício 1) Foi feita uma pesquisa com 61 alunos do primeiro ano de Nutrição de 2013 para verificar seus hábitos e costumes quando vão à festa. Fora perguntado com quem eles costumam frequentar festas e se elas tem o hábito de ingerir bebida alcoólica em festas. O banco de dados desta pesquisa está apresentado na 5. Tabela 5 Parte do Banco de dados da Pesquisa sobre Festas id companhia de festa bebida alcoólica id companhia de festa bebida alcoólica 1 1 1 31 1 2 2 1 1 32 3 2 3 2 2 33 2 1 4 2 2 34 2 2 5 2 1 35 1 1 6 2 2 36 1 1 7 3 1 37 1 2 8 1 1 38 3 2 9 1 2 39 2 2 10 2 2 40 1 1 11 3 1 41 2 1 12 3 1 42 2 2 13 3 43 1 1 14 2 1 44 1 2 15 3 1 45 3 1 16 3 2 46 2 1 17 2 1 47 3 2 18 3 1 48 2 1 19 2 1 49 1 2 20 3 1 50 2 2 21 3 2 51 1 22 2 1 52 3 1 23 3 2 53 3 2 24 2 1 54 3 1 25 2 1 55 1 2 26 2 2 56 1 2 27 3 1 57 2 1 28 2 1 58 3 2 29 1 2 59 3 2 30 1 2 60 3 2 61 1 2 22 As perguntas feitas e os códigos usados foram: 6. Com quem você mais vai à festa? ( 1 ) Família ( 2 ) amigos ( 3 ) companheiro(a) 11. Você costuma ingerir bebida alcoolica quando vai à festa? ( 1 ) sim ( 2 ) não O objetivo dos alunos era verificar se a pessoa com quem elas iam para festas frequentemente poderia influenciar no hábito de beber (ou não). Para responder à este objetivo, faça as atividades abaixo descritas. a) Elabore a tabela de distribuição de frequências (tabela de dupla entrada). Coloque na linha a Companhia (família, amigos, companheiro(a)) e na coluna Bebida (sim e não) b) Calcule a porcentagem por linha. c) Escolha um gráfico (barras múltiplas ou empilhadas). d) Olhando sua tabela e seu gráfico, escreva uma interpretação para esta situação, de maneira a RESPONDER O OBJETIVO DOS ALUNOS. 23 TAREFA 4 DA PESQUISA DE CAMPO = Tabela de dupla entrada e gráfico de barras múltiplas ou empilhadas Seu grupo tem 5 variáveis qualitativas (gênero e mais 4 perguntas sobre o tema escolhido). Escolha 2 variáveis qualitativas que vocês tenham interesse em relacionar e: 1) Escreva o objetivo da elaboração da tabela. Veja o objetivo descrito no exercício da festa na página anterior. 2) Elabore uma tabela de dupla entrada, contendo a frequência e a porcentagem 3) Faça um gráfico de barras múltiplas OU empilhadas. A escolha pelo gráfico deve seguir o conteúdo do Capítulo 4 deste material. 3) A tabela e o gráfico deve seguir as normas aqui explicadas. 4) A tabela deve ser digitada. 5) O gráfico pode ser feito manualmente ou em Excel (ver Tópico 7 deste material) 6) Fazer uma interpretação para a Tabela (que é a mesma para o gráfico) 7) Entregar a Tarefa 4 impressa para a professora, na data estipulada. Certifique-se com seu grupo que vocês fizeram completamente a tarefa e seguiram todas as recomendações. A tarefa entrega será submetida à avaliação da professora e uma nota será atribuída. Para lembrar, verifique se sua Tabela: 1) tem número e título. 2) tem formatação correta (somente linhas para separar cabeçalho e linha de total) 3) tem frequência e porcentagem 4) tem interpretação Para lembrar, verifique se seu Gráfico: 1) tem número e título. 2) tem legenda 3) tem escala adequada 4) tem interpretação (é a mesma da tabela - não precisa repetir) 24 5. Outros gráficos O gráfico de barras é muito utilizado também para apresentar outras estatísticas, como por exemplo, a média. Também é utilizado para representar uma variável medida no tempo, que denominamos de série temporal. Veja estes dois casos nos subcapítulos 5.1 e 5.2. No entanto, a representação gráfica mais utilizada para série temporal é o gráfico de linhas, que você pode analisar no subcapítulo 5.3. 5.1 Apresentar outras estatísticas como a média ± desvio padrão (ao invés de frequência ou porcentagem). Observe a Figura 12, em que o eixo das ordenadas (eixo y) apresenta a média mais ou menos um desvio padrão do número de palavras recordadas por pessoas que participaram do grupo controle e que participaram do grupo experimental de uma pesquisa para melhoria da memória em pacientes com doença de Alzheimer. Figura 12. Média ± desvio padrão do número de palavras recordadas das pessoas do grupo experimental (fizeram tratamento para memória) e do grupo controle (não fizeram o tratamento). Vamos deixar a interpretação deste tipo de gráfico para o momento em que discutiremos as medidas de tendência central e dispersão em nossa disciplina 5.2 Apresentar uma série temporal ao invés de uma variável qualitativa. É muito comum o uso do gráfico de barras para apresentar uma série temporal, ou seja, uma observação acompanhada ao longo do tempo. Esse tipo de gráfico geralmente contém o tempo no eixo das abscissas (eixo x), que pode ser medido em dias, horas, meses, anos, e no eixo y a medida estatística, que pode ser frequência, porcentagem, média, etc.. Observe a Figura 13, em que o eixo y apresenta a taxa de juros embutida na venda de uma determinada mercadoria e o eixo x apresenta o período (em meses) dos 3 últimos anos. 25 Figura 13. Taxa de juros embutida na venda de uma determinada mercadoria. A interpretação deste tipo de gráfico tem como objetivo: a) verificar o período em que teve a medida mais alta ou mais baixa. b) verificar a tendência da medida ao longo do tempo, e se possível inferir o que acontecerá em períodos futuros. Uma possível interpretação seria: A taxa de juros foi mais alta em Novembro de 2011 e mais baixa em Agosto de 2012. Durante o período analisado, a taxa de juros oscilou entre 19% e 46%, tendo uma variação cíclica. O gráfico usado em série temporal pode ser de barras simples, como o da Figura 13, ou com barras múltiplas (ou empilhadas) como o apresentado na Figura 14. A Figura 14 contém um gráfico de barras empilhadas, em que o eixo x tem o período (em anos) e o eixo y tem o número da população, em milhões de pessoas, ou seja, a frequência, em cada classe social. A interpretação deste tipo de gráfico tem como objetivo: a) verificar o período em que teve a medida mais alta ou mais baixa. b) verificar a tendência da medida ao longo do tempo, e se possível inferir o que acontecerá em períodos futuros. c) comparar os grupos nos períodos 26 Figura 14. Distribuição da população por classes econômicas, em milhões de pessoas, no período de 2003 a 2009. Uma possível interpretação seria: A população brasileira aumentou constantemente no período de 2003 a 2009, estando com aproximadamente 190 milhões de habitantes em 2009.Houve um aumento da população nas classes A, B e C e consequentemente uma diminuição das classes D e E. Em todo o período analisado, a maior parte da população brasileira está concentrada na Classe C. 5.3. Série temporal representada em um Gráfico de linhas O gráfico de linhas é muito usado para apresentar uma série temporal. Em algumas situações, o gráfico de linhas apresenta uma frequência (ou uma porcentagem), que poderia também estar em um gráfico de barras. Pode também apresentar qualquer outra estatística, como taxas, médias, valores de venda, etc.. Observe a Figura 15. O gráfico foi elaborado por Waiselfisz (2012), em que foi feita uma análise da violência no Brasil. O eixo x contém o tempo (em anos) e o eixo y contém o número de homicídios em cada 100 mil habitantes (uma medida relativa semelhante à porcentagem). Nesta situação, o gráfico de linhas é mais indicado do que o gráfico de barras, pois permite comparar diferentes localidades (Brasil, Capitais + regiões metropolitanas e interior), sem prejudicar a visualização (o que aconteceria no gráfico de barras múltiplas). A interpretação deste tipo de gráfico tem como objetivo: a) verificar o período em que teve a medida mais alta ou mais baixa. b) verificar a tendência da medida ao longo do tempo, e se possível inferir o que acontecerá em períodos futuros. c) comparar os grupos nos períodos 27 Figura 15. Taxa de homicídio no período de 1980 a 2010. Agora é com você. Escreva uma interpretação para os dados da Figura 15. ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ ________________________________________________________________________________ 28 6. Construção de Gráfico em planilha eletrônica (Microsoft Excel) 6.1 Gráfico de Barras Para a construção do gráfico de barras no Excel, você precisa seguir os seguintes passos: a) Construir a tabela simples (uma variável qualitativa) ou tabela de dupla entrada (duas variáveis qualitativas) utilizando apenas a frequência ou a porcentagem. b) Selecionar a tabela c) No menu principal, selecionar Inserir. Na opção gráfico, selecionar colunas. Preferencialmente escolha o gráfico em 2D, pois permite a perfeita visualização da altura da barra. d) O gráfico que você obteve não tem os títulos dos eixos. Para colocá-los, clique na área gráfica, selecione a opção Design e escolhe um dos layouts apresentados. e) No gráfico de barras múltiplas ou emplilhadas, você pode trocar a variável do eixo com a variável da legenda. Para isto, clique na área gráfica com o botão direito do mouse, selecione a opção Selecionar Dados, clique em Alternar entre linha/coluna. f) Para arrumar a escala elaborada pelo Excel, você deve clicar com o botão direito do mouse sobre a escala, selecionar a opção Formatar Eixo, no item Opções de Eixo, manter o mínimo em zero e o valor máximo mais próximo do valor da maior frequência observada. Escolher a escala a ser utilizada na opção Unidade Principal. 6.2 Gráfico de Setores Para a construção do gráfico de setores em Excel, você precisa seguir os seguintes passos: a) Construir a tabela simples (uma variável qualitativa) utilizando apenas a frequência. b) Selecionar a tabela c) No menu principal, selecionar Inserir. Na opção gráfico, selecionar pizza. d) O gráfico que você obteve não tem o valor de cada fatia da pizza. Para colocá-los, clique com o botão direito do mouse sobre qualquer fatia da pizza. Escolha a opção Adicionar Rótulo de Dados. e) Para trocar o valor da frequência pelo valor da porcentagem em cada setor (fatia) do gráfico , clique com o botão direito do mouse sobre qualquer fatia da pizza. Escolha a opção Formatar Rótulo de Dados, Opções de Rótulo e trocar a seleção de Valor pela opção de Porcentagem. 6.3 Gráfico de linhas Para a construção do gráfico de linhas em Excel, você precisa seguir os seguintes passos: a) Construir a tabela com o tempo em uma coluna e as observações em outras colunas. Veja o modelo a seguir. brasil outras 2012 29 30 2013 33 40 2014 35 39 b) Selecionar a tabela c) No menu principal, selecionar Inserir. Na opção gráfico, selecionar linhas. Preferencialmente escolha o gráfico em 2D, pois permite mais facilmente a observação da estatística feita. d) O gráfico que você obteve não tem o título do eixo y. Para colocá-los, clique na área gráfica, selecione a opção Design e escolhe um dos layouts apresentados. 29 Exercícios Complementares dos Capítulos 3, 4 e 5 1. (UFRS 2011) Muitos brasileiros acessam a internet de banda larga via celular. Abaixo, está indicado, em milhões de pessoas, o número de brasileiros com acesso à internet de banda, fixa ou móvel, desde o início do ano de 2007 até março de 2010, segundo dados publicados na imprensa. Figura 16. Número de brasileiros (em milhões) com acesso à banda larga móvel e fixa, no período de 2007 até 2010. Com base nas informações, é correto afirmar que: a) O número de usuários da internet de banda larga fixa decresceu nesses anos. b) O número de usuários de cada uma das duas bandas largas cresceu igualmente nesses anos. c) Menos de 4% dos usuários de banda larga usavam a banda larga móvel em 2007. d) O número de usuários de banda larga móvel era de 50% do número dos usuários da banda larga fixa em 2009. e) O número de usuários de banda larga era menor que 23 milhões em março de 2010. 2. Ao se cadastrar em um site de comércio eletrônico, o usuário deve preencher um questionário com estas 8 perguntas: 1. Você tem computador em casa? 2. Quantas vezes por semana você acessa a internet? 3. Numa escala de 0 a 10, qual seu índice de confiança na segurança do comércio eletrônico? 4. Quantos cartões de crédito você possui? 5. A residência que você vive é própria ou alugada? 6. Qual é o provedor que você utiliza para acessar a rede? 7. Qual é o tempo médio de acesso à internet? 8. Já comprou algum produto via internet? Para cada uma das questões anteriores, classifique a variável como qualitativas ou quantitativas. 30 3. (UNICAMP 2013) A Figura 17 exibe, em porcentagem, a previsão da oferta de energia no Brasil em 2030, segundo o Plano Nacional de Energia. Figura 17. Previsão (em %) da oferta de energia no Brasil em 2030. Segundo o plano, em 2030, a oferta total de energia do país irá atingir 557 milhões de tep (toneladas equivalentes petróleo). Nesse caso, podemos prever que a parcela oriunda de fontes renováveis, indicada em cinza na figura, equivalerá a: a) 178,240 milhões de tep. b) 297,995 milhões de tep. c) 353,138 milhões de tep. d) 259,562 milhões de tep. e) 50,687 milhões de tep. 31 4. (UERJ 2013) Observe no gráfico o número de médicos ativos registrados no Conselho Federal de Medicina (CFM) e o número de médicos atuantes no Sistema Único de Saúde (SUS), para cada mil habitantes, nas cinco regiões do Brasil. Figura 18. Número de médicos (para cada mil habitantes) registrados no CFM e atuantes no SUS, distribuídos por região brasileira. O SUS oferece 1,0 médico para cada grupo de x habitantes. Na região Norte, o valor de x é aproximadamente igual a: a) 660 b) 1000 c) 1334 d) 1515 e) 1001 32 5. ENEM – O gráfico a seguir mostra as exportações brasileiras de carne suína, em mil toneladas, sinalizando forte tendência de queda no mês de março de 2006. A partir da análise do gráfico,julgue as afirmações abaixo. Figura 19. Exportação brasileira de carne suína (em mil toneladas) no período de Junho de 2005 a Março de 2006. I. Se fosse confirmada a tendência de queda apresentada no gráfico, em março de 2006 o Brasil teria exportado 15 milhões de quilogramas a menos do que exportou em fevereiro de 2006. II. A quantidade de carne exportada em outubro de 2005 foi o dobro da exportada em fevereiro de 2006. III. As exportações de agosto de 2005 e outubro de 2005 totalizaram 130 milhões de quilogramas de carne. É correto apenas o que se afirma em: a) I b) II c) III d) I e III e) I e II. 33 6. (ENEM) Para o cálculo da inflação, utiliza-se, entre outros, o índice Nacional de Preços ao Consumidor Amplo (IPCA), que toma como base os gastos das famílias residentes nas áreas urbanas, com rendimentos mensais compreendidos entre um e quarenta salários mínimos. O gráfico a seguir mostra as variações do IPCA de quatro capitais brasileiras no mês de maio de 2008. Com base no gráfico, qual item foi mais determinante para a inflação de maio de 2008: Figura 20. Variação do IPCA em Maio de 2008 nas principais capitais do pais. a) Alimentação e bebidas. b) Artigos de residência. c) Habitação. d) Vestuário. e) Transportes 34 7. Leia atentamente o gráfico 2.1, retirado de www.giorgiorenanporjustica.org/mapadaviolencia.htm e analise as afirmativas sobre ele. I) A maioria das mortes se deve a causas naturais. II) A maioria das mortes de jovens se devem a causas externas enquanto que a maioria das mortes de não jovens se deve a causas naturais. III) 37,1% das mortes violentas de jovens se devem a outros fatores não apresentados neste gráfico. IV) Quase metade das mortes violentas de jovens e não jovens são causadas pelos homicídios. V) Maioria dos jovens morrem de causas externas, com 39,7% devido aos homicídios. Com base nas afirmativas apresentadas, é correto apenas o que se afirma em: a) I e II b) I e III c) I e IV d) II, III e IV e) II, III e V http://www.giorgiorenanporjustica.org/mapadaviolencia.htm 35 Gabarito 1) Alternativa C. Total de usuários de banda larga: 0,3+ 7,7 = 8 milhões Fazendo a porcentagem, temos %75,3100. 8 3,0 , que é menor que 4%. 2) 1. Qualitativa 2. Quantitativa 3. Quantitativa 4. Quantitativa 5. Qualitativa 6. Qualitativa 7. Quantitativa 8. Qualitativa 3) Alternativa D Ao somar as porcentagens da parte cinza, temos: 9,1%+13,5% +18,5% + 5,5% = 46,6% Para calcular a energia oriunda de fontes renováveis, fazemos milhões562,259557. 100 6,46 4) Alternativa D Neste caso, na região Norte, para cada mil habitantes há 0,66 médicos oferecidos pelos SUS. Para saber o valor de x, que é a quantidade de habitantes para cada 1,0 médico, fazemos por regra de três simples 15,1515 66,0 1000 x . Usando o arredondamento, temos que x = 1515. 5) Alternativa D (I e III estão corretas, pois o dobro de carne exportada em relação a 2006 totaliza 75,2 (37,6 x 2), e em outubro de 2005 foram exportados 65,5 mi toneladas de carne). 6) Alternativa A. 7) Alternativa E 36 7. Gráfico e Tabela de distribuição de frequência para variável quantitativa 7.1 Variável quantitativa discreta com poucos valores diferentes A elaboração da tabela de distribuição de frequência para variável qualitativa é construída a partir da contagem do número de casos de cada categoria de resposta (exemplo: número de homens e número de mulheres). Vamos utilizar a mesma estratégia de trabalho para a variável quantitativa discreta que tem poucos valores diferentes na amostra, como por exemplo, número de filhos, número de copos d’água bebidos em um dia, etc.. Exemplo: Imagine que tenha sido feito a seguinte pergunta para 20 pessoas: Quantos “namorados oficiais” você já teve? Entenda como namorado oficial aquele em que você tenha se relacionado seriamente, por um período de tempo mais longo e com o aval da sua família. Os resultados da pesquisa estão apresentados na Tabela 6. Tabela 6 Número de “namorados oficiais” Número de namorados oficiais Frequência % Nenhum 10 50 Um 5 25 Dois 1 5 Três 4 20 Total 20 100 A Tabela 6 foi construída a partir da contagem do número de pessoas que respondeu que nunca teve namorado oficial, a contagem do número de pessoas que respondeu que teve um namorado oficial e assim sucessivamente. Após a contagem do número de pessoas em cada possibilidade de resposta, foi calculada a porcentagem. Os dados da Tabela 6 podem ser representados pelos gráficos de bastão ou de pontos (dispersão unidimensional ou dotplot), como podem ser vistos nas Figuras 21 e 22, respectivamente. 37 Figura 21. Número de namorados oficiais dos 20 entrevistados (gráfico de bastão) Figura 22. Número de namorados oficiais dos 20 entrevistados (gráfico de pontos) Como o Excel não faz nenhum desses dois gráficos, é aceitável o uso do gráfico de barras, como pode ser visto na Figura 23. 3210 número de namorados 38 Figura 23. Número de namorados oficiais dos 20 entrevistados (gráfico de barras) 7.2 Variável quantitativa contínua ou discreta com muitas valores diferentes Na elaboração da Tabela 6 foi contado o número de casos (pessoas) com nenhum namorado, com um namorado e assim sucessivamente. Se fosse utilizar a mesma metodologia para variável quantitativa discreta com muitos valores diferentes ou para variável quantitativa continua, tornar-se- ia inviável em 99% dos casos. Veja o seguinte exemplo. Exemplo: Imagine que você obteve o número da população ( em mil habitantes) de 28 municípios do Brasil e deseja representar graficamente esta informação: ROL do número de habitantes (em mil habitantes): 33, 33, 34, 37, 39, 40, 40, 41, 41, 42, 44, 47, 53, 55, 58, 61, 63, 66, 71, 92, 102, 109, 112, 117, 120, 130, 150, 179. 39 Tabela 7 Distribuição de freqüência (usando metodologia qualitativa) População ( em mil habitantes) freqüência 33 2 34 1 37 1 39 1 40 2 41 2 42 1 44 1 47 1 53 1 55 1 58 1 61 1 63 1 66 1 71 1 92 1 102 1 109 1 112 1 117 1 120 1 130 1 150 1 179 1 Total 28 O que você achou da Tabela 7? Está resumindo a informação de maneira a facilitar a leitura dos dados? Considerando que estivesse correta a Tabela 7, o gráfico de colunas deveria conter uma coluna para cada valor diferente da Tabela 7, mantendo a escala de 33 até 179 no eixo das abscissas (eixo x), como pode ser visto na Figura 24. 40 Figura 24. Distribuição da frequência da população de 28 municípios. E agora, o que você achou da Figura 24? Observe na Figura 24 que existem vários valores da variável (número de habitantes) com frequência 1, ou seja, apenas uma cidade apresentava determinado valor da variável. Isto torna inviável a interpretação da informação. Para facilitar a análise de dados quantitativos com muitos valores diferentes, faz-se necessário fazer o agrupamento dos dados em pequenos conjuntos, denominados classes, que são pequenos intervalos de dados, simbolizados por k. A reunião de todas as classes deve abranger todo o conjunto de dados. Existem muitas maneiras de se obter o número de classes (ou número de agrupamentos) para a elaboração da tabela de distribuição de frequência. Uma dessas maneiras é obter a raiz quadrada do número de observações da amostra, limitado entre 5 e 20 classes. Para o exemplo, o número total de municípios é 28. Portanto, 29,528 , o que nos permite utilizar 5 ou 6 agrupamentos (nesta situação não é necessárioseguir a regra de arredondamento, pois o resultado é uma sugestão do número de classes). Para facilitar a representação gráfica, é interessante que todas as classes da distribuição tenham o mesmo tamanho. Para isto, é necessário saber a variação total dos dados e dividi-la pelo número de classes que vamos trabalhar. 41 A variação total dos dados denomina-se Amplitude total que é o valor máximo da distribuição menos o valor mínimo da distribuição. Em linguagem simbólica, minmax xxAt . O tamanho da classe denomina-se Amplitude da classe e é representado por h. Portanto, podemos escrever que a amplitude da classe é determinada por k A h t . Se houver necessidade de arredondamento do valor obtido para h, faça-o sempre para valores maiores e coerentes com a tA . Para o exemplo, vamos elaborar CORRETAMENTE o gráfico e a tabela. 1) n= 28 k = 5 ou k = 6. 2) 14633179 tA 3) 2,29 5 146 k A h t ou ..333,24 6 146 k A h t . Em qualquer uma das situações, podemos usar um número um pouco maior que o obtido na equação, de maneira que possibilite a inclusão do maior valor da amostra (no exemplo, 179). 4) Podemos ter muitas tabelas diferentes de distribuição de frequência, mas vamos apresentar apenas dois exemplos. A Tabela 8 foi elaborada com 5 intervalos de amplitude 29,5 cada um (valor um pouco maior que o obtido na fórmula, que era 29,2), iniciando pelo menor valor (no exemplo, a cidade que tem 33 mil habitantes). A Tabela 9 foi elaborada com 6 intervalos de amplitude 24,5 cada um (valor um pouco maior que o obtido na fórmula, que era 24,333) , iniciando também pelo menor valor. Tabela 8 Distribuição da frequência das cidades de acordo com sua população (k = 5; h = 29,5) Classes freqüência 33,0 --- 62,5 62,5 --- 92,0 92,0 --- 121,5 121,5 --- 151,0 151,0 --- 180,5 Tabela 9 Distribuição da frequência das cidades de acordo com sua população ( k = 6; h = 24,5) Classes freqüência 33,0 --- 57,5 57,5 --- 82,0 82,0 --- 106,5 106,5 --- 131,0 131,0 --- 155,5 155,5 --- 180,0 42 Observando a Tabela 8, a primeira classe é determinada pelos valores 33 e 62,5, que representam, respectivamente, os limites inferior e superior da 1ª classe. A segunda classe é determinada pelos valores 62,5 e 92, que representam, respectivamente, os limites inferior e superior da 2ª classe. E assim sucessivamente, até a quinta e última classe, que tem como limite inferior o valor 151 e como limite superior o valor 180,5. Para completar as Tabelas 8 e 9, é necessário contar o número de cidades que tenham entre 33 e 62,5 mil habitantes, que representará a frequência da primeira classe da distribuição, contar o número de cidades que tenham entre 62,5 e 92 mil habitantes e assim sucessivamente. Se houver uma (ou mais) cidade(s) com exatamente 92 mil habitantes, devemos contá-la(s) na segunda ou na terceira classe? A resposta correta é na terceira classe, pois ao utilizar a notação matemática de intervalo devemos incluir os valores que coincidam com o limite inferior da classe e excluir os valores que coincidam com o limite superior da classe na contagem dos dados. Agora, podemos elaborar corretamente as tabelas de distribuição de frequência para a variável quantitativa número de habitantes de cidades brasileiras. Para facilitar a contagem, ou seja, obter a frequência de cada intervalo de classe, é interessante elaborar o rol dos dados, que é a ordenação (em ordem crescente ou decrescente) dos valores. ROL: 33, 33, 34, 37, 39, 40, 40, 41, 41, 42, 44, 47, 53, 55, 58, 61, 63, 66, 71, 92, 102, 109, 112, 117, 120, 130, 150, 179. A frequência da primeira classe é 16, pois contamos do número 33 até o número 61. A segunda classe tem frequência 3, pois foram consideradas as cidades que tinham 63, 66 e 71 mil habitantes. A terceira classe tem frequência 6, pois contamos os valores 92, 102, 109, 112, 117 e 120. E assim por diante. A Tabela 10 apresenta os dados com 5 classes ( k = 5) e amplitude de classe de 29,5 (h = 29,5). A Tabela 11 apresenta o exemplo de agrupamento com 6 classes ( k = 6) e amplitude de classe de 24,5 (h = 24,5). 43 Tabela 10 Distribuição da frequência das cidades de acordo com sua população Classes freq % Explicação 33,0 62,5 16 57 Inclui valores iguais ou maiores que 33, mas menores que 62,5. 62,5 92,0 3 11 Inclui valores iguais ou maiores que 62,5, mas menores que 92. 92,0 121,5 6 21 Inclui valores iguais ou maiores que 92, mas menores que 121.5. 121,5 1151,0 2 7 Inclui valores iguais ou maiores que 121.5, mas menores que 151 151,0 180,5 1 4 Inclui valores iguais ou maiores que 151, mas menores que 180,5. Total 28 100 Tabela 11 Distribuição da freqüência das cidades de acordo com sua população Classes freqüência % 33,0 57,5 14 50 57,5 82,0 5 18 82,0 106,5 2 7 106,5 131,0 5 18 131,0 155,5 1 4 155,5 180,0 1 4 Total 28 100 A partir das Tabelas 10 e 11 elaboram-se os gráficos de distribuição de frequência para variável quantitativa, denominados histograma (Figuras 25 e 26). Nestes gráficos, cada coluna representa uma classe, cuja altura é a frequência observada. As colunas devem ser, necessariamente, justapostas. 7.3 Interpretação do Histograma 33,0 57,5 82,0 106,5 131,0 155,5 180,0 Figura 25. Histograma das cidades de acordo com sua população. Figura 26. Histograma das cidades de acordo com sua população. 33 62,5 92 121,5 151 180,5 44 Quando usamos o histograma para descrever uma variável quantitativa, nosso interesse é a observação da maioria, para que possamos traçar um perfil da amostra. Vamos padronizar o uso do termo "maioria" quando se tratar de mais de 50% das observações (das pessoas da amostra). Para exemplificar, veja a interpretação das Figuras 25 e 26: interpretação da Figura 26 é: A maioria das cidades (57%) tem entre 33 e 62,5 mil habitantes. interpretação da Figura 27: Exatamente metade das cidades tem entre 33 e 57,5 mil habitantes. Além de descrever uma variável quantitativa, o histograma tem outras duas finalidades importantes: a estimativa da simetria da distribuição da variável em relação à sua média, que chamaremos aqui apenas de simetria 1 e o ajuste à uma distribuição de Probabilidade. Uma distribuição é denominada simétrica quando o valor da média, da moda e da mediana é o mesmo. A distribuição de Probabilidade será estudada posteriormente. Vamos utilizar o exemplo a seguir (notas de Matemática) para explicar essas duas finalidades ao mesmo tempo. Exemplo: As notas de Matemática de uma turma (fictícia) estão apresentadas na Figura 27. Vamos estimar a simetria e o ajuste à uma distribuição de Probabilidade. Na Figura 27 há uma grande concentração de notas em torno da média, ficando poucos alunos com notas muito baixas (0 a 2) ou muito altas (8 a 10). Este é um exemplo de simetria perfeita e de distribuição Normal de Probabilidade. Na prática, vamos encontrar histogramas com distribuições semelhantes ao da Figura 27, e vamos dizer que a distribuição é quase simétrica e se assemelha à Distribuição Normal. 1 Neste momento, nosso interesse é que você estime a simetria (ou assimetria) de uma distribuição a partir do formato do histograma. Se você tiver interesse em calcular o valor da assimetria, você pode estudar esse assunto no livro de Martins (2001, p. 59) ou no livro do Spiegel (1993, p. 139) 45Figura 27. Distribuição das notas da turma X de Matemática (distribuição simétrica) Agora já conhecemos o formato de uma distribuição simétrica. Agora, vamos entender o que é Assimetria (em relação à média), que se refere ao grau de afastamento de uma distribuição da unidade de simetria. São situações em que as observações não se distribuem igualmente acima e abaixo da média. Vejamos dois exemplos nas Figuras 28 e 29. A Figura 28 é um exemplo de distribuição assimétrica à direita, em que o valor da média é "arrastado para a direita" devido aos poucos valores mais altos. No exemplo, a média do valor pago por uma boa noite de sono é 240 reais, enquanto que a maioria das pessoas pagariam até 177 reais por uma boa noite de sono. A Figura 29 é um exemplo de distribuição assimétrica à esquerda, em que o valor da média é "arrastado para a esquerda" devido aos poucos valores mais baixos. No exemplo, a maioria das residências consome entre 380 e 430 Kwh de energia, mas a média está registrada em 368 kwh, abaixo do limite inferior do intervalo de classe que contém a maioria. 0 2 4 6 8 10 média da turma = 5 46 Figura 32. Distribuição dos valores pagos por uma boa noite de sono (distribuição assimétrica) Figura 33. Distribuição do consumo de energia elétrica (distribuição assimétrica) É importante observar que quando o número de observações da variável é muito pequeno ( n < 30), nem sempre é possível identificar visualmente se a distribuição é simétrica ou assimétrica. 0 177 354 531 708 885 1062 1239 média = 240 180 230 280 330 380 430 média = 368 47 7.4 Construção do Histograma em Planilha Eletrônica (Microsoft Excel) Para construir o histograma em Excel, você deve seguir os seguintes passos: a) Você construiu manualmente a tabela a seguir Classes frequência 33,0 57,5 14 57,5 82,0 5 82,0 106,5 2 106,5 131,0 5 131,0 155,5 1 155,5 180,0 1 Total 28 b) Em Excel, digite a tabela tal como se apresenta abaixo, ou seja, substitua a coluna que tem os intervalos de classe por qualquer código sequencial (1, 2, 3, ...) ou ( A, B, C, ..). Classes frequência A 14 B 5 C 2 D 5 E 1 F 1 Total 28 c) Solicite o gráfico de barras, tal como você fez com a variável qualitativa. Daí você vai obter um gráfico semelhante ao apresentado na Figura 30. Figura 30. Passo 2 para construção do histograma 48 d) Com o gráfico obtido (Figura 30), é necessário juntas as barras. Para isto, clique com o botão direito do mouse sobre qualquer barra do gráfico. Solicite “Formatar série de dados”, depois “Opções de Série”, coloque zero na largura do espaçamento. Você vai obter o gráfico da Figura 31. Figura 31. Passo 3 para a construção do histograma e) Agora é necessário arrumar o eixo x, inserindo os valores da variável (número de habitantes) representados pelos intervalos de classe. Para isto, você deve clicar com o botão direito sobre o eixo x e solicitar “Excluir”. Os dados da variável (A, B, C, ..) vão desaparecer, tal como mostrado na Figura 32. Figura 32. Passo 4 para a construção do histograma 49 f) Agora você vai fazer um trabalho artesanal. Copie o gráfico em um editor de texto (Word). Coloque uma caixa de texto sobre o eixo x, esticando-a de maneira a ficar do mesmo comprimento do gráfico. Você vai digitar os valores da variável (limites superior e inferior de cada classe) exatamente no início e término de cada barra. Você vai obter um gráfico idêntico à Figura 26. 50 Exercícios 1) Na Tabela 12 você encontra o rol do preço de uma sessão de terapia praticado por 70 profissionais de Psicologia Tabela 12 Custo de um sessão de terapia praticado por 70 psicólogos de uma cidade. 82 108 119 130 140 141 144 148 149 154 163 166 175 191 90 109 123 130 140 143 145 148 149 157 164 167 178 197 95 111 127 135 141 144 145 149 150 158 164 168 183 202 96 114 128 137 141 144 146 149 151 163 164 171 185 206 102 116 129 139 141 144 147 149 153 163 165 172 187 213 a) Determine o número de intervalos de classe ( K) para o preço de uma sessão de terapia; b) Determine a amplitude total (At) do preço de uma sessão de terapia; c) Determine a amplitude dos intervalos das classes ( h) para o preço de uma sessão de terapia; d) Construa a tabela de distribuição de frequência; e) Represente graficamente a tabela que você construiu no item d com um histograma. f) Faça uma interpretação de seu gráfico. g) Se possível, classifique a distribuição em simétrica ou assimétrica. 51 2) Foi perguntado a 48 pessoas que tem problemas para dormir: “Quanto você estaria disposto a pagar para ter uma boa noite de sono?” As respostas destas pessoas estão apresentadas na Tabela 13. Tabela 13 Rol das respostas sobre o valor que pagaria por uma boa noite de sono 0 50 100 150 500 0 50 100 180 700 0 50 100 200 1.000 0 50 100 200 1.000 0 50 100 200 1.000 10 50 100 300 1.000 10 50 100 300 1.000 25 75 100 300 1.237 30 80 100 400 50 90 100 500 Para esses dados: a) Determine o número de intervalos de classe ( K); b) Determine a amplitude total (At); c) Determine a amplitude dos intervalos das classes ( h); d) Construa a tabela de distribuição de frequência; e) Represente graficamente a tabela que você construiu no item d com um histograma. f) Faça uma interpretação de seu gráfico. g) Se possível, classifique a distribuição em simétrica ou assimétrica. 52 3) Observe os histogramas a seguir: O histograma que representa a distribuição de notas de uma turma de graduação em uma prova muito fácil e o histograma que representa à distribuição do último dígito da placa de carro (por exemplo, DYE0037, cujo ultimo digito é 7) são respectivamente: (a) Histogramas I e II (c) Histogramas I e IV (e) Histogramas II e III (b) Histogramas II e IV (d) Histogramas III e IV 4) Classifique os Histogramas I, II, III e IV do exercício anterior em simétrico ou assimétrico. Histograma I: _________________ Histograma II: ________________ Histograma III: _______________ Histograma IV: ________________ Histograma I Histograma II Histograma III Histograma IV 53 TAREFA 5 DA PESQUISA DE CAMPO = Tabelas e Gráficos para as variáveis quantitativas Seu grupo tem 3 variáveis quantitativas (idade e mais 2 perguntas sobre o tema escolhido). Para cada variável quantitativa: 1) Faça o rol da variável (colocar os valores em ordem crescente); 2) Se a variável tiver poucas possibilidades de resposta, como por exemplo, número de vezes por semana que faz atividade física, você pode optar por usar uma tabela simples (veja Tabela 6 do Capítulo 7) OU por um gráfico de barras simples. 3) Se a variável tiver muitas possibilidades de resposta ou for contínua, faça cada etapa a seguir: a) Calcule o número de intervalos de classe (k); b) Calcule a amplitude total (At); c) Calcule a amplitude dos intervalos de classe (h); d) Construa a tabela de distribuição de frequências; e) Elabore o histograma; 4) Interprete sua tabela OU gráfico; 5) Se possível, verifique se a distribuição é simétrica ou assimétrica 6) A tabela e o gráfico devem seguir as normas aqui explicadas. 7) Para as variáveis que você utilizou tabela simples ou gráfico de barras simples, obrigatoriamente apresentar atarefa digitada. Se você utilizou um histograma, preferencialmente fazê-lo em Excel. 8) Entregar a Tarefa 5 para a professora, na data estipulada. Lembre-se que será avaliada e uma nota será atribuída. Antes de entregar esta tarefa, verifique se sua Tabela: 1) tem número e título. 2) tem formatação correta (somente linhas para separar cabeçalho e linha de total) 3) tem frequência e porcentagem 4) tem interpretação Antes de entregar esta tarefa, verifique se seu Gráfico: 1) tem número e título. 2) tem escala adequada 3) tem interpretação 54 Exercícios Complementares 1) A seguir estão apresentadas as notas de 50 alunos, em uma escala de zero a cem: 33 41 50 55 61 66 71 77 84 91 35 42 52 57 64 66 73 77 85 94 35 45 53 59 65 67 73 78 85 94 39 47 54 60 65 68 74 80 88 95 41 48 55 60 65 69 76 81 89 98 Pede-se: a) Determinar a amplitude total (At) da amostra; b) Determinar o número de intervalos de classes (k); c) Determinar a amplitude dos intervalos de classe (h); d) Elaborar a tabela de distribuição de frequência; e) Elaborar o histograma. f) Analisar o histograma. g) Se possível, classifique a distribuição em simétrica ou assimétrica 2) Uma companhia aérea aceita reservas de voo por telefone. Os seguintes dados mostram a duração das chamadas (em minutos) para uma amostra de 20 reservas feitas por telefone. Construa a distribuição de frequência para os dados. Elabore o histograma e analise-o. Se possível, classifique a distribuição em simétrica ou assimétrica. 2,1 4,5 5,3 6,0 2,4 4,8 5,4 6,1 3,8 4,8 5,4 7,8 3,9 4,8 5,5 10,4 4,0 5,3 5,7 10,5 55 3) Abaixo estão relacionados os preços de um determinado produto dietético observado em 85 estabelecimentos. a) Elaborar a tabela de distribuição de frequência absoluta ( para isso, calcular o valor de k, At e h); b) Apresentar graficamente os dados do item a com um histograma e interpretá-lo. c) Se possível, classifique a distribuição em simétrica ou assimétrica. 10,00 21,00 24,00 28,00 37,00 13,00 22,00 24,00 28,00 38,00 15,00 22,00 24,00 28,00 38,00 15,00 22,00 24,00 28,00 38,00 16,00 22,00 24,00 28,00 38,00 16,00 22,00 25,00 28,00 39,00 17,00 22,00 25,00 29,00 40,00 17,00 23,00 25,00 29,00 42,00 18,00 23,00 26,00 29,00 43,00 19,00 23,00 26,00 29,00 43,00 19,00 23,00 26,00 29,00 44,00 20,00 23,00 27,00 30,00 44,00 20,00 23,00 27,00 30,00 47,00 21,00 23,00 27,00 34,00 47,00 21,00 23,00 27,00 34,00 50,00 21,00 23,00 28,00 35,00 51,00 21,00 24,00 28,00 36,00 51,00 56 4) Observe o histograma, que indica o número de matriculas na rede pública do Distrito Federal, no período de 1960 a 2009. I. Podemos afirmar que o número de matrículas só aumentou de 1960 até 2009. II. Embora houve um crescimento acentuado de matrículas da década de 1960 até 2009, pode-se perceber que há uma pequena diminuição do número de alunos na rede em 1987. III. A partir do ano 2000, houve queda no número de alunos matriculados no Distrito Federal. IV. Podemos afirmar que no ano 2000, mais de 600.000 alunos foram matriculados na rede pública do Distrito Federal. Com base nas afirmativas acima, é correto apenas o que se afirma em: a) I e II b) I e III c) II e III d) II, III e IV e) I, III e IV. 57 Gabarito Exercício 1 a) Amplitude total = At = 98 - 33 = 65 b) 1,750 k . Logo, k = 7 (7 colunas ) ou k = 8 (8 colunas) c) Se k = 7, 3,9 7 65 h . Se k = 8, 2,8 8 65 h d) Tabelas 14 ou 15 Tabela 14 Distribuição das notas dos alunos (k = 7; h = 9,3) Classes frequência % 33,0 42,3 7 14 42,3 51,6 4 8 51,6 60,9 9 18 60,9 70,2 10 20 70,2 79,5 8 16 79,5 88,8 6 12 88,8 98,1 6 12 Total 50 100 Tabela 15 Distribuição das notas dos alunos ( k = 8; h = 8,2) Classes frequência % 33,0 41,2 6 12 41,2 49,4 4 8 49,4 57,6 7 14 57,6 65,8 8 16 65,8 74,0 8 16 74,0 82,2 7 14 82,2 90,4 5 10 90,4 98,6 5 10 Total 50 100 58 e) histograma para k = 7, h = 9,3(para Tabela 14) f) Interpretação do histograma (k = 7 e h = 9,3) A turma é bastante heterogênea, tendo alunos com notas distribuídas de maneira semelhante de 33 até 98,1, havendo maioria dos alunos com notas entre 51,6 até 79,5. e) histograma para k = 8, h = 8,2 (para Tabela 15) f) Interpretação do histograma (k = 8 e h = 8,2) A turma é bastante heterogênea, tendo alunos com notas distribuídas de maneira semelhante de 33 até 98,1, havendo uma maior frequência dos alunos com notas entre 57,6 até 74,0. g) Não é possível classificar a distribuição em simétrica ou assimétrica. 33 42,3 51,6 60,9 70,2 79,5 88,8 98,1 33 41,2 49,4 57,6 65,8 74,0 82,2 90,4 98,6 59 Exercício 2) a) Amplitude total = At = 10,5 - 2,1 = 8,4 b) 5,420 k . Logo, k = 5 (5 colunas ) que é o mínimo recomendável c) Com k = 5, 7,168,1 5 4,8 h . d) Tabela 16 Distribuição do tempo para fazer reserva de voo Classes frequência % 2,1 3,8 2 10 3,8 5,5 11 55 5,5 7,2 4 20 7,2 8,9 1 5 8,9 10,6 2 10 Total 20 100 e) histograma do tempo de ligação para efetuar a reserva em voo. Interpretação: A maioria das ligações duraram entre 3,8 e 5,5 minutos para efetuar a reserva de voo. A distribuição do tempo de duração das ligações tem distribuição aproximadamente assimétrica à direita. 2,1 3,8 5,5 7,2 8,9 10,6 60 Exercício 3) a) Amplitude total = At = 51 - 10 = 41 2,985 k . Logo, k = 9 (9 colunas ) ou k = 10 (10 colunas) Com k = 9, 6,4 9 41 h (Tabela 17). Com k = 10, 1,4 10 41 h (usar 4,2 para que a última classe contemple o maior valor) (Tabela 18) b) Histograma e sua interpretação para Tabela 17 Interpretação: A maioria dos estabelecimentos cobra entre 19,2 e 28,4 reais pelo produto dietético. Tabela 17 Distribuição dos preços dos produtos (k = 9; h = 4,6) Classes frequência % 10,0 14,6 2 2,4 14,6 19,2 9 10,6 19,2 23,8 22 25,9 23,8 28,4 24 28,2 28,4 33,0 7 8,2 33,0 37,6 5 5,9 37,6 42,2 7 8,2 42,2 46,8 4 4,7 46,8 51,4 5 5,9 Total 85 100,0 10 14,6 19,2 23,8 28,4 33,0 37,6 42,2 46,8 51,4 61 OU b) Histograma e sua interpretação (para Tabela 18) Interpretação: A maioria dos estabelecimentos cobra entre 18,4 e 31,0 reais pelo produto dietético. c) A distribuição é aproximadamente assimétrica à direita. 4) Alternativa C Tabela 18 Distribuição dos preços dos produtos ( k = 10; h = 4,2) Classes frequência % 10,0 14,2 2 2,4 14,2 18,4 7 8,2 18,4 22,6 15 17,6 22,6 26,8 21 24,7 26,8 31,0 19 22,4 31,0 35,2 3 3,5 35,2 39,4 7 8,2 39,4 43,6 4 4,7 43,6 47,8 4 4,7 47,8 52,0 3 3,5 Total 85 100,0 62 8. Média, Variância, Desvio Padrão e Coeficiente de Variação A análise exploratória de dados compreende a interpretação de uma realidade por meio de representações gráficas e/ou pelas medidas que resumem um conjunto de dados, que são as medidas de tendência central e as medidas de dispersão. As medidas de tendência central mais conhecidas são a média aritmética, a mediana e a moda. A medida de dispersão mais conhecida é o desvio padrão. Vamos estudar algumas medidas de tendência central e de dispersão. 8.1 Moda A moda é o valor que mais se repete em uma amostra. Em algumas amostras, a moda é muito útil para representá-la, mas em muitas outras amostras, a moda não contribuiu para a interpretação
Compartilhar