Baixe o app para aproveitar ainda mais
Prévia do material em texto
1/10 Probabilidade e Estatística 1º. Semestre de 2015 Exercício Programado 2 – Versão para o Tutor Profa. Keila Mara Cassiano (UFF) Nos Exercícios Programados 2 a 4, você analisará o conjunto de dados apresentado ao final deste exercício utilizando as ferramentas de análise apresentadas nas aulas de 1 a 4. Em cada exercício você fará uma parte da análise e ao final você deverá ser capaz de entender os passos necessários para a resolução de problemas práticos envolvendo a análise exploratória de dados. O Departamento de Vendas de uma grande empresa está estudando a possibilidade de disponibilizar um serviço de venda dos seus produtos pela Internet. Para estudar a viabilidade de tal projeto, ela precisa saber a opinião dos clientes e obter algumas informações relevantes. Para isso, ela elabora um questionário cuja parte inicial é apresentada a seguir e faz o levantamento junto a alguns clientes. Nesse questionário, os números entre colchetes indicam a codificação numérica da resposta. Em geral, as respostas são armazenadas em formato numérico nos sistemas computacionais. Ao final do exercício você tem os dados relativos a 40 questionários. Esses dados estão em forma de tabela, em que cada linha representa um questionário (cliente) diferente. Na verdade, esse é o formato de um banco de dados: cada coluna representa uma variável e cada linha, uma observação. Suponha que você seja o responsável pela apresentação e análise dos resultados. Para isso você deve começar organizando os dados. 1) Identifique as variáveis do estudo, classificando-as corretamente (qualitativa, quantitativa discreta ou quantitativa contínua). 2) Para cada uma das variáveis qualitativas do estudo, construa tabelas e gráficos que consolidem as informações desejadas. 3) Construa gráficos apropriados para comparar as pessoas com e sem curso superior com relação à posse de computador. 4) Construa gráficos apropriados para comparar homens e mulheres com relação ao hábito de fazer compras pela Internet. 5) Para a variável “Valor das Compras”, construa uma tabela de freqüências utilizando as seguintes classes: (0,100]; (100;200]; (200;500]; (500;1000]; (1000;1500] 6) Construa diagramas de ramos e folhas para as variáveis “Número de horas semanais de navegação na Internet” e “Idade”. 2/10 7) (AD1 – Questão 1) – (2,5 pontos)* O Polígono de Freqüências abaixo refere-se a uma distribuição de salários de uma determinada empresa. Construa a tabela de distribuição de freqüências (simples: absoluta e percentual) e (acumulada: absoluta e percentual) que originou este gráfico. 3/10 Parte 1: Uso de computadores 1. Você tem computador em casa? Sim [ 1 ] Não [ 2 ] Em caso negativo, responda à Questão 2 e pule para a Parte 2. Em caso afirmativo, pule para a Questão 3. 2. Por que? Falta de interesse [ 1 ] Falta de recursos [ 2 ] Outro motivo [ 3 ] Especifique 3. Você tem acesso à Internet em sua casa? Sim [ 1 ] Não [ 2 ] Em caso negativo, responda à Questão 4 e pule para a Parte 2. Em caso afirmativo, pule para a Questão 5. 4. Por que? Falta de interesse [ 1 ] Falta de recursos [ 2 ] Outro motivo [ 3 ] Especifique 5. 6. Sim [ 1 ] Não [ 2 ] Em caso negativo, pule para a Parte 2. 7. Qual foi o valor gasto nas compras efetuadas nos dois últimos meses? Parte 2: Dados pessoais 8. Sexo Masculino [ 1 ] Feminino [ 2 ] 9. Você tem diploma de curso superior? Sim [ 1 ] Não [ 2 ] 10. Por favor, você poderia me informar a sua idade? 11. Por favor, indique sua faixa de renda pessoal mensal [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ] Aproximadamente, quantas horas por semana você navega pela Internet? (informe um número inteiro) OBRIGADA POR SUA PARTICIPAÇÃO! Nos últimos dois meses você fez compras pela Internet? Menos de R$ 500 R$ 500 a R$ 1000 R$ 5000 a R$ 10.000 R$ 3000 a R$ 5000 Acima de R$ 10.000 R$ 1000 a R$ 3000 4/10 Banco de Dados com 40 questionários Num.Quest. Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 Q11 1 1 -1 1 -1 55 1 230 1 1 29 3 2 1 -1 1 -1 15 2 -1 1 2 35 4 3 1 -1 2 1 -1 -1 -1 1 2 43 4 4 1 -1 1 -1 32 1 950 2 1 62 5 5 2 1 -1 -1 -1 -1 -1 1 2 35 4 6 2 2 -1 -1 -1 -1 -1 2 2 27 3 7 2 1 -1 -1 -1 -1 -1 2 2 19 1 8 1 -1 1 -1 12 2 -1 2 1 16 1 9 1 -1 2 2 -1 -1 -1 1 2 32 4 10 2 1 -1 -1 -1 -1 -1 1 2 18 2 11 1 -1 1 -1 120 1 120 2 1 45 3 12 1 -1 1 -1 45 1 240 1 1 25 4 13 1 -1 2 2 -1 -1 -1 2 1 36 5 14 1 -1 1 -1 15 2 -1 2 1 18 1 15 1 -1 1 -1 39 1 1100 2 2 55 5 16 1 -1 1 -1 55 1 260 1 1 52 6 17 2 1 -1 -1 -1 -1 -1 1 2 65 5 18 1 -1 1 -1 120 1 320 1 1 48 4 19 1 -1 1 -1 39 1 580 2 1 45 5 20 1 -1 1 -1 40 2 -1 2 2 26 3 21 1 -1 1 -1 60 2 -1 2 1 32 4 22 2 3 -1 -1 -1 -1 -1 1 2 18 2 23 1 -1 1 -1 12 1 150 1 1 52 5 24 1 -1 1 -1 65 1 400 2 1 47 4 25 2 2 -1 -1 -1 -1 -1 2 2 41 4 26 2 2 -1 -1 -1 -1 -1 2 2 36 3 27 1 -1 1 -1 145 1 100 2 1 28 3 28 1 -1 1 -1 15 1 25 1 1 24 2 29 1 -1 2 2 -1 -1 -1 1 1 31 3 30 2 2 -1 -1 -1 -1 -1 1 1 26 4 31 1 -1 1 -1 25 2 -1 1 1 52 5 32 1 -1 1 -1 39 1 1200 2 1 49 6 33 2 3 -1 -1 -1 -1 -1 1 2 32 5 34 1 -1 1 -1 40 1 820 1 1 31 4 35 1 -1 1 -1 65 2 -1 2 1 45 3 36 1 -1 1 -1 85 1 150 2 2 56 3 37 2 2 -1 -1 -1 -1 -1 1 2 43 4 38 1 -1 1 -1 72 2 -1 1 1 19 2 39 2 1 -1 -1 -1 -1 -1 1 1 20 1 40 1 -1 2 2 -1 -1 -1 1 1 22 2 5/10 Comentários sobre a solução do Exercício Programado 2 Antes de passar à solução propriamente dita, você deve fazer os seguintes comentários sobre o problema. Primeiro, chame a atenção para a estrutura de salto do questionário. Essa é uma situação bastante comum na prática. Para facilitar a visualização, você pode apresentar o seguinte fluxograma (um fluxograma é bastante útil durante o treinamento dos entrevistadores, no caso de entrevista presencial): Q1 Q2 Q3 Parte 2: Q8: Sexo Não Sim Q9: C.Sup. Q10: Idade Q11: Renda Q4 Q5 Parte 2: Q6 Q8: Sexo Q9: C.Sup. Q10: Idade Q11: Renda Não Sim Parte 2: Q7 Q8: Sexo Q9: C.Sup. Q10: Idade Q11: Renda Parte 2: Q8: Sexo Q9: C.Sup. Q10: Idade Q11: Renda Horas de Navegação Não Sim Por que? Por que? Valor Computador em casa? Internet? Compras? Chame a atenção para a questão da codificação das variáveis. Um ponto interessante é o seguinte: embora para efeitos de cálculos a codificação 0-1 seja mais prática para as variáveis binárias, alguns programas computacionais estatísticos não aceitam o valor 0 na codificação. É interessante salientar também que, nesse tipo de pesquisa não é comum perguntar-se a idade exata da pessoa; além de pouco educado, essa informação não precisa ser tão detalhada. Em pesquisas de mercado, normalmente trabalha-se com faixas etárias. No exercício, estamos usando o valor exato para termos mais exemplos de variáveis quantitativas. 6/10 SOLUÇÃO DO EXERCÍCIO PROGRAMADO 2 Questão 1 As variáveis são: Q1: Posse de computador – Qualitativa Q2: Razão para não ter computador – Qualitativa Q3: Acesso à Internet – Qualitativa Q4: Razão para não ter Internet – Qualitativa Q5: Horas semanais de navegação – Quantitativa discreta (porque foi solicitado que se informasse um número inteiro) Q6: Indicador de compras na Internet – Qualitativa Q7: Valor das compras – Quantitativa contínua Q8: Sexo – Qualitativa Q9: Posse de diploma de curso superior – Qualitativa Q10: Idade – Quantitativa discreta Q11: Faixa de renda – Qualitativa ordinal (existe uma ordenação das classes) 7/10 Questão 2 Absoluta Relativa % Sim 28 70,0 Não12 30,0 Total 40 100,0 Absoluta Relativa % Falta de interesse 5 41,67 Falta de Recurso 5 41,67 Outra 2 16,67 Total 12 100,00 Absoluta Relativa % Sim 23 82,14 Não 5 17,86 Total 28 100,00 Absoluta Relativa % Falta de interesse 1 20,0 Falta de Recurso 4 80,0 Outra 0 0,0 Total 5 100,0 Tabela 1 Computador em casa Freqüência Freqüência Tabela 2 Razão para não ter computador em casa Razão para não ter Internet Freqüência Tabela 3 Acesso à Internet Freqüência Tabela 4 Computador em casa 0 5 10 15 20 25 30 Sim Não N ú m e ro d e p e s s o a s Razão para não ter computador em casa 0 10 20 30 40 50 Falta de interesse Falta de Recurso Outra F re q u ê n c ia p e rc e n tu a l Acesso à Internet 0 5 10 15 20 25 Sim Não N ú m e ro d e p e s s o a s Razão para não ter Internet 0 20 40 60 80 100 Falta de interesse Falta de Recurso Outra F re q u ê n c ia p e rc e n tu a l 8/10 Solução da Questão 2 - continuação Absoluta Relativa % Sim 15 53,57 Não 8 28,57 Total 23 82,14 Absoluta Relativa % Masculino 22 55,0 Feminino 18 45,0 Total 40 100,0 Absoluta Relativa % Sim 24 60,0 Não 16 40,0 Total 40 100,0 Absoluta Relativa % Menos de R$ 500 4 10,0 R$ 500 a R$ 1000 5 12,5 R$ 1000 a R$ 3000 9 22,5 R$ 3000 a R$ 5000 12 30,0 R$ 5000 a R$ 10.000 8 20,0 Acima de R$ 10.000 2 5,0 Total 40 100,0 Sexo do entrevistado Freqüência Tabela 5 Compras pela Internet Freqüência Tabela 6 Freqüência Tabela 7 Diploma de Curso Superior Freqüência Tabela 8 Faixa de Renda Compras pela Internet nos últimos 2 meses 0 5 10 15 20 Sim Não N ú m e ro d e p e s s o a s Diploma de Curso Superior 0 5 10 15 20 25 30 Sim Não N ú m e ro d e p e s s o a s Compras pela Internet nos últimos 2 meses 0 5 10 15 20 25 Masculino Feminino N ú m e ro d e p e s s o a s Faixa de renda dos entrevistados 0 2 4 6 8 10 12 14 Menos de R$ 500 R$ 500 a R$ 1000 R$ 1000 a R$ 3000 R$ 3000 a R$ 5000 R$ 5000 a R$ 10.000 Acima de R$ 10.000 N ú m e ro d e p e s s o a s 9/10 Questões 3 e 4 Veja tabelas e figuras a seguir. É importante, aqui, comentar sobre a construção da tabela. Como são 2 variáveis, a tabela tem que ser bivariada. Em cada célula temos a freqüência conjunta, ou seja, a freqüência relativa ao cruzamento das categorias das 2 variáveis. Assim, 22 pessoas têm curso superior E computador em casa; 6 pessoas não têm curso superior E têm computador em casa, etc. Como queremos comparar as pessoas com e sem curso superior, a melhor forma de calcular as percentagens (ou freqüências relativas) é trabalhando o grupo dos que têm curso superior e depois o grupo dos que não têm curso superior. Seria possível também calcular as percentagens em relação ao total da linha, mas não ilustraria tão bem a nossa questão de interesse. Olhando a tabela e o gráfico, podemos ver claramente que a grande maioria das pessoas que têm curso superior também tem computador. No grupo dos que não têm curso superior, essa diferença já não é tão acentuada. Comentários análogos valem para a questão do Sexo versus Compras na Internet. Sem computador 2 10 Com computador 22 6 Total 24 16 Sem computador 8,3333 62,5000 Com computador 91,6667 37,5000 Total 100,0000 100,0000 Comprou 8 7 Não comprou 5 3 Total 13 10 Comprou 61,5385 70,0000 Não comprou 38,4615 30,0000 Total 100,0000 100,0000 Com Curso Sup. Sem Curso Sup. Homens Mulheres Compras pela Internet por Sexo Homens Mulheres Com Curso Sup. Sem Curso Sup. Tabela 9 Posse de Computador por Portador de Diploma Tabela 10 0 5 10 15 20 25 Com Curso Sup. Sem Curso Sup. N úm er o de p es so as Sem computador Com computador 0 1 2 3 4 5 6 7 8 9 Comprou Não comprou N úm er o de p es so as Homens Mulheres Questão 5 Valor das Compras Absoluta Relativa Absoluta Relativa (0,100] 2 13,33 2 13,33 (100,200] 3 20,00 5 33,33 (200,500] 5 33,33 10 66,67 (500,1000] 3 20,00 13 86,67 (1000,1500] 2 13,33 15 100,00 Total 15 100,00 Freqüência AcumuladaFreqüência Simples 10/10 Questão 6 Horas de navegação na Internet 1 2 2 5 5 5 2 5 3 2 9 9 9 4 0 0 5 5 5 5 6 0 5 5 7 2 8 5 9 10 11 12 0 0 13 14 5 IDADE 1 6 8 8 8 9 9 2 0 2 4 5 6 6 7 8 9 3 1 1 2 2 2 5 5 6 6 4 1 3 3 5 5 5 7 8 9 5 2 2 2 5 6 6 2 5
Compartilhar