Prévia do material em texto
1 MATERIAL DE APOIO EXERCÍCIOS DE FIXAÇÃO ESTATÍSTICA DESCRITIVA - EXERCÍCIOS 1. Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos de uma turma do ensino médio da Escola A 4 2 1 0 3 1 2 0 2 1 0 2 1 1 0 4 3 2 3 5 8 0 1 6 5 3 2 1 6 4 3 4 3 2 1 0 2 1 0 3 (a) Classifique a variável. (b) Organize os dados em uma tabela adequada (distribuição de frequências para dados não agrupados). (c) Qual o percentual de alunos que adquiriram menos do que 3 livros? (d) Qual o percentual de alunos que adquiriram pelo menos 4 livros? (e) A partir do item (b), quantos livros foram adquiridos pelos 40 alunos? 2. O revisor de um jornal fez, durante um mês, o levantamento dos erros ortográficos encontrados no editorial do jornal. Os resultados encontrados foram: 0 1 0 1 0 0 0 0 2 3 0 1 2 3 4 0 0 0 1 4 1 1 0 0 3 5 1 0 0 1 (a) Faça um quadro com a distribuição de frequência dos dados (dados não agrupados em classes). (b) Calcule as medidas de tendência central. (c) Calcule as medidas de dispersão. Procedimento Excel Dados →Análise de dados → Estatística descritiva → Resumo estatístico 2 Saída do Excel Coluna 1 Média 1,133 Erro padrão 0,265 Mediana 1 Moda 0 Desvio padrão 1,455 Variância da amostra 2,119 Curtose 0,621 Assimetria 1,261 Intervalo 5 Mínimo 0 Máximo 5 Soma 34 Contagem 30 3. Durante certo período de tempo as taxas de juros para dez ações foram as abaixo registradas: Ação 01 02 03 04 05 06 07 08 09 10 Taxa % 2,59 2,64 2,60 2,62 2,55 2,61 2,50 2,63 2,64 2,69 3 Calcule: (a) a taxa média; (b) a taxa mediana; (c) a taxa modal; (d) o desvio padrão das taxas; (e) o coeficiente de variação das taxas. Saída do Excel Média 2,607 Mediana 2,615 Moda 2,64 Desvio padrão 0,052 Variância da amostra 0,002 Curtose 1,171 Assimetria -0,726 Mínimo 2,5 Máximo 2,69 Contagem 10 Coeficiente de Variação 0,020 4. Abaixo são mostrados os saldos médios de 48 contas de clientes do Banco Novo S.A. (dados brutos em US$ 1,00) 450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275 600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650 150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270 (a) Agrupe os dados em uma distribuição de frequências. (b) Determine as frequências relativas: simples e acumulada. (c) Apresente o histograma de frequências relativas. (d) Calcule média, mediana e moda. Interprete. 5. Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em educação, por habitante, realizado pelas prefeituras. De uma amostra de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Cidade A B C D E F G H I J Investimento 35 26 24 20 29 25 29 26 29 28 a) Calcule a média e a mediana das observações. b) Receberão um programa especial as cidades com valores de investimento inferiores à média menos duas vezes o desvio padrão. Alguma cidade da amostra receberá o programa? 6. Desejamos estudar o número de erros de impressão de um livro. Para isso foram escolhidas aleatoriamente 50 páginas entre as 500 páginas desse livro e anotados o número de erros de impressão observados por página, resultando na tabela abaixo: 4 Número de erros 0 1 2 3 4 frequência 30 15 3 1 1 Determinar para a variável estudada (número de erros): (a) média (b) moda (c) mediana (d) desvio padrão (e) quantos erros de impressão, aproximadamente, possui o livro? (f) qual a interpretação para a segunda frequência cumulada crescente? (Fac) 7. Um grupo de 600 hóspedes do Hotel Mary Posa & Cia. Ltda. apresenta os seguintes valores com relação ao tempo de permanência no hotel. Média 9 dias 1º Quartil 5 dias 3º Quartil 15 dias Coeficiente de variação 20% Pede-se: a) quantos hóspedes permaneceram mais de 15 dias b) quantos hóspedes permaneceram entre 5 e 15 dias c) o desvio-padrão para o tempo de permanência 8. Os 20 alunos de uma turma especial de Estatística obtiveram as notas abaixo: 84 88 78 80 89 94 95 77 81 90 83 87 91 83 92 90 92 77 86 99 Determine: (a) A amplitude total das notas (b) O desvio padrão das notas (c) A variância absoluta das notas (d) O coeficiente de variação (e) A proporção de alunos com notas maiores que 90 (f) A média, sabendo que o professor acrescentou 5 pontos para cada aluno (g) O desvio padrão, quando foi adicionado 5 pontos 9. Consideremos os seguintes valores brutos que representam a idade da primeira habilitação de uma amostra de 13 alunos: 18 19 18 20 19 22 22 20 22 19 22 21 22 (a) Reorganize os dados numa distribuição de frequência por valores simples. (b) Calcule média, moda e mediana. (c) Calcule o coeficiente de variação. 10. De acordo com a Annual Consumer Spending Survey de 2003 a cobrança mensal média no cartão de crédito Visa do Bank of America foi de $1.838 (U.S Airways Attaché Magazine, dezembro de 2003). Uma amostra dos gastos mensais de cartões de crédito apresenta os seguintes dados: 5 236 1710 1351 825 7450 11572 316 4135 1333 1584 387 7755 991 3396 170 1428 1688 7673 (a) Calcule a média e a mediana. (b) Calcule a amplitude. (c) Calcule a variância e o desvio padrão. (d) A medida de assimetria desses dados é 2,12. Comente a forma dessa distribuição. 11. Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da CORSAN. 36 6 22 11 34 40 16 26 23 31 27 10 38 17 13 45 25 50 18 23 35 22 30 14 18 20 13 24 35 29 33 48 20 12 31 39 17 58 19 16 12 21 15 12 20 51 12 19 15 41 29 25 13 23 32 14 27 43 37 21 28 37 26 44 11 53 38 46 17 36 28 49 56 19 11 (a) Organize os dados numa distribuição de frequência com 9 classes de amplitudes iguais. (b) A partir da distribuição de frequência construída no item anterior, determine e interprete: f3; fr4; F5; Fr6. (c) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (d) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (e) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos) (f) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 0 1000 2000 3000 4000 5000 6000 7000 8000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Gastos com cartão de crédito 6 Distribuição de frequências com 9 classes Consumo de água Xi No de contas fi fri fri acum Fi↓ Fi↑ Xifi Xi2fi [(𝑿𝒊 − �̅�)𝟑] × 𝒇𝒊 [(𝑿𝒊 − �̅�)𝟒] × 𝒇𝒊 6 I– 12 9 5 0,067 0,067 5 75 45 405 -31147,52 573114,37 12 I– 18 15 16 0,213 0,280 21 70 240 3600 -30505,98 378274,2 18 I– 24 21 15 0,200 0,480 36 54 315 6615 -3932,16 25165,824 24 I– 30 27 11 0,147 0,627 47 39 297 8019 -0,704 0,2816 30 I– 36 33 9 0,120 0,747 56 28 297 9801 1580,544 8851,0464 36 I– 42 39 8 0,107 0,853 64 19 312 12168 12487,168 144851,15 42 I– 48 45 4 0,053 0,907 68 11 180 8100 21807,104 383805,03 48 I– 54 51 5 0,067 0,973 73 7 255 13005 65721,28 1551022,2 54 I– 60 57 2 0,027 1,000 75 2 114 6498 51868,672 1535312,7 ∑ 75 1 2055 68211 87878,4 4600396,8 Saída do Excel Consumo Média 27 Erro padrão 1,4694 Mediana 25 Modo 12 Desvio padrão 12,7258 Variância da amostra 161,9459 Curtose -0,5198 Assimetria 0,5886 Intervalo 52 Mínimo 6 Máximo 58 Soma 2025 Contagem 75 712. Considere os dados sobre o consumo mensal de feijão do tipo mulatinho em determinada família (em kg.) Nº Classes Xi fi Fac ↓ fri fri ac ↓ Xifi Xi2fi 1 2,75 I– 2,80 2,775 2 5,55 15,40 2 2,80 I– 2,85 2,825 3 8,48 23,94 3 2,85 I– 2,90 2,875 10 28,75 82,66 4 2,90 I– 2,95 2,925 11 32,18 94,11 5 2,95 I– 3,00 2,975 24 71,40 212,42 6 3,00 I– 3,05 3,025 14 42,35 128,11 7 3,05 I– 3,10 3,075 9 27,68 85,10 8 3,10 I– 3,15 3,125 8 25,00 78,13 9 3,15 I– 3,20 3,175 6 19,05 60,48 10 3,20 I– 3,25 3,225 3 9,68 31,20 Total 90 270,1 811,55 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 0,01941 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 0,02620 (a) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (b) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (c) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (d) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 13. A altura de 60 alunos da FACE-PUC foi registrada abaixo, em cm. 174 170 156 168 176 178 162 182 172 168 166 156 169 168 162 160 163 168 162 172 168 167 170 153 171 166 168 156 160 172 173 163 170 175 176 182 158 176 161 175 173 163 172 167 170 179 179 170 151 175 152 151 172 173 170 174 167 167 158 174 (a) Construa uma distribuição de frequência com 8 classes de amplitudes iguais, adotando como limite inferior da distribuição 150 cm. (b) Qual o percentual de alunos com altura mínima de 166 cm? (c) Quantos alunos tem menos de 162 cm? (d) Qual o percentual de alunos com altura média de 164 cm? (e) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (f) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (g) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos) (h) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 8 Altura Número de alunos Xi Xifi Xi2fi fri fri acum 150 I– 154 4 152 608 92416 0,0667 0,0667 154 I– 158 3 156 468 73008 0,0500 0,1167 158 I– 162 5 160 800 128000 0,0833 0,2000 162 I– 166 6 164 984 161376 0,1000 0,3000 166 I– 170 13 168 2184 366912 0,2167 0,5167 170 I– 174 15 172 2580 443760 0,2500 0,7667 174 I– 178 9 176 1584 278784 0,1500 0,9167 178 I– 182 5 180 900 162000 0,0833 1,0000 ∑ 60 1328 10108 1706256 1 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = ̶15063 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 514430,7 14. Considere os dados referentes ao consumo de água, em m3, de 75 contas da Companhia de Água do Nordeste. 32 40 22 11 34 40 16 26 23 31 27 10 38 17 13 45 25 10 18 23 35 22 30 14 18 20 13 24 35 29 33 48 20 12 31 39 17 58 19 16 12 21 15 12 20 51 12 19 15 41 29 25 13 23 32 14 27 43 37 21 28 37 26 44 11 53 38 46 17 36 28 49 56 19 11 (a) Agrupar os dados em uma distribuição de frequência, em intervalos fechados à direita e com amplitude 10. Utilize o limite inferior da distribuição igual a zero (b) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (c) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (d) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (e) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). Consumo f Xi fri fri ac ↓ Fi ac Xifi Xi2fi 0 I– 10 2 5 0,027 0,0267 2 10 50 10 I– 20 27 15 0,360 0,3867 29 405 6075 20 I– 30 19 25 0,253 0,6400 48 475 11875 30 I– 40 16 35 0,213 0,8533 64 560 19600 40 I– 50 7 45 0,093 0,9467 71 315 14175 50 I– 60 4 55 0,053 1,0000 75 220 12100 ∑ 75 1 1985 63875 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 86873,24 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 4453652 9 15. Uma distribuidora de refrigerantes fez um levantamento sobre o consumo semanal (em litros) por pessoa, em jan./2002, em uma cidade do litoral, obtendo: consumo nº de pessoas Xi Xifi Xi2fi fri fri ac ↓ 0,0 I– 0,5 10 0,25 2,50 0,6250 0,1754 0,1754 0,5 I– 1,0 25 0,75 18,75 14,0625 0,4386 0,6140 1,0 I– 1,5 9 1,25 11,25 14,0625 0,1579 0,7719 1,5 I– 2,0 7 1,75 12,25 21,4375 0,1228 0,8947 2,0 I– 2,5 6 2,25 13,50 30,3750 0,1053 1,0000 Ʃ 57 58,25 80,5625 1,0000 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 8,8186 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 19,3259 (a) Qual o percentual de pessoas que consomem menos de 1 litro de refrigerante por semana? (b) Se a empresa tem um lucro de R$0,50 por litro, qual o lucro médio por pessoa? (c) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (d) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (e) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (f) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 0 5 10 15 20 25 30 0 I– 10 10 I– 20 20 I– 30 30 I– 40 40 I– 50 50 I– 60 fr e q u ê n ci as classes de consumo de água 10 16. Seja a variável aleatória X, representando o valor do faturamento mensal (em mil reais) de uma amostra de empresas de determinada área geográfica de Fortaleza. A partir da distribuição de frequências abaixo, responda o que for pedido. Classes fi Xi Xifi fri fri acum Fac ↓ Fac ↑ Xifri Xi2fi 20 ├ 40 15 30 450 0,08 0,08 15 185 2,43 13.500 40 ├ 60 45 50 2250 0,24 0,32 60 170 12,16 112.500 60 ├ 80 70 70 4900 0,38 0,7 130 125 26,49 343.000 80 ├ 100 35 90 3150 0,19 0,89 165 55 17,03 283.500 100├ 120 20 110 2200 0,11 1 185 20 11,89 242.000 ∑ 185 12950 1 70 994500 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 240000 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 102400000 (a) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (b) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (c) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (d) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 17. Os dados a seguir referem-se à permanência média, em dias, de turistas nos países do continente europeu no período compreendido entre 2005 a 2006. (Dados fictícios em ordem crescente) 1,8 1,9 2 2 2 2 2 2,6 2,6 2,8 3 3,1 3,7 3,7 4,2 4,3 4,9 4,9 5,6 5,7 5,9 5,9 6 6,1 6,2 6,8 7 7,2 7,2 7,2 7,3 8,1 8,4 8,6 8,9 9 9 10,8 11,3 11,5 11,6 11,7 11,9 11,9 12,2 12,3 12,3 14 17,6 17,6 A partir da distribuição de frequência, determinar: (a) A interpretação do ponto médio correspondente à segunda classe. (b) A interpretação da frequência relativa correspondente à terceira classe. (c) A interpretação da frequência acumulada crescente (Fac) correspondente à segunda classe. (d) A interpretação da frequência acumulada decrescente (Fad) correspondente à terceira classe. (e) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (f) Apresente as medidas de dispersão: desviopadrão e coeficiente de variação. (g) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (h) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). 11 Classes Xi fi fri↓ fri ac ↓ Fac ↓ Fac ↑ Xifi Xifri Xi2fi 1,80 |− 4,06 2,93 14 0,28 0,28 14 50 41,02 0,8204 120,19 4,06 |− 6,32 5,19 11 0,22 0,50 25 36 57,09 1,1418 296,30 6,32 |− 8,58 7,45 8 0,16 0,66 33 25 59,6 1,1920 444,02 8,58 |− 10,84 9,71 5 0,1 0,76 38 17 48,55 0,9710 471,42 10,84 |− 13,1 11,97 9 0,18 0,94 47 12 107,73 2,1546 1289,53 13,1 |− 15,36 14,23 1 0,02 0,96 48 3 14,23 0,2846 202,49 15,36 |− 17,62 16,49 2 0,04 1 50 2 32,98 0,6596 543,84 50 1 361,2 7,224 3367,79 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 1773,032 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 26857,81 18. A distribuição dos salários mensais (em salários mínimos), dos moradores do bairro B1, que têm alguma forma de rendimento está apresentada na tabela abaixo: Classe 0├ 2 2├ 4 4├ 6 6├ 8 8├ 10 10├ 12 12├ 14 fi 10.000 4.000 2.000 1.000 800 700 1.500 Determinar: a) o salário médio dos moradores do bairro B1, b) o coeficiente da variação dos salários dos moradores do bairro B1; c) o bairro B2 apresenta, para a mesma variável, uma média salarial = 3,69 e um desvio padrão s = 2,58. Em qual dos bairros a distribuição salarial é mais homogênea? Por quê? Classe fi Xifi Xi2fi ∑ 20.000 73.400 548.000 19. Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio padrão das notas de sua disciplina, conforme abaixo. Qual a turma com menor variabilidade? Justifique adequadamente. Turma A B C Média 6,5 8,0 8,0 Desvio Padrão 2,2 1,7 2,0 20. Uma companhia distribuidora tem por hipótese que uma chamada telefônica é mais eficiente que uma carta para acelerar a cobrança de contas atrasadas. Esta companhia fez uma experiência usando duas amostras e obteve os seguintes resultados: Método utilizado Nº de dias até o pagamento Carta 10 8 9 11 11 14 10 Chamada telefônica 7 4 5 4 8 6 9 12 (a) Qual dos métodos apresentou resultados mais homogêneos? Justifique através do coeficiente de variação. (b) Se houver mais um dia de atraso em TODAS as contas, o que acontecerá neste caso com o coeficiente de variação anterior. (Apresente novamente o coeficiente de variação). (c) Se dobrar o tempo até o pagamento de TODAS as contas observadas, o que acontecerá com a variância do grupo que recebeu cobrança através de carta. 21. Dois estudantes foram informados de que alcançaram as variáveis reduzidas de 0,8 e −0,4, respectivamente, em um exame de múltipla escolha de estatística. Se seus graus foram de 88 e 64, respectivamente, determinar a média e o desvio padrão dos graus do exame. 22. Marcos, um vendedor de produtos químicos, fez vendas de $15.000 em abril; Carlos, um vendedor de material de escritório, fez vendas de $6.250. As vendas em abril pelos vendedores da indústria química e de material de escritório tiveram, respectivamente, médias de $13.000 e $5.000 e desvio padrão de $2.000 e $500. Pede-se a) Quantos desvios padrão acima da média foram as vendas de Marcos e Carlos? Quem teve a média mais alta em seus respectivos grupos? b) Qual o grupo de vendas que teve maior dispersão? 23. O Departamento de Pessoal de certa firma fez um levantamento dos salários dos 120 funcionários do setor administrativo, o resultado obtido gerou a tabela abaixo: Número de salários mínimos 0⊢2 2⊢4 4⊢6 6⊢8 8⊢10 Frequência relativa (fi) 0,25 0,40 0,20 0,10 0,05 Determinar: (a) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (b) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (c) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (d) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). (e) 30% dos funcionários ganham, pelo menos, quantos salários? Classes fri Xi fi Xifi Xifri Xi2fi Fac ↓ Fac ↑ fri ac ↓ fri ac ↑ 0 |- 2 0,25 1 30 30 0,25 30 30 120 0,25 1 2 |- 4 0,4 3 48 144 1,2 432 78 90 0,65 0,75 4 |- 6 0,2 5 24 120 1 600 102 42 0,85 0,35 6 |- 8 0,1 7 12 84 0,7 588 114 18 0,95 0,15 8 |- 10 0,05 9 6 54 0,45 486 120 6 1 0,05 120 432 3,6 2136 13 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 944,64 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 8174,784 24. Estudando-se o consumo diário de leite em uma região com 5.000 famílias, verificou-se que, 20% das famílias consomem até 1 litro de leite, 50% consomem entre 1 e 2 litros, 20% consomem entre 2 e 3 litros, 8% entre 3 e 4 litros e as restantes consomem entre 4 e 5 litros. Para a variável em estudo, determinar: (a) Apresente as medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (b) Apresente as medidas de dispersão: desvio padrão e coeficiente de variação. (c) Apresente as medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (d) Apresente os coeficientes de curtose (coeficientes de produto-momento e coeficientes quartílicos). (e) 30% das famílias consomem, no máximo, quantos litros? (f) 25% das famílias consomem, pelo menos, quantos litros? Xi = Consumo médio de leite n = 5000 Classes fri fi Xi Xifi Xifri Xi2fi fri ac ↓ fri ac ↑ Fi ac ↓ Fi ac ↑ 0 |-- 1 0,2 1000 0,5 500 0,1 250 0,2 1 1000 5000 1 |-- 2 0,5 2500 1,5 3750 0,75 5625 0,7 0,8 3500 4000 2 |-- 3 0,2 1000 2,5 2500 0,5 6250 0,9 0,3 4500 1500 3 |-- 4 0,08 400 3,5 1400 0,28 4900 0,98 0,1 4900 500 4 |-- 5 0,02 100 4,5 450 0,09 2025 1 0,02 5000 100 ∑ 1 5000 12,5 8600 1,72 19050 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 3036,48 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 12579,66 25. O quadro abaixo representa os salários pagos a 100 funcionários da empresa GLT & Cia. Nº de salários mínimos Nº de operários Xi Xifi fri fri ac ↓ fri ac ↑ Fi Fi ac ↓ Fi ac ↑ 0 |- 2 40 1 40 0,4 0,4 1 40 40 100 2 |- 4 30 3 90 0,3 0,7 0,6 70 70 60 4 |- 6 10 5 50 0,1 0,8 0,3 80 80 30 6 |- 8 15 7 105 0,15 0,95 0,2 95 95 20 8 |- 10 5 9 45 0,05 1 0,05 100 100 5 Total 100 330 1 Pede-se: (a) Quantos operários ganham até 2 salários mínimos? (b) Quantos operários ganham até 6 salários mínimos? (c) Qual a porcentagem de operários com salário entre 6 e 8 salários mínimos? (d) Qual a porcentagem de operários com salário inferior a 4 salários mínimos? 14 (e) Determine o salário médio (f) Determine o salário modal (g) Determine o salário mediano 26. Uma pesquisa referente ao tempo necessário para a conclusão das auditorias revelou os dados abaixo. Tempo (dias) fi Fi fri Fri ac ↓ Xifi Xi2fi 10 |-| 14 4 4 0,160 0,160 48 576 15 |-| 19 8 12 0,320 0,480 136 2312 20 |-| 24 0 12 0,000 0,480 0 0 25 |-| 29 2 14 0,080 0,560 54 1458 30 |-| 34 1 15 0,040 0,600 32 1024 35 |-| 39 5 20 0,200 0,800 185 6845 40 |-| 44 5 25 0,200 1,000 210 8820 ∑ 25 1,000 665 21035 Dados adicionais: ∑ [(𝑿𝒊 − �̅�)𝟑𝒌𝒊=𝟏 ] × 𝒇𝒊 = 4516,8 ∑ [(𝑿𝒊 − �̅�)𝟒 𝒌 𝒊=𝟏 ] × 𝒇𝒊 = 590264,1 Pede-se o cálculo e a interpretação das seguintes medidas: (a) Medidas de posição: média, moda, mediana, 1º e 3º quartis e 10º e 90º percentis. (b) Medidas de dispersão: desvio padrão e coeficiente de variação.(c) Medidas de assimetria (medidas empíricas de Pearson, coeficientes de produto- momento e coeficientes quartílicos). (d) Medidas de curtose (coeficientes de produto-momento e coeficientes quartílicos). (e) Qual a porcentagem de auditorias que duraram de 15 à 34 dias? (f) Qual o total de auditorias que tiveram menos de 25 dias? 15 TESTE DE HIPÓTESES - EXERCÍCIOS BRUNI, Adriano Leal. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. Teste de uma amostra para médias a. Uma instituição de ensino alega que a média de seus alunos em provas de vestibulares de universidades de primeira linha é igual a 7,60. Uma amostra aleatória formada por 60 alunos revelou uma média igual a 6,80, com desvio igual a 2,40. Assumindo alfa igual a 5%, teste a alegação da instituição, supondo que as hipóteses alternativas (H1) sejam: (a) média populacional diferente de 7,60; (b) média populacional menor que 7,60. b. Uma empresa produtora de cosméticos alega que a quantidade de algas marinhas especiais contida em frascos de 400 g é, no mínimo, igual a 58 g. Uma amostra formada por 23 frascos revelou que estes continham, em média, 52 g, com um desvio padrão de 18 g. Pede-se: (a) é possível concordar com a afirmação do fabricante? (b) refaça a questão, supondo que a amostra tivesse sido formada por 74 frascos. Assuma alfa igual a 3% e suponha população normalmente distribuída. c. A Construtora Estrada Forte Ltda. alega ser capaz de produzir concreto com, no máximo, 15 kg de impurezas para cada tonelada fabricada. Dezenove amostras de uma tonelada cada uma revelaram possuir impurezas com média amostral igual a 23 kg e desvio padrão amostral igual a 9 kg. Assumindo α igual a 4% e população normalmente distribuída, seria possível discordar da construtora? d. Uma empresa que comercializa bancos de dados com informações sobre assinantes de revistas e jornais assegura que a renda média dos assinantes é de, no mínimo, $ 850,00. Uma amostra aleatória com 24 pessoas revelou uma renda média igual à $ 800,00, com desvio padrão igual a $ 200,00. É possível concordar com a empresa? Assuma um nível de confiança igual a 98% e suponha população normalmente distribuída. e. Uma grande construtora nacional afirma que seus funcionários recebem um salário médio igual a, no mínimo, $ 1.450,00, com desvio padrão igual a $ 700,00 e distribuição supostamente normal. Uma amostra com 500 funcionários apresentou uma média de $ 1.000,00. A alegação da empresa poderia ser aceita? Justifique. Considere α = 2%. f. Um hotel afirma receber em média, no mínimo, 450 hóspedes por mês. Uma operadora turística, interessada em comprar o hotel, observou a frequência mensal do hotel durante dois anos. Encontrou uma média igual a 400 hóspedes/mês, com um desvio padrão associado igual a 60 hóspedes por mês. O que se pode afirmar acerca da alegação do hotel? Assuma um nível de significância igual a 2% e suponha população normalmente distribuída. 16 g. O representante da Guantanamera Engenharia Ltda. está interessado em construir um shopping center na região do Pacaembu, em São Paulo. Ele foi informado que a renda média familiar da região é de, no mínimo, $ 10.000,00. Para a zona em questão, a distribuição da renda média familiar é aproximadamente normal e o desvio padrão é de $ 1.500,00. Após ter sido realizada uma pesquisa na área, foi constatado que uma amostra de dez famílias apresentou renda média familiar igual a $ 9.800,00. Pode-se aceitar a alegação inicial? Assuma α = 0,05 e suponha população normalmente distribuída. h. Uma grande rede de lanchonetes afirma que suas vendas médias são exatamente iguais a $ 10,00. Uma amostra aleatória formada por 16 vendas apontou uma média igual à $ 9,00. Supõe- se que o desvio padrão populacional das vendas é igual a $ 3,00, sendo as vendas normalmente distribuídas. O que pode ser dito sobre a alegação? Assuma H1 como média populacional diferente de $ 10,00 e adote 5% de nível de significância. i. Um fabricante de clipes afirma que suas caixas possuem em média 100 g, no mínimo. Uma amostra com 60 caixas de clipes apontou uma média de 95 g, com um desvio padrão de 5 g. Com um nível de significância igual a 3%, o que pode ser dito? j. Uma fábrica de embalagens de papelão afirma que suas caixas modelo padrão têm uma resistência média não inferior a 14 kg. Uma amostra de cinco caixas revelou uma resistência média igual a 12,6 kg. Assumindo um nível de significância igual a 2%, é possível confiar na palavra da fábrica? Sabe-se que o desvio padrão populacional das resistências das caixas é igual a 2 kg e que esta variável encontra-se normalmente distribuída. k. Querendo acelerar o tempo de produção que uma máquina precisa para encher uma garrafa, um engenheiro analisou e modificou uma certa peça da máquina que acusava um tempo médio de enchimento igual a 1,9 minuto. Após a mudança, em 30 observações feitas pelo engenheiro, foi possível constatar um tempo médio de 1,5 min, com desvio padrão igual a 0,7 minuto. Adotando um nível de significância igual a 1%, podemos confirmar que a modificação reduziu o tempo de produção? l. Um fabricante de casas pré-fabricadas iniciará uma campanha publicitária de grande porte para vendê-las, apenas se for verificada que a renda média mensal de uma determinada população seja superior a $ 1.500,00. Analisando uma amostra aleatória de 45 habitantes, encontrou uma média igual a $ 1.600,00 e com desvio padrão de $ 200,00. Adotando um nível de significância igual a 5%, a alegação deve ser aceita ou rejeitada? m. Uma indústria de xampu afirma que a quantidade média contida nos frascos produzidos é no mínimo igual a um litro. Uma amostra com 40 frascos de xampus revelou uma média igual a 0,93 litro com um desvio padrão de 0,5 litro. Admitindo um nível de confiança de 99%, é possível aceitar a afirmação de indústria? 17 Teste de uma amostra para proporção 1. Um fabricante de creme dental alega que em no máximo 3% dos casos seus produtos apresentam menos de 100 g por embalagem. Uma amostra aleatória com 300 produtos revelou que 14 possuíam menos de 100 g. Assumindo alfa igual a 5%, é possível dizer que o fabricante está mentindo? 2. Uma agência de propaganda alega que pelo menos 19% das pessoas que assistem a um determinado filme comercial exibido no horário nobre da televisão são capazes de recordá-lo durante os 30 dias seguintes. Um pesquisador independente questionou 350 telespectadores diferentes e encontrou que apenas 64 foram capazes de recordar o comercial após 30 dias. Estaria a agência de publicidade mentindo? Assuma alfa igual a 1 %. 3. Um fabricante de pesticidas afirma que em no máximo 2% das aplicações seus produtos causam problemas ambientais considerados sérios. Após estudar 560 aplicações, o Ministério da Agricultura encontrou que 15 aplicações haviam causado sérios danos ao meio ambiente. É possível aceitar a alegação da indústria? Considere um nível de confiança igual a 95%. 4. As Indústrias Soteropolitanas Ltda. planejam estudar a distribuição dos defeitos de suas linhas de produção, destinada à fabricação de dois produtos básicos: tubos de cobre e tubos de aço. Uma amostra aleatória e representativa composta por 830 tubos de aço e 350 tubos de cobre está apresentada na tabela seguinte. Com base nos dados fornecidos e supondo alfa igual a 4%, teste as seguintes hipóteses: (a) a proporção de tubos com defeito é, no máximo, igual a 6%; (b) a proporção de tubos de aço sem defeito é, no mínimo, igual a 95%; (c) a proporção de tubos de cobre com defeito é igual a, no máximo, 9%. Defeitos Aço Cobre Total Com 50 40 90 Sem 780 310 1090 Total 830350 1180 5. A partir de uma pesquisa sobre duas companhias telefônicas, constatou-se que, de uma amostra formada por 200 pessoas, 110 preferiam a companhia A. É possível afirmar que a telefônica A tem a preferência? Suponha um nível de significância igual a 6%. 6. Uma loja de departamentos visa lançar no mercado uma nova linha de perfumes através do seu departamento de Perfumaria e Cosméticos, afirmando que seria possível interessar pelo menos 18 70% dos seus atuais consumidores. Após analisar uma amostra de 2.000 clientes, 1.390 revelaram interesse pelo novo produto. É possível aceitar a afirmação da loja de departamentos? Considere α = 4%. 7. Uma grande rede de academias de ginástica alega que no mínimo 80% de seus equipamentos utilizados pelos alunos estão em boas condições de uso. De uma amostra de 160 equipamentos, 90 estavam em más condições de uso. Será que é possível aceitar a afirmação da rede? Use α = 5%. 8. Um determinado restaurante de comidas naturais alega que, no mínimo, 70% dos alimentos servidos possuem baixo teor de colesterol. Em uma amostra de 162 pratos analisados em laboratório, 101 apresentaram baixos níveis de colesterol. É possível aceitar a alegação do restaurante? Suponha α = 3%. 9. Em uma amostra aleatória com 500 alunos do curso de Administração da faculdade selecionados ao acaso foram constatados 52% de mulheres. Poderia ser aceita a hipótese de que a proporção populacional é igual a 50%? Use a hipótese alternativa de a proporção ser diferente de 50%. Assuma alfa igual a 3%. 10. Uma empresa apresentou dois projetos a seus clientes. De 10.000 clientes comunicados, 6.000 afirmaram que têm preferência pelo Projeto I. Há possibilidades, a um nível de confiança de 95%, de confirmar a aprovação e a implantação de Projeto I apresentado pela empresa? Ou seja, é possível supor que p seja maior 50%? Use um nível de confiança igual a 95%. 11. Um fabricante de lâmpadas alega que 80% ou mais de seus produtos possuem vida útil igual ou superior a 2.000 horas. Uma amostra com 300 produtos apresentou 65 com vida útil inferior a 2.000 horas. É possível aceitar a afirmação do fabricante? Trabalhe com alfa unicaudal e assuma valor para alfa igual a 3%. 12. Uma indústria automobilística, fabricante de velas para veículos, alega que, no mínimo, 95% de seus produtos suportam, pelo menos, 15.000 km rodados. Em uma amostra de 750 unidades, 69 duraram menos que o limite alegado. Para alfa = 7%, é possível aceitar a alegação da indústria? 13. O encarregado do controle de trafego aéreo da companhia de aviação “Voo Seguro” afirma que pelo menos 95% dos voos dessa Companhia chegam ao lugar de destino no máximo com 20 minutos de atraso. Uma instituição de defesa do consumidor recebeu queixas dos clientes da Voo Seguro que afirmam que a porcentagem de voos que chegam no máximo com 20 minutos de atraso é muito maior. Os clientes examinam uma amostra selecionada ao acaso de 200 registros de voos da Voo Seguro e verificaram que 182 voos chegaram com no máximo 20 minutos de atraso. Pede- se: (a) formule um teste de hipótese para a situação apresentada; (b) teste a hipótese assumindo alfa igual a 1 %. 14. A indústria de molas Pula Pula Ltda. considera que sua linha de montagem está sob controle se a proporção de defeituosos produzidos nessa linha for menor ou igual a 3%. Se a proporção de defeituosos for maior que 3% reparos devem ser realizados na linha. Uma amostra casual de 1.000 itens produzidos na linha de montagem é selecionada. Se o número de defeituosos na amostra é menor ou igual a 40, a linha é considerada sob controle. Pede-se: (a) formule as hipóteses H0 e H1; (b) calcule o nível de significância do teste. 15. A emissora de TV Sinal no Ar decidiu que o programa Bola na Trave será mantido no ar caso tenha pelo menos 25% da audiência de seu horário. Se a audiência for menor que 25%, o 19 programa será cancelado. Foram entrevistadas por telefone 50 pessoas que estavam assistindo a programas de televisão no horário de exibição do Bola na Trave. Nove delas estavam assistindo o programa. O programa deve ser cancelado? Formule a hipótese H0 e H1 e diga qual o nível descritivo. Suponha um nível de confiança igual a 95%. TESTE DE DIFERENÇA DE MÉDIAS E ANÁLISE DE VARIÂNCIA - EXERCÍCIOS 1. Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais satisfação para o funcionário. Para isso, durante um mês, 10 funcionários foram entrevistados. Ao final de um mês os funcionários responderam um questionário gerando uma nota para o bem estar do funcionário. Postos Funcionários 1 2 3 1 7 5 8 2 8 6 9 3 7 7 8 4 8 6 9 5 9 5 8 6 7 6 8 7 8 7 9 8 6 5 10 9 7 6 8 10 6 6 9 2. No Quadro mostrado a seguir, temos cinco grupos com cinco observações em cada grupo. Queremos saber “as diferenças nas médias amostrais são variações aleatórias que ocorrem apenas devido ao acaso (just by chance) ou se existem diferenças sistemáticas entre as médias”. A B C D E 6 7 4 5 3 6 8 4 5 4 6 8 5 6 4 8 8 6 6 4 9 9 6 8 5 3. Os salários horários médios de mecânicos de automóveis foram estudados por um grupo de consumidores. A finalidade era determinar a eventual existência de diferenças entre 4 localidades. Obteve-se: 20 Observação Loc. A Loc. B Loc. C Loc. D 1 6 12 11 9 2 9 11 8 7 3 9 10 12 10 4 6 8 9 10 5 5 9 10 9 No nível de significância 5% podemos afirmar que existe diferença? 4. Um consumidor pretende verificar se existe diferença no preço de aspirinas em diferentes cidades e em diferentes tipos de loja. Selecionou a seguinte amostra: Centro Leste Oeste Sul Drogaria 2,46 2,85 2,4 2,51 Farmácia 2,27 2,61 2,35 2,17 Supermercado 2,72 2,64 2,59 2,8 Utilizando análise de variância de um fator é possível concluir que há diferença entre regiões? (5%) b) Utilizando análise de variância de um fator é possível concluir que há diferença entre regiões? c) Qual sua resposta em (a) se for utilizada análise de variância de dois fatores? (5%). 5. Foram criados dois grupos de nove estudantes de um curso de estatística. Duas técnicas de ensino foram adotadas, uma em cada grupo, e as notas finais são apresentadas a seguir: 1 2 3 4 5 6 7 8 9 A 76 92 99 87 65 87 86 85 88 B 98 57 85 89 60 53 52 93 95 a) É possível concluir que as notas foram inferiores com a técnica B ao nível de 5% de significância? (Faça hipóteses apropriadas sobre as variâncias). A B 1 76 98 2 92 57 3 99 85 4 87 89 5 65 60 6 87 53 7 86 52 8 85 93 21 9 88 95 6. No mês de dezembro, 9 pessoas vão para um SPA. Elas são pesadas no dia de chegada e no dia de saída, obtendo-se o seguinte: Chegada 76 92 99 87 65 87 86 85 88 Saída 98 57 85 89 60 53 52 93 95 Você pode concluir (5%) que passar o mês no SPA reduz o peso de pacientes? Considere os dados abaixo onde y representa o número de produtos vendidos e x o valor (mil reais) aplicado em publicidade: 7. Um especialista em educação quer avaliar o nível de ensino de matemática para alunos do ensino fundamental das escolas de sua cidade. Para isto, foi realizado uma amostragem entre os alunos das escolas, no qual foi aplicado uma prova. À partir dos dados coletados: sobre as notas dos alunos do ensino fundamental na prova de matemática em cada escola, o que podemos dizer a respeito da uniformidade do ensino entre as escolas? Nota Escola A B C D 1 3,94 4,23 5,2 3,86 2 4,45 5,69 6,3 3,74 3 4,43 5,37 9,92 4,35 4 6,21 4,5 7,38 55 3,63 3,78 9,41 5,99 6 5,89 6,19 8,47 3,95 7 6,36 5,43 6,74 2,84 8 3,89 5,64 7,93 5,37 9 5,84 5,74 8,91 4,39 10 5,15 4,2 4,99 3,89 11 4,16 2,91 6,91 2,06 12 4,44 6,92 8,73 2,72 13 4,8 6,84 5,61 3,29 14 4,04 5,91 8,89 3,14 15 4,15 6,74 6,28 3,61 16 3,46 5,09 7,38 5,38 17 4,04 8,01 6,85 4,24 18 3,29 4,45 6,57 3,58 19 3,7 4,36 8,38 5,01 20 3,8 4,76 8,06 3,97 22 ANÁLISE DE CORRELAÇÃO LINEAR DE PEARSON - EXERCÍCIOS 1. Considere os dados de uma amostra de fábricas de uma determinada indústria: Custo total Y Produção X 80 12 44 4 51 6 70 11 61 8 Calcule e interprete o coeficiente de correlação linear de Pearson. 2. Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar e o número de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatória de 15 consumidores, da qual resultaram os seguintes dados: Y X XY X2 Y2 5 2 8 2 8 2 7 2 9 2 7 3 9 3 8 3 9 3 10 3 0 2 4 6 8 10 12 14 0 20 40 60 80 100 Q u an ti d ad e p ro d u zi d a Custo total 23 10 3 11 4 10 4 12 4 9 4 A variável Y refere-se ao tempo necessário para a tomada de decisão e X o número de alternativas. a) Estime e interprete o coeficiente de correlação linear de Pearson. 3. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias. Renda Familiar (X) Gasto com Alimentação (Y) 3 1,5 5 2,0 10 6,0 10 7,0 20 10,0 20 12,0 20 15,0 30 8,0 40 10,0 50 20,0 60 20,0 70 25,0 70 30,0 80 25,0 100 40,0 100 35,0 100 40,0 120 30,0 120 40,0 140 40,0 150 50,0 180 40,0 180 50,0 200 60,0 200 50,0 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 0 2 4 6 8 10 12 14 X 24 (a) Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). (b) Calcular o coeficiente de correlação entre essas variáveis. Denotamos as variáveis: Y = Gasto com Alimentação e X = Renda familiar 83,120X 26,660Y 271934 25 1 2 i iX 24899,250 25 1 2 i iY 80774,500 25 1 i iiXY Renda Familiar (X) Gasto com Alimentação (Y) Renda Familiar (X) 1 Gasto com Alimentação (Y) 0,954051 1 0 10 20 30 40 50 60 70 0 50 100 150 200 250 G as to c o m a lim e n ta çã o Renda familiar 25 ANÁLISE DE REGRESSÃO LINEAR - EXERCÍCIOS 1. A tabela abaixo indica o valor Y do aluguel e a idade X de cinco casas. a) Faça o gráfico dos pontos e da reta ajustada. Você acha que o modelo adotado é razoável? b) Encontre a reta de mínimos quadrados, supondo a relação E (Y|X) = a + bX. c) É possível afirmar que existe regressão linear para o modelo ajustado? d) Teste as hipóteses para os parâmetros individuais. e) O que é possível inferir sobre a qualidade de modelo ajustado? X 10 13 5 7 20 Y 4 3 6 5 2 X Y XY X2 Y2 Ŷ (Y − )2 (Y – Ŷ)2 (Ŷ − )2 (X − )2 10 4 40 100 16 4,26 0 0,07 0,07 1 13 3 39 169 9 3,48 1 0,23 0,27 4 5 6 30 25 36 5,57 4 0,19 2,45 36 7 5 35 49 25 5,04 1 0,0019 1,09 16 20 2 40 400 4 1,65 4 0,12 5,51 81 ∑ 55 20 184 743 90 10 0,61 9,39 138 n= 5 = 11 = 4 2. Dado as observações para as variáveis X e Y: X 1 2 3 4 5 Y 3 7 5 11 14 Somatórios X Y XY X2 Y2 15 40 146 55 400 Gráfico de dispersão a) Desenvolva um diagrama de dispersão para esses dados; b) Encontre a reta de mínimos quadrados, supondo a relação E (Y|X) = a + bX. 0 5 10 15 0 2 4 6 26 c) É possível afirmar que existe regressão linear para o modelo ajustado? d) Teste as hipóteses para os parâmetros individuais. e) O que é possível inferir sobre a qualidade de modelo ajustado? 3. Dados os valores de X e Y na tabela abaixo: X 2 3 -2 1 3 4 -1 2 Y 6,9 8,7 -5,8 3,4 8,2 10,8 -1,6 6 a) Estime os parâmetros da reta de regressão; b) Construa a tabela ANOVA; c) Calcule e R2; d) Faça os testes t (para β) e F. X Y XY X2 Y2 SQT (Y - )2 SQR (Y – Ŷ)2 SQE (Ŷ − )2 (X − )2 ∑ 12 36,6 136,3 48 390,94 223,50 2,63 220,81 30 5,1 ; = 4,57 4. Dados os valores de X e Y na tabela abaixo: X 6 7 8 9 5 4 7 9 11 Y 104 122 202 193 76 32 67 103 189 a) Estime os parâmetros, calcule o R2 e faça os testes t e F. X Y XY X2 Y2 SQT (Y - )2 SQE (Ŷ − ) SQR (Y – Ŷ)2 (X − ) 2 66 1.088 8.814 522 161.372 29.844,89 18.362,68 11.482,21 38,00 27 5. Após uma regressão simples, onde se utilizou uma amostra com 20 elementos, foram tabulados os seguintes dados: ANOVA Soma dos quadrados SQE = 123 SQT = 189 a) Complete a tabela ANOVA b) Calcule o R2 c) Faça o teste F. 6. Na tabela a seguir são apresentados os custos totais de produção de certas quantidades de determinado artigo, em cinco observações independentes. Quantidades (X) 10 20 30 40 50 Custos totais (Y) 100 230 270 410 490 Quantidades (X) Custos totais (Y) XY X2 Y2 SQT (Y - )2 SQE (Ŷ − ) SQR (Y – Ŷ)2 (X − ) 2 150 1.500 54.600 5.500 544.000 94.000 92.160 1840 1.000 a) Encontre a reta de mínimos quadrados, supondo a relação E (Y|X) = a + bX. b) É possível afirmar que existe regressão linear para o modelo ajustado? c) Teste as hipóteses para os parâmetros individuais. d) O que é possível inferir sobre a qualidade de modelo ajustado? e) Faça estimativa para o custo total quando quantidade for 60. 7. As importações de determinada matéria-prima, no período de 1997 a 2003 foram: Ano 1997 1998 1999 2000 2001 2002 2003 Importação (t) 50 47 35 30 24 10 16 0 100 200 300 400 500 600 0 20 40 60 28 Ano Importação Y Ano X XY X2 Y2 Ŷ SQT (Y - )2 SQE (Ŷ − ) SQR (Y – Ŷ)2 (X − ) 2 1997 50 1 50 1 2500 50,32 388,65 401,43 0,10 9 1998 47 2 94 4 2209 43,64 279,37 178,41 11,27 4 1999 35 3 105 9 1225 36,96 22,22 44,60 3,86 1 2000 30 4 120 16 900 30,29 0,08 0,00 0,08 0 2001 24 5 120 25 576 23,61 39,51 44,60 0,15 1 2002 10 6 60 36 100 16,93 411,51 178,41 48,01 4 2003 16 7 112 49 256 10,25 204,08 401,43 33,06 9 ∑ 212 28 661 140 7.766 1.345,43 1.248,89 96,54 28 = 30,28571; = 4 a) Encontre a reta de mínimos quadrados, supondo a relação E (Y|X) = a + bX. b) É possível afirmar que existe regressão linear para o modelo ajustado? c) Teste as hipóteses para os parâmetros individuais. d) O que é possível inferir sobre a qualidade de modelo ajustado? e) Estimar a quantidade a ser importada em 2004. 8. Considere duas variáveis X e Y, cuja amostra de cinco pares de observações, está expressa na tabela seguinte: X 10 k 30 40 50 Y 6 8 7 8 6 Calcule o valor de K para que exista ausência de relação linear entre as variáveis X e Y. 9. A empresa ALFA Ltda., fabricante de implementos agrícolas de alta tecnologia, realizou um levantamento do custo total de um de seus produtos (Y), expresso em $1.000,00, em função de númerototal de peças produzidas (X), expresso em unidades, durante cinco meses, com o objetivo de montar uma regressão linear simples entre essas variáveis. Obtendo os somatórios: 440 5 1 i iX ; 120 5 1 i iY ; 300.12 5 1 i i iYX 450.49 5 1 2 i iX ; 200.3 5 1 2 i iY = 88; = 24 0 10 20 30 40 50 60 0 2 4 6 8 29 Nessas condições pede-se: a) a reta que melhor se ajuste a esses dados; b) o valor do coeficiente de correlação linear; c) o valor mais provável dos custos fixos; d) o valor estimado do custo variável para uma produção de 500 unidades; e) admitindo-se um preço de venda de $ 3.000,00, por unidade, estimar a quantidade mínima que se deve produzir para se obter um lucro de $ 80.000,00 10. A tabela seguinte mostra os resultados de uma pesquisa com 10 famílias de determinada região. Famílias Renda (u.m.:100) Poupança u.m.:1000) Número de filhos Média de anos de estudo da família A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 Calcule o coeficiente de correlação linear de Pearson entre: a) renda familiar e poupança das dez famílias; b) renda e número de filhos para as dez famílias; c) poupança e número de filhos; d) média de anos de estudo e número de filhos; e) renda familiar e média de anos de estudo. Coeficiente de correlação linear de Pearson – Renda – Poupança Renda (u.m.:100) Poupança u.m.:1000) Renda (u.m.:100) 1 Poupança u.m.:1000) 0,983518 1 0 5 10 15 20 25 30 35 0 20 40 60 80 100 120 P o u p an ça ( u .m .: 1 0 0 0 ) Renda 30 Coeficiente de correlação linear de Pearson – Renda – Número de filhos Renda (u.m.:100) Número de filhos Renda (u.m.:100) 1 Número de filhos -0,7586 1 Renda (u.m.:100) Média de anos de estudo da família Renda (u.m.:100) 1 Média de anos de estudo da família 0,947271 1 11. Observou-se que o volume mensal de lixo gerado em uma cidade, em função do número de dormitórios das residências, é o seguinte (em m3): No Dormitórios 1 2 3 4 Volume de lixo 0,15 0,29 0,45 0,57 0 1 2 3 4 5 6 7 8 9 0 20 40 60 80 100 120 N ú m e ro d e f ilh o s Renda 0 2 4 6 8 10 12 14 16 18 20 0 20 40 60 80 100 120M é d ia d e a n o s d e e st u d o d a fa m íli a Renda 31 a) Encontre a reta de mínimos quadrados, supondo a relação E (Y|X) = a + bX. b) É possível afirmar que existe regressão linear para o modelo ajustado? c) Teste as hipóteses para os parâmetros individuais. d) O que é possível inferir sobre a qualidade de modelo ajustado? e) Estimar o volume de lixo para uma residência com 5 dormitórios. Subsídios: ƩX = 10 ƩY = 1,46 ƩX2 = 30 ƩY2 = 0,634 ƩXY = 4,36 12. Considere os dados sobre despesa com consumo pessoal (em dólares) e renda pessoal disponível (em dólares). a) Estime a função que descreve o comportamento do consumo, supondo que ele sofre variações com a renda. (Para isso suponha uma relação linear entre as variáveis estudadas descrita por uma função de 1º grau). b) Interprete os valores dos coeficientes (angular e linear) encontrados. c) Estime os valores esperados para o consumo de cada família, dada a função estimada. d) Calcule os valores dos resíduos. Observe os valores da soma destes resíduos. e) Calcule o coeficiente de determinação (R2) e interprete-o. f) Teste as hipóteses de existência de regressão e intercepto. Observações Despesa com consumo pessoal (dólares) Y Renda pessoal disponível (dólares) X YX X2 Y2 1 78,40 83,22 6524,448 6.925,57 6.146,56 2 79,68 81,50 6493,92 6.642,25 6.348,90 3 79,67 83,43 6646,8681 6.960,56 6.347,31 4 79,57 82,35 6552,5895 6.781,52 6.331,38 5 80,33 84,40 6779,852 7.123,36 6.452,91 6 81,16 86,94 7056,0504 7.558,56 6.586,95 7 81,46 88,74 7228,7604 7.874,79 6.635,73 8 82,26 89,09 7328,5434 7.937,03 6.766,71 9 82,39 87,41 7201,7099 7.640,51 6.788,11 10 83,43 87,44 7295,1192 7.645,75 6.960,56 11 83,13 87,43 7268,0559 7.644,00 6.910,60 12 83,62 87,50 7316,75 7.656,25 6.992,30 13 84,88 93,69 7952,4072 8.777,82 7.204,61 14 86,50 93,37 8076,505 8.717,96 7.482,25 15 89,93 93,78 8433,6354 8.794,69 8.087,40 16 88,43 96,17 8504,3131 9.248,67 7.819,86 17 89,99 95,47 8591,3453 9.114,52 8.098,20 1.414,83 1.501,93 125.250,87 133.043,81 117.960,36 Outras informações: SQE = 18.184,86; SQR = 2.887,1; SQT = 21.071,96. 32 13. Em um mesmo mercado imobiliário, esperamos que haja uma correlação positiva entre os tamanhos das casas e os seus preços de venda. Utilize os dados da Tabela 2.13 para testar esta hipótese para as casas de Ames, Iowa. (Estabeleça as hipóteses, encontre a correlação amostral r e a estatística t nela baseada, e forneça um valor P aproximado, além de suas conclusões.) a) Estime a função que descreve o comportamento do preço, supondo que ele sofre variações com o tamanho das casas. (Para isso suponha uma relação linear entre as variáveis estudadas descrita por uma função de 1º grau). b) Interprete os valores dos coeficientes (angular e linear) encontrados. c) Calcule os valores dos resíduos. Observe os valores da soma destes resíduos. d) Calcule o coeficiente de determinação (R2) e interprete-o. e) Teste as hipóteses de existência de regressão e intercepto. Estatística de regressão R múltiplo 0,845425 R-Quadrado 0,714743 R-quadrado ajustado 0,698895 Erro padrão 38385,741 Observações 20 ANOVA gl SQ MQ F F de significação Regressão 1 6,65E+10 6,65E+10 45,10097 2,69E-06 Resíduo 18 2,65E+10 1,47E+09 Total 19 9,3E+10 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção -11713,7 25575,52 -0,458 0,65243 -65445,9 42018,46 -65445,9 42018,46 PésQuad 105,8082 15,75528 6,715726 2,69E-06 72,70754 138,9088 72,70754 138,9088 14 ESTUDO DE CASO: Produtividade agrícola. Poucos setores da economia aumentaram sua produtividade com tanta rapidez quanto a agricultura. Define-se produtividade como a produção obtida por unidade de insumo. O "fator total de produtividade" (FTP) leva em conta todos os insumos (trabalho, capital, combustíveis e assim por diante). A Tabela 10.3 fornece o fator total de produtividade das fazendas norte- americanas para os anos entre 1948 e 1994. Os valores são números índices, ou seja, eles fornecem o FTP de cada ano como um percentual do valor de 1948. A sua tarefa é descrever, com certo detalhe, como a produtividade nas fazendas norte-americanas aumentou. (MOORE et al., 2006, p. 510). a) Represente graficamente FTP contra os anos. Parece que, por volta de 1980, a taxa de aumento do FTP se alterou. Por que isto é visível a partir do gráfico? Qual foi a natureza da mudança? b) Faça a regressão de FTP sobre os anos, utilizando os dados referentes ao período entre 1948 e 1980. Acrescente a reta de mínimos quadrados em seu diagrama de dispersão. A reta faz com que o fato observado em (a) fique mais claro. 1 Erro-padrão – raiz quadrada do Quadrado Médio dos Resíduos. 33 c) Faça a regressão do FTP sobre os anos para o período entre 1981 e 1994. d) Escrevaum breve relato sobre as tendências da produtividade agrícola dos Estados Unidos a partir de 1948, utilizando as análises feitas nas partes (a) a (c). Ano Ano FTP Ano Ano FTP 1948 1 100 1971 24 149 1949 2 95 1972 25 149 1950 3 94 1973 26 151 1951 4 98 1974 27 143 1952 5 100 1975 28 155 1953 6 102 1976 29 152 1954 7 106 1977 30 164 1955 8 104 1978 31 158 1956 9 106 1979 32 164 1957 10 106 1980 33 156 1958 11 111 1981 34 175 1959 12 111 1982 35 180 1960 13 114 1983 36 162 1961 14 120 1984 37 184 1962 15 121 1985 38 197 1963 16 124 1986 39 199 1964 17 125 1987 40 205 1965 18 129 1988 41 193 1966 19 128 1989 42 212 1967 20 134 1990 43 219 1968 21 138 1991 44 218 1969 22 139 1992 45 235 1970 23 138 1993 46 220 1994 47 245 Seja: ∑X ∑Y ∑XY ∑X2 ∑Y2 1128 7028 194290 35720 1131224 Estatística de regressão R múltiplo 0,9720 R-Quadrado 0,9449 R-quadrado ajustado 0,9438 Erro padrão 9,91678 34 Observações 47 ANOVA gl SQ MQ F F de significação Regressão 1 75888,2891 75888,2891 771,6732 5,7661E-30 Resíduo 45 4425,4130 98,3425 Total 46 80313,7021 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção 78,4366 2,9398 26,6808 3,1989E-29 72,5155 84,3578 72,5155 84,3577 Ano 2,9623 0,1066 27,7790 5,7661E-30 2,7475 3,1770 2,7475 3,1770 -40 -20 0 20 40 0 10 20 30 40 50R e sí d u o s Ano Plotagem de resíduos 0 50 100 150 200 250 300 0 10 20 30 40 50 FTP 35 ANÁLISE DE REGRESSÃO NÃO LINEAR (LINEAR POR TRANSFORMAÇÃO) - EXERCÍCIOS 1. A Companhia GH Manufatureira fabrica um produto chamado Z. Alguns gastos de fabricação são facilmente identificados como fixos, outros diretamente variáveis com a produção. O contador da Cia. Está confrontando-se com um problema para preparar um orçamento flexível para o próximo exercício, e deseja distinguir os elementos fixos e variáveis dos gastos semi-variáveis de fabricação. Custos semi-variáveis são custos que variam com o nível de produção, mas que, entretanto, têm uma parcela fixa que existe mesmo que não haja produção. É o caso, por exemplo, da conta de energia elétrica da fábrica, na qual a concessionária cobra uma taxa mínima mesmo que nada seja gasto no período, embora o valor da conta dependa do número de quilowatts consumidos e, portanto, do volume de produção da empresa. Os detalhes apresentados ocorreram nos 10 primeiros meses do ano anterior. X Y XY X2 Y2 150 80 12.000 22.500 6.400 200 100 20.000 40.000 10.000 300 135 40.500 90.000 18.225 250 125 31.250 62.500 15.625 300 130 39.000 90.000 16.900 250 120 30.000 62.500 14.400 350 140 49.000 122.500 19.600 300 125 37.500 90.000 15.625 250 115 28.750 62.500 13.225 150 80 12.000 22.500 6.400 2.500 1.150 300.000 665.000 136.400 Seja X Número de unidades produzidas e Y Custos individuais semi-variáveis. X Y ln X ln Y [(lnX) (lnY)] (lnX)2 (lnY)2 [(lnY) ( X)] 150 80 5,011 4,382 21,957 25,106 19,202 657,304 200 100 5,298 4,605 24,400 28,072 21,208 921,034 0 50 100 150 200 250 300 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 Título do Gráfico Ano FTP 36 300 135 5,704 4,905 27,979 32,533 24,062 1.471,582 250 125 5,521 4,828 26,659 30,487 23,313 1.207,078 300 130 5,704 4,868 27,763 32,533 23,693 1.460,260 250 120 5,521 4,787 26,434 30,487 22,920 1.196,873 350 140 5,858 4,942 28,948 34,315 24,420 1.729,575 300 125 5,704 4,828 27,540 32,533 23,313 1.448,494 250 115 5,521 4,745 26,199 30,487 22,514 1.186,233 150 80 5,011 4,382 21,957 25,106 19,202 657,304 2500 1150 54,853 47,273 259,835 301,659 223,846 11.935,738 Calcule: 1. Equação de regressão potencial, especificando a função; 2. Equação de regressão exponencial, especificando a função; 3. O coeficiente de determinação para os dois modelos estimados. Escolha o melhor modelo, Justifique sua escolha. 2. Os dados a seguir referem-se aos somatórios das variáveis representantes do consumo de determinada mercadoria (Y) ao longo de 6 meses (X), no Brasil. X Y (X Y) Y2 X2 21 1260 6070 446090 91 (Ln Y) (Ln X) [(Ln Y) ( Ln X)] [(Ln Y) X] [(Ln Y)2] [(Ln X)2] 29,907 6,579 35,844 113,637 153,670 9,409 Calcule: (f) Equação de regressão potencial, especificando a função; (g) Equação de regressão exponencial, especificando a função; (h) O coeficiente de determinação para os dois modelos estimados. Escolha o melhor modelo, Justifique sua escolha.