Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal Rural do Rio de Janeiro 22/09/2020 Prof.: Felipe Leite Lista 2 de Estat́ıstica Análise Exploratória e Medidas Estat́ısticas 1. Considere o conjunto de dados de idade (em meses) de uma determinada planta. 1 2 2 2 3 4 5 5 6 6 7 9 10 11 11 12 13 15 19 20 a) Faça o histograma com 5 classes iniciando no menor valor do conjunto. E, em seguida o poĺıgono de frequência. b) É verdade que a média de idade das plantas é inferior a 8 meses? Justifique: c) Encontre a moda, mediana, variância, desvio padrão e o coeficiente de variação. d) Encontre o 20o e o 90o percentis. e) Faça o Box-plot. f) Qual é o intervalo interquartil? g) Qual é classificação para a assimetria e a curtose da curva de frequência? 2. Considere o histograma (di = fi/∆i) do peso, de 200 observações, de um determinado produto. Figura 1: Gráfico do peso de um produto contendo 200 observações. a) Encontre a tabela de frequências para os dados. b) Determine a média, a moda, mediana e a variância. c) Qual é a porcentagem dos produtos com peso superior a 6 Kg? d) Qual é a porcentagem dos produtos entre 2,5 e 5,2 kg? 3. Considere o conjunto de dados de idade (em meses) de uma determinada planta. 2 3 2,1 3 4 5 2 7 6 5 6 3 3 8 6,3 4 4 7 2 2,7 a) Faça o histograma com 5 classes iniciando no menor valor do conjunto. E, em seguida o poĺıgono de frequência. b) É verdade que a média de idade das plantas é inferior a 3,5 meses? Justifique: 1 4. Foi realizada uma pesquisa com 20 funcionários de uma empresa para avaliar a preferência entre dois produtos (A e B). A tabela 1 apresenta os resultados das seguintes caracteŕısticas investigadas: Nota para avaliação do produto A (Y); Nota para avaliação do produto B (Z). Entrevistado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Avaliação A (Y) 10 7 9 5 5 6 8 5 8 7 4 6 10 9 8 8 10 6 7 8 Avaliação B (Z) 5 8 5 6 7 8 5 7 3 4 9 10 5 6 4 6 5 8 4 5 a) Mostre através de alguma medida estat́ıstica que a avaliação do produto A é melhor do que a do produto B. Sabendo que: ∑20 i=1 yi = 146 ∑20 i=1 zi = 120 b) Calcule a variância da variável de avaliação do produto A. Sabendo que: ∑20 i=1 xi = 146 ∑20 i=1 xi 2 = 1128 5. Uma determinada pesquisa, durante 20 dias de um mês, observou o número de pessoas em uma fila de um posto médico as 8 horas. 3 11 8 12 14 13 15 14 14 19 6 20 14 23 29 12 25 5 8 8 a) Determine a média, moda e a mediana. b) Faça um histograma com seis classes e começando no menor valor do conjunto de dados. c) Determine os quartis e o intervalo interquartil. d) Faça o Box-plot. e) Construa o gráfico: poĺıgono de frequência. f) Qual é classificação para a assimetria e a curtose da curva de frequência? Sabendo que: ∑20 i=1 xi = 273 ∑20 i=1 xi 2 = 4605 6. Considere o conjunto de n observações x1, x2, ..., xn e o conjunto dado por y1, y2, ..., yn. Se yi = xi + k para i = 1, 2, ..., n, mostre que ȳ = x̄ + k. 7. Considere o conjunto de n observações x1, x2, ..., xn e conjunto dado por y1, y2, ..., yn. Se yi = kxi para k uma constante não nula, mostre que ȳ = kx̄. 8. Mostre que para um conjunto de observações não-nulas, vale as seguintes relações: x̄h 6 x̄g 6 x̄ 9. Na tabela abaixo temos os dados de área de pastagens (ha) de 1970 à 2006 (Fonte: IBGE). a) Um estudante da universidade diz que a média dos dados da tabela, de área de pastagens, é inferior a 120230000 ha. O que você acha? Justifique: b) Determine a variância, o desvio padrão e o coeficiente de variação para os dados de área de pastagens. 2 Ano Área de pastagens (ha) 1940 88141733 1950 107633043 1960 122335386 1970 154138529 1975 165652250 1980 174499641 1985 179188431 1995 − 1996 177700472 2006 172333073 10. A tabela a seguir apresenta a porcentagem do consumo de energia életrica pelas regiões sudeste e centro oeste do Brasil de Março a Dezembro, decorrente da capacidade de seus reservatórios (Fonte: ONS). mês Mar Abr Mai Jun Jul Ago Set Out Nov Dez Porcentagem 80,82 83,68 82,3 78,75 76,24 72,49 70,31 69,16 67,57 72,57 Com base nestes dados, qual é a média do consumo de energia dos seus reservatório no peŕıodo citado? Um pesquisador diz que os dados são heterogêneos se o coeficiente de variação for superior a 30%, com base no que o pesquisador concluiu, os dados de consumo de energia do reservatório não são heterogêneos? E, determine a média e desvio médio absoluto do consumo de energia. 11. A tabela abaixo mostra o tempo de atendimento (em minutos) dentro de um banco no horário de 13h até às 14h para um conjunto de 25 pessoas. Tempo Frequência [2; 7) 8 [7; 12) 7 [12; 17) ? [17; 22) 3 [22; 27) 2 Determine o tempo médio de atendimento, a moda, a mediana, a variância, o desvio padrão, o coeficiente de variação, o intervalo interquartil e construa o boxplot. 3 12. O departamento pessoal de uma certa empresa fez um levantamento dos salários dos 120 funcionários do setor administrativo, obtendo os resultados (em salários mı́nimos) da tabela abaixo: a) Esboce o histograma correspondente. b) Determine a média, a variância e o desvio padrão. c) Faça o Box-plot. d) Qual é classificação para a assimetria da curva de frequência? Salário mı́nimo Frequência [0; 2) 0, 30 [2; 4) ? [4; 6) 0, 20 [6; 8) 0, 08 [8; 10) 0, 02 13. Dado o conjunto de altura (em metros) de 10 árvores de um determinado parque de preservação ambiental. 3,2 3,8 4,5 4,5 6 6,5 7 8,3 8,5 8,6 a) Um biólogo afirma que a altura de cada árvore deveria receber mais 70cm, então qual seria a média de altura das árvores? b) Um estudante garante que a altura de cada árvore deveria ser multiplicado por 0,8, então qual seria a média de altura? c) Considerando que houve um erro na medida da altura, isto é, a altura de cada árvore estava 10% superior a medida correta; então qual deveria ser a média de altura das árvores? 14. Exemplifique, através de gráficos, a diferença de classificação por assimetria. 15. Exemplifique, através de gráficos, a diferença de classificação por curtose. 4 16. A tabela abaixo apresenta o critério simplificado do IBGE (Divisão de classes sociais econômicas segundo o IBGE, 2012). Classe Salários Mı́nimos (SM) Renda Familiar A acima de 20 SM B 10 A 20 SM C 4 a 10 SM D 2 a 4 SM E até 2 SM Um determinado aluno entrevistou 20 pessoas, no centro de uma cidade X, para coletar informações sobre as classes sociais. A tabela abaixo mostra o resultado da entrevista. Entrevistado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Salários Mı́nimos 2 1 11 3 6 25 12 15 4 5 2 10 6 2 3 4 3 2 3 5 Faça uma análise dos dados. Sugestão: Medidas estat́ısticas e gráficos. 17. O restante dos exerćıcios está no livro texto (ESTATÍSTICA BÁSICA) pag. 31, 32, 33, 34, 35, 36, 37, 38, 39. Principalmente os números: 2.1, 2.2, 2.13, 2.14, 2.17, 2.21, 2.22. 18. ( Exerćıcicio para ser enviado até 29/09, e-mail: felipeleite@ufrrj.br ) O corpo adminis- trativo de um consultório médico estudou o tempo de espera dos pacientes que chegavam ao consultório com uma solicitação de serviço de emergência. Os seguintes dados foram coletados no peŕıodo de um mês (os tempos de espera estão em minutos): 2, 5, 10, 12, 4, 4, 5 , 17, 11, 8, 9, 8, 12, 21, 6, 8, 7, 13, 18, 3. (a) Classifique a variável tempo de espera. (b) Com os dados acima, determine o tempo médio de espera, a moda, a mediana, a variância, o desvio padrão, o coeficiente de variação e o intervalo interquartil. (c) Construa o boxplot. (d) Utilize 5 classes para construir uma tabela de distribuição de frequências para a variável. (e) A partir dos dados desta tabela obtida no item anterior, determine o tempo médio de espera, a moda, a variância, o desvio padrão e o coeficiente de variação. (f) Construa o histograma e o poĺıgono de frequências. (g) Detemine a mediana e o intervalo interquartil.5 Faixa salarial (× salários mińımos) Frequência [0;2) 10.000 [2;4) 3.900 [4;6) 2.000 [6;8) 1.100 [8;10) 800 [10;12) 700 [12;14) 2.000 Total 20.500 19. ( Exerćıcicio para ser enviado até 06/10) A distribuição de frequências do salário anual dos moradores do bairro A que têm alguma forma de rendimento é apresentada a seguir: (a) Construa um histograma de proporção. (b) Qual é a média e o desvio padrão dos salários? (c) O bairro B apresenta, para a mesma variável, uma média de 7,2 e um desvio padrão de 15,1. Em qual dos bairros a população é mais homogênea quanto à renda? (d) Qual a riqueza total dos moradores do bairro? (e) Se for concedido um aumento de 100% para todos os moradores, haverá alteração na média? E no desvio padrão? Justifique. (f) Se for concedido um abono de 2 salários mı́nimos para todos moradores, haverá alteração na média? E na variância? E na mediana? Justifique. 6
Compartilhar