Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE FEDERAL DO MARANHÃO DEPARTAMENTO DE MATEMÁTICA CURSO: MATEMÁTICA - PARFOR, Matões do Norte DISC.: Estatística e Probabilidade 1ª LISTA DE EXERCÍCIOS 1. Dadas as Tabelas 1 e 2 a seguir. Esboçar um gráfico adequado em cada caso e interpretar. TABELA 1 - Consumo mensal de energia elétrica da Fábrica X., 2001-2010. ANO KW 2001 196 2002 195 2003 183 2004 150 2005 164 2006 185 2007 173 2008 308 2009 180 2010 405 Fonte: Fábrica X. 2. Atualize até o ano de 2015 e represente graficamente os dados da Tabela 3 para as variáveis: densidade demográfica, e população residente, segundo o ano, sexo e situação do domicílio. Para atualizar os dados utilize o site do IBGE (www.ibge.gov.br). Tabela 3 - Estado do Maranhão - População residente, por sexo, situação do domicílio e densidade demográfica. Ano Total (hab) Sexo Situação do domicílio Densidade demográfica (hab/km2) Homens Mulheres Urbana Rural 1980 3.996.444 1.991.701 2.004.743 1.254.830 2.741.614 11,99 1991 4.930.253 2.446.865 2.483.388 1.972.421 2.957.832 14,79 1996 5.222.183 2.595.181 2.627.002 2.711.175 2.511.008 15,67 2000 5.651.475 2.812.681 2.838.794 3.357.898 2.285.062 16,95 2001(1) 5.749.966 2.869.255 2.880.711 3.754.892 1.995.074 17,25 Fonte: IBGE. (1) PNAD. 3. Atualize e represente graficamente os dados da Tabela 3 para a variável população residente (%), segundo cor ou raça , no Estado do Maranhão, Nordeste e Brasil – 2001. Para atualizar os dados utilize o site do IBGE (www.ibge.gov.br). Comparar os dados atualizados com o dados do ano 2001. Tabela 3 - População residente (%), segundo cor ou raça, no Estado do Maranhão, Nordeste e Brasil 2001. Cor ou raça (%) Maranhão Nordeste Brasil Branca 24,5 29,5 53,4 Preta 7,4 6,1 5,6 Parda 66,9 64,1 40,4 Amarela e indígena 1,3 0,3 0,6 Fonte: IBGE. PNAD 2001: microdados. Rio de Janeiro: IBGE, 2002. 1 CD-ROM. Extraído da publicação Indicadores Sociais Mínimos TABELA 2 - Escolaridade de 2.000 empregados da Companhia MB, segundo o grau de instrução. Grau de instrução frequência (��) superior 650 médio 1020 fundamental 330 Total 2000 Fonte: Companhia MB. 2 Nota: Os dados do Brasil não incluem a população rural de Rondônia, Acre, Amazonas, Roraima, Pará e Amapá. 4. Os dados abaixo representam a idade � em anos de 50 indivíduos: 84, 68, 53, 52, 59, 73, 68, 61, 73, 77, 74, 71, 81, 81, 65, 55, 57, 65, 85, 88, 59, 80, 61, 50, 53, 65, 76, 85, 73, 60, 67, 51, 78, 56, 74, 65, 55, 55, 64, 74, 65, 84, 66, 58, 59, 69, 89, 78, 72, 54 a) Obtenha uma tabela de distribuição de frequências, calculando fj, (freq. simples) e fr (freq. relativa). b) Supondo que os indivíduos com idade superior a 65 devem ser escolhidos, determine este percentual. c) Construa um histograma e o polígono de frequências baseado nas frequências relativas (frj) para os dados. d) Calcule a média, a variância e o desvio padrão para os dados brutos e dados agrupados em classes. Compare os resultados. e) Determine a idade x que deixa 90% dos indivíduos abaixo desse valor. Sugestão: utilizar os intervalos de classe: [50, 55), [55, 60), .... 5. O que acontece com a média, a mediana e desvio-padrão de uma amostra observada de tamanho n (��, ��, ⋯ , � ) de uma variável quantitativa X quando a) soma-se uma constante c a cada observação (� = � + �) ; b) subtrai-se a média amostral x de cada observação (� = � − �̅); c) subtrai-se de cada observação a média amostral x e divide-se este resultado pelo desvio-padrão �� . 6. Uma indústria produz dois tipos de componentes eletrônicos A e B. O tempo de duração até falhar (em horas) de A e de B é dado: A : 3020, 2890, 2350, 2875, 2970, 3005, 2780, 3010, 2600, 3040 B : 2900, 3050, 2975, 2450, 2890, 2875, 2990, 2300, 2700, 2990 a) Qual o componente que tem a maior dispersão? b) Qual o componente que tem a maior dispersão relativa? 7. A Tabela 4 a seguir apresenta a média e o desvio padrão dos valores de três variáveis usadas como indicadoras da qualidade de vida de uma população, medidas nas 27 unidades da federação brasileiras (Folha de São Paulo de 09/09/98): Tabela 4 Variável Média Desvio Padrão Esperança de vida (em anos) 66,97 2,39 Taxa de alfabetização (em %) 80,85 9,62 PIB per capita ajustado (em dólares ajustados pelo poder de compra) 4846 1697 Deseja-se escolher uma dessas variáveis para se criar um ranking de qualidade de vida entre estas UF’s. A variável escolhida deve ser, portanto, a de melhor poder de discriminação. Com as informações fornecidas na Tabela 4, podemos dizer que esta deve ser a variável de maior heterogeneidade entre as UF’s. Qual deve ser a variável escolhida ? Justifique. 8. Uma companhia telefônica está interessada em obter informações sobre o tempo de duração (em minutos) das conversações telefônicas e determinou-se que o tempo médio de conversação era de 3,4 minutos. Um mês mais tarde, 30 chamadas telefônicas foram observadas e achou-se um tempo médio de conversação de 4,2 minutos. Ache o tempo médio de conversação das 50 chamadas da pesquisa. 9. Medidos os comprimentos de 101 peças fabricadas obteve-se x = 152,2cm e S = 6,9cm. O peso médio dessas mesmas peças é 25kg, com um desvio padrão de 1,3kg. Essas peças apresentam maior variabilidade em comprimento ou em peso? 3 10. Para se estudar o desempenho de duas companhias corretoras de ações, selecionou-se de cada uma delas amostras aleatórias das ações negociadas. Para cada ação selecionada; computou-se a percentagem de lucro apresentada durante um período fixado de tempo. Os dados estão a seguir: CORRETORA A ( AX ) 45 62 38 55 54 65 60 55 48 56 59 55 54 70 64 55 48 60 CORRETORA B ( BX ) 57 50 59 61 57 55 59 55 52 55 52 57 58 51 58 59 56 53 50 54 56 a) Para verificar a homogeneidade das duas populações um estatístico sugeriu o quociente: )( )( B A XVar XVar F = , em que )( AXVar e )( BXVar correspondem a variância de AX e variância de BX , respectivamente. Que decisão você adotaria para dizer se são homogêneas ou não ? b) Adote agora o seguinte teste: BA nn BAt S xx 11 * + = − , nnn BA =+ ; 2 )()1()()1(2 −+ −+− = BA BBAA nn XVarnXVarn S . Caso | t | < 2 os desempenhos são semelhantes, caso contrário são diferentes. Qual é a sua conclusão ? 11. A distribuição de frequência do salário mensal dos funcionários da fábrica X é apresentada na tabela abaixo: TABELA 5 - Salário mensal dos funcionários da Fábrica X - nov/2010. SALÁRIOS MÍNIMOS FREQUÊNCIA 0 | 2 1000 a) construa um histograma da distribuição 2 | 4 390 b) determine a média a variância e o desvio-padrão 4 | 6 200 c) Uma fábrica Y apresenta , uma média de 8,2 salários mínimos e um 6 | 8 110 Desvio-padrão de 15,1 salários mínimos. Em qual das fábricas os salários são mais homogêneos ? 8 | 10 80 10 | 12 70 12 | 14 200 TOTAL 2050 Fonte: Dept. de Pessoal. 12. Para cada uma das doses 200, 300, 500 e 1000 (mg) de uma determinada droga foram submetidos seis grupos, cada um com dez indivíduos, e observado o nº de pacientes curados. Os dados são resumidos na tabela abaixo. 200 300 500 1000 7 9 10 6 7 9 6 4 8 1 3 2 8 9 9 7 8 4 5 6 3 2 6 5 Calcule para cada dose a média, mediana e o desvio padrão. Compare o nº médio com o nº mediano de indivíduos curados segundo as doses. Comente. 13. Os Os dados abaixo se referem ao tempo de espera numa fila de 30 indivíduos. 4,2 4,2 1,9 3,6 4,2 5,1 6,0 1,8 1,5 6,9 6,5 4,5 2,4 5,4 5,1 7,4 6,0 2,0 3,0 8,2 4 7,5 6,8 8,0 6,9 5,7 7,5 7,2 2,7 3,9 8,5 a) Calcule as medidas descritivas: mínimo,1º. quartil, média, mediana, 3º. quartil, máximo; b) Construa uma tabela de distribuição de frequências e calcule as medidas acima, a partir dos dados da tabela; c) Compare os resultados obtidos nos itens a) e b); d) Construa um histograma e interprete; e) Construa um desenho esquemático (box plot) e interprete. 14. Uma indústria, desejando melhorar o nível de seus funcionários em cargos de chefia, montou um curso experimental e indicou 25 funcionários para a primeira turma. Os dados referentes à seção a que pertencem, notas e graus obtidos no curso estão na tabela a seguir. Utilizando o R, EXCEL ou MINITAB. (a) Classifique as variáveis listadas. (b) Calcule média, moda, mediana e desvio padrão das variáveis Direito, Política e Estatística. (c) Compare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística (use “dotplots”). (d) Compare o aproveitamento dos funcionários da disciplina Estatística segundo a seção a que eles pertencem. (e) Construa uma tabela de contingência para as variáveis seção e inglês. Determine as freqüências relativas e compare o desempenho dos funcionários em inglês segundo a seção a que eles pertencem. Funcionário Seção Direito Política Estatística Inglês Metodologia 1 Pessoal 9 9 9 B A 2 Pessoal 9 6,5 9 B C 3 Pessoal 9 9 8 D B 4 Pessoal 9 6 8 D C 5 Pessoal 9 6,5 9 A A 6 Pessoal 9 6,5 10 B A 7 Pessoal 9 9 8 D C 8 Técnica 9 6 8 B C 9 Técnica 9 10 9 B B 10 Técnica 9 9 8 B C 11 Técnica 9 10 10 C B 12 Técnica 9 6,5 7 D B 13 Técnica 9 6 7 B C 14 Técnica 9 10 9 A B 15 Vendas 9 10 9 C B 16 Vendas 9 9 7 A A 17 Vendas 9 10 8 D C 18 Vendas 9 6 9 C C 19 Vendas 9 6 1 D C 20 Vendas 9 6 7 C B 21 Vendas 9 6,5 7 D B 22 Vendas 9 6 8 C A 23 Vendas 9 9 10 C C 24 Vendas 9 6,5 9 A A 25 Vendas 9 9 9 B A 15. A tabela a seguir apresenta o tempo (em unidades de milhões de ciclos) até a perda de velocidade de cinco tipos de turbina de avião. Foram considerados 10 motores para cada tipo de turbina. Calcule para cada tipo a média, mediana, desvio padrão e intervalo interquartil. Compare os cinco tipos segundo essas medidas. Calcule também o coeficiente de variação para cada tipo, comente. Utilize agora o comando boxplot do R e faça uma comparação gráfica do desempenho dos cinco tipos de turbina. Tipo 1 Tipo 2 Tipo 3 Tipo 4 Tipo 5 3.03 3.19 3.46 5.88 6.43 5.53 4.26 5.22 6.74 9.97 5.60 4.47 5.69 6.90 10.39 9.30 4.53 6.54 6.98 13.55 9.92 4.67 9.16 7.21 14.45 5 12.51 4.69 9.40 8.14 14.72 12.95 5.78 10.19 8.59 16.81 15.21 6.79 10.71 9.80 18.39 16.04 9.37 12.58 12.28 20.84 16.84 12.75 13.41 25.46 21.51 16. A tabela seguinte mostra os resultados de uma pesquisa com 10 famílias de determinada região. Famílias Renda (u.m.:100) Poupança u.m.:1000) Número de filhos Média de anos de estudo da família A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 Calcule o coeficiente de correlação linear de Pearson entre: a) renda familiar e poupança das dez famílias; b) renda e número de filhos para as dez famílias; c) poupança e número de filhos; d) média de anos de estudo e número de filhos; e) renda familiar e media de anos de estudo. 17. Existe associação entre as vendas de gasolina com chumbo e a concentração de chumbo no cordão umbilical de recém-nascidos? A s vendas mensais de gasolina com chumbo no estado de Massachusetts (X) e as concentrações médias de chumbo no cordão umbilical (Y) de bebês nascidos no principal hospital de Boston durante 14 meses no período de 1980-1981 são listados na tabela abaixo. a) Calcule o coeficiente de correlação linear de Pearson entre X e Y. b) Ajuste de uma reta de regressão para descrever a relação entre as variáveis Y (dependente) e X (independente). Qual é o acréscimo na concentração média de chumbo no cordão umbilical ocasionado pela venda adicional de uma tonelada métrica de gasolina? c) Considerando a reta estimada dada no item (b), estime a concentração média no cordão umbilical correspondente à venda de 110 toneladas métricas de gasolina. X 141 166 161 170 148 136 169 109 117 87 105 73 82 75 Y 6,4 6,1 5,7 6,9 7,0 7,2 6,6 5,7 5,7 5,3 4,9 5,4 4,5 6,0 18. Uma pesquisa sobre a qualidade da água foi realizada numa cidade. Em 8 comunidades com reservatórios de água na superfície, estudou-se o efeito da quantidade de magnésio (miligramas p/ litro) sobre um índice de qualidade. x 8,7 9 11 8,5 9,2 12 12 18 y 25 25 26 48 65 87 90 100 (a) calcular o coeficiente de correlação amostral. Fazer um diagrama de dispersão das variáveis X (covariável) e Y (variável resposta). (b) Obter 0β̂ , 1β̂ e a equação da reta ajustada. Qual a interpretação de 0β̂ e 1β̂ ? (c) Achar o valor de previsão para a qualidade da água com x = 15 miligramas por litro de magnésio 6 (d) Fazer o gráfico dos resíduos yyei ˆ−= e comentar. 19. Os dados a seguir representam o número de filhos do sexo feminino (X) de 40 moradores de um bairro A da cidade de São Luís. x = (5 ,2, 3, 1, 3, 2, 2, 3, 2, 2, 4, 4, 1, 3, 2, 2, 4, 4, 3, 3, 3, 0, 2, 4, 3, 2, 2, 4, 2, 5, 1, 4, 1, 1, 1, 3, 3, 0, 3, 1). Construir uma tabela com as frequências simples (fj) e relativas (frj). Construir um gráfico apropriado para representar a variável X. Determinar a média a mediana e o desvio padrão de X. Estimar a probabilidade de uma família sorteada ao acaso possuir dois ou menos filhos do sexo feminino pela frequência relativa deste evento. 20. Os dados a seguir representam uma amostra (x,y) de tamanho 10 das notas de alunos de Cálculo (1a prova) e Estatística (1a prova) do curso de Matemática da UFMA. Cálculo (X) Estatística (Y) 5 6 7.5 8 6.5 6 8 9 9.5 10 3 4 5.5 5 9 10 7 7.5 2 2.5 (a) calcular o coeficiente de correlação amostral. Fazer um diagrama de dispersão das variáveis X (covariável) e Y (variável resposta). (b) Obter 0β̂ , 1β̂ e a equação da reta ajustada. Qual a interpretação de 0β̂ e 1β̂ ? (c) Achar o valor de previsão para a nota de estatística com x = 9. (d) Fazer o gráfico dos resíduos padronizados e comentar. 21. As três maiores universidades do país em quantidade de alunos na graduação estão longe do topo na lista de melhores do país no RUF (Ranking Universitário Folha), publicado em 09/09/2013, veja a figura a seguir. Fonte: http://f.i.uol.com.br/folha/cotidiano/images/13254708.jpeg 7 Utilize um modelo de regressão linear para ajustar os dados observados das variáveis X = número de alunos e Y = nota total no RUF (variável resposta). Comente os resultados. 22. Considere uma variável de interesse X. Mostre que soma dos quadrados dos desvios de X em relação à média X é um mínimo. Sugestão: Mostrar que o valor da função ∑ = −= n i ixf 1 2)()( µµ será mínimo quando X=µ . 23. (PROFMAT - 2015) As notas obtidas por cinco alunos em uma prova de matemática indicam que a mediana é 6, a moda é 8 e a média aritmética é 6. Acrescentando-se à amostra a nota de um sexto aluno, que fez a segunda chamada da prova, a mediana aumenta para 6,5. Nessas condições, determine a nova média aritmética das notas. Resposta: 37/6. 24. A idade média dos candidatos a um determinado curso sempre foi baixa, da ordem de 22 anos. Como esse curso foi planejado para atender a todas as idades, decidiu-se uma campanha de divulgação. Para verificar se a campanha foi ou não eficiente, fez-se um levantamento da idade dos candidatos atualmente, e os resultados estão na tabela a seguir. Idade (X) Frequência simples Frequência acumulada absoluta relativa absoluta relativa fj frj #$ #%$ 18 | 20 18 0,36 #� #%� 20 | 22 12 0,24 #� #%� 22 | 26 10 0,20 ⋮ ⋮ 26 | 30 8 0,16 ⋮ ⋮ 30 | 36 2 0,4 ' 1 TOTAL 50 1,0(a) Baseando-se nesses resultados, você diria que a campanha produziu algum efeito (isto é, aumentou a média?) (b) Um outro pesquisador decidiu usar a seguinte regra: se a diferença (�̅ − 22) fosse maior que o valor 2*�/√', então a campanha surtiu efeito. Qual a conclusão dele baseada nos dados? (c) Fazer um histograma para os dados da variável X. (d) Determinar as frequências acumuladas #$ e #%$, - = 1,2, ⋯ , . , sendo que, #$ = /� + /� + ⋯ + /$; #%$ = 01 , - = 1,2, ⋯ , .; ou #%$ = /%� + /%� + ⋯ + /%$. 25. O que acontece com a média e o desvio padrão de uma série de dados quando: (a) cada observação é multiplicada por 2? (b) soma-se 10 a cada observação? (c) subtrai-se a média amostral �̅ de cada observação? (d) de cada observação subtrai-se �̅ e divide-se pelo desvio padrão amostral S ? 26. Os dados a seguir representam o tempo de atendimento em horas para uma amostra de n = 20 pacientes numa clínica médica, no ano de 2015 num hospital da cidade de São Luís. 8 11.80,11.90,12.00,12.30,12.80,12.99,13.10,13.50,13.80,14.10, 14.55,14.65,14.70,15.00,15.10,15.20,15.50,15.80,15.90,15.96 (a) Obter a média �̅, a variância �� e o desvio padrão � amostrais. (b) Determinar o coeficiente de variação 23 . Qual é a principal diferença entre o desvio padrão e a variância? (c) Determinar o erro padrão da média (45(�6) = �/√'). (d) Se você fosse solicitado a apresentar duas medidas (estatísticas) para resumir os dados, quais você recomendaria? (e) Se cada observação for dividida por 24, para se obter o tempo de atendimento em dias, quais serão os novos valores da média, variância, desvio padrão, coeficiente de variação e erro padrão da média? (f) Agrupar os dados tempo entre chegadas em horas em classes (distribuição de frequências). Responder as questões:. (f1) Construir um histograma para os dados do tempo entre chegadas em horas. Determinar a média usando os dados agrupados. (f2) Calcular a variância, desvio padrão, coeficiente de variação e erro padrão da média. (f3) Após uma mudança de diretoria do hospital o tempo de atendimento apresentou média de 14 dias e desvio padrão de 2 dias. Qual é a situação que apresentou maior variabilidade, anterior ou posterior a mudança de diretoria? (f4) Em qual caso a média foi calculada com maior precisão? No item (a) ou no item (f1)? Justifique sua resposta. 27. Os dados de uma amostra observada de tamanho n = 30 da variável X = tempo em meses até a falha de um equipamento eletrônico são dados por: x = (8.13,8.23,8.60,8.80,8.97,9.05,9.12,9.30,9.35,9.78,9.80, 9.86,9.90,9.95,10.00,10.11,10.13,10.15,10.16,10.23,10.31, 10.33,10.40,10.46,10.50,11.14,11.29,11.46,12.05,12.14) . a) Obter a média, a mediana e o desvio padrão da variável X. b) Se o tempo de falha de cada equipamento for multiplicado pela constante 30, qual será o valor da média, da mediana e do desvio padrão amostral da variável transformada? 28. Escalas de medidas. (Bussab & Morettin, 2017) A seguir descrevemos outros possíveis critérios para classificar variáveis, em função da escala adotada. Observe a similaridade com a classificação apresentada anteriormente. Nossas observações são resultados de medidas feitas sobre os elementos de uma população. Existem quatro escalas de medidas que podem ser consideradas: Escala nominal. Nesta escala somente podemos afirmar que uma medida é diferente ou não de outra, e ela é usada para categorizar indivíduos de uma população. Um exemplo é o sexo de um indivíduo. Para cada categoria associamos um numeral diferente (letra ou número). Por exemplo, no caso de sexo: podemos associar as letras M (masculino) e F (feminino) ou 1 (masculino) e 2 (feminino). Não podemos realizar operações aritméticas aqui e uma medida de posição apropriada é a moda. (As medidas citadas nesse problema, como a média, mediana e moda, são definidas no Capítulo 3.) Escala ordinal. Aqui podemos dizer que uma medida é diferente e maior do que outra. Temos a situação anterior, mas as categorias são ordenadas, e a ordem dos numerais associados ordena as categorias. Por exemplo, a classe socioeconômica de um indivíduo pode ser baixa (1 ou X), média (2 ou Y) e alta (3 ou Z). Transformações que preservam a ordem não alteram a estrutura de uma escala ordinal. No exemplo acima, podemos representar as categorias por 1, 10 e 100 ou A, L e Z. Medidas de posição apropriadas são a mediana e a moda. 9 Escala intervalar. Nesta escala podemos afirmar que uma medida é igual ou diferente, maior e quanto maior do que outra. Podemos quantificar a diferença entre as categorias da escala ordinal. Necessitamos de uma origem arbitrária e de uma unidade de medida. Por exemplo, considere a temperatura de um indivíduo, na escala Fahrenheit. A origem é 0o F e a unidade é 1o F. Transformações que preservam a estrutura dessa escala são do tipo y = ax + b, a > 0. Por exemplo, a transformação y = 5/9 (x – 32) transforma graus Fahrenheit em centígrados. Para essa escala, podemos fazer operações aritméticas, e média, mediana e moda são medidas de posição apropriadas. Escala razão. Dadas duas medidas nessa escala, podemos dizer se são iguais, ou se uma é diferente, maior, quanto maior e quantas vezes a outra. A diferença com a escala intervalar é que agora existe um zero absoluto. A altura de um indivíduo é um exemplo de medida nessa escala. Se ela for medida em centímetros (cm), 0 cm é a origem e 1 cm é a unidade de medida. Um indivíduo com 190 cm é duas vezes mais alto do que um indivíduo com 95 cm, e esta relação continua a valer se usarmos 1 m como unidade. Ou seja, a estrutura da escala razão não é alterada por transformações da forma y = cx, c > 0. Por exemplo, y = x/100 transforma cm em m. As estatísticas apropriadas para a escala intervalar são também apropriadas para a escala razão. Para cada uma das variáveis abaixo, indique a escala usualmente adotada para resumir os dados em tabelas de freqüências: (a) Salários dos empregados de uma indústria. (b) Opinião de consumidores sobre determinado produto. (c) Número de respostas certas de alunos num teste com dez itens. (d) Temperatura diária da cidade de Manaus. (e) Porcentagem da receita de municípios aplicada em educação. (f) Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento. (g) QI de um indivíduo.
Compartilhar