Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercícios Profª Josefa A . Alvarez 1 Analise de Dados 1) Classifique as variáveis qualitativas quantitativa nominal ordinal discreta Contínua Cor dos olhos das alunas x Peso do boi em quilos x Produção de café no Brasil x Número de defeitos em aparelhos x Comprimento dos pregos produzidos por uma empresa x O ponto obtido em cada jogada de um dado x Sexo x Resp. a) Cor dos olhos das alunas... Resp: qualitativa nominal b) Peso do boi em quilos Resp: quantitativa contínua c) Produção de café no Brasil... Resp: quantitativa contínua d) Número de defeitos em aparelhos de TV... Resp: quantitativa discreta e) Comprimento... Resp: quantitativa contínua f) O ponto obtido em cada jogada de um dado... Resp: quantitativa discreta g)Sexo: Resp: Qualitativa nominal 2) Um concurso realizado simultaneamente nos locais A, B e C, apresentou as médias: 70, 65 e 45, obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a média geral do concurso? Resp. 60,5 Solução: 5,60 304030 45.3065.4070.30 i ii f xf x 3) Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma média de 70 pontos em determinada prova. Sabendo-se que a média geral dos candidatos (independente de sexo) foi de 64 pontos, qual foi a média dos candidatos do sexo feminino? Resp.55 Solução 64.4,070.6,0 mg xx 55 4,0 4264 mx 4) Foi organizado um churrasco para comemorar a conclusão do Curso. Foram compradas as seguintes carnes aos respectivos preços: 10 Kg de filé mignon 12,00 u.m. o Kg 20 Kg de lingüiça 7,00 u.m. o Kg 10 Kg de picanha 16,00 u.m. o Kg Qual o preço médio do Kg de carne adquirida ? R. preço médio da carne comprada é 10,50 u.m.. 5) Determinar a moda de idade de uma classe de alunos em que a pesquisa tenha revelado as seguintes idades: 18,18,19,20,21,21,22,23,23,23,24,25,26. R. Como a moda é o valor que mais ocorre na pesquisa, então a moda da série de idades é 23 anos. 6) Dada a série: 1,2; 1,4; 1,5; 1,8; 2 calcular a média e o desvio padrão. R: média=1,58 dp=0,319 7) Determinar a média e a mediana dos conjuntos de números a seguir: a) 5, 4, 8, 3, 7, 2, 9 ( R - Média = 5,429 Mediana = 5 ) b) 18, 3, 20, 6, 19, 3, 22, 4, 20, 2, 18, 8, 19, 7, 20, 0 R. (b) Média = 11,8125 Mediana = 13 s=8,2) 8) Em um exame final de A, a nota média de um grupo de 150 alunos foi 7,8 e o desvio padrão foi 0,80. Em B, entretanto, a nota média final foi 7,3 e o desvio padrão foi 0,76. Em qual disciplina foi maior a dispersão utilizando-se o coeficiente de variação? Média Desvio Padrão A têm maior dispersão absoluta sA>sB A 7,8 0,80 B 7,3 0,76 Resp:A têm dispersão relativa menor que B. CV(A)= 10,26%< CV(B)= 10,41% Exercícios Profª Josefa A . Alvarez 2 9) Em um mês, um laboratório recebeu os seguintes serviços: Tipo do serviço Preço por serviço (R$) Quantidade A 30,00 1000 B 45,00 450 C 60,00 600 D 50,00 350 E 25,00 250 Qual o preço médio cobrado por serviço? R. média=41,509 10) A tabela a seguir expressa o número de não conformidades encontrados num levantamento de 350 unidades: x 0 1 2 3 4 5 6 f 55 60 112 82 31 8 2 a) Classifique a variável. b) Quantas unidades têm no máximo duas não conformidades? c) Qual é o percentual de unidades que apresentaram somente uma não conformidade? d) Qual é o percentual de unidades que apresentaram pelo menos uma não conformidade? e) Qual foi a moda? f) Determine a mediana. Resp a) Quantitativa discreta. b) 227 c) 17,14% d) 84,29% e) 2 não conformidades f) 2 não conformidades. 11) Um gerente comprou um material específico de dois fornecedores diferentes. Para comparar o nível de impurezas presentes nas compras feitas, o gerente mediu a porcentagem de impurezas presentes em cada um dos grupos, obtendo o que segue: Fornecedor A: 1,8 2,5 1,5 1,2 1 Fornecedor B: 1,6 2,5 1,2 2,3 1,5 Qual das compras é mais homogenea nas impurezas? Justifique adequadamente, utilizando os resultados do Excel abaixo: Fornecedor A: Fornecedor B: n 5 5 Média 1,6000 1,8200 Mediana 1,5 1,6 Moda #N/D #N/D Variância 0,345 0,307 Desvio padrão 0,587 0,554 Resp. Compras do fornecedor B, porque tem menor coeficiente de variação Fornecedor A: CV =36,71% Fornecedor B: CV =30,44% 12) Identifique, justificando, qual a variável mais homogênea. Distribuição A Distribuição B n = 100 x = 50 ii xf = 5000 ii xf 10000 2ii xf = 256400 2)( xxf ii = 7200 100. x s .V.C n xf X ii n xf xf nn xxf s ii ii ii 2 2 2 2 1 1 1 )( Resp: CVA=8,0403/50=0,1608> CVB=6,0151/50=0,1203 Exercícios Profª Josefa A . Alvarez 3 13) Observe a tabela abaixo: Tempo de Montagem de 30 Equipamentos Tempo (min) (x) 50 51 52 53 54 Total Nº de equipamentos (f) 5 10 8 5 2 30 Determine a média e a mediana e o desvio padrão. Resp: Média = 51,63 minutos/equipamento; Mediana = 51,50 minutos. Desvio padrão=1,159 14) A idade em anos dos primeiros 10 presidentes do Brasil, na ocasião de suas posses foram: 57 61 57 57 58 57 61 54 68 51 Resumo estatístico P10 Q1=P25 Q2=P50 Q3=P75 P90 Média Desvio padrão 53,7 57 57 60,25 61,7 Calcule e interprete a) o coeficiente de variação b) o coeficiente de assimetria c) o coeficiente de curtose d) existem valores discrepantes. Cálculos Interpretação s )x~x(3 sA 0,724 Assimetria moderada Curtose 3 1 90 102( ) Q Q C P P 0,203 Leptocurtica 100. x s .V.C 7,84% Baixa dispersão Q1-1,5*(Q3-Q1) 52,125 Existem valores discrepantes 51 e 68 Q3+1,5*(Q3-Q1) 65,125 15) Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Cidade A B C D E F G H I J Investimento 20 15 14 10 18 18 15 16 20 18 a) Calcule a média e o desvio-padrão, Q1, Q2, Q3, e a moda das observações; b) Receberão um programa especial às cidades com valores de investimento inferiores à média menos duas vezes o desvio padrão. Alguma cidade receberá o programa? Resp média, 4,16x ; desvio padrão 06,3s ; Q1 =15 ; Mediana = Q2=17,00 ; Q3 =18 Moda=18,00 ; [ ]275,10*2 sx sim a cidade D Exercícios Profª Josefa A . Alvarez 4 16) Conjunto de dados: Uma amostra de saques de dinheiro feitos em caixas eletrônicos (em um). Determine: a) Calcule o coeficiente de variação. b) Calcule o coeficiente de Assimetria. c) Determine o Q3-Q1. Existem valores discrepantes? 35 20 25 25 20 25 50 60 60 25 30 60 40 40 80 40 70 10 10 40 40 10 75 40 20 20 30 20 70 25 25 20 50 80 30 40 10 10 20 10 30 80 80 50 25 30 30 35 40 60 Resumo Estatístico P25 P50 =Mediana P75 Média Variância 21,25 30 50 37,4000 436,980 R. a) CV=55,89% b) As=1,062 assimetria c) Q3-Q1=50-21,25=28,75 Não existem valores discrepantes, menores que: Q1-1.5* (Q3-Q1)=-21,875 maiores que: Q3+1.5*(Q3-Q1)=93,125 Nome Valores Mínimo 10,00 Q1 21,25 Mediana=Q2 30,00Q3 50,00 Maximo 80,00 IQR = Q3 - Q1 28,75 1.5*IQR 43,13 Q1 - 1.5*IQR -21,88 Q3 + 1.5*IQR 93,13 Resp a) 15,7250 b) 15,65 c) 10,35% d) não e) analisando o box plot os dados são simétricos 17) Uma empresa precisa escolher, dentre três marcas de pneus (A, B, C), qual deverá comprar. O manual do fabricante das três marcas de pneus afirma que o desgaste dos pneus a cada 10.000 km é de 1 milímetro. O gerente de suprimentos da empresa comprou 10 pneus de cada marca e submeteu-os a um teste de desgaste de 10.000 km. O resultado (em número de milímetros gastos) obtido para cada pneu foi o seguinte: n ix Variância x~ Pneus A 10 10 0,164 1 Pneus B 10 9 0,013 0,9 Pneus C 10 10 0,013 1 Qual das marcas de pneus apresentou desempenho mais homogêneo? Calcule a dispersão relativa. Justifique b) Calcule o coeficiente de assimetria. c) Interprete os Box plot Exercícios Profª Josefa A . Alvarez 5 CBA 1,75 1,50 1,25 1,00 0,75 0,50 Da ta Boxplot of A; B; C Pneus n x X i 100... x s VC s xx sA )~(3 A B C Resposta: Os Box plot são uteis em comparações gráficas entre conjunto de dados, uma vez que têm alto impacto visual e são fáceis de entender. Pneus Média Variância Coeficiente de variação Coeficiente de assimetria A 1 0,164 40,6% 0 B 0,9 0,013 12,8% 0 C 1 0,013 11,5% 0 18) Conduziu-se um experimento para investigar a capacidade de enchimento de um equipamento de embalagem em uma vinícola em Newberg, Oregon. Vinte garrafas de Piont Gris foram selecionadas aleatoriamente e o volume de enchimento (em ml) foi medido. Os dados obtidos foram os seguintes: 753 751 752 753 753 752 753 754 754 752 753 751 752 750 753 755 753 756 751 750 Sabe-se que a distribuição dos dados é denominada normal quando os valores de uma variável padronizada s xx z estão contidos no intervalo de variação de -3 a 3. Além disso, a distribuição deve ser simétrica e o valor da média próximo da mediana. O que você diz a respeito da distribuição dos dados da vinícola? Resposta Média=752,55 Modo=753 Mediana=753 Desvio padrão=1,538 Variância da amostra=2,365789 753 751 752 753 753 752 753 754 754 752 s xx z 0,29 -1,01 -0,36 0,29 0,29 -0,36 0,29 0,94 0,94 -0,36 753 751 752 750 753 755 753 756 751 750 s xx z 0,29 -1,01 -0,36 -1,66 0,29 1,59 0,29 2,24 -1,01 -1,66 Exercícios Profª Josefa A . Alvarez 6 19) Existem dados discrepantes (outliers)? 19 20 20 18 25 23 12 10 15 16 15 20 Resumo Estatístico Dados Min = 10,00 Q1 = 15 Q3 = 20 Max = 25,00 Min = 10,00 IQR=Q3-Q1 Média 17,75 Variância 18,93 Quantidade 12 q1-1.5*IQR q3+1.5*IQR Resposta: Não existem pontos discrepantes IQR=Q3-Q1=5,00 Não existem valores menores que: q1-1.5*IQR=7,5 ou maiores que: q3+1.5*IQR=27,5 20) O comprimento de quarenta e nove peças foram medidas e resultaram no seguinte ramos-e- folhas: 15 3 3 4 5 8 16 0 0 1 1 2 2 4 5 7 7 8 9 9 17 0 1 2 2 2 3 3 3 4 5 5 7 9 9 9 9 18 0 1 1 3 4 4 4 5 7 19 0 0 2 3 4 20 0 Determine: a) a moda b) a mediana Resposta Moda =179 Mediana=173 Exercícios Profª Josefa A . Alvarez 7 21) Construa o diagrama de ramos e folhas. Os valores são os seguintes (minutos): 23 - 31 - 42 - 45 - 51 - 52 - 57 - 61 - 61 - 64 - 68 - 69 - 73 - 75 - 75 - 82 - 89 - 94 - 118 – 120. Resposta: Dezenas de minutos Minutos 2| 3 3| 1 4| 2 5 5| 1 2 7 6| 1 1 4 8 9 7| 3 5 5 8| 2 9 9| 4 10| 11| 8 12| 0 22) Conjunto de dados: Uma amostra de saques de dinheiro feitos em caixas eletrônicos (em um). Determine: a) Calcule o coeficiente de variação. b) Calcule o coeficiente de Assimetria. c) Determine o Q3-Q1. Existem valores discrepantes? 10 10 10 10 10 10 20 20 20 20 20 20 20 20 20 25 25 25 25 25 30 30 30 30 30 30 35 35 40 40 40 40 40 40 40 40 50 50 50 60 60 60 60 70 70 75 80 80 80 80 Resumo estatístico P10 Q1=P25 Q2=P50 Q3=P75 P90 Média Variância 10 20 30 50 70,5 37,2000 443,2 R. a) CV=56,58% b) As=1,026 assimetria c) Q3-Q1=30 Não existem valores discrepantes, menores que: Q1-1.5* (Q3-Q1)=-25 maiores que: Q3+1.5*(Q3-Q1)=95 Figura. Diagrama de ramos e folhas Exercícios Profª Josefa A . Alvarez 8 23) Completar os dados que faltam para a seguinte distribuição: Xi: número de imperfeições fi: número de lotes Xi fi Fr=fi/n Frequência relativa Fa Frequência acumulada 1 4 0,04 2 8 3 0,18 30 4 27 0,27 5 15 72 6 83 7 10 0,10 93 8 total 1 R. Xi fi Fr=fi/n Frequência relativa Fa Frequência acumulada 1 4 0,04 4 2 8 0,08 12 3 18 0,18 30 4 27 0,27 57 5 15 0,15 72 6 11 0,11 83 7 10 0,1 93 8 7 0,07 100 total 100 1 23) Construa o histograma. Calcule a freqüência relativa, freqüência acumulada e acumulada relativa Notas Número de alunos Fa 0,0 |---- 2,0 4 4 2,0 |---- 4,0 5 9 4,0 |---- 6,0 10 19 6,0 |---- 8,0 12 31 8,0 |---- 10,0 8 39 Total 39 ---- Exercícios Profª Josefa A . Alvarez 9 Solução 4 5 10 12 8 0 2 4 6 8 10 12 14 0,0 - 2,0 2,0- 4,0 4,0 - 6,0 6,0 - 8,0 8,0 -10,0 Fr eq üê nc ia Nota Notas Prova Estatística R. Notas Número de alunos fi Fr=fi/n Frequência relativa Fa Frequência acumulada Far Frequência acumulada relativa 0,0 |---- 2,0 4 4/39=0,1025 4 4/39=0,1025 2,0 |---- 4,0 5 5/39=0,1282 9 9/39=0,2308 4,0 |---- 6,0 10 10/39=0,2564 19 19/39=0,4872 6,0 |---- 8,0 12 12/39=0,3777 31 31/39=0,7949 8,0 |---- 10,0 8 8/39=0,2051 39 39/39=1 Total 39 1 ---- 24) Dada a distribuição de freqüências, construa o histograma, polígono de frequências simples e acumulado (ogiva) . Classes (R$) fi 402 |420 12 420 |438 15 438 |456 10 456 |474 8 474 |492 5 Solução Classes X ponto médio da classei f i Fr=fi/n Frequência relativa Fa Frequência acumulada Frequência acumulada relativa faR % 402 |420 (420+402)/2=411 12 0,24 12 24,0% 420 |438 429 15 0,3 27 54,0% 438 |456 447 10 0,2 37 74,0% 456 |474 465 8 0,16 45 90,0% 474 |492 483 5 0,1 50 100,0% Total 1 Resp.: Exercícios Profª Josefa A . Alvarez 10 0 2 4 6 8 10 12 14 16 393 411 429 447 465 483 501 frequen cia Classes(R$) Histograma 0 2 4 6 8 10 12 14 16 393 411 429 447 465 483 501 frequen cia Classes (R$) Polígono de frequencias Simples Fa Exercícios Profª Josefa A . Alvarez 11 30) Cinquenta amostras de ar numa região foram obtidas e para cada uma delas foi determinada a concentração de monóxido de carbono. Os resultados (em ppm) foram: 35 20 25 25 20 25 50 60 60 25 30 60 40 40 80 40 70 10 10 40 40 10 75 40 20 20 30 20 70 25 25 20 50 80 30 40 10 10 20 10 30 80 80 50 25 30 30 35 40 60 Determine: Calcule o coeficiente de variação. R. CV=55,89% Saída do Minitab 80604020Median Mean 4540353025 A nderson-Darling Normality Test V ariance 436,980 Skewness 0,716539 Kurtosis -0,443604 N 50 Minimum 10,000 A -Squared 1st Q uartile 20,000 Median 30,000 3rd Q uartile 50,000 Maximum 80,000 95% C onfidence Interv al for Mean 31,459 1,52 43,341 95% C onfidence Interv al for Median 25,000 40,000 95% C onfidence Interv al for StDev 17,462 26,049 P-V alue < 0,005 Mean 37,400 StDev 20,904 95% Confidence Intervals Summary for tempos tempos Pe rc en t 100806040200 99 95 90 80 70 60 50 40 30 20 10 5 1 Mean <0,005 37,4 StDev 20,90 N 50 AD 1,515 P-Value Probability Plot of tempos Normal Exercícios Profª Josefa A . Alvarez 12 1) Mediana: Medida (ou média aritmética das duas medidas) acima da qual existe a mesma quantidade de medidas do que abaixo dela. Da mesma forma, se definem: os Quartis: Q1, Q2, Q3 (dividem as quantidades em 4), os Decis: D1, D2,..., D9 (dividem as quantidades em 10), os Percentis: P1, P2,..., P99 (dividem as quantidades em 100). Assim, a Mediana = Q2 = D5 = P50 A medida Q3 – Q1 = IQR é chamada de amplitude Interquartil 2) Moda: A medida que aparece o maior número de vez. Existem situações: amodais (sem que uma medida apareça mais que as outras), unimodais (apenas uma medida aparecendo mais que as outras), bimodais (duas medidas bem diferentes aparecendo mais que as outras), multimodais (mais medidas diferentes aparecendo mais que as outras), 3) Box Plot: Gráfico em forma de uma caixa (retângulo vertical ou horizontal) mostrando os Quartis x1 = mínimo = menor medida depois de Q1 -1,5 IQR (As medidas antes de x1 são ditas outliers) x2 = máximo = maior medida antes de Q3 +1,5 IQR (As medidas depois de x3 são ditas outliers) Assimetria + Assimetria - Simétrica Q1 Mediana Q3 Q1 Mediana Q3 Q1 Mediana Q3 1,5 IQR 1,5 IQR IQR
Compartilhar