Baixe o app para aproveitar ainda mais
Prévia do material em texto
https://www.passeidireto.com/perfil/matheus-ferreirakxhwfl-54/ 1ª LISTA DE EXERCÍCIOS – 2022.2 (2,0 pontos) 1ª) Classifique as variáveis em qualitativa (nominal ou ordinal) e quantitativa (discreta ou contínua) e dê exemplo de um valor (numérico ou não numérico) para cada item. Variáveis Qualitativa/Quantitativa Valor a) estado civil de uma pessoa: qualitativa nominal (solteira, casado) b) marcas de carros em um estacionamento: qualitativa nominal (Ford, Fiat, Honda) c) salário de um funcionário de uma empresa: quantitativa contínua (1.950,60, 4.550,95) d) número de acidentes de trabalho em uma empresa: quantitativa discreta (10, 25, 60) e) cor dos cabelos das modelos de uma agencia de modelos: qualitativa nominal (preto, ruivo, loiro) f) cor dos olhos: qualitativa nominal (azul, verde, castanho) g) grau de instrução: qualitativa ordinal (1ºgrau completo, 3º grau incompleto) 2ª) Vinte e quatro pacientes portadores de uma doença grave foram submetidos a uma intervenção cirurgia que implantou um dispositivo em seus tórax que visa desacelerar o agravamento da doença. Os dados a seguir exibem o tempo (em meses) de uso do dispositivo até sua rejeição por parte do organismo do paciente. (a) Com base nos dados brutos correspondentes ao tempo de uso, identifique o tempo médio e o coeficiente de variação. Construa o Box-plot e com base nele selecione as medidas resumo mais adequadas para representar a variável. 0,5 0,5 0,5 0,5 0,5 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 18 24 72 100 ● Mediana (o valor que ocupa a posição central da série de observações): 1 mês ● Tempo mínimo: 0.5 mês (15 dias) ● Tempo máximo: 100 meses ● Primeiro quartil: 1 mês ● Terceiro quartil: 3 meses ● Tempo médio: 10,062 meses ● Desvio padrão amostral = Desvio padrão da amostra: 24,411 ● Coeficiente de variação = desvio padrão / média x 100 Coeficiente de variação = 24,411 / 10,062 x 100 Coeficiente de variação = 242,62% No gráfico abaixo, a princípio, buscou-se analisar os dados obtidos na questão. Com isso, concluímos que o tempo mínimo de uso do dispositivo era 0.5 mês e o tempo máximo era de 100 meses. Após isso, buscou-se encontrar os quartis. O primeiro quartil é de 1 mês, enquanto o segundo quartil é de 3 meses. A mediana também é de 1 mês. EQ1 = 24X1 / 4 = 6º = 1 EQ2 = 24 X 2 / 4 = 12º = 1 EQ3= 24X3/4 = 18º = 3 Posteriormente, buscou-se encontrar o limite mínimo e o limite máximo das caixas. O limite mínimo é o menor observado que não é outlier. Neste caso, o limite mínimo é 0.5. Para tal, utilizou-se a seguinte fórmula: Limite mínimo = q1 – 3/2 x DQ; se o resultado é menor que o limite inferior do conjunto de dados, o limite mínimo é igual ao limite inferior do conjunto. Limite máximo = q1 + 3/2 x DQ Limite máximo: 0,5 + 1,5 x 2 = 4 Sendo que Q1 = primeiro quartil e DQ = distância entre o Q3 e Q1. Com isso, o limite mínimo é 0,5 e o limite máximo 6. Como os valores 100, 72, 24 e 18 são extremamente discrepantes, eles foram considerados como outliers (representados por pontos no gráfico) (b) Construa da distribuição de frequências – dados agrupados por classes - para o tempo de uso do dispositivo. No processo considere 5 classes, construa o polígono de frequências e a ogiva de Galton. Com base na referida distribuição, calcule a moda elaborada, o coeficiente de variação e o 3º. Quartil. Qual média foi mais representativa, a calculada a partir dos dados brutos ou a calculada a partir dos dados agrupados? Justifique suas respostas. Segue abaixo a distribuição de frequências, onde buscou-se esquematizar o nº de vezes que cada item do conjunto de dados foi citado. A moda desse conjunto de dados é o tempo de 1 mês com frequência 8. TEMPO (em meses) FREQUÊNCIA 0,5 5 1 8 2 4 3 3 18 1 24 1 72 1 100 1 Segue abaixo a distribuição de frequências agrupados por classes. Para descobrir o intervalo entre as classes, realizou-se as seguintes etapas: (1) Amplitude total: At = Maior valor observado – Menor valor observado At: 99,5 (2) Amplitude dos intervalos: H= amplitude total (R) / número de intervalos (K) H= 99,5 / 5 H= 19,9 A amplitude de intervalos acima foi arredondada para 20 para facilitar a criação dos gráficos. TEMPO (em meses) FREQUÊNCIAABSOLUTA FREQUÊNCIA ACUMULADA 0.5 a 20.5 21 21 20.51 a 40,5 1 22 40,51 a 60,5 0 22 60,51 a 80,5 1 23 80,51 a 100,5 1 24 Segue abaixo o polígono de frequências absolutas. A classe modal é de 0,5 a 20,5 meses com frequência 21. Com essa informação, calcula-se a moda bruta: Moda bruta = 0,5 + 20,5 / 2 = 10 A média é de 4,8. O desvio padrão é de 9,06. O coeficiente de variação é de 188.75%. O terceiro quartil é 11. Média = 21 + 1 + 0 + 1 + 1/5 = 4,8 Desvio de 21 = 16,2; Desvio de 1 = 3,8; Desvio de 0 = 4,8; Desvio de 1: 3,8; Desvio de 1: 3,8. Variância = (16,2)² + (3,8)² + (4,8)² + (3,8)² + (3,8)² = 328,8 Desvio padrão amostral = Desvio padrão amostral = raiz quadrada de 328,8 dividido por 4 Desvio padrão amostral = raiz quadrada de 82,2 Desvio padrão amostral = 9,06 Coeficiente de variação = desvio padrão / média x 100 Coeficiente de variação = 9,06 / 4,8 x 100 Coeficiente de variação = 188,75 Terceiro quartil: sabendo que a mediana é 1, o terceiro quartil deve estar entre 1 e 21. 1 + 21 = 22; 22/2 = 11. 0 1 1 1 21 Segue abaixo a ogiva de Galton. A classe modal de 80,51 a 100,5 meses com frequência 24. Com essa informação, calcula-se a moda bruta: Moda bruta = 80,51 + 100,5 / 2 = 90,5 A média é de 22,4. O desvio padrão da amostra é de 1,14. O coeficiente de variação será de 5.09%. O terceiro quartil é 23,5. DADOS: 21, 22, 22, 23, 24 Média = 21 + 22 + 22 + 23 + 24 / 5 = 22,4 Desvio de 21 = 1,4; Desvio de 22 = 0,4; Desvio de 22 = 0,4; Desvio de 23 = 0,6; Desvio de 24: 1,6. Variância = (1,4)² + (0,4)² + (0,4)² + (0,6)² + (1,6)² = 5,2 Desvio padrão amostral = Desvio padrão amostral = raiz quadrada de 5,2 dividido por 4 Desvio padrão amostral = raiz quadrada de 1,3 Desvio padrão amostral = 1.14 Coeficiente de variação = desvio padrão / média x 100 Coeficiente de variação = 1,14 / 22,4 x 100 Coeficiente de variação = 5,09 Terceiro quartil: sabendo que a mediana é 22, o terceiro quartil deve estar entre 23 e 24. 23 + 24 = 47; 47/2 = 23,5. 21, 22, 22, 23, 24 Entendemos como uma média representativa aquela que o coeficiente de variação seja o mais próximo possível de 0%. Quanto maior for este valor, menos representativo será a média. Nesse caso, a representação por Ogiva de Galton, calculada a partir dos dados agrupados, é mais representativa pois possui um coeficiente de variação menor que a representação por Polígono de Frequência Absoluta. 3ª) Um dos principais indicadores da poluição do ar nas grandes cidades é a concentração de ozônio na atmosfera. O nível de concentração de ozônio na atmosfera foi medido em São Paulo durante o inverno de 1998, e os resultados são apresentados a seguir: a) Disponha os dados em rol crescente. Determine a amplitude total dos dados. 1,1 1,4 1,4 1,4 1,6 1,7 2,0 2,4 2,5 2,5 2,8 3,0 3,0 3,1 3,1 3,3 3,4 3,4 3,5 3,5 3,7 3,7 3,7 3,8 3,9 4,0 4,1 4,1 4,2 4,4 4,4 4,4 4,5 4,7 4,7 4,7 4,7 5,1 5,3 5,3 5,4 5,4 5,5 5,5 5,6 5,6 5,6 5,7 5,7 5,8 5,8 5,8 5,8 5,9 6,0 6,0 6,0 6,1 6,2 6,2 6,2 6,5 6,6 6,6 6,6 6,6 6,7 6,8 6,8 6,8 7,4 7,5 7,6 7,6 8,1 9,4 9,4 10,9 10,9 - 1,1 = 9,8 (amplitude) b) Agrupe convenientemente esses valores em classes de igual amplitude (Distribuição de freqüências; determine as freqüências absoluta e relativa simples e absoluta e relativa acumuladas classe fi Fri (%) fac Frac(%) 1,1 |-- 2,5 8 10,256 8 10,256 2,5 |-- 3,9 16 20,512 24 30,768 3,9 |-- 5,3 14 17,948 38 48,716 5,3 |-- 6,7 28 35,897 66 84,613 6,7 |-- 8,1 8 10,256 74 94,869 8,1 |-- 9,5 3 3,846 77 98,715 9,5 |-- 10,9 1 1,282 78 99,9977 100 total 78 100% c) Construa o histograma e o polígono de frequência. d) Calcule as medidas de posição e dispersão adequadas aos dados. Emd= 78/2= 39 Mmd= 5,3+1,4 (1/28) Mmd= 5,35 (mediana) Mo=6,7+5,3/2=6 (moda) S2= 3,64 (variância) S = 2, aproximadamente (Desvio Padrão) CV= 2/5 x100 CV= 40% (coeficiente de variação) 4ª) A taxa de mortalidade infantil corresponde ao número médio de mortes, dentre 1000 crianças nascidas vivas, antes de completarem um ano de vida. Os dados abaixo representam a Taxa de mortalidade infantil dos municípios da Microrregião Oeste Catarinense (1982) e foram extraídos da publicação Municípios Catarinenses - Dados Básicos, 1987, GAPLAN - SC, que utiliza dados levantados pelo IBGE. a) Agrupe convenientemente esses dados em classes (Distribuição de freqüências). b) Construa o histograma e o polígono de freqüências. 5ª) Dada a distribuição de freqüências acumuladas do número de desquites, segundo a duração do casamento: a) Reproduza as informações do gráfico em uma tabela de freqüências absolutas para a duração do casamento. Anos de casamento Frequência absoluta acumulada Frequência relativa acumulada Frequência absoluta simples Frequência relativa simples 0 |-- 6 2300 57,5% 2300 57,5% 6 |-- 12 3300 82,5% 1000 25,0% 12 |-- 18 3850 96,3% 550 13,8% 18 |-- 24 4000 100% 150 3,8% b) 25% dos desquites se deram com casamentos de até quantos anos? R.: Até 6 anos, pois Q1=0,25x(24-1)=5,75 6ª) Uma turma obteve as seguintes notas: a) O professor da turma ofereceu bolsas para os 5% melhores e um programa de reforço para os 8% piores, qual a menor nota dos bolsistas? Qual a maior nota dos 8% piores? R: A menor nota dos bolsistas é, aproximadamente, 8,66 pontos. A maior nota dos 8% piores é cerca de 2,3 pontos. b) Determine a nota média da turma e o coeficiente de variação, analise o resultado obtido pela turma. R: A nota média da turma é 5,45, pois: 1.4+3.16+5.24+7.30+9.6/80. 436/80= 5,45. De acordo com a formula do coeficiente de variação (CV), o CV = desvio padrão/média. Então, o coeficiente de variação é 37,06, pois 2,01/5,45 x 100 = 36,88. c) O professor acrescentou 0,5 ponto a nota da prova de todos os alunos por um exercício extra resolvido por estes alunos, Sem refazer os cálculos, determine as medidas pedidas no item anterior. Justifique sua resposta. R: Como o professor aumentou 0,5 em cada nota, a média também teve um aumento de 0,5, se tornando 5,95. Já o desvio padrão permaneceu o mesmo, visto que a variação ocorreu em todas as notas. Além disso, o coeficiente de variação terá uma redução, passando para 33,78. 7ª) Os valores a seguir referem-se ao Tempo de Adaptação (TA) a um novo sistema de gestão de 18 enfermeiros de um dado hospital. Os dados estão expressos em dias. Construa a tabela da distribuição de frequências para o tempo de uso considerando 5 classes. Com base na tabela construa o polígono de freqüências. Também com base na tabela calcule as medidas descritivas adequadas. Considerando as informações coletadas na questão qual medida melhor se ajusta para descrever o TA: a média aritmética, a moda ou a mediana? Justifique sua resposta. Tempo de adaptação/dia Fi Fri(%) Fac Frac(%) xi Xi*Fi (xi-x)2 *Fi 0,5 - 15,5 16 88 16 88 7,5 120 282,24 15,5 - 30,5 1 6 17 94 23 23 127,69 30,5 - 45,5 0 0 17 94 38 0 0 45,5 - 60,5 0 0 17 94 53 0 0 60,5 - 75,5 1 6 18 100 68 68 3169 Total 18 100 18 100 211 3578,93 MODA: 0,5+15,5/2 = 8 MÉDIA A : 118,5/18 = 6,6 MÉDIA P: 211/18 = 11,7 MEDIANA: 18/2=9 0,5 + 15 *9-0/16 = 8,9 MEDIANA EM ROL: 1+2 /2= 1,5 VARIANCIA: 3.578,93/17 = 210 DESVIO PADRÃO: 14,5 A mediana calculada a partir do rol, pois é uma medida de tendência central que não é alterada por dados com valores discrepantes, como ocorreu nessa situação, inclusive da para perceber que o desvio padrão está muito alto. 8ª) Considere a distribuição de notas de 2 turmas, A e B, Compare as 2 distribuições com base nas medidas abaixo: a) Turma A: média = 6 ; variância = 2 e Turma B: média = 6 ; variância = 1 A turma B possui notas mais homogêneas. Para descobrirmos isso, primeiramente, encontramos o coeficiente de variação: COEFICIENTE DE VARIAÇÃO DA TURMA A= desvio padrão/média x 100 Desvio padrão da Turma A = √variância; √2 = 1,41 COEFICIENTE DE VARIAÇÃO DA TURMA A = 1,41 / 6 x 100 = 23,5 COEFICIENTE DE VARIAÇÃO DA TURMA B= desvio padrão/média x 100 Desvio padrão da Turma B = √variância; √1 = 1 COEFICIENTE DE VARIAÇÃO DA TURMA B = 1 / 6 x 100 = 16,66 Sabemos que quanto maior o coeficiente de variância, mais distante estão os valores desse conjunto do valor médio. Logo, a turma A possui notas mais heterogêneas e a turma B possui notas mais homogêneas. b) Turma A: Nota mínima= 1 ; 1o quartil= 3; 2o quartil= 4,5; 3o, quartil = 7; Nota máxima = 8 Turma B: Nota mínima= 2 ; 1o quartil= 3; 2o quartil= 6; 3o quartil = 9; Nota máxima = 10 A turma B apresentou notas melhores e mais homogêneas. A princípio, podemos analisar os valores do 2º quartil, que representa a mediana (valor central do conjunto). O 2º quartil da turma B é 6, o que indica que 50% das notas estão acima desse valor. Enquanto isso, o 2º quartil da turma A é de apenas 4,5. O 3º quartil da turma B é de 9, o que indica que 75% das notas estão abaixo de 9 e 25% estão acima de 9. O 3º quartil da turma A é de apenas 7. A nota mínima de A foi 1, enquanto a nota mínima da turma B foi 2. Por fim, é possível considerar também a nota máxima, que é maior na turma B. 9ª) Dado o histograma a seguir, determinar a média, mediana, moda, o coeficiente de variação e o 1ºquartil da distribuição (no interior dos retângulos estão anotadas as freqüências relativas simples). Classe Valor médio (Xi) Frequência relativa (fi) Frequência Acumulada Relativa (frac) 10-20 15 15% 15% 20-30 25 20% 35% 30-40 35 30% 65% 40-50 45 25% 90% 50-60 55 10% 100% ● A moda é o valor de maior frequência, ou seja 35 ● A mediana é o valor que deixa 50% dos dados abaixo. O primeiro acumulado maior que 50% é 65%, logo a mediana é de 35 ● Existe outro método de encontrar a mediana: Md= 35 ● Podemos usar a mesma lógica para descobrir o primeiro quartil. Sabemos que o primeiro quartil deixa 25% dos dados abaixo, logo se o primeiro acumulado maior que 25% é 35%, então temos que o primeiro quartil é 25. Coeficiente de variação CV= 12,03/34,5 x100= 0,3487 x100 CV= 34,87% 10ª) Os box plots a seguir mostram da idade dos alunos de uma dada escola, segundo o sexo. Analise-os (de acordo com os pontos fundamentais A, B, C, D e E) e descreva o comportamento dessas duas distribuições: Feminino A B C D E Masculino A B C D E 13 14 15 16 17 18 19 20 (anos) O gráfico box plot em questão relaciona a idade e o sexo dos alunos de um escola. Analisando-os pontos mostrados é possível entender e destacar algumas afirmações sobre o comportamento dessas distribuições, a saber: A idade mínima para as alunas dessa escola é de 15 anos, isto é, nenhuma dessas alunas têm menos de 15 anos. Enquanto a idade mínima para os meninos é de 14 anos. A maior idade das alunas está entre 18 e 19 anos. Para os alunos, a maior idade também está entre 18 e 19 anos. O segundo quartil dos discentes do sexo feminino está entre 16 e 17 anos, o que significa que 50% das alunas tem uma idade menos de 16-17 anos e as outras 50% tem mais de 16-17 anos. O 2º quartil dos discentes do sexo masculino está entre 17 e 18 anos, o que significa que 50% dos alunos tem uma idade inferior a 17-18 anos e os outros 50% tem uma idade superior a 17-18 anos. Excluindo os outliers, nenhum aluno e aluna dessa escola têm menos de 14 anos . Nenhum aluno e aluna dessa escola tem 20 anos . 75% das alunas têm, pelo menos, 17 anos . 75% dos alunos têm, pelo menos, 17 anos . 25% das alunas têm mais de 17 anos . 25% dos alunos tem mais de 17 anos. 25% das alunas têm menos de 16 anos . 25% dos meninos tem menos de 17 anos . Para os alunos a quantidade de outliers é maior que para as alunas .
Compartilhar