Baixe o app para aproveitar ainda mais
Prévia do material em texto
Noc¸o˜es de Estat´ıstica 2º sem de 2016 - FEA Lista de exerc´ıcios 2 - Introduc¸a˜o e Estat´ıstica Descritiva - CASA Exerc´ıcio 01 Os dados a seguir referem-se a medidas de prostaglandina (pg/ml) e ca´lcio (ml/dl) em pacientes com caˆncer apresentando ou na˜o hipercalcemia. a) Calcule para cada varia´vel, separando por grupos com e sem hipercalcemia, a me´dia, a mediana, o desvio padra˜o, o intervalo interquartil e o coeficiente de variac¸a˜o. b) Compare as variabilidades das varia´veis separadas por grupos (escolha o crite´rio de comparac¸a˜o). c) Desenhe o diagrama de caixa para cada varia´vel, separando por grupos com e sem hipercalcemia, e use-os para concluir sobre o efeito de hipercalcemia nas medidas de prostaglandina e ca´lcio. Tabela 1: Pacientes com hipercalcemia Paciente prostaglandina ca´lcio 1 500 13.3 2 500 11.2 3 301 13.4 4 272 11.5 5 226 11.4 6 183 11.6 7 183 11.7 8 177 12.1 9 136 12.5 10 118 12.2 11 60 18 Tabela 2: Pacientes sem hipercalcemia Paciente prostaglandina ca´lcio 12 254 10.1 13 172 9.4 14 168 9.3 15 150 8.6 16 148 10.5 17 144 10.3 18 130 10.5 19 121 10.2 20 100 9.7 21 88 9.2 1 Soluc¸a˜o do exerc´ıcio 01 a) Pacientes com hipercalcemia – X: Prostaglandina, x = {60, 118, 136, 177, 183, 183, 226, 272, 301, 500, 500} n∑ i=1 xi = 2.656; n∑ i=1 x2i = 849.988; n = 11 x¯ = ∑n i=1 xi n = 241, 45, s2x = ∑n i=1 x 2 i − nx¯ 2 n− 1 = 20.868, 47 ⇒ sx = 144, 46 CV = sx x¯ ∗ 100% = 59, 83% PQ1 = 0, 25 ∗ (n + 1) = 3 ⇒ Q1 = 136 PQ2 = PMd = 0, 50 ∗ (n+ 1) = 6 ⇒ Md = 183 PQ3 = 0, 75 ∗ (n + 1) = 9 ⇒ Q3 = 301 IIQ = Q3 −Q1 = 165 – Y: Ca´lcio, y = {11, 2; 11, 4; 11, 5; 11, 6; 11, 7; 12, 1; 12, 2; 12, 5; 13, 3; 13, 4; 18} n∑ i=1 yi = 138, 9; n∑ i=1 y2i = 1.791, 05; n = 11 y¯ = ∑n i=1 yi n = 12, 63, s2y = ∑n i=1 y 2 i − ny¯ 2 n− 1 = 3, 71 ⇒ sY = 1, 93 CV = sy y¯ ∗ 100% = 15, 26% PQ1 = 0, 25 ∗ (n+ 1) = 3 ⇒ Q1 = 11, 5 PQ2 = PMd = 0, 50 ∗ (n+ 1) = 6 ⇒ Md = 12, 1 PQ3 = 0, 75 ∗ (n+ 1) = 9 ⇒ Q3 = 13, 3 IIQ = Q3 −Q1 = 1, 8 2 Pacientes sem hipercalcemia – X: Prostaglandina, x = {88, 100, 121, 130, 144, 148, 150, 168, 172, 254} n∑ i=1 xi = 1.475; n∑ i=1 x2i = 236.749; n = 10 x¯ = ∑n i=1 xi n = 147, 5, s2x = ∑n i=1 x 2 i − nx¯ 2 n− 1 = 2.131, 83 ⇒ sx = 46, 17 CV = sx x¯ ∗ 100% = 31, 3% PQ1 = 0, 25 ∗ (n+ 1) = 2, 75 ⇒ Q1 = 100 + 121 2 = 110, 5 PQ2 = PMd = 0, 50 ∗ (n + 1) = 5, 5 ⇒ Md = 144 + 148 2 = 146 PQ3 = 0, 75 ∗ (n+ 1) = 8, 25 ⇒ Q3 = 168 + 172 2 = 170 IIQ = Q3 −Q1 = 59, 5 – Y: Ca´lcio, y = {8, 6; 9, 2; 9, 3; 9, 4; 9, 7; 10, 1; 10, 2; 10, 3; 10, 5; 10, 5} n∑ i=1 yi = 97, 8; n∑ i=1 y2i = 960, 18; n = 10 y¯ = ∑n i=1 yi n = 9, 78, s2y = ∑n i=1 y 2 i − ny¯ 2 n− 1 = 0, 41 ⇒ sY = 0, 64 CV = sy y¯ ∗ 100% = 6, 55% PQ1 = 0, 25 ∗ (n+ 1) = 2, 75 ⇒ Q1 = 9, 2 + 9, 3 2 = 9, 25 PQ2 = PMd = 0, 50 ∗ (n+ 1) = 5, 5 ⇒ Md = 9, 7 + 10, 1 2 = 9, 9 PQ3 = 0, 75 ∗ (n + 1) = 8, 25 ⇒ Q3 = 10, 3 + 10, 5 2 = 10, 4 IIQ = Q3 −Q1 = 1, 15 b) Podemos considerar o desvio padra˜o, o intervalo interquartil ou o coeficiente de variac¸a˜o. Em todos os casos o grupo de pacientes com hipercalcemia possui uma variabilidade maior que o grupo sem hipercalcemia. Temos ainda, que a varia´vel prostaglandina em ambos os grupos possui uma variabilidade maior que a varia´vel ca´lcio, ver coeficiente de variac¸a˜o. 3 c) A hipercalcemia aumenta os valores das varia´veis prostaglandina e ca´lcio dos paci- entes, ale´m de aumentar a assimetria. Foram utilizados como limite superior, LS, e limite inferior, LI, as seguintes fo´rmulas LS = Q3 + 1, 5 ∗ IIQ e LI = Q1 − 1, 5 ∗ IIQ 4 Exerc´ıcio 02 Os dados abaixo referem-se aos instantes de chamadas para atendimentos em uma rodovia em dois dias consecutivos. a) Calcule para cada dia a me´dia, a mediana, o desvio padra˜o e o intervalo interquartil. b) Utilize diagrama de caixa para comparar os dois dias do ponto de vista da distri- buic¸a˜o de chamadas. c) Obtenha os histogramas correspondentes, agrupando os dados em 12 intervalos (com 2 horas em cada intervalo). 1º dia: 0,55 1,30 5,00 5,20 5,20 6,35 6,55 7,00 9,20 9,20 9,30 10,32 11,20 10,40 11,05 11,30 12,10 16,35 16,00 16,10 16,15 18,30 17,35 17,50 17,53 19,20 20,35 21,45 22,00 23,15 23,20 23,50 2ª dia: 4,20 7,00 7,10 8,07 10,10 12,25 12,25 12,40 13,45 14,45 14,45 15,35 15,20 15,20 16,30 16,42 16,42 17,00 17,00 17,00 19,05 22,55 20,30 Soluc¸a˜o do exerc´ıcio 02 a) D1 = {0, 55; 1, 30; 5, 00; 5, 20; 5, 20; 6, 35; 6, 55; 7, 00; 9, 20; 9, 20; 9, 30; 10, 32; 11, 20; 10, 40; 11, 05; 11, 30; 12, 10; 16, 35; 16, 00; 16, 10; 16, 15; 18, 30; 17, 35; 17, 50; 17, 53; 19, 20; 20, 35; 21, 45; 22, 00; 23, 15; 23, 20; 23, 50} n∑ i=1 D1 = 419, 35; n∑ i=1 D2 1 = 6.851, 47; n = 32 D¯1 = ∑n i=1D1 n = 13, 10, s2D1 = ∑n i=1D 2 1 − nD¯1 2 n− 1 = 43, 74 ⇒ sD1 = 6, 61 CV = sD1 D¯1 ∗ 100% = 50, 47% PQ1 = 0, 25 ∗ (n+ 1) = 8, 25 ⇒ Q1 = 7, 00 + 9, 20 2 = 8, 10 PQ2 = PMd = 0, 50 ∗ (n+ 1) = 16, 5 ⇒ Md = 11, 30 + 12, 10 2 = 11, 70 PQ3 = 0, 75 ∗ (n + 1) = 24, 75 ⇒ Q3 = 17, 53 + 18, 30 2 = 17, 92 IIQ = Q3 −Q1 = 9, 82 5 D2 = {4, 20; 7, 00; 7, 10; 8, 07; 10, 10; 12, 25; 12, 25; 12, 40; 13, 45; 14, 45; 14, 45; 15, 35; 15, 20; 15, 20; 16, 30; 16, 42; 16, 42; 17, 00; 17, 00; 17, 00; 19, 05; 22, 55; 20, 30} n∑ i=1 D2 = 323, 51; n∑ i=1 D2 2 = 4.989, 70; n = 23 D¯2 = ∑n i=1D2 n = 14, 07, s2D2 = ∑n i=1D 2 2 − nD¯2 2 n− 1 = 19, 97 ⇒ sD2 = 4, 47 CV = sy y¯ ∗ 100% = 31, 77% PQ1 = 0, 25 ∗ (n+ 1) = 6 ⇒ Q1 = 12, 25 PQ2 = PMd = 0, 50 ∗ (n+ 1) = 12 ⇒ Md = 15, 20 PQ3 = 0, 75 ∗ (n+ 1) = 18 ⇒ Q3 = 17, 00 IIQ = Q3 −Q1 = 4, 75 Classes (em horas) 1º dia 2º dia 0 ⊢ 2 2 0 2 ⊢ 4 0 0 4 ⊢ 6 3 1 6 ⊢ 8 3 2 8 ⊢ 10 3 1 10 ⊢ 12 5 1 12 ⊢ 14 1 4 14 ⊢ 16 0 5 16 ⊢ 18 7 6 18 ⊢ 20 2 1 20 ⊢ 22 2 1 22 ⊢ 0 4 1 6 b) Pelos boxplots temos que no primeiro dia os dados esta˜o mais dispersos e possuem mais chamadas no in´ıcio do dia. Temos tambe´m que a mediana do primeiro dia e´ menor que do segundo. Foram utilizados como limite superior, LS, e limite inferior, LI, as seguintes fo´rmulas LS = Q3 + 1, 5 ∗ IIQ e LI = Q1 − 1, 5 ∗ IIQ c) Pelos histogramas temos que os dados esta˜o mais concentrados ate´ as 12h o que acontece o oposto no segundo dia. 7 Exerc´ıcio 03 Construa o histograma de frequeˆncia e os histograma de densidade da durabilidade de baterias automotivas de certa marca com base nos dados da tabela abaixo: Durabilidade (em meses) Quantidade Frequeˆncia relativa h = Frequeˆncia relativa Tamanho da classe 0 - 3 40 4/100 0,013 3 - 6 50 5/100 0,017 6 - 9 130 13/100 0,043 9 - 12 250 25/100 0,083 12 - 18 330 33/100 0,055 18 - 24 200 20/100 0,033 Soluc¸a˜o do exerc´ıcio 03 Considerando a quantidade de baterias em cada classe e h podemos fazer os seguintes histogramas. Comparando os dois notamos que quando observamos tamanhos de classes diferentes temos que ter cuidado em nossas concluso˜es, pois temos que olhar os valores relativos, h, nestes os dados esta˜o melhores expressados. 8
Compartilhar