Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Lavras - Estat´ıstica - GEX112 Departamento de Cieˆncias Exatas Professor Ju´lio Bueno Pra´tica 01: Te´cnicas de somato´rio, e introduc¸a˜o ao uso do R 1. Escreva em notac¸a˜o de somato´rio a) x1 + x 2 2 + x 3 3 + x 4 4 b) x1 + x2 2 + x3 3 + x4 4 c) (y1 + y2 + y3 + y4) 4 d) 1 + 1 2 + 1 3 + 1 4 2. Sejam os valores abaixo referentes a 12 observac¸o˜es da uma varia´vel aleato´ria X: x1 = 3, x2 = 5, x3 = 6, x4 = 8, x5 = 5, x6 = 11, x7 = 5, x8 = 2, x9 = 9, x10 = 10, x11 = 1, x12 = 4 Calcule: a) n∑ i=1 xi b) 5∑ i=3 xi c) 4∑ i=1 x3i d) ( n∑ i=1 xi )2 e) n∑ i=1 (xi − 5, 75) f) 6 × 3∑ i=1 xi − 9∑ i=6 xi g) 6∑ i=1 ixi 3. Refac¸a os ca´lculos utilizando o ambiente de programac¸a˜o R. 08 e 09 de Outubro de 2013 Universidade Federal de Lavras - Estat´ıstica - GEX112 Departamento de Cieˆncias Exatas Professores Jair Wyzykowski e Ju´lio Bueno Pra´tica 02: Coleta e Organizac¸a˜o de Dados e Construc¸a˜o de Distribuic¸o˜es de Frequeˆncias A) Vamos produzir uma planilha de dados com os seguintes dados pesso- ais da turma pra´tica: Nome, Curso, Idade, Peso, Altura, Nu´mero de irma˜os (exceto o respondente), se almoc¸a no R.U., qual o transporte que usa para vir a` UFLA, Cidade de Origem, Frequeˆnca com que conversa com os pais (responda 1 para: diariamente, 2 para: ao menos uma vez por semana, 3 para: ao menos uma vez por quinzena, 4 para: ao menos uma vez por meˆs, 5 para: menos que uma vez por meˆs), qual o seu tipo de moradia (alojamento da UFLA, repu´blica, com os pais, pensa˜o, outros), se e´ fumante, se e´ usua´rio de bebida alcoo´lica, se tem algum hobby e se sim, qual o hobby 1. Salve o arquivo com o nome ”TurmaX”, em que X e´ a sua turma pra´tica. Salve no formato planilha (.xls, .ods, etc) e tambe´m no formato texto (.txt, .csv, etc). 2. Leia o arquivo salvo no formato texto no R com o comando read.table() 3. confira se consegue apresentar corretamente taebla com os dados da sua turma B) Vamos usar um arquivo pronto (Magalha˜es e Lima, site da se´tima edic¸a˜o, 2011: www.ime.usp/ noproest) com muitos dados para ilustrar a construc¸a˜o de tabelas de distribuic¸a˜o de frequeˆncias. 1. Abra o arquivo de dados ”questionario.xls”e salve um arquivo texto ”questionario.txt” 2. Leia o arquivo ”questionario.txt”no R com o comando read.table() 3. construa tabelas de frequeˆncias e gra´ficos para as varia´veis que sa˜o categorizadas 4. Construa uma tabela de distribuic¸a˜o de frequeˆncias para as varia´veis cont´ınuas (ver roteiro a seguir) 26 a 30 de novembro de 2012 C) Roteiro para uma Tabela de Distribuic¸a˜o de Frequeˆncias com uma varia´vel cont´ınua: 1. Descubra o maior e o menor valor e com eles calcule a Amplitude Total: A = xmax − xmin 2. Determine o nu´mero de classes a ser usado com base no tamaho da amostra: k = √ n ou se n > 100 podemos usar a expressa˜o k = 5 ∗ log10(n) 3. A amplitude de classe pode ser enta˜o calculada como: c = A/(k − 1) 4. O limite inferior da primeira classe pode ser calculado como: LI1 = xmin − c/2 5. Os demais limites de classe podem ser calculados adicionando-se sempre uma amplitude de classe ao limite inferior da primeira classe. Por exemplo: LI2 = LI1 + c 6. Construa a func¸a˜o ”TDF(amostra)”que imlementa o roteiro acima e faz uma distribuic¸a˜o de frequeˆncias a partir dos dados de uma amostra. 7. Note que para construir esta func¸a˜o talvez seja melhor olhar para frequeˆncias acumuladas primeiro 8. Fac¸a com que sua tabela inclua limites inferior e superior de classe, frequeˆncias de classe e acumuladas, absolutas e relativas. D) Qual a porcentagem de valores maiores que 1,68m? Calcule isto dire- tamente nos dados na˜o agrupados e estime isso com base na sua tabela de distribuic¸a˜o de frequeˆncias. Universidade Federal de Lavras - Estat´ıstica - GEX112 Departamento de Cieˆncias Exatas Professor Ju´lio S. de S. Bueno Filho P03: Medidas de Posic¸a˜o ou de Tendeˆncia Central A) Em uma prova de aceitac¸a˜o de uma bebida de cupuac¸u foi pedido que se desse uma das seguintes notas para o produto: 1: excelente, 2: bom, 3; me´dio, 4: ruim 5: pe´ssimo. [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 [39] 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.7666 1.5220 2.2360 2.0830 2.5810 3.9980 1. Qual(is) a(s) melhor(es) medida(s) de posic¸a˜o para esta amostra? 2. Calcule a me´dia e diga se voceˆ a usaria para descrever a tendeˆncia central. Justifique. B) A Tabela abaixo foi construida com base nos seguintes rendimentos brutos de 100 empregados: [1] 0.1 0.1 0.3 0.4 0.4 0.4 0.6 0.7 0.8 0.8 0.9 0.9 1.1 1.1 1.2 [16] 1.4 1.5 1.5 1.5 1.6 1.7 1.8 1.8 1.9 2.2 2.2 2.3 2.4 2.5 2.8 [31] 2.9 3.0 3.3 3.3 3.9 4.0 4.2 4.4 4.4 4.5 4.7 4.7 4.8 4.9 5.4 [46] 5.4 5.5 5.7 5.9 6.1 6.5 6.7 6.9 7.4 7.8 7.9 8.0 8.1 8.4 8.5 [61] 8.7 9.0 9.1 9.1 9.2 9.4 9.6 9.8 9.8 10.0 10.2 10.3 11.2 11.4 11.8 [76] 12.1 12.3 12.6 13.1 14.2 15.2 15.5 16.3 16.8 16.8 17.5 17.8 18.2 18.2 20.0 [91] 20.5 23.4 24.2 25.1 25.5 26.0 26.6 27.8 39.3 41.3 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.10 2.20 6.30 8.71 11.88 41.30 [1] 2.884273 LI LS pmc F FAA FAP [1,] -2.19 2.39 0.10 27 0 73 [2,] 2.39 6.97 4.68 26 27 47 [3,] 6.97 11.55 9.26 21 53 26 [4,] 11.55 16.13 13.84 8 74 18 [5,] 16.13 20.71 18.42 9 82 9 [6,] 20.71 25.29 23.00 3 91 6 17 e 18 de marc¸o de 2015 [7,] 25.29 29.87 27.58 4 94 2 [8,] 29.87 34.45 32.16 0 98 2 [9,] 34.45 39.03 36.74 0 98 2 [10,] 39.03 43.61 41.32 0 98 0 [1] 7.7466 LI 6.441538 LI 2.226429 1. Qual(is) a(s) medida(s) de posic¸a˜o desta amostra? Nota: Use primeiro os dados ordenados e depois a Tabela de Distribuic¸a˜o de Frequeˆncias. Compare os resultados. 2. O que ocorre com estas medidas se somarmos 0, 2 a cada um dos valores observados? Universidade Federal de Lavras - Estat´ıstica - GEX112 Departamento de Cieˆncias Exatas Professor Ju´lio S. de S. Bueno Filho P04: Medidas de Dispersa˜o A Tabela abaixo foi construida com base nos seguintes dados de altura de plantas de milho, medida em polegadas: [1] 62.5 63.0 65.2 66.2 66.4 67.1 67.8 68.0 68.2 68.5 69.1 69.4 69.5 69.5 69.7 [16] 69.9 70.4 70.9 71.0 71.1 71.4 72.6 72.9 73.0 73.5 73.6 73.7 73.9 74.2 74.3 [31] 74.4 74.4 74.7 75.4 75.8 76.2 76.2 76.9 79.4 81.1 LI LS pmc F FAA FAP [1,] 60.64 64.36 62.50 2 0 38 [2,] 64.36 68.08 66.22 6 2 32 [3,] 68.08 71.80 69.94 13 8 19 [4,] 71.80 75.52 73.66 13 21 6 [5,] 75.52 79.24 77.38 4 34 2 [6,] 79.24 82.96 81.10 2 38 0 Treine a obtenc¸a˜o das medidas de posic¸a˜o com este conjunto de dados > media <- sum(TDF[,3]*TDF[,4])/n > media [1] 71.521 > mediana <- TDF[2,1] + ((n/2-TDF[2,5])/TDF[2,4])*c > mediana LI 75.52 > delta1 <- TDF[1,4]-0 > delta2 <- TDF[1,4]-TDF[2,4] > moda <- TDF[1,1] + (delta1/(delta1+delta2))*c > moda LI 56.92 > d <- density(altura) > moda <- d$x[which( d$y == max(d$y))] 24 e 15 de marc¸o de 2015 1. Qual(is) a(s) medida(s) de dispersa˜o desta amostra? Nota: Use pri- meiro os dados ordenados e depois a Tabela de Distribuic¸a˜o de Frequeˆn- cias. Compare os resultados. 2. O que ocorre com estas medidas se subtrairmos 100 de cada um dos valores observados? 3. Qual seria a variaˆncia se a medida fosse em cent´ımetros? Nota: 1 polegada equivale a aproximadamente 2, 54 cent´ımertros. 4. Calcule o desvio padra˜o e o coeficiente de variac¸a˜o da amostra, com os dados expressos em cent´ımetros 5. Calcule a variaˆncia da me´dia e o erro padra˜o da me´dia para os dados expressos em cent´ımetros Universidade Federal de Lavras - Estat´ıstica - GEX112 Respostas: > media.dados <- mean(altura); media.dados[1] 71.525 > var.dados <- var(altura); var.dados [1] 17.08705 > desv.padr.dados <- sd(altura); desv.padr.dados [1] 4.133649 > CV.dados <- desv.padr.dados/media.dados; CV.dados [1] 0.05779306 > n <- length(altura) > Soma <- sum(TDF[,4]*TDF[,3]); Soma [1] 2860.84 > SQ <- sum(TDF[,4]*(TDF[,3]^2)); SQ [1] 205354.3 > media.tabela <- Soma/n; media.tabela [1] 71.521 > Var.tabela <- (SQ-(Soma^2)/n)/(n-1); Var.tabela [1] 19.08102 > Desv.padr.tabela <- sqrt(Var.tabela); Desv.padr.tabela [1] 4.368183 > CV.tabela <- Desv.padr.tabela/media.tabela; CV.tabela [1] 0.06107553 24 e 15 de marc¸o de 2015 Gra´fico do histograma suavizado (densidade) 60 65 70 75 80 85 0. 00 0. 02 0. 04 0. 06 0. 08 density.default(x = altura) N = 40 Bandwidth = 1.726 D en si ty
Compartilhar