Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE JOAQUIM NABUCO – UNINABUCO DIGITAL DATA SCIENCE FELIPE BANDEIRA DA SILVA MATRÍCULA – 10001452 Atividade contextualizada de Dados Atividade contextualizada – Estudo de caso Análise Estatística O Dataset utilizado foi o “mtcar”, onde contém dados 32 carros do ano de 1973-74 com informação de seus desempenhos, peso, tipo de marcha, cavalo de potência entre outros, retirado da revista “Motor Trend - US magazine” do ano de 1947. Para esta análise vou focar nos seguintes dados do Dataset, onde quero ver a relação do consumo de combustível x tipo de marcha: • mpg Miles/(US) gallon , que chamo de Milhas/Galões; • am Transmission (0 = automatic, 1 = manual), que chamo de Marcha automática ou Manual; Início carregando do Dataframe no R, carregando apenas o dados que vou precisar para análise. 1 data(mtcars) 2 mtcars[,c(1,9)] Logo após carro o gráfico desses dois dados: 1 hist(mtcars$mpg, xlab = 'Consumo Milhas/Galão', 2 ylab = 'Total de Carros', 3 main = 'Consumo Milhas por Galão', 4 4col = 'skyblue') 5 contagem = table(mtcars$am) 6 nomes = levels(mtcars$am) 7 porcent = round(contagem/sum(contagem)*100,2) 8 rotulo=paste(nomes," (",porcent,"%",")",sep="") 9 pie(table(mtcars$am),labels=rotulo, 10 main="Tipo de marcha", col=c("gray","skyblue")) Dessa forma começo a fazer o teste de hipóteses que neste caso será analisado por Teste T, a diferença no consumo de combustível por Milha/Galão das marchas manuais e automáticas. • Hipótese nula: não existe diferenças. • Hipótese alternativa: há uma diferença no valor do consumo de combustível por Milha/Galão. 1 boxplot(mpg ~ am, 2 data=mtcars, 3 col = 'skyblue', 4 ylab = 'Consumo Milhas por galão', 5 xlab="Tranção Automatia Manual", 6 main= 'Consumo x tipo de Marcha') 1 summary(mtcars[,c(1,9)]) mpg am Min. :10.40 Min. :0.0000 1st Qu.:15.43 1st Qu.:0.0000 Median :19.20 Median :0.0000 Mean :20.09 Mean :0.4062 3rd Qu.:22.80 3rd Qu.:1.0000 Max. :33.90 Max. :1.0000 1 mtcars$am <- as.factor(mtcars$am) 2 t.test(mpg~am, 3 data=mtcars, 4 conf.level=0.95) Welch Two Sample t-test data: mpg by am t = -3.7671, df = 18.332, p-value = 0.001374 alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0 95 percent confidence interval: -11.280194 -3.209684 sample estimates: mean in group 0 mean in group 1 17.14737 24.39231 O valor p é 0,0013 com 95% de confiança, onde podemos rejeitar a hipótese nula e concluir que a marcha automática tem um consumo milhas/galão mais baixo em comparação as marchas manuais, isso e visto no gráfico boxplot acima intitulado “Consumo x tipo de Marcha”. 1 Media <- aggregate(mpg~am, data=mtcars, mean) 2 Media A data.frame: 2 × 2 am mpg <fct> <dbl> Automático 1714737 Manual 2439231 O Consumo médio de Milhas por Litros dos carros com Marcha manual e de 24,3 uma diferença de +7.3pp em comparação a os carros com marcha automática, que tem um consumo de 17,1. Dessa forma confirmamos a hipótese e vimos à diferença do desvio entre elas. Para acessar o Notebook com o código usado basta clicar no link: https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712 mhEU6jof4 https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712mhEU6jof4 https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712mhEU6jof4
Compartilhar