Buscar

Atividade Contextualizada - Análise Estatística de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

FACULDADE JOAQUIM NABUCO – UNINABUCO DIGITAL 
DATA SCIENCE 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
FELIPE BANDEIRA DA SILVA 
MATRÍCULA – 10001452 
Atividade contextualizada 
de Dados 
 
 
Atividade contextualizada – Estudo de caso 
Análise Estatística 
 
 
O Dataset utilizado foi o “mtcar”, onde contém dados 32 carros do ano de 1973-74 com 
informação de seus desempenhos, peso, tipo de marcha, cavalo de potência entre outros, 
retirado da revista “Motor Trend - US magazine” do ano de 1947. 
 
Para esta análise vou focar nos seguintes dados do Dataset, onde quero ver a relação do 
consumo de combustível x tipo de marcha: 
• mpg Miles/(US) gallon , que chamo de Milhas/Galões; 
• am Transmission (0 = automatic, 1 = manual), que chamo de Marcha automática ou 
Manual; 
 
Início carregando do Dataframe no R, carregando apenas o dados que vou precisar para 
análise. 
1 data(mtcars) 
2 mtcars[,c(1,9)] 
 
 
 
 
 
 
 
 
Logo após carro o gráfico desses dois dados: 
1 hist(mtcars$mpg, xlab = 'Consumo Milhas/Galão', 
2 ylab = 'Total de Carros', 
3 main = 'Consumo Milhas por Galão', 
4 4col = 'skyblue') 
5 contagem = table(mtcars$am) 
6 nomes = levels(mtcars$am) 
7 porcent = round(contagem/sum(contagem)*100,2) 
8 rotulo=paste(nomes," (",porcent,"%",")",sep="") 
9 pie(table(mtcars$am),labels=rotulo, 
10 main="Tipo de marcha", col=c("gray","skyblue")) 
 
 
 
 
Dessa forma começo a fazer o teste de hipóteses que neste caso será analisado por Teste T, 
a diferença no consumo de combustível por Milha/Galão das marchas manuais e automáticas. 
 
• Hipótese nula: não existe diferenças. 
• Hipótese alternativa: há uma diferença no valor do consumo de combustível por 
Milha/Galão. 
 
1 boxplot(mpg ~ am, 
2 data=mtcars, 
3 col = 'skyblue', 
4 ylab = 'Consumo Milhas por galão', 
5 xlab="Tranção Automatia Manual", 
6 main= 'Consumo x tipo de Marcha') 
 
 
 
1 summary(mtcars[,c(1,9)]) 
 
 
mpg am 
Min. :10.40 Min. :0.0000 
1st Qu.:15.43 1st Qu.:0.0000 
Median :19.20 Median :0.0000 
Mean :20.09 Mean :0.4062 
3rd Qu.:22.80 3rd Qu.:1.0000 
Max. :33.90 Max. :1.0000 
 
 
1 mtcars$am <- as.factor(mtcars$am) 
2 t.test(mpg~am, 
3 data=mtcars, 
4 conf.level=0.95) 
 
 
Welch Two Sample t-test 
 
data: mpg by am 
t = -3.7671, df = 18.332, p-value = 0.001374 
alternative hypothesis: true difference in means between group 0 and group 1 is not 
equal to 0 
95 percent confidence interval: 
 -11.280194 -3.209684 
sample estimates: 
mean in group 0 mean in group 1 
 17.14737 24.39231 
 
 
O valor p é 0,0013 com 95% de confiança, onde podemos rejeitar a hipótese nula e 
concluir que a marcha automática tem um consumo milhas/galão mais baixo em comparação 
as marchas manuais, isso e visto no gráfico boxplot acima intitulado “Consumo x tipo de 
Marcha”. 
 
1 Media <- aggregate(mpg~am, data=mtcars, mean) 
2 Media 
 
A data.frame: 2 × 2 
am mpg 
<fct> <dbl> 
Automático 1714737 
Manual 2439231 
 
 
 
 
O Consumo médio de Milhas por Litros dos carros com Marcha manual e de 24,3 uma 
diferença de +7.3pp em comparação a os carros com marcha automática, que tem um consumo 
de 17,1. 
 
Dessa forma confirmamos a hipótese e vimos à diferença do desvio entre elas. 
 
Para acessar o Notebook com o código usado basta clicar no link: 
https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712
mhEU6jof4 
 
 
 
https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712mhEU6jof4
https://colab.research.google.com/drive/16GBK2VfCjEdn9FXofHFeRfFJaNIVbHQU#scrollTo=712mhEU6jof4

Continue navegando