Baixe o app para aproveitar ainda mais
Prévia do material em texto
Desa�o do Módulo 3 Entrega 5 out em 21:00 Pontos 40 Perguntas 15 Disponível até 5 out em 21:00 Limite de tempo Nenhum Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 7.984 minutos 40 de 40 O Desafio do Módulo 3 está disponível! 1. Instruções para realizar o desafio Consulte a data de entrega no teste e em seu calendário. Reserve um tempo para realizar a atividade, leia as orientações e enunciados com atenção. Em caso de dúvidas utilize o "Fórum de dúvidas do Desafio do Módulo 3". Para iniciá-lo clique em "Fazer teste". Você tem somente uma tentativa e não há limite de tempo definido para realizá-lo. Caso precise interromper a atividade, apenas deixe a página e, ao retornar, clique em "Retomar teste". Clique em "Enviar teste" somente quando você concluí-lo. Antes de enviar confira todas as questões. Caso o teste seja iniciado e não enviado até o final do prazo de entrega, a plataforma enviará a tentativa não finalizada automaticamente, independente do progresso no teste. Fique atento ao seu teste e ao prazo final, pois novas tentativas só serão concedidas em casos de questões médicas. O gabarito será disponibilizado partir de sexta-feira, 07/10/2022, às 23h59. Bons estudos! 2. O arquivo abaixo contém o enunciado do desafio Enunciado do Desafio - Módulo 3 - Bootcamp Gestor(a) de Business Intelligence.pdf Codigo_R_Desafio.R Codigo_R_Desafio (1).txt Dataset_Varejo.xlsx https://online.igti.com.br/courses/4880/quizzes/65041/history?version=1 https://online.igti.com.br/courses/4880/files/345485/download?wrap=1 https://online.igti.com.br/courses/4880/files/344570/download?wrap=1 https://online.igti.com.br/courses/4880/files/344571/download?wrap=1 https://online.igti.com.br/courses/4880/files/344572/download?wrap=1 As respostas corretas estarão disponíveis em 7 out em 23:59. Pontuação deste teste: 40 de 40 Enviado 29 set em 15:44 Esta tentativa levou 7.984 minutos. 2,67 / 2,67 ptsPergunta 1 Explore a relação entre as Vendas e o Preço do café. Pelo gráfico de dispersão, você identifica relação entre as duas variáveis? Se sim, ela é positiva ou negativa? Sim, existe relação entre as duas variáveis, mas é uma relação quadrática, não é linear. Sim, mediante gráfico de dispersão, existe relação entre as duas variáveis e é uma relação linear positiva, pois quanto maior o preço, menores são as vendas. Não, mediante gráfico de dispersão não existe relação entre as duas variáveis. Sim, mediante gráfico de dispersão, existe relação entre as duas variáveis e é uma relação linear negativa, pois quanto maior o preço, menores são as vendas. 2,67 / 2,67 ptsPergunta 2 Explore a relação entre as Vendas e o Preço do café. Interprete o valor do Coeficiente de Correlação. (Ver tabela do Cohen) O coeficiente de correlação entre as Vendas e o Preço do Café é -0,84, isso nos diz que é uma correlação linear positiva fraca. O coeficiente de correlação entre as Vendas e o Preço do Café é -0,84, isso nos diz que é uma correlação linear positiva forte. O coeficiente de correlação entre as Vendas e o Preço do Café é -0,84, isso nos diz que é uma correlação linear negativa fraca. O coeficiente de correlação entre as Vendas e o Preço do Café é -0,84, isso nos diz que é uma correlação linear negativa forte. 2,67 / 2,67 ptsPergunta 3 Explore a relação entre as Vendas e o Preço do Concorrente. Pelo gráfico de dispersão, você identifica relação entre as duas variáveis? Se sim, ela é positiva ou negativa? Não, mediante gráfico de dispersão não existe relação entre as duas variáveis. Sim, mediante gráfico de dispersão, existe relação entre as duas variáveis e é uma relação linear positiva, pois quanto maior o preço do concorrente, maiores são as vendas. Sim, existe relação entre as duas variáveis, mas é uma relação quadrática, não é linear. Sim, mediante gráfico de dispersão existe relação entre as duas variáveis e é uma relação linear negativa, pois quanto maior o preço do concorrente, maiores são as vendas. 2,67 / 2,67 ptsPergunta 4 Explore a relação entre as Vendas e o Preço do Concorrente. Interprete o valor do Coeficiente de Correlação. (Ver tabela do Cohen) O coeficiente de correlação entre as Vendas e o Preço do Concorrente é 0,92, isso nos diz que é uma correlação linear positiva fraca. O coeficiente de correlação entre as Vendas e o Preço do Concorrente é 0,92, isso nos diz que é uma correlação linear negativa forte. O coeficiente de correlação entre as Vendas e o Preço do Concorrente é 0,92, isso nos diz que é uma correlação linear negativa fraca. O coeficiente de correlação entre as Vendas e o Preço do Concorrente é 0,92, isso nos diz que é uma correlação linear positiva forte. 2,67 / 2,67 ptsPergunta 5 Explore a relação entre as Vendas e a Promoção. Pelo boxplot, como é o comportamento das vendas quando o produto está em promoção em relação a quando ele não está em promoção? É difícil identificar se a promoção exerce impacto positivo nas vendas, pois as duas medianas estão perfeitamente alinhadas. A mediana das vendas quando há promoção é mais alta do que a mediana das vendas quando não está em promoção. Sugerindo assim que de fato vende mais quando o produto está em promoção. O terceiro quartil das vendas quando o produto está em promoção é menor que o terceiro quartil das vendas quando o produto não está em promoção. A mediana das vendas quando há promoção é mais baixa do que a mediana das vendas de quando não há promoção, sugerindo assim que a promoção não é efetiva. 2,67 / 2,67 ptsPergunta 6 Explore a relação entre as Vendas e a Promoção. Pelo boxplot, você identifica algum outlier? Sim, há dois outliers nas vendas em que há promoção. Não há nenhum outlier. Sim, há três outliers nas vendas em que há promoção. Sim, há um outlier nas vendas em que não há promoção, antes de ser removido da base de dados, o outlier deve ser investigado, pois pode revelar um novo padrão ou comportamento nos negócios. 2,67 / 2,67 ptsPergunta 7 Explore a relação entre o Preço do Café e o Preço do Leite. Pelo gráfico de dispersão, você identifica relação entre as duas variáveis? Se sim, ela é positiva ou negativa? Sim, há uma relação linear negativa, pois quando uma das variáveis diminui a outra aumenta. Não, não há relação entre as duas variáveis, pois na medida que o Preço do Café aumenta, o Preço do Leite não aumenta nem diminui, ele permanece em um padrão aleatório de espalhamento. Sim, há uma relação polinomial de terceiro grau entre as duas variáveis. Sim, há uma relação linear positiva, pois quando uma das variáveis aumenta a outra também aumenta. 2,67 / 2,67 ptsPergunta 8 Explore a relação entre o as Vendas, o Preço do Café e a Promoção: Ajuste uma Regressão Linear colocando as Vendas como variável resposta e o Preço do Café e a Promoção como variáveis preditoras. Interprete o coeficiente angular do Preço do Café. O coeficiente angular do Preço do Café é -16,64, ou seja, mantendo as demais variáveis constantes, a cada real aumentado no preço do café, as vendas caem em média 16,64 unidades. O coeficiente angular do Preço do Café é -16,64, ou seja, mantendo as demais variáveis constantes, a cada real aumentado no preço do café, as vendas caem em média 2,71 unidades. O coeficiente angular do Preço do Café é -16,64, ou seja, mantendo as demais variáveis constantes, a cada real aumentado no preço do café, as vendas aumentam em média 16,64 unidades. O coeficiente angular do Preço do Café é -16,64, ou seja, mantendo as demais variáveis constantes, a cada real aumentado no preço do café, nada acontece com as vendas. 2,67 / 2,67 ptsPergunta 9 Explore a relação entre o as Vendas, o Preço do Café e a Promoção: Ajuste uma Regressão Linear colocando as Vendas como variável resposta e o Preço do Café e a Promoção como variáveis preditoras. Interprete o coeficiente angular da Promoção. O coeficiente angular da Promoção é 4,19, ou seja, mantendo as demais variáveisconstantes, quando tem promoção as vendas aumentam em média 4,19 unidades. O coeficiente angular da Promoção é 4,19, ou seja, mantendo as demais variáveis constantes, quando tem promoção nada acontece com as vendas. O coeficiente angular da Promoção é 4,19, ou seja, mantendo as demais variáveis constantes, quando tem promoção as vendas aumentam em média 2,71 unidades. O coeficiente angular da Promoção é 4,19, ou seja, mantendo as demais variáveis constantes, quando tem promoção as vendas caem em média 4,19 unidades. 2,67 / 2,67 ptsPergunta 10 Treine uma Árvore de Decisão: Aplique a Árvore de Decisão treinada nos dados e obtenha o MAE. Interprete o valor obtido. (ver capítulo 4) O MAE (Mean Absolute Error) comparando as predições da Árvore de Decisão e os valores Originais foi de 2,11, ou seja, o algoritmo errou em média por 2,11 unidades multiplicado pela quantidade de preditores que são 5. O MAE (Mean Absolute Error) comparando as predições da Árvore de Decisão e os valores Originais foi de 2,11, ou seja, o algoritmo errou em média por 2,11 unidades vezes a raiz cúbica da quantidade de preditores que são 5. O MAE (Mean Absolute Error) comparando as predições da Árvore de Decisão e os valores Originais foi de 2,11, ou seja, o algoritmo errou em média por 2,11 unidades. O MAE (Mean Absolute Error) comparando as predições da Árvore de Decisão e os valores Originais foi de 2,11, ou seja, o algoritmo errou em média por 2,11 unidades vezes a raiz quadrada da quantidade de preditores que são 5. 2,67 / 2,67 ptsPergunta 11 Treine um Random Forest: Aplique o Random Forest treinado nos dados e obtenha o MAE. Interprete o valor obtido. (ver capítulo 4) O MAE (Mean Absolute Error) comparando as predições do Random Forest e os valores Originais foi de 1,04 , ou seja, o algoritmo errou em média por 2,11 unidades multiplicado pela quantidade de preditores que são 5. O MAE (Mean Absolute Error) comparando as predições da Árvore de Decisão e os valores Originais foi de 1,04, ou seja, o algoritmo errou em média por 1,04 unidades vezes a raiz cúbica da quantidade de preditores que são 5 O MAE (Mean Absolute Error) comparando as predições do Random Forest e os valores Originais foi de 1,04, ou seja, o algoritmo errou em média por 1,04 unidades vezes a raiz quadrada da quantidade de preditores que são 5. O MAE (Mean Absolute Error) comparando as predições do Random Forest e os valores Originais foi de 1,04, ou seja, o algoritmo errou em média por 1,04 unidades. 2,67 / 2,67 ptsPergunta 12 Qual a diferença entre o Random Forest e a Árvore de Decisão? Nenhuma, se trata do mesmo algoritmo com nomes diferentes. No Random Forest sempre são utilizadas duas árvores de decisões. No Random Forest são utilizadas combinações de n árvores de decisões, isso torna o Random Forest mais potente do que uma simples Árvore de Decisão, porém, perde-se a interpretabilidade que uma Árvore de Decisão possui. No Random Forest sempre são utilizadas três árvores de decisões. 2,67 / 2,67 ptsPergunta 13 O que é a normalização Min-Max ? É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Min-Max em um conjunto de variáveis, todas elas ficam situadas entre os valores 0 e 1. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Min-Max em um conjunto de variáveis, todas elas ficam situadas entre os valores 0 e 111. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Min-Max em um conjunto de variáveis, todas elas ficam situadas entre os valores 0 e 0,5. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Min-Max em um conjunto de variáveis, todas elas ficam situadas entre os valores 0 e 10. 2,67 / 2,67 ptsPergunta 14 O que é a normalização Z-Score? É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Z-Score em um conjunto de variáveis, todas as variáveis passam a ter média um e desvio padrão unitário. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Z-Score em um conjunto de variáveis, todas as variáveis passam a ter média zero e desvio padrão unitário. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Z-Score em um conjunto de variáveis, todas as variáveis passam a ter média dois e desvio padrão unitário. É um procedimento para remover a unidade de medida das variáveis. Ao aplicar a normalização Z-Score em um conjunto de variáveis, todas as variáveis passam a ter média cem e desvio padrão unitário. 2,62 / 2,62 ptsPergunta 15 Na tarefa de Regressão, supondo que um modelo treinado resulte em um R2 de 93%, interprete este valor. Significa que de acordo com o algoritmo utilizado e as variáveis preditoras utilizadas, foi possível explicar 93% da variação da variável resposta. Significa que de acordo com o algoritmo utilizado e as variáveis preditoras utilizadas, o erro médio absoluto (MAE) foi 93%. Significa que de acordo com o algoritmo utilizado e as variáveis preditoras utilizadas, o erro médio absoluto percentual (MAPE) foi 93%. Significa que de acordo com o algoritmo utilizado e as variáveis preditoras utilizadas, o logaritmo do erro médio absoluto foi 93%. Pontuação do teste: 40 de 40
Compartilhar