Prévia do material em texto
3a Prova Entrega 23 jun em 22:30 Pontos 25 Perguntas 14 Disponível 23 jun em 20:50 - 23 jun em 22:30 1 hora e 40 minutos Limite de tempo Nenhum Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 25 minutos 21 de 25 As respostas corretas estão ocultas. Pontuação deste teste: 21 de 25 Enviado 23 jun em 21:19 Esta tentativa levou 25 minutos. Pergunta 1 1 / 1 pts Apenas as afirmações I, II e III são verdadeiras. Apenas as afirmações I, II e V são verdadeiras. Apenas as afirmações II, III e IV são verdadeiras. Apenas as afirmações III, IV e V são verdadeiras. Apenas as afirmações I, III e IV são verdadeiras. Outliers são dados que diferem significativamente dos demais valores em um conjunto. Identificá-los e tratá-los é essencial em Ciência de Dados, pois eles podem impactar análises estatísticas e algoritmos de aprendizado de máquina de maneira inesperada. Analise as afirmações abaixo sobre outliers e escolha a alternativa que contém apenas as afirmações verdadeiras. I. Outliers podem distorcer medidas como a média, mas têm pouco impacto sobre a mediana. II. Métodos como o z-score e o IQR (Intervalo Interquartil) são comumente usados para detectar outliers. III. Em algoritmos de aprendizado de máquina baseados em árvores, como árvores de decisão, os outliers têm um impacto significativo nos resultados. IV. A remoção de outliers é sempre a melhor abordagem para lidar com eles em um conjunto de dados. V. Outliers podem indicar erros de medição ou fenômenos importantes que merecem investigação adicional. 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 1/10 https://pucminas.instructure.com/courses/221788/quizzes/552721/history?version=1 IncorretaPergunta 2 0 / 1 pts Apenas as afirmações I, II e III são verdadeiras. Apenas as afirmações II, III e V são verdadeiras. Apenas as afirmações I, III e IV são verdadeiras. Apenas as afirmações I, II, III e IV são verdadeiras. Apenas as afirmações I, III, IV e V são verdadeiras. Pergunta 3 1 / 1 pts Os quartis são uma ferramenta estatística amplamente usada em Ciência de Dados para dividir um conjunto de dados ordenados em partes iguais, permitindo uma análise detalhada da distribuição dos valores. Eles são úteis para identificar a dispersão e possíveis outliers no conjunto de dados. Analise as afirmações abaixo sobre quartis e escolha a alternativa que contém apenas as afirmações verdadeiras. I. O primeiro quartil (Q1) representa o valor abaixo do qual estão 25% dos dados ordenados. II. O terceiro quartil (Q3) é o valor acima do qual estão 75% dos dados ordenados. III. A diferença entre Q1 e Q3 é conhecida como intervalo interquartil (IQR). IV. Valores fora do intervalo são frequentemente considerados outliers. V. A mediana de um conjunto de dados corresponde ao segundo quartil (Q2), que divide os dados em dois grupos de 25%. O gráfico abaixo apresenta a acurácia de quatro modelos (Model A, Model B, Model C e Model D) utilizados para resolver um problema de classificação. Com base nos resultados mostrados, responda à seguinte pergunta: 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 2/10 O modelo com a maior acurácia é o Model D. A diferença de acurácia entre o Model C e o Model A é de 7 pontos percentuais. O Model C tem a maior acurácia apresentada no gráfico. O Model D tem a menor acurácia apresentada no gráfico. Todos os modelos possuem acurácia superior a 90%. Pergunta 4 1 / 1 pts Qual das afirmações a seguir está correta sobre os resultados apresentados no gráfico? Dados nulos representam valores ausentes em um conjunto de dados e podem impactar diretamente a qualidade das análises e os resultados dos modelos preditivos. Saber identificar, interpretar e tratar dados nulos é fundamental para lidar com problemas reais em Ciência de Dados. Analise as afirmações abaixo sobre dados nulos e escolha a alternativa que contém apenas as afirmações verdadeiras. 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 3/10 Apenas as afirmações I, II e IV são verdadeiras. Apenas as afirmações I, II e V são verdadeiras. Apenas as afirmações II, III e IV são verdadeiras. Apenas as afirmações III, IV e V são verdadeiras. Apenas as afirmações I, III e V são verdadeiras. Pergunta 5 1 / 1 pts Apenas as afirmações I, II e III estão corretas. Apenas as afirmações I e III estão corretas. Apenas as afirmações II e IV estão corretas. I. Dados nulos podem ser substituídos por valores calculados, como a média ou a mediana, para evitar a perda de informações durante a análise. II. A presença de dados nulos em um dataset pode causar erros em algoritmos de aprendizado de máquina que não lidam nativamente com valores ausentes. III. Métodos de imputação são usados exclusivamente para remover todos os dados nulos de um conjunto de dados. IV. A remoção de linhas ou colunas com dados nulos é sempre a melhor abordagem para lidar com valores ausentes. V. A análise da distribuição dos dados deve ser considerada ao decidir como tratar os valores nulos. Uma empresa industrial utiliza modelos preditivos para identificar falhas em suas máquinas. A detecção correta de falhas é essencial para evitar interrupções na produção e custos excessivos. Entretanto, a escolha do modelo deve considerar dois cenários: 1. O Modelo A possui maior número de falsos positivos (FP), mas minimiza os falsos negativos (FN). 2. O Modelo B reduz os falsos positivos (FP), mas tem maior número de falsos negativos (FN). Sabendo que as falhas críticas podem causar interrupções graves e elevados custos de reparo, mas que a manutenção preventiva desnecessária também gera custos consideráveis, o engenheiro de manutenção precisa decidir qual modelo utilizar em um cenário específico. Com base nos cenários apresentados, qual modelo seria mais adequado nos seguintes casos? I. Caso as falhas críticas resultem em altos custos e perigos significativos, o Modelo A é mais indicado. II. Em situações em que o custo de paradas para manutenção preventiva é maior do que o impacto de falhas críticas, o Modelo B é preferível. III. O Modelo A reduz a possibilidade de falhas críticas não previstas, mesmo que aumente o número de manutenções desnecessárias. IV. O Modelo B é melhor para reduzir custos de manutenção em sistemas com redundâncias que toleram falhas ocasionais. 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 4/10 Todas as afirmações estão corretas. Nenhuma das afirmações está correta. Pergunta 6 1 / 1 pts Threshold 0.9: Muito conservador, reduz FP, mas aumenta FN, resultando em mais erros totais. Threshold 0.7: Melhor que o 0.9, mas ainda não é o ideal em termos de equilíbrio. Uma fábrica utiliza um modelo preditivo para detectar falhas em máquinas. O gráfico da Curva ROC abaixo ilustra o desempenho do modelo para diferentes thresholds, com base nos seguintes valores: Eixo X (Taxa de Falsos Positivos - FPR): Proporção de negativos reais incorretamente classificados como positivos. Eixo Y (Taxa de Verdadeiros Positivos - TPR): Proporção de positivos reais corretamente classificados como positivos. Os thresholds correspondentes estão marcados em pontos específicos da curva. A fábrica deseja minimizar o número total de erros, ou seja, reduzir tanto os Falsos Positivos (FP) quanto os Falsos Negativos (FN). Com base no gráfico da Curva ROC, escolha o threshold mais adequado para atingiresse objetivo. Qual threshold deve ser escolhido para minimizar o número total de erros (FP e FN)? 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 5/10 Threshold 0.6: Melhor escolha, pois oferece alta TPR e baixa FPR, equilibrando bem FP e FN. Threshold 0.1: Muito permissivo, aumenta significativamente os FP, apesar de capturar todos os TP. Errado, o threshold de 0.6 é o mais adequado. Pergunta 7 1 / 1 pts O modelo prevê que a operação será normal, mas uma falha ocorre. O modelo prevê corretamente que uma falha irá ocorrer. O modelo prevê que uma falha irá ocorrer, mas ela não ocorre. O modelo não detecta uma falha iminente, mas a operação permanece normal. O modelo prevê corretamente que a operação será normal. IncorretaPergunta 8 0 / 3 pts A matriz de confusão ajuda a analisar erros e acertos de modelos preditivos, como em sistemas de manutenção industrial. Saber identificar corretamente cada elemento dessa matriz é crucial para avaliar o desempenho de modelos. O que representa um "Falso Negativo" (FN) em uma matriz de confusão? Uma equipe de engenharia de produção está avaliando um sistema de manutenção preditiva baseado em aprendizado de máquina. O sistema classifica estados do equipamento em três categorias: 0: Operação Normal 1: Necessidade de Manutenção Preventiva 2: Necessidade de Manutenção Corretiva O modelo foi avaliado em um conjunto de testes, gerando a seguinte matriz de confusão: Predito → / Real ↓ 0 1 2 0 8 6 7 1 7 6 6 2 6 7 7 Além disso, o relatório de classificação gerou os seguintes indicadores: Precisão Geral: 32% Média Macro da Precisão: 32% Média Macro do Recall: 32% Média Macro do F1-Score: 31% Cenário: Cada decisão incorreta do sistema impacta os custos da empresa de forma diferente: 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 6/10 242.000 Pergunta 9 3 / 3 pts 140.000 Pergunta 10 2 / 2 pts O modelo comete, em média, um erro de R$ 320,00 por previsão, sem diferenciar erros grandes de pequenos. Uma falha ao prever a necessidade de manutenção corretiva (falso negativo para a classe 2) custa $10.000. Uma manutenção preventiva desnecessária (falso positivo para a classe 1) custa $2.000. Todas as demais decisões incorretas custam $5.000 cada. Qual é o custo total do modelo? Uma empresa utiliza manutenção preditiva para reduzir os custos com paradas de máquinas. Para avaliar o custo do modelo de predição, os engenheiros de produção analisaram a seguinte matrize de confusão: Parada Prevista Parada Não Prevista Parada Necessária 45 15 Parada Não Necessária 20 120 Informações Adicionais: 1. Cada parada de máquina para manutenção preditiva (necessária ou não) custa $1000. 2. Cada parada não prevista (falha) custa $5000. 3. Considere o custo total como a soma dos custos de paradas previstas e não previstas. Qual é o custo total desde modelo? Uma empresa está utilizando um modelo de regressão para prever o custo de manutenção mensal de suas máquinas. O modelo apresentou um MAE = R$ 320,00 em uma base de teste, cujos custos reais variaram entre R$ 1.000,00 e R$ 5.000,00. Com base no valor do MAE obtido, qual é a interpretação mais adequada sobre o desempenho do modelo? 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 7/10 O MAE indica que o erro percentual médio do modelo é de 6,4%, já que os valores reais variam entre R\$ 1.000,00 e R\$ 5.000,00. O modelo apresenta erro elevado, pois o MAE é calculado com base nos quadrados dos erros. O MAE é insatisfatório, pois está em uma unidade diferente da variável prevista. O valor do MAE indica a raiz quadrada da média dos erros absolutos, o que o torna mais sensível a outliers. Pergunta 11 2 / 2 pts O Modelo X apresenta MSE menor, portanto é o mais preciso, independentemente da variável prevista. O MSE do Modelo Y é maior porque sua variável está em uma escala maior; não se deve comparar MSEs entre variáveis com unidades diferentes. O Modelo Y deve ser rejeitado, pois seu MSE é maior que 1000, o que indica falha grave no modelo. O Modelo X tem menor variabilidade, mas a comparação direta só é válida se as variáveis tiverem a mesma escala. O MSE do Modelo Y é alto porque foi aplicado o log da variável; por isso, seu erro aumenta. Pergunta 12 2 / 2 pts O MSE, pois trata todos os erros da mesma forma e é robusto a outliers. O RMSE, pois representa o erro médio absoluto e é insensível a variações nos dados. O MAE, pois trata todos os erros igualmente e é menos sensível a outliers. Dois modelos de regressão foram treinados para prever variáveis distintas: Modelo X prevê o peso de cargas em toneladas Modelo Y prevê o consumo de energia em kilowatts-hora (kWh) Ambos os modelos foram avaliados usando MSE como métrica, e os valores obtidos foram: Modelo X: MSE = 1,8 Modelo Y: MSE = 1.800 Um estudante comparou diretamente os dois MSEs e concluiu que o Modelo X era muito melhor que o Modelo Y. Qual é a melhor avaliação sobre a conclusão do estudante? Uma equipe de ciência de dados está avaliando diferentes modelos de regressão para prever a demanda diária de produtos em um supermercado. Os dados contêm alguns valores extremos (outliers) devido a promoções esporádicas e comportamentos de sazonalidade. A equipe precisa escolher a métrica de avaliação mais adequada para esse cenário. Qual das métricas abaixo é mais apropriada para avaliar os modelos neste caso? 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 8/10 O R², pois fornece o percentual de erro médio cometido pelo modelo. O MAPE, pois funciona bem mesmo quando os valores reais são próximos de zero. Pergunta 13 3 / 3 pts 90,5 Pergunta 14 3 / 3 pts Em um ambiente industrial, o uso de modelos preditivos para identificar falhas em máquinas é essencial para reduzir custos e evitar interrupções inesperadas. Uma equipe de manutenção utilizou um modelo de classificação para prever se uma máquina apresentaria falha iminente ou se operaria normalmente. A matriz de confusão obtida foi a seguinte: Predito: Falha Predito: Operação Normal Falha Real 46 (TP) 1 (FN) Operação Normal Real 10 (FP) 59 (TN) Com base nos dados acima e considerando o conceito de acurácia, responda: qual é o valor da acurácia do modelo apresentado? Obs.: Resposta em % (de zero a 100) com uma casa decimal. Uma empresa utiliza um modelo de classificação para prever falhas em seus equipamentos industriais, visando evitar paradas inesperadas e otimizar as manutenções. A matriz de confusão obtida após testes do modelo foi a seguinte: Predito: Falha Predito: Operação Normal Falha Real 56 (TP) 9 (FN) Operação Normal Real 2 (FP) 10 (TN) Dentre as métricas de avaliação, o Recall (ou Sensibilidade) mede a capacidade do modelo de identificar corretamente as situações em que há falha real. Qual é o valor do Recall do modelo apresentado? 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 9/10 86,2 Pontuação do teste: 21 de 25 Obs.: Resposta em % (de zero a 100) com uma casa decimal. 23/06/2025, 21:19 3a Prova: Engenharia Organizacional: Sistemas para Manufatura e Logística - Engenharia de Produção - Campus Betim - P… https://pucminas.instructure.com/courses/221788/quizzes/552721 10/10