Baixe o app para aproveitar ainda mais
Prévia do material em texto
28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 1/8 Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5) Iniciado em terça, 28 jun 2022, 21:55 Estado Finalizada Concluída em terça, 28 jun 2022, 22:12 Tempo empregado 17 minutos 34 segundos Avaliar 5,00 de um máximo de 10,00(50%) Questão 1 Completo Atingiu 1,00 de 1,00 Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa popularidade advém do fato de que as árvores de decisão são de muito fácil interpretação, o que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se que florestas randômicas têm melhor performance preditiva que árvores de decisão. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. Mesmo sabendo-se que florestas randômicas têm melhor performance preditiva que árvores de decisão, muitas vezes o cientista de dados dá preferência a modelos de árvores de decisão frente a florestas randômicas. Pois: II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil interpretabilidade que árvores de decisão têm. Essa facilidade de interpretação não só é útil para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos resultados aos clientes. A seguir, assinale a alternativa correta: a. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. b. As asserções I e II são proposições falsas. c. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I. d. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I. NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/my/ https://ambienteacademico.com.br/course/view.php?id=12295 https://ambienteacademico.com.br/course/view.php?id=12295§ion=6 https://ambienteacademico.com.br/mod/quiz/view.php?id=343066 https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 2/8 Questão 2 Completo Atingiu 0,00 de 1,00 Questão 3 Completo Atingiu 1,00 de 1,00 Leia o excerto a seguir: “A ciência dos dados é uma fusão de múltiplas disciplinas, incluindo estatística, ciência da computação, tecnologia da informação e campos de domínios específicos. Consequentemente, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito.” BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p. xv. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito. Pois II. A estatística usa, de forma profunda, a matemática como pilar do seu desenvolvimento. É considerada a ciência mais sutil, e a mais ampla, quanto o assunto são dados. É usada por todas áreas científicas. a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. b. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I. c. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. d. As asserções I e II são proposições falsas. e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa da I. Leia o excerto a seguir: “Uma rede neural artificial (ou rede neural) é um modelo preditivo motivado pelo forma como funciona o cérebro humano. Pense no cérebro como uma coleção de neurônios conectados. Cada neurônio olha para a saída dos outros neurônios que o alimentam, faz um cálculo e então ele dispara (se o cálculo exceder algum limite) ou não (se não exceder) [...] Redes neurais podem resolver uma variedade de problemas como reconhecimento de caligrafia e detecção facial, e elas são muito usadas em deep learning (aprendizado profundo), uma das subáreas mais populares de data science. Entretanto, a maioria das redes neurais são “caixas-pretas” - inspecionar seus detalhes não lhe fornece muito entendimento de como elas estão resolvendo um problema. E grandes redes neurais podem ser difíceis de treinar. Para a maioria dos problemas você encontrará como um cientista de dados, elas provavelmente não são a melhor solução [...]”. GRUS, J. Data science do zero: primeiras regras com o Python. Rio de Janeiro: Alta Books, 2016. p. 213. Tomando como base esse texto sobre redes neurais artificiais, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Uma rede neural artificial, também chamada simplesmente de rede neural, é um modelo preditivo motivado pela forma como o cérebro funciona. II. ( ) Em uma rede neural artificial, há vários neurônios que se interconectam, e o resultado do cálculo de um alimenta a entrada de outros. III. ( ) Redes neurais, como são modelos preditivos que tomam como base o funcionamento do cérebro, são de muito fácil interpretação. IV. ( ) Redes neurais, como são modelos preditivos, podem ser usadas para tarefas tais como reconhecimento de caligrafia e detecção facial. Assinale a alternativa que apresenta a sequência correta: a. V, V, F, F. b. F, F, F, F. c. V, V, V, V. d. F, V, F, V. e. V, V, F, V. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 3/8 Questão 4 Completo Atingiu 1,00 de 1,00 O ser humano tem enorme facilidade em agrupar, por similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos: I. a Netflix usa classificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes assistirmos, maior será a sua receita; II. o Facebook usa classificadores para recomendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita; III. um banco de varejo usa classificadores para detectar se uma operação com cartão de débito ou crédito é ou não uma operação fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operações fraudulentas forem detectadas, mais rapidamente o banco pode agir para impedir perdas para seus clientes e para ele próprio; IV. uma concessionária de distribuição de energia elétrica usa classificadores para identificar casos potenciais de roubo de energia da rede, os famosos “gatos”. Para as concessionárias de distribuição de energia elétrica, o valor dessa aplicação é evitar prejuízo com o furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas. Está correto o que se afirma em: a. I e III, apenas. b. I, II, III e IV. c. I e II, apenas. d. III e IV, apenas. e. II e IV, apenas. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5):Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 4/8 Questão 5 Completo Atingiu 0,00 de 1,00 Modelos de regressão linear são os mais importantes modelos de regressão da estatística e da ciência dos dados. Eles são divididos em dois grupos: modelos de regressão linear simples e modelos de regressão linear múltipla. Quanto ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área e do seu andar, analise as afirmativas a seguir. I. O estatístico desenvolveu um modelo para o valor esperado de (valor do imóvel) em função de (área do imóvel) e (andar do imóvel), simultaneamente. Esse modelo ficou assim: II. Quando se faz o ajuste simultâneo do modelo para duas variáveis de entrada, é natural que os valores dos coeficientes para cada variável sejam diferentes do que os mesmos coeficientes para cada variável sozinha em uma regressão linear simples. Isso vale sempre que adicionamos variáveis de entrada ou eliminamos variáveis de entrada de um modelo de regressão linear. III. Os coeficientes b1 e b2 indicam, respectivamente, quanto varia o valor esperado para o apartamento com a variação unitária de sua área (em metros quadrados) e a variação unitária do seu andar (1 andar a mais). IV. Ao usar esse modelo preditivo, podemos estimar o valor esperado de um apartamento com 40 metros quadrados localizado no quinto andar em 433 mil reais (arredondando para mil reais). Está correto o que se afirma em: a. I e II, apenas. b. I, II e III, apenas. c. II e III, apenas. d. III e IV, apenas. e. I, II, III e IV. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 5/8 Questão 6 Completo Atingiu 1,00 de 1,00 Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o valor do imóvel, é quantitativa. Figura: Árvore de decisão ajustada aos valores dos imóveis Fonte: Elaborada pelo autor. A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20 mil reais, se seu andar for menor ou igual ao 6º andar. II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º andar, a estimativa para seu valor é de 366,50 mil reais. III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais, independentemente da sua localização, bairro ou centro, e do seu andar. IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º andar, a estimativa para seu valor é de 366,50 mil reais. Assinale a alternativa que apresenta a sequência correta: a. F, F, V, F. b. F, V, V, V. c. F, F, V, V. d. F, V, V, F. e. V, F, V, F. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 6/8 Questão 7 Completo Atingiu 0,00 de 1,00 Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente comercial do fabricante da boneca. Dentre elas, há a variável dos gastos do fabricante da boneca com publicidade, cuja relação com vendas altas ou baixas é exibida no gráfico adiante. Figura: Efeito dos gastos com publicidade nas vendas Fonte: Elaborada pelo autor. Quanto à relação entre gastos mensais com publicidade e o volume de vendas (vendas altas ou baixas), analise as afirmativas a seguir: I. Ao estudarmos este caso, percebemos que vendas altas ocorrem mesmo quando os gastos com publicidade são apenas ligeiramente maiores. II. Visualmente, podemos perceber que a mediana (linha sólida dentro da caixa) dos gastos com publicidade é da ordem de 20 mil reais por mês para vendas altas e da ordem de 8 mil reais por mês para vendas baixas. III. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas não mostra qualquer efeito dos gastos com publicidade sobre o volume de vendas da boneca. IV. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas mostra que vendas altas ocorrem quando os gastos com publicidade são significativamente maiores. Está correto o que se afirma em: a. II e IV, apenas. b. I e II, apenas. c. III e IV, apenas. d. I, apenas. e. III, apenas. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 7/8 Questão 8 Completo Atingiu 1,00 de 1,00 Questão 9 Completo Atingiu 0,00 de 1,00 Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como tratamos as variáveis estudadas que se dá a diferença entre esses dois tipos de aprendizagens, supervisionada e não supervisionada. Esses dois tipos são os mais importantes dentre os diversos tipos de aprendizagem. Relativamente a esse assunto, analise as afirmativas a seguir: I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada. II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável dependente. III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável preditora, variável explanatória ou variável independente. IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento de uma delas em função dos valores assumidos pelas outras. a. I, II e IV, apenas. b. II e III, apenas. c. I, III e IV, apenas. d. II, III e IV, apenas. e. I, II, III e IV. Vimos que há dois principais tipos de aprendizagem supervisionada: problema de regressão e problema de classificação. São os tipos de variáveis resposta dos dados em análise que distinguem esses dois tipos entre si. Relativamente a esses dois tipos, analise as afirmativas a seguir. I. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é qualitativa. II. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é quantitativa. III. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é qualitativa. IV. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é quantitativa. Está correto o que se afirma em: a. III, apenas. b. III e IV, apenas. c. II e IV, apenas. d. II e III, apenas. e. I e III,apenas. NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 28/06/2022 22:13 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 8/8 Questão 10 Completo Atingiu 0,00 de 1,00 Considere dois pontos de venda da boneca falante com as seguintes características: primeiro ponto com local de exposição ruim da boneca, preço da boneca de 289,99 reais, gastos mensais com publicidade de 90 mil reais e idade média da população local de 39 anos. Segundo ponto com bom local de exposição da boneca e preço da boneca de 399,99 reais. Figura - Árvore de decisão ajustada às vendas do produto de varejo Fonte: Elaborada pelo autor. Use a árvore que construímos para o caso da boneca falante (novamente exibida aqui) e assinale a alternativa que indica corretamente a estimativa de vendas para esse ponto de venda: a. Vendas baixas e baixas, respectivamente. b. Vendas altas e baixas, respectivamente. c. Vendas altas e altas, respectivamente. d. Vendas baixas e altas, respectivamente. e. Vendas altas, apenas. ◄ Atividade 4 (A4) Seguir para... N2 SUB (A6) ► NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1 https://ambienteacademico.com.br/mod/quiz/view.php?id=343067&forceview=1 https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade
Compartilhar