Prévia do material em texto
12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 1/8 Minhas Disciplinas 222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5) Iniciado em segunda, 12 dez 2022, 19:01 Estado Finalizada Concluída em segunda, 12 dez 2022, 20:02 Tempo empregado 1 hora 1 minuto Avaliar 10,00 de um máximo de 10,00(100%) Questão 1 Completo Atingiu 1,00 de 1,00 A atividade de venda de produtos financeiros por bancos, tais como cartões de crédito, requer que se faça uma avaliação do cliente. São focos dessa avaliação aprovar ou não um cartão de crédito para o cliente e, se aprovado, definir o limite do cartão, ou seja, o valor do crédito a conceder. Com base nessa introdução, analise as afirmativas a seguir. I. O primeiro foco da avaliação é um problema de regressão: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotômica, com dois níveis (classes). II. O primeiro foco da avaliação é um problema de classificação: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotômica, com dois níveis (classes). III. O segundo foco da avaliação é um problema de classificação, predizer o valor do limite (do crédito) do cartão. IV. O segundo foco da avaliação é um problema de regressão, predizer o valor do limite (do crédito) do cartão. Está correto o que se afirma em: a. II e IV, apenas. b. II, III e IV, apenas. c. I e III, apenas. d. I, II e III, apenas. e. I e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/my/ https://ambienteacademico.com.br/course/view.php?id=18312 https://ambienteacademico.com.br/course/view.php?id=18312§ion=7 https://ambienteacademico.com.br/mod/quiz/view.php?id=509714 https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 2/8 Questão 2 Completo Atingiu 1,00 de 1,00 Apresentamos o desenvolvimento de um algoritmo preditivo, com base em modelos de regressão linear, a partir de um caso envolvendo a interação entre uma corretora de imóveis e seu amigo estatístico. Relativamente a esse caso, analise as afirmativas a seguir. I. No estudo de caso discutido, a corretora não via razão para trabalhar com um algoritmo preditivo de valor de venda de imóveis, pois isso não a ajudaria no desenvolvimento do seu trabalho. II. A corretora de imóveis passou para seu amigo estatístico uma amostra de tamanho n = 90, contendo dados relativos a imóveis vendidos pela imobiliária onde trabalhava. III. As variáveis observadas na amostra são a área do imóvel, seu andar, sua localização e o valor pelo qual havia sido vendido. IV. Na amostra, a localização do imóvel foi dividida em cinco níveis (também denominados classes): centro, zona norte, zona sul, zona leste e zona oeste. Está correto o que se afirma em: a. III e IV, apenas. b. II, apenas. c. I e III, apenas. d. III, apenas. e. IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 3/8 Questão 3 Completo Atingiu 1,00 de 1,00 Leia o excerto a seguir: “Uma rede neural artificial (ou rede neural) é um modelo preditivo motivado pelo forma como funciona o cérebro humano. Pense no cérebro como uma coleção de neurônios conectados. Cada neurônio olha para a saída dos outros neurônios que o alimentam, faz um cálculo e então ele dispara (se o cálculo exceder algum limite) ou não (se não exceder) [...] Redes neurais podem resolver uma variedade de problemas como reconhecimento de caligrafia e detecção facial, e elas são muito usadas em deep learning (aprendizado profundo), uma das subáreas mais populares de data science. Entretanto, a maioria das redes neurais são “caixas-pretas” - inspecionar seus detalhes não lhe fornece muito entendimento de como elas estão resolvendo um problema. E grandes redes neurais podem ser difíceis de treinar. Para a maioria dos problemas você encontrará como um cientista de dados, elas provavelmente não são a melhor solução [...]”. GRUS, J. Data science do zero: primeiras regras com o Python. Rio de Janeiro: Alta Books, 2016. p. 213. Tomando como base esse texto sobre redes neurais artificiais, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Uma rede neural artificial, também chamada simplesmente de rede neural, é um modelo preditivo motivado pela forma como o cérebro funciona. II. ( ) Em uma rede neural artificial, há vários neurônios que se interconectam, e o resultado do cálculo de um alimenta a entrada de outros. III. ( ) Redes neurais, como são modelos preditivos que tomam como base o funcionamento do cérebro, são de muito fácil interpretação. IV. ( ) Redes neurais, como são modelos preditivos, podem ser usadas para tarefas tais como reconhecimento de caligrafia e detecção facial. Assinale a alternativa que apresenta a sequência correta: a. V, V, F, F. b. V, V, V, V. c. F, F, F, F. d. F, V, F, V. e. V, V, F, V. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 4/8 Questão 4 Completo Atingiu 1,00 de 1,00 Questão 5 Completo Atingiu 1,00 de 1,00 Os modelos de regressão são de enorme importância na estatística e na ciência dos dados. Dentre os diversos modelos de regressão que existem, são justamente os modelos de regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais difundidos, com aplicações nas mais diversas áreas. Considerando as técnicas discutidas de desenvolvimento de modelos preditivos pautados em modelos de regressão linear simples ou múltipla, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Modelos de regressão linear podem ser empregados na predição do peso médio (massa corporal média) de uma pessoa em função da sua altura, idade e sexo. II. ( ) Modelos de regressão linear podem ser empregados na predição do consumo médio de combustível de um carro em função da potência do seu motor e do seu peso. III. ( ) Modelos de regressão linear podem ser empregados na predição da renda média mensal de uma pessoa em função da sua escolaridade, idade, sexo e classe social. IV. ( ) Modelos de regressão linear podem ser empregados na predição da classe social de uma pessoa em função da sua renda média mensal, escolaridade, idade e sexo. Assinale a alternativa que apresenta a sequência correta. a. V, V, V, V. b. F, F, F, F. c. V, V, V, F. d. V, V, F, F. e. F, V, F, V. A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualizaçãode dados para analisar sua amostra, mas deixou outras de lado. Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados. I. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito. II. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito. III. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados. IV. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o que poderia ter feito, se quisesse. Está correto o que se afirma em: a. IV, apenas. b. II e III, apenas. c. I e II, apenas. d. I, III e IV apenas. e. I e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 5/8 Questão 6 Completo Atingiu 1,00 de 1,00 Questão 7 Completo Atingiu 1,00 de 1,00 O texto em referência fornece os seguintes exemplos de agrupamento: análise de perfil de usuários e perfil de itens para sistemas de recomendação; análise de padrões de comportamento de multidões; identificação de grupos de risco para empresas seguradoras; análise de emoções em redes sociais; reconhecimento de padrões em imagens de satélites ou imagens médicas; análise de padrões em cliques em páginas da internet, etc. SILVA, L. A. da; PERES, S. M.; BOSCARIOLI, C. Introdução à mineração de dados: com aplicações em R. Rio de Janeiro: Elsevier, 2016, p.146. A respeito dos campos de aplicação da análise de agrupamento, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A análise de emoções por meio de agrupamento pode servir ao propósito de averiguar o índice de aceitação de um candidato a um cargo eletivo público por região. II. ( ) O reconhecimento de padrões em imagens de satélites pode servir ao propósito de averiguar regiões com processos acelerados de desertificação. III. ( ) A identificação de grupos de risco para empresas seguradoras pode servir ao propósito de precificação correta do valor do seguro para cada grupo de risco. IV. ( ) A análise de padrões em cliques em páginas da internet pode servir ao propósito de identificar a procura de páginas da web por cada bairro de um município. a. F, V, V, F. b. V, V, V, F. c. V, V, F, F. d. V, F, F, V. e. V, V, V, V. Com o advento dos computadores, surgiu a necessidade de se estabelecer uma forma de comunicação dos seres humanos com eles, o que provocou a criação de linguagens de programação. Relativamente a esse assunto, analise as afirmativas a seguir. I. Linguagens de programação não são importantes para a estatística, mas só para a ciência dos dados. II. Uma das funções de linguagens de programação é viabilizar a comunicação dos seres humanos com máquinas e das máquinas entre si. III. São muitas as linguagens de programação que podem ser empregadas na estatística e na ciência dos dados, mas há uma preferência, atualmente, pelas linguagens R e Python. IV. O R base já vem com todas as funções estatísticas e gráficas das quais precisaremos em um curso introdutório de aplicações da estatística à ciência dos dados. Está correto o que se afirma em: a. II e IV, apenas. b. I, III e IV, apenas. c. I, II e III, apenas. d. II e III, apenas. e. II, III e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 6/8 Questão 8 Completo Atingiu 1,00 de 1,00 A estatística, a ciência da computação e a ciência dos dados são mutuamente relacionadas. Todas elas fazem proveito de desenvolvimentos realizados pelas outras, fazendo-as ainda mais vigorosas do que se funcionando de forma isolada umas das outras. Quanto a esse assunto, analise as afirmativas a seguir. I. A ciência da computação tem uma relação direta com a ciência dos dados, pois derivam dela os métodos de análise estatística que são aplicados à ciência dos dados. II. A estatística é a mais antiga, se comparada com a ciência da computação e a ciência dos dados. III. A ciência dos dados faz proveito simultâneo de métodos da estatística e de algoritmos de machine learning da ciência da computação. IV. Machine learning, ou seja, aprendizagem de máquina, concerne a algoritmos que tiveram a sua origem na ciência da computação e são, atualmente, muito usados, tanto na estatística quanto na ciência dos dados. Está correto o que se afirma em: a. I, II e IV, apenas. b. III e IV, apenas. c. II e III, apenas. d. I, II e III, apenas. e. II, III e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 7/8 Questão 9 Completo Atingiu 1,00 de 1,00 Quando acontece de haver várias variáveis quantitativas em uma determinada amostra de dados, é comum a realização da análise da (possível) relação entre essas variáveis por meio do cálculo de suas correlações. Neste caso, o cálculo de suas correlações sempre é feito de duas em duas variáveis. Comumente, também se apresenta a correlação de cada variável com ela mesma, o que sempre resulta em uma correlação perfeita, igual a 1. A tabela adiante mostra o resultado do cálculo das correlações entre 5 variáveis quantitativas de uma determinada amostra. x1 x2 x3 x4 x5 x1 1,00 - 0,85 - 0,78 - 0,87 0,42 x2 - 0,85 1,00 0,79 0,89 - 0,43 x3 - 0,78 0,79 1,00 0,66 - 0,71 x4 - 0,87 0,89 0,66 1,00 - 0,17 x5 0,42 - 0,43 - 0,71 - 0,17 1,00 Quadro: Correlações cruzadas entre as variáveis quantitativas x1, x2, x3, x4 e x5 Fonte: Elaborado pelo autor. Com respeito a essa tabela de correlações, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Os valores 1,00 apenas indicam a correlação perfeita que existe entre uma variável e ela mesma, uma informação de pouco valor prático. II. ( ) A maior correlação positiva é aquela entre as variáveis x2 e x4, no valor de 0,89, que indica uma forte associação entre essas duas variáveis, e que uma aumenta com um aumento da outra. III. ( ) A maior (em valor absoluto) correlação negativa é aquela entre as variáveis x1 e x4, no valor de - 0,87, que indica umaforte associação entre essas duas variáveis, e que uma diminui quanto a outra aumenta. IV. ( ) A menor (em valor absoluto) correlação negativa é aquela entre as variáveis x4 e x5, no valor de - 0,17, que indica uma fraca associação entre essas duas variáveis, e que uma diminui quando a outra aumenta. a. F, V, V, F. b. F, F, F, F. c. V, V, V, V. d. F, F, V, V. e. V, F, F, V. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/22, 20:02 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1664955&cmid=509714 8/8 Questão 10 Completo Atingiu 1,00 de 1,00 Considere quatro apartamentos: o primeiro com 55 metros quadrados, no centro, no 4º andar; o segundo com 77 metros quadrados, no bairro, no 5º andar; o terceiro com 54 metros quadrados, no centro, no 9º andar; o quarto com 60 metros quadrados, no bairro, no 12º andar. Figura - Árvore de decisão ajustada aos valores dos imóveis Fonte: Elaborada pelo autor. Use a árvore que construímos para o caso dos imóveis (novamente exibida aqui) e assinale a alternativa que indica corretamente as estimativas de preço desses apartamentos: a. 319,20; 448,80; 366,50; 366,50 mil reais. b. 319,20; 448,80; 366,50; 390,40 mil reais. c. 319,20; 448,80; 390,40; 366,50 mil reais. d. 390,40; 366,50; 390,40; 448,80 mil reais. e. 366,50; 319,20; 390,40; 448,80 mil reais. ◄ Revisão Atividade 4 (A4) Seguir para... Revisão Prova N2 (A5) ► Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/mod/quiz/view.php?id=509713&forceview=1 https://ambienteacademico.com.br/mod/quiz/view.php?id=509716&forceview=1 https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade