Baixe o app para aproveitar ainda mais
Prévia do material em texto
12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 1/8 Minhas Disciplinas 222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5) Iniciado em segunda, 12 dez 2022, 19:03 Estado Finalizada Concluída em segunda, 12 dez 2022, 19:15 Tempo empregado 12 minutos 21 segundos Avaliar 9,00 de um máximo de 10,00(90%) Questão 1 Completo Atingiu 1,00 de 1,00 Questão 2 Completo Atingiu 1,00 de 1,00 Na estatística ou, genericamente, na análise de dados, muito frequentemente analisamos dados ditos retangulares ou estruturados, onde as variáveis - quantitativas ou qualitativas - são dispostas nas colunas e as observações na linhas de uma tabela. Em algumas situações é vantajoso se fazer a padronização das variáveis quantitativas. Assinale a alternativa correta relativamente ao assunto de padronização de variáveis quantitativas na estatística: a. Na padronização, se subtrai de cada variável seu desvio padrão, e não se faz nada com respeito à sua média. b. Na padronização, se subtrai de cada variável sua média, e depois se divide o resultado pelo seu desvio padrão. c. Na padronização, se subtrai de cada variável seu desvio padrão, e depois se divide o resultado pela média da variável. d. Na padronização, se calcula a média geral entre todas variáveis e depois se subtrai este valor de cada uma das variáveis. e. Na padronização, se subtrai de cada variável sua média, e não se faz nada com respeito ao seu desvio padrão. Usamos gráficos para a visualização do comportamento (a descoberta de padrões), tanto de cada variável individualmente quanto da relação entre variáveis (o comportamento de uma em relação à outra). Ambas visualizações, seja da variável individualmente, seja da sua possível relação com outra variável, são de grande utilidade. Quanto aos gráficos para a visualização da relação entre duas variáveis, analise as afirmativas a seguir: I. Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas. II. Boxplots são usados para a visualização da relação entre uma variável quantitativa e uma variável qualitativa (ou os níveis de uma variável qualitativa). III. Mosaic plots são usados para a visualização entre duas variáveis qualitativas (ou, em outras palavras, entre os níveis de duas variáveis qualitativas). IV. Em qualquer uma das situações descritas acima, sempre exibiremos uma das variáveis no eixo horizontal e a outra no eixo vertical. Está correto o que se afirma em: a. II e III, apenas. b. I, II e III, apenas. c. I e IV, apenas. d. II, III e IV, apenas. e. I, II, III e IV. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/my/ https://ambienteacademico.com.br/course/view.php?id=18312 https://ambienteacademico.com.br/course/view.php?id=18312§ion=7 https://ambienteacademico.com.br/mod/quiz/view.php?id=509714 https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 2/8 Questão 3 Completo Atingiu 0,00 de 1,00 Questão 4 Completo Atingiu 1,00 de 1,00 Vimos que dados podem ser classificados em dados estruturados e dados não estruturados. Atribuímos um foco aos dados estruturados, de enorme importância para a estatística e para a ciência dos dados. Ademais, há, na estatística e na ciência dos dados, uma forma básica preferida de organização dos dados. Com base no exposto, analise as afirmativas a seguir. I. Dados retangulares são dados organizados na forma de tabelas, em que as variáveis são dispostas nas colunas e as observações são dispostas nas linhas. II. Os dados cedidos pela corretora ao seu amigo estatístico foram organizados na forma de uma tabela, porém essa tabela não é um exemplo de dados retangulares, pois as variáveis estão dispostas nas linhas e as observações nas colunas. III. No R, as estruturas de dados organizados em tabelas, com as variáveis dispostas nas colunas e as observações nas linhas, são denominadas data-frames. Esse conceito é copiado no Python por meio da sua biblioteca “Pandas”. IV. Na estatística, ou na ciência de dados, não há preferência por dados estruturados na forma de data-frames, já que estatísticos e cientistas de dados podem trabalhar com dados organizados em qualquer tipo de estrutura. Está correto o que se afirma em: a. I e II, apenas b. II e III, apenas. c. II e IV, apenas. d. III e IV, apenas. e. I e III, apenas. Em algumas situações, o cientista de dados pode decidir transformar dados quantitativos em dados qualitativos, o que chamamos discretização. Por exemplo, em vez de tratar idade como uma variável quantitativa contínua, podemos transformá-la em uma variável qualitativa com quatro níveis: criança, jovem, adulto, idoso. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. A discretização (transformação) de variáveis quantitativas em qualitativas é comum na estatística e na ciência dos dados. Pois: II. A discretização, em muitas situações, simplifica a análise e, principalmente, traz maior clareza à interpretação dos resultados. A seguir, assinale a alternativa correta: a. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. b. As asserções I e II são proposições falsas. c. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. d. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I. e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 3/8 Questão 5 Completo Atingiu 1,00 de 1,00 Quando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de dispersão entre pares dessas variáveis, duas a duas. No software estatístico R, isto pode ser feito com a função gráfica pairs(). Adiante apresentamos um output típico da função pairs() quando aplicada a quatro variáveis quantitativas de um determinado conjunto de dados. Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArrest Fonte: Elaborada pelo autor. A respeito deste output típico da função gráfica pairs() do software estatístico R, para a exibição de múltiplos gráficos de dispersão entre variáveis quantitativas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) O gráfico de y = Murder versus x = Assault mostra uma tendência de aumento de Murder para um aumento de Assault. II. ( ) O gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou descida. III. ( ) O gráfico de y = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Assault, porém com uma dispersão dos pontos um pouco maior que para o caso de y = Murder versus x = Assault. IV. ( ) Como são quatro variáveis quantitativas (Murder, Assault, UrbanPop e Rape), então ao total são 12 gráficos de dispersão, de cada uma delas contra as outras três. a. V, V, V, F. b. F, V, F, V. c. F, V, V, F. d. V, V, V, V. e. F, V, V, V.Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 4/8 Questão 6 Completo Atingiu 1,00 de 1,00 Considere quatro apartamentos: o primeiro com 55 metros quadrados, no centro, no 4º andar; o segundo com 77 metros quadrados, no bairro, no 5º andar; o terceiro com 54 metros quadrados, no centro, no 9º andar; o quarto com 60 metros quadrados, no bairro, no 12º andar. Figura - Árvore de decisão ajustada aos valores dos imóveis Fonte: Elaborada pelo autor. Use a árvore que construímos para o caso dos imóveis (novamente exibida aqui) e assinale a alternativa que indica corretamente as estimativas de preço desses apartamentos: a. 390,40; 366,50; 390,40; 448,80 mil reais. b. 366,50; 319,20; 390,40; 448,80 mil reais. c. 319,20; 448,80; 366,50; 390,40 mil reais. d. 319,20; 448,80; 390,40; 366,50 mil reais. e. 319,20; 448,80; 366,50; 366,50 mil reais. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 5/8 Questão 7 Completo Atingiu 1,00 de 1,00 Leia o excerto a seguir: “Uma parte fundamental do kit de ferramentas do cientista de dados é a visualização de dados. Embora seja muito fácil criar visualizações é bem mais difícil produzir algumas boas. Existem dois usos primários para a visualização de dados: - Para explorar dados. - Para comunicar dados. Neste capítulo, nos concentraremos em construir habilidades das quais você precisará para começar a explorar seus próprios dados e produzir visualizações que usaremos no decorrer do livro. Como a maioria dos nossos tópicos do capítulo, a visualização de dados é uma rica área de estudos que merece seu próprio livro. Mas, mesmo assim, tentaremos mostrar o que é preciso e o que não é para uma boa visualização.” GRUS, J. Data science do zero: primeiras regras com Python. Rio de Janeiro: Alta Books, 2016. p. 37. Considerando o excerto apresentado, em relação à visualização de dados, analise as afirmativas a seguir: I. O autor do texto considera a visualização de dados uma parte acessória ao trabalho do cientista de dados. II. O autor considera fácil criar visualizações de dados, porém acha difícil criar boas visualizações de dados. III. O autor considera que, por ser fácil criar visualizações de dados, não há razão para merecer seu próprio livro. IV. O autor deixa claro que existem dois usos primários para a visualização de dados: explorar dados e comunicar dados. Está correto o que se afirma em: a. I, II e IV, apenas. b. II, III e IV, apenas. c. I, II e III, apenas. d. II e III, apenas. e. II e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 6/8 Questão 8 Completo Atingiu 1,00 de 1,00 Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o valor do imóvel, é quantitativa. Figura: Árvore de decisão ajustada aos valores dos imóveis Fonte: Elaborada pelo autor. A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20 mil reais, se seu andar for menor ou igual ao 6º andar. II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º andar, a estimativa para seu valor é de 366,50 mil reais. III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais, independentemente da sua localização, bairro ou centro, e do seu andar. IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º andar, a estimativa para seu valor é de 366,50 mil reais. Assinale a alternativa que apresenta a sequência correta: a. V, F, V, F. b. F, F, V, F. c. F, V, V, V. d. F, F, V, V. e. F, V, V, F. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 7/8 Questão 9 Completo Atingiu 1,00 de 1,00 Estudamos algoritmos preditivos com base em (1) modelos de regressão linear e (2) modelos de regressão logística. Esses modelos são aplicados em situações bem distintas, que dependem, essencialmente, da natureza da variável resposta, também chamada de variável dependente. Com esses dois modelos em mente, analise as afirmativas a seguir. I. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma variável de entrada. II. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma variável de entrada. III. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é: em que e são os coeficientes do modelo, , o gasto médio mensal da pessoa com cartão de crédito e , o valor esperado para a probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão. IV. O método comumente usado para calcular os valores dos coeficientes e é o Método da Máxima Verossimilhança. Para isso, pode-se fazer uso do software estatístico R. Está correto o que se afirma em: a. II, III e IV, apenas. b. I e II, apenas. c. III e IV, apenas. d. II e III, apenas. e. I, II e IV, apenas. Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade 12/12/2022 19:16 N2 (A5): Revisão da tentativa https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 8/8 Questão10 Completo Atingiu 1,00 de 1,00 No decorrer desta unidade, apresentamos uma série de exemplos de problemas de regressão e problemas de classificação. A diferença entre eles reside no tipo da variável resposta, se quantitativa ou qualitativa. Problemas de regressão são aqueles em que a variável resposta é quantitativa. As variáveis de entrada, também chamadas de regressoras ou preditoras, podem ser quantitativas ou qualitativas. Em relação a problemas de regressão, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A predição da redução da massa corporal de uma pessoa, em quilos, em função do tipo de dieta alimentar e das horas semanais dedicadas à prática de atividades físicas, é um problema de regressão. II. ( ) A predição da resistência à tração de uma liga metálica, em Pascal (1 Pascal = 1 Newton/m ), em um ensaio de tração, em função da sua composição, granulometria e condições gerais do processo de fabricação da liga, é um problema de regressão. III. ( ) A predição da taxa de mortalidade anual por melanoma maligno, em mortes a cada 100.000 habitantes, em função da latitude da região na qual habita a pessoa, é um problema de regressão. IV. ( ) A predição do consumo de combustível de um veículo, em litros de combustível por quilômetro rodado, em função do seu peso, do número de cilindros do seu motor, e do volume do seu motor, é um problema de regressão. Assinale a alternativa que apresenta a sequência correta: a. F, F, V, V. b. F, F, V, F. c. V, V, V, V. d. F, V, V, F. e. V, F, V, F. 2 ◄ Revisão Atividade 4 (A4) Seguir para... Revisão Prova N2 (A5) ► Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental https://ambienteacademico.com.br/mod/quiz/view.php?id=509713&forceview=1 https://ambienteacademico.com.br/mod/quiz/view.php?id=509716&forceview=1 https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html https://informa.fmu.br/carreiras/ https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html https://portal.fmu.br/sustentabilidade
Compartilhar