Buscar

N2 (A5)_ Revisão da tentativa_ds

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 1/10
Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em quinta, 23 jun 2022, 18:10
Estado Finalizada
Concluída em quinta, 23 jun 2022, 18:26
Tempo
empregado
15 minutos 33 segundos
Avaliar 9,00 de um máximo de 10,00(90%)
Questão 1
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir: 
“Exploração de dados é a arte de olhar os seus dados, rapidamente gerar hipóteses sobre eles, e rapidamente testar essas hipóteses. E
repetir isso outra vez, outra vez, outra vez. O objetivo da exploração de dados é a geração de pistas sobre o que os dados nos revelam,
pistas que você poderá explorar, mais tarde, em maior profundidade.” 
WICKHAM, Hadley; GROLEMUN, Garret. R for data science: import, tidy, transform, visualize, and model dada. Sebastopol (CA): O’Reilly
Media, 2017, p.1. 
 
A respeito das fontes que originaram os contos de fadas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s)
Falsa(s). 
 
I. ( ) Análise estatística descritiva é parte da análise exploratória de dados, frequentemente entendida como a exploração inicial dos dados. 
II. ( ) Além dos métodos da estatística descritiva, algoritmos de agrupamento também são parte da análise exploratória de dados. 
III. ( ) A análise exploratória dos dados permite a geração de hipóteses sobre os dados, para posterior investigação mais detalhada. 
IV. ( ) Gerar hipóteses sobre dados significa gerar afirmações sobre possíveis padrões e descobertas reveladas pelos dados, a serem
melhor investigadas e comprovadas.
a. V, V, F, V.
b. V, V, V, V.
c. V, V, F, F.
d. F, F, F, F.
e. F, V, F, V.
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 2/10
Questão 2
Completo
Atingiu 1,00 de 1,00
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente
comercial do fabricante da boneca. Entre elas, há a variável do local de exposição da boneca (ruim, médio, bom) no ponto de venda, cuja
relação com vendas altas ou baixas é exibida no gráfico adiante. 
 
Figura: Efeito do local de exposição nas vendas 
Fonte: Elaborada pelo autor. 
Quanto à relação entre o local de exposição da boneca (ruim, médio, bom) e o volume de vendas (vendas altas ou baixas), analise as
afirmativas a seguir: 
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem com mais frequência nos pontos de venda onde o local de exposição da
boneca é bom. 
II. Ao estudarmos este caso, percebemos que não há qualquer efeito do local de exposição sobre o volume de vendas da boneca nos
pontos de venda. 
III. O gráfico exibido acima mostra que a frequência de pontos com vendas altas é baixa quando o local de exposição da boneca é ruim. 
IV. O gráfico de visualização da relação entre o local de exposição da boneca no ponto de venda e o volume de vendas, por se tratarem
ambas de variáveis qualitativas, é um gráfico do tipo mosaic plot, apropriado para esta situação. 
Está correto o que se afirma em:
a. I, II e III, apenas.
b. II e III, apenas.
c. I, III e IV, apenas.
d. III e IV, apenas.
e. I, II e IV, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 3/10
Questão 3
Completo
Atingiu 1,00 de 1,00
Um jovem cientista de dados realizou uma análise de agrupamento de apenas cinco estados americanos parte do famoso conjunto de
dados USArrests, o qual possue 50 observações (50 estados americanos) de 4 variáveis (Murder, Assault, UrbanPop e Rape). 
 
Obteve o resultado exibido na figura exibida adiante: 
 
Figura - Dendrograma do agrupamento dos cinco estados 
Fonte: Elaborada pelo autor 
 
Relativamente à interpretação desta figura, assinale a alternativa correta: 
 
 
a. É um dendrograma, ou seja, um grá�co na forma de uma árvore, que lido de cima para baixo, na altura (height) 1,5 sugere a
formação de 10 grupos.
b. É um dendrograma, ou seja, um grá�co na forma de uma árvore, que sugere serem os estados New Mexico e Oklahoma os
mais próximos em termos de violência urbana.
c. É um dendrograma, ou seja, um grá�co na forma de uma árvore, que lido de baixo para cima, na altura (height) 1,5 sugere a
formação de 6 grupos.
d. É um dendrograma, ou seja, um grá�co na forma de uma árvore, que representa os vários grupos formados em cada estágio
do processo de agrupamento hierárquico.
e. É um dendrograma, ou seja, um grá�co na forma de uma árvore, que sugere serem os estados Texas e Arkansas os mais
próximos em termos de violência urbana.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 4/10
Questão 4
Completo
Atingiu 1,00 de 1,00
Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como
modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o
valor do imóvel, é quantitativa. 
 
 
Figura: Árvore de decisão ajustada aos valores dos imóveis 
Fonte: Elaborada pelo autor. 
 
A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua
conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20
mil reais, se seu andar for menor ou igual ao 6º andar. 
II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º
andar, a estimativa para seu valor é de 366,50 mil reais. 
III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais,
independentemente da sua localização, bairro ou centro, e do seu andar. 
IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º
andar, a estimativa para seu valor é de 366,50 mil reais. 
 
Assinale a alternativa que apresenta a sequência correta:
a. F, V, V, F.
b. F, F, V, F.
c. F, F, V, V.
d. F, V, V, V.
e. V, F, V, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 5/10
Questão 5
Completo
Atingiu 1,00 de 1,00
O texto em referência fornece os seguintes exemplos de agrupamento: análise de perfil de usuários e perfil de itens para sistemas de
recomendação;análise de padrões de comportamento de multidões; identificação de grupos de risco para empresas seguradoras; análise
de emoções em redes sociais; reconhecimento de padrões em imagens de satélites ou imagens médicas; análise de padrões em cliques
em páginas da internet, etc. 
 
SILVA, L. A. da; PERES, S. M.; BOSCARIOLI, C. Introdução à mineração de dados: com aplicações em R. Rio de Janeiro: Elsevier, 2016,
p.146. 
A respeito dos campos de aplicação da análise de agrupamento, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F
para a(s) Falsa(s). 
 
I. ( ) A análise de emoções por meio de agrupamento pode servir ao propósito de averiguar o índice de aceitação de um candidato a um
cargo eletivo público por região. 
II. ( ) O reconhecimento de padrões em imagens de satélites pode servir ao propósito de averiguar regiões com processos acelerados de
desertificação. 
III. ( ) A identificação de grupos de risco para empresas seguradoras pode servir ao propósito de precificação correta do valor do seguro
para cada grupo de risco. 
IV. ( ) A análise de padrões em cliques em páginas da internet pode servir ao propósito de identificar a procura de páginas da web por cada
bairro de um município.
a. V, F, F, V.
b. V, V, V, V.
c. V, V, V, F.
d. V, V, F, F.
e. F, V, V, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 6/10
Questão 6
Completo
Atingiu 0,00 de 1,00
Modelos de regressão linear são os mais importantes modelos de regressão da estatística e da ciência dos dados. Eles são divididos em
dois grupos: modelos de regressão linear simples e modelos de regressão linear múltipla. 
 
Referente ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área, seu andar e sua localização, analise as
afirmativas a seguir. 
 
I. O estatístico desenvolveu um modelo completo para o valor esperado de (valor do imóvel) em função de (área do imóvel), (andar
do imóvel) e (localização do imóvel), simultaneamente. Esse modelo ficou assim: 
 
 
II. Os coeficientes b1 = 4,87, b3 = 6,36 e b3 = - 27,43 indicam, respectivamente, quanto varia o valor esperado para o apartamento com a
variação unitária de sua área (em metros quadrados), a variação unitária do seu andar (1 andar a mais) e a sua localização (bairro = 0 ou
centro = 1). 
III. Com base nesse modelo, foi possível verificar que, para apartamentos de mesma área e mesmo andar, porém um no bairro e outro no
centro, o apartamento do centro tem um valor esperado menor que o do bairro em 27,43 mil reais (27 mil arredondando para mil reais). Isso
é válido para aquele município e para aqueles dados da corretora. 
IV. Com base nesse modelo, foi possível verificar que um apartamento de 50 metros quadrados no 10º andar tem um valor esperado de
339,77 mil reais no bairro contra um valor esperado de 312,34 mil para um apartamento de mesma área e andar no centro. 
Está correto o que se afirma em: 
 
 
a. I e II, apenas.
b. I, II e IV, apenas.
c. I, II, III e IV.
d. I, II e III, apenas.
e. II e III, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 7/10
Questão 7
Completo
Atingiu 1,00 de 1,00
O modelo de regressão logística simples desenvolvido por uma jovem cientista de dados para a predição da probabilidade de inadimplência
com o cartão de crédito foi: 
 
 
Tomando como base esse modelo, que foi ajustado aos dados da amostra cedida pelo gerente, podemos estimar o valor esperado para a
probabilidade de inadimplência com cartão de crédito das pessoas. Por exemplo, vamos considerar duas pessoas, uma com um gasto de
médio mensal com o cartão de R$ 500,00, e a outra com um gasto médio mensal de R$ 1.000,00. Usando o modelo ajustado anterior,
obtemos, respectivamente (assinale a alternativa correta): 
 
 
a. 37% e 17%.
b. 17% e 27%.
c. 7% e 37% .
d. 27% e 7%.
e. 7% e 27%.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 8/10
Questão 8
Completo
Atingiu 1,00 de 1,00
A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a
visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou
outras de lado. 
 
Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados. 
 
I. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados
quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
II. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados
quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
 
 
III. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos,
respectivamente, na estatística e na ciência dos dados.
IV. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software
estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem
fazer uso de diagramas de barras, o que poderia ter feito, se quisesse.
 
Está correto o que se afirma em: 
 
 
a. I e II, apenas.
b. II e III, apenas.
c. I, III e IV apenas.
d. IV, apenas.
e. I e IV, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 9/10
Questão 9
Completo
Atingiu 1,00 de 1,00
Questão 10
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir: 
“Normalização: É comum normalizar (padronizar) variáveis contínuas através da subtração da média e divisão pelo desvio-padrão, ou então
as variáveis com grande escala dominarão o processo de agrupamento (veja Padronização (Normalização, Escores Z), no Capítulo 6).” 
 
BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p.
265. 
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. Sabemos que, na estatística ou na ciência dos dados, é comum normalizar (padronizar) variáveis quantitativas, ou variáveis contínuas,
antes da realização de uma análise de agrupamento. 
Pois 
II. No conjunto de dados observados (a amostra de dados), podem existir variáveis que estão em uma escala muito maior que as outras, e a
medida de distância entre observações dessas variáveis dominarão o resultado da análise de agrupamento, na formação dos grupos de
observações similares entre si.
a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b. A asserção I é uma proposiçãoverdadeira e a asserção II é uma proposição falsa.
c. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
d. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I.
e. As asserções I e II são proposições falsas.
A estatística, a ciência da computação e a ciência dos dados são mutuamente relacionadas. Todas elas fazem proveito de
desenvolvimentos realizados pelas outras, fazendo-as ainda mais vigorosas do que se funcionando de forma isolada umas das outras. 
 
Quanto a esse assunto, analise as afirmativas a seguir. 
 
I. A ciência da computação tem uma relação direta com a ciência dos dados, pois derivam dela os métodos de análise estatística que são
aplicados à ciência dos dados. 
II. A estatística é a mais antiga, se comparada com a ciência da computação e a ciência dos dados. 
III. A ciência dos dados faz proveito simultâneo de métodos da estatística e de algoritmos de machine learning da ciência da computação. 
IV. Machine learning, ou seja, aprendizagem de máquina, concerne a algoritmos que tiveram a sua origem na ciência da computação e são,
atualmente, muito usados, tanto na estatística quanto na ciência dos dados. 
 
Está correto o que se afirma em:
a. II e III, apenas.
b. I, II e IV, apenas.
c. II, III e IV, apenas.
d. III e IV, apenas.
e. I, II e III, apenas.
◄ Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=343068&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 18:26 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=909755&cmid=343066 10/10

Continue navegando