Buscar

N2 (A5) - ESTATISTICA APLICADA AO DATA SCIENCE

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 1/8
Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em terça, 28 jun 2022, 21:55
Estado Finalizada
Concluída em terça, 28 jun 2022, 22:12
Tempo
empregado
17 minutos 34 segundos
Avaliar 5,00 de um máximo de 10,00(50%)
Questão 1
Completo
Atingiu 1,00 de 1,00
Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa popularidade advém do fato de que as árvores
de decisão são de muito fácil interpretação, o que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se
que florestas randômicas têm melhor performance preditiva que árvores de decisão. A partir do apresentado, analise as asserções a seguir
e a relação proposta entre elas. 
 
I. Mesmo sabendo-se que florestas randômicas têm melhor performance preditiva que árvores de decisão, muitas vezes o cientista de
dados dá preferência a modelos de árvores de decisão frente a florestas randômicas. 
Pois: 
II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil interpretabilidade que árvores de decisão têm.
Essa facilidade de interpretação não só é útil para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos
resultados aos clientes. 
 
A seguir, assinale a alternativa correta:
a. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
b. As asserções I e II são proposições falsas.
c. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
d. A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I.
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 2/8
Questão 2
Completo
Atingiu 0,00 de 1,00
Questão 3
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir: 
“A ciência dos dados é uma fusão de múltiplas disciplinas, incluindo estatística, ciência da computação, tecnologia da informação e campos
de domínios específicos. Consequentemente, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito.” 
 
BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p.
xv. 
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito. 
Pois 
II. A estatística usa, de forma profunda, a matemática como pilar do seu desenvolvimento. É considerada a ciência mais sutil, e a mais
ampla, quanto o assunto são dados. É usada por todas áreas científicas.
a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
c. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
d. As asserções I e II são proposições falsas.
e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa  da I.
Leia o excerto a seguir: 
 
“Uma rede neural artificial (ou rede neural) é um modelo preditivo motivado pelo forma como funciona o cérebro humano. Pense no cérebro
como uma coleção de neurônios conectados. Cada neurônio olha para a saída dos outros neurônios que o alimentam, faz um cálculo e
então ele dispara (se o cálculo exceder algum limite) ou não (se não exceder) [...] Redes neurais podem resolver uma variedade de
problemas como reconhecimento de caligrafia e detecção facial, e elas são muito usadas em deep learning (aprendizado profundo), uma
das subáreas mais populares de data science. Entretanto, a maioria das redes neurais são “caixas-pretas” - inspecionar seus detalhes não
lhe fornece muito entendimento de como elas estão resolvendo um problema. E grandes redes neurais podem ser difíceis de treinar. Para a
maioria dos problemas você encontrará como um cientista de dados, elas provavelmente não são a melhor solução [...]”. 
 
GRUS, J. Data science do zero: primeiras regras com o Python. Rio de Janeiro: Alta Books, 2016. p. 213. 
 
Tomando como base esse texto sobre redes neurais artificiais, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para
a(s) Falsa(s). 
 
I. ( ) Uma rede neural artificial, também chamada simplesmente de rede neural, é um modelo preditivo motivado pela forma como o cérebro
funciona. 
II. ( ) Em uma rede neural artificial, há vários neurônios que se interconectam, e o resultado do cálculo de um alimenta a entrada de outros. 
III. ( ) Redes neurais, como são modelos preditivos que tomam como base o funcionamento do cérebro, são de muito fácil interpretação. 
IV. ( ) Redes neurais, como são modelos preditivos, podem ser usadas para tarefas tais como reconhecimento de caligrafia e detecção
facial. 
 
Assinale a alternativa que apresenta a sequência correta:
a. V, V, F, F.
b. F, F, F, F.
c. V, V, V, V.
d. F, V, F, V.
e. V, V, F, V.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 3/8
Questão 4
Completo
Atingiu 1,00 de 1,00
O ser humano tem enorme facilidade em agrupar, por similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas
de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação
de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos: 
 
I. a Netflix usa classificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes
assistirmos, maior será a sua receita;
II. o Facebook usa classificadores para recomendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor
desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita;
III. um banco de varejo usa classificadores para detectar se uma operação com cartão de débito ou crédito é ou não uma operação
fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operações fraudulentas forem detectadas, mais rapidamente
o banco pode agir para impedir perdas para seus clientes e para ele próprio;
IV. uma concessionária de distribuição de energia elétrica usa classificadores para identificar casos potenciais de roubo de energia da
rede, os famosos “gatos”. Para as concessionárias de distribuição de energia elétrica, o valor dessa aplicação é evitar prejuízo com o
furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas.
 
Está correto o que se afirma em: 
 
 
a. I e III, apenas.
b. I, II, III e IV.
c. I e II, apenas.
d. III e IV, apenas.
e. II e IV, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5):Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 4/8
Questão 5
Completo
Atingiu 0,00 de 1,00
Modelos de regressão linear são os mais importantes modelos de regressão da estatística e da ciência dos dados. Eles são divididos em
dois grupos: modelos de regressão linear simples e modelos de regressão linear múltipla. 
 
Quanto ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área e do seu andar, analise as afirmativas a
seguir. 
 
I. O estatístico desenvolveu um modelo para o valor esperado de (valor do imóvel) em função de (área do imóvel) e (andar do
imóvel), simultaneamente. Esse modelo ficou assim: 
 
 
II. Quando se faz o ajuste simultâneo do modelo para duas variáveis de entrada, é natural que os valores dos coeficientes para cada
variável sejam diferentes do que os mesmos coeficientes para cada variável sozinha em uma regressão linear simples. Isso vale sempre
que adicionamos variáveis de entrada ou eliminamos variáveis de entrada de um modelo de regressão linear. 
III. Os coeficientes b1 e b2 indicam, respectivamente, quanto varia o valor esperado para o apartamento com a variação unitária de sua
área (em metros quadrados) e a variação unitária do seu andar (1 andar a mais). 
IV. Ao usar esse modelo preditivo, podemos estimar o valor esperado de um apartamento com 40 metros quadrados localizado no quinto
andar em 433 mil reais (arredondando para mil reais). 
Está correto o que se afirma em: 
 
 
a. I e II, apenas.
b. I, II e III, apenas.
c. II e III, apenas.
d. III e IV, apenas.
e. I, II, III e IV.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 5/8
Questão 6
Completo
Atingiu 1,00 de 1,00
Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como
modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o
valor do imóvel, é quantitativa. 
 
 
Figura: Árvore de decisão ajustada aos valores dos imóveis 
Fonte: Elaborada pelo autor. 
 
A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua
conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20
mil reais, se seu andar for menor ou igual ao 6º andar. 
II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º
andar, a estimativa para seu valor é de 366,50 mil reais. 
III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais,
independentemente da sua localização, bairro ou centro, e do seu andar. 
IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º
andar, a estimativa para seu valor é de 366,50 mil reais. 
 
Assinale a alternativa que apresenta a sequência correta:
a. F, F, V, F.
b. F, V, V, V.
c. F, F, V, V.
d. F, V, V, F.
e. V, F, V, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 6/8
Questão 7
Completo
Atingiu 0,00 de 1,00
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente
comercial do fabricante da boneca. Dentre elas, há a variável dos gastos do fabricante da boneca com publicidade, cuja relação com
vendas altas ou baixas é exibida no gráfico adiante. 
 
 Figura: Efeito dos gastos com publicidade nas vendas 
Fonte: Elaborada pelo autor. 
 
Quanto à relação entre gastos mensais com publicidade e o volume de vendas (vendas altas ou baixas), analise as afirmativas a seguir: 
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem mesmo quando os gastos com publicidade são apenas ligeiramente
maiores. 
II. Visualmente, podemos perceber que a mediana (linha sólida dentro da caixa) dos gastos com publicidade é da ordem de 20 mil reais por
mês para vendas altas e da ordem de 8 mil reais por mês para vendas baixas. 
III. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas não mostra qualquer efeito dos
gastos com publicidade sobre o volume de vendas da boneca. 
IV. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas mostra que vendas altas ocorrem
quando os gastos com publicidade são significativamente maiores. 
Está correto o que se afirma em:
a. II e IV, apenas.
b. I e II, apenas.
c. III e IV, apenas.
d. I, apenas.
e. III, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 7/8
Questão 8
Completo
Atingiu 1,00 de 1,00
Questão 9
Completo
Atingiu 0,00 de 1,00
Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como tratamos as variáveis estudadas
que se dá a diferença entre esses dois tipos de aprendizagens, supervisionada e não supervisionada. Esses dois tipos são os mais
importantes dentre os diversos tipos de aprendizagem. 
 
Relativamente a esse assunto, analise as afirmativas a seguir: 
 
I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função
dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada. 
II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável
dependente. 
III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável
preditora, variável explanatória ou variável independente. 
IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento
de uma delas em função dos valores assumidos pelas outras. 
 
 
a. I, II e IV, apenas. 
 
b. II e III, apenas.
c. I, III e IV, apenas.
d. II, III e IV, apenas.
e. I, II, III e IV.
Vimos que há dois principais tipos de aprendizagem supervisionada: problema de regressão e problema de classificação. São os tipos de
variáveis resposta dos dados em análise que distinguem esses dois tipos entre si. 
 
Relativamente a esses dois tipos, analise as afirmativas a seguir. 
 
I. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é qualitativa.
II. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é quantitativa.
III. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é qualitativa.
IV. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é quantitativa.
 
Está correto o que se afirma em:
a. III, apenas.
b. III e IV, apenas.
c. II e IV, apenas.
d. II e III, apenas.
e. I e III,apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
28/06/2022 22:13 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=975321&cmid=343066 8/8
Questão 10
Completo
Atingiu 0,00 de 1,00
Considere dois pontos de venda da boneca falante com as seguintes características: primeiro ponto com local de exposição ruim da
boneca, preço da boneca de 289,99 reais, gastos mensais com publicidade de 90 mil reais e idade média da população local de 39 anos.
Segundo ponto com bom local de exposição da boneca e preço da boneca de 399,99 reais. 
 
Figura - Árvore de decisão ajustada às vendas do produto de varejo 
Fonte: Elaborada pelo autor. 
 
 
Use a árvore que construímos para o caso da boneca falante (novamente exibida aqui) e assinale a alternativa que indica corretamente a
estimativa de vendas para esse ponto de venda:
a. Vendas baixas e baixas, respectivamente.
b. Vendas altas e baixas, respectivamente.
c. Vendas altas e altas, respectivamente.
d. Vendas baixas e altas, respectivamente.
e. Vendas altas, apenas.
◄ Atividade 4 (A4)
Seguir para...
N2 SUB (A6) ►
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=343067&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando