Buscar

N2 (A5)_ Revisão da tentativa1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 1/9
Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em sexta, 24 jun 2022, 20:24
Estado Finalizada
Concluída em sexta, 24 jun 2022, 20:44
Tempo
empregado
19 minutos 33 segundos
Avaliar 8,00 de um máximo de 10,00(80%)
Questão 1
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir sobre as ideias-chave para agrupamento hierárquico: 
 
“Começa com todos os registros. Progressivamente, os grupos são unidos aos grupos próximos até que todos os registros pertençam a um
único grupo. O histórico de aglomeração é retido e plotado, e o usuário pode visualizar o número e a estrutura dos grupos em diferentes
estágios. As distâncias intergrupos são calculadas de jeitos diferentes, todas baseadas no conjunto de distância inter-registros.”
 
BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p.
278. 
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. No agrupamento hierárquico, o usuário deve obrigatoriamente especificar o número de grupos que deseja ver o algoritmo formar. 
Pois 
II. O algoritmo começa com grupos formados por registros individuais e, progressivamente, os grupos são unidos aos grupos mais
próximos, até que todos os registros pertençam a um único grupo. 
 
a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa  da I.
c. As asserções I e II são proposições falsas.
d. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
e. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.

NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 2/9
Questão 2
Completo
Atingiu 0,00 de 1,00
Leia o excerto a seguir: 
“O quadro típico para uma análise em ciência de dados é um objeto de dados retangulares, como uma planilha ou tabela de banco de
dados. Dado retangularé basicamente uma matriz bidimensional com linhas indicando registros (caso) e colunas indicando características
(variáveis). Os dados nem sempre começam dessa forma: dados não estruturados (por exemplo, texto) devem ser processados e tratados
de modo a serem representados como um conjunto de características nos dados retangulares.” 
BRUCE, P.; BRUCE, A. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019. p. 5–6. 
Tomando como base esse texto e o que já discutimos sobre dados estruturados, tabulares e retangulares, analise as afirmativas a seguir e
assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) É impossível converter dados não estruturados em representações estruturadas, para que possam ser analisados pela ciência dos
dados. 
II. ( ) Dados retangulares não são uma forma típica de organização de dados para análise em ciência dos dados. 
III. ( ) Textos são dados estruturados, pois sempre vêm em estruturas bem padronizadas, como aquelas que estudamos em gramática. 
IV. ( ) Dados retangulares, dados tabulares ou dados estruturados são termos usados como sinônimos na ciência dos dados. 
 
Assinale a alternativa que apresenta a sequência correta:
a. F, V, F, V.
b. F, F, V, F.
c. F, F, F, V.
d. F, F, V, V.
e. F, F, F, F.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 3/9
Questão 3
Completo
Atingiu 0,00 de 1,00
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente
comercial do fabricante da boneca. Entre elas, há a variável do local de exposição da boneca (ruim, médio, bom) no ponto de venda, cuja
relação com vendas altas ou baixas é exibida no gráfico adiante. 
 
Figura: Efeito do local de exposição nas vendas 
Fonte: Elaborada pelo autor. 
Quanto à relação entre o local de exposição da boneca (ruim, médio, bom) e o volume de vendas (vendas altas ou baixas), analise as
afirmativas a seguir: 
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem com mais frequência nos pontos de venda onde o local de exposição da
boneca é bom. 
II. Ao estudarmos este caso, percebemos que não há qualquer efeito do local de exposição sobre o volume de vendas da boneca nos
pontos de venda. 
III. O gráfico exibido acima mostra que a frequência de pontos com vendas altas é baixa quando o local de exposição da boneca é ruim. 
IV. O gráfico de visualização da relação entre o local de exposição da boneca no ponto de venda e o volume de vendas, por se tratarem
ambas de variáveis qualitativas, é um gráfico do tipo mosaic plot, apropriado para esta situação. 
Está correto o que se afirma em:
a. I, III e IV, apenas.
b. I, II e III, apenas.
c. III e IV, apenas.
d. II e III, apenas.
e. I, II e IV, apenas.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 4/9
Questão 4
Completo
Atingiu 1,00 de 1,00
A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a
visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou
outras de lado. 
 
Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados. 
 
I. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados
quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
II. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados
quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
 
 
III. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos,
respectivamente, na estatística e na ciência dos dados.
IV. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software
estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem
fazer uso de diagramas de barras, o que poderia ter feito, se quisesse.
 
Está correto o que se afirma em: 
 
 
a. I e IV, apenas.
b. IV, apenas.
c. I, III e IV apenas.
d. II e III, apenas.
e. I e II, apenas.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 5/9
Questão 5
Completo
Atingiu 1,00 de 1,00
Ao longo das nossas discussões, demos foco a um classificador chamado de regressão logística que, apesar do nome regressão (esse
nome por razões históricas e por conta de algumas de suas características), é usado como um classificador. Mas também vimos que
existem outros tipos de classificadores. 
Relativamente a esse assunto de algoritmos de classificação, analise as afirmativas a seguir. 
 
I. Regressão logística é o único método de aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são
métodos de regressão.
II. Apesar do nome regressão logística, o que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos
de aprendizagem supervisionada utilizado para classificação.
III. Dentre os métodos utilizados para classificação se encontram regressão logística, análise discriminante linear (LDA = Linear
Discriminant Analysis), árvores de decisão para classificação, máquinas de vetores de suporte (SVM = support vector machines) e k-
vizinhos mais próximos (KNN = k-nearest neighbors).
IV. Regressão linear não é um método de classificação, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados
na predição de valores de variáveis respostas quantitativas.
 
Está correto o que se afirma em: 
 
 
a. II, apenas.
b. I, III e IV, apenas.
c. III, apenas.
d. II e III, apenas.
e. II, III e IV, apenas.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 6/9
Questão 6
Completo
Atingiu 1,00 de 1,00
Com os dados cedidos pela corretora em mãos, o estatístico aplicou a função cor(), do software estatístico R, na análise da correlação entre
o valor do imóvel e a sua área e entre o valor do imóvel e o seu andar. 
 
Relativamente a esse assunto, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) O resultado da correlação entre o valor do imóvel e a sua área, isto é, cor(y,x1) = 0,55, indica uma correlação negativa moderada entre
essas duas variáveis. 
II. ( ) O resultado da correlação entre o valor do imóvel e o seu andar, isto é, cor(y,x2) = 0,24, indica uma correlação negativa fraca entre
essas duas variáveis. 
III. ( ) O resultado da correlação entre o valor do imóvel e a sua área, isto é, cor(y,x1) = 0,55, indica uma correlação positiva moderada entre
essas duas variáveis. 
IV. ( ) O resultado da correlação entre o valor do imóvel e o seu andar, isto é, cor(y,x2) = 0,24, indica uma correlação positiva fraca entre
essas duas variáveis. 
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
a. F, V, V, F.
b. F, F, V, V.
c. F, V, F, V.
d. V, F, V, F.
e. V, V, F, F.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 7/9
Questão 7
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir:
"O vice-presidente de Talentos da DataSciencester entrevistou um número de candidatos para emprego do site, com níveis de
sucesso variados. Ele coletou um conjunto de dados com vários atributos (qualitativos) de cada candidato, bem como se o candidato
se saiu bem ou mal na entrevista. Você poderia usar esses dados para construir um modelo identi�cando quais candidatos farão
boas entrevistas, para que ele não precise perder tempo fazendo entrevistas? [...] Isso parece perfeito para uma árvore de decisão,
outra ferramenta de modelagem de previsão no kit de um cientista de dados."
GRUS, J. Data science do zero: primeiras regras com o Python. Rio de Janeiro: Alta Books, 2016. p. 201.
Tomando como base esse texto e o conteúdo apresentado sobre árvores de decisão, analise as a�rmativas a seguir e assinale V para
a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) A resposta à pergunta "Você poderia usar dados para construir um modelo identi�cando quais candidatos farão boas entrevistas,
para que o vice-presidente não precise perder tempo entrevistando-os?" é "não".
II. ( ) Uma árvore de decisão pode ser desenvolvida para o processo de seleção de candidatos, em que as variáveis de entrada seriam
um conjunto de dados com vários atributos (qualitativos) de cada candidato. 
III. ( ) O autor do texto imagina poder usar uma árvore de decisão para o processo de seleção de candidatos, em que a variável de
saída é qualitativa dicotômica - se o candidato se sairá bem ou mal na entrevista.
IV. ( ) Neste caso, em particular, pode-se aplicar uma árvore de decisão de classi�cação para o processo de seleção, pois a variável
resposta é qualitativa, porém árvores de decisão também podem ser usadas para problemas de regressão. 
Assinale a alternativa que apresenta a sequência correta:
a. F, V, V, F.
b. F, V, F, V.
c. F, V, V, V.
d. V, V, F, V.
e. V, V, V, F.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 8/9
Questão 8
Completo
Atingiu 1,00 de 1,00
Questão 9
Completo
Atingiu 1,00 de 1,00
Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como tratamos as variáveis estudadas
que se dá a diferença entre esses dois tipos de aprendizagens, supervisionada e não supervisionada. Esses dois tipos são os mais
importantes dentre os diversos tipos de aprendizagem. 
 
Relativamente a esse assunto, analise as afirmativas a seguir: 
 
I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função
dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada. 
II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável
dependente. 
III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável
preditora, variável explanatória ou variável independente. 
IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento
de uma delas em função dos valores assumidos pelas outras. 
 
 
a. II, III e IV, apenas.
b. I, II, III e IV.
c. I, II e IV, apenas. 
 
d. II e III, apenas.
e. I, III e IV, apenas.
A análise descritiva dos dados é uma etapa muito importante no processo de descoberta de padrões em dados. Por vezes, ela se limita à
análise descritiva, pois comumente já traz muitas descobertas. Em grande parte das vezes, é uma das etapas iniciais, seguida de etapas
relacionadas à modelagem dos dados. 
 
Em relação às ferramentas usadas por um estatístico ou um cientista de dados para a análise descritiva de dados, analise as afirmativas a
seguir: 
 
I. Gráficos são usados para a visualização de cada variável ou relação entre variáveis. 
II. Tabelas, sumários e gráficos são as ferramentas básicas da análise descritiva. 
III. Modelos preditivos são usados para a análise descritiva de dados. 
IV. Tabelas e sumários estatísticos são usados na análise descritiva de dados. 
 
Está correto o que se afirma em:
a.II, III e IV, apenas.
b. I, III e IV, apenas.
c. II e III, apenas.
d. I, II e III, apenas.
e. I, II e IV, apenas.

NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
24/06/2022 20:44 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=931702&cmid=343066 9/9
Questão 10
Completo
Atingiu 1,00 de 1,00
Vimos que a análise descritiva de dados se consiste em sumários estatísticos relativos aos dados analisados, o que também denominamos
resumos estatísticos, e no emprego de gráficos que exibem o comportamento dos dados de uma forma visual, o que denominamos
visualização dos dados. O estatístico produziu alguns sumários relativos à área dos imóveis da amostra que a corretora lhe passou. 
 
Em relação a esses sumários, analise as afirmativas a seguir. 
 
I. O valor max(x1) se refere ao valor máximo da área entre todos imóveis observados na amostra cedida pela corretora ao estatístico. 
II. O valor sd(x1) fornece uma indicação de quão grande é a dispersão da área dos imóveis na amostra analisada. 
III. O valor mean(x1) pode ser menor que o valor min(x1) ou maior que o valor max(x1), a depender da amostra analisada. 
IV. Em alguns casos especiais, min(x1) pode ser maior que max(x1), ou seja, o valor mínimo maior que o valor máximo. 
 
Está correto o que se afirma em: 
 
 
a. I e II, apenas.
b. II e III, apenas.
c. IV, apenas.
d. I e III, apenas.
e. I, II e III, apenas.
◄ Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►

NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=343068&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Outros materiais