Buscar

N2 (A5)_ Revisão da tentativa

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 1/7
Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em quinta, 23 jun 2022, 17:08
Estado Finalizada
Concluída em quinta, 23 jun 2022, 17:33
Tempo
empregado
24 minutos 53 segundos
Avaliar 7,00 de um máximo de 10,00(70%)
Questão 1
Completo
Atingiu 0,00 de 1,00
A análise descritiva dos dados é uma etapa muito importante no processo de descoberta de padrões em dados. Por vezes, ela se limita à
análise descritiva, pois comumente já traz muitas descobertas. Em grande parte das vezes, é uma das etapas iniciais, seguida de etapas
relacionadas à modelagem dos dados.
 
 Em relação às ferramentas usadas por um estatístico ou um cientista de dados para a análise descritiva de dados, analise as afirmativas a
seguir:
 
 I. Gráficos são usados para a visualização de cada variável ou relação entre variáveis.
 II. Tabelas, sumários e gráficos são as ferramentas básicas da análise descritiva.
 III. Modelos preditivos são usados para a análise descritiva de dados.
 IV. Tabelas e sumários estatísticos são usados na análise descritiva de dados.
 
 Está correto o que se afirma em:
a. II, III e IV, apenas.
b. II e III, apenas.
c. I, II e III, apenas.
d. I, III e IV, apenas.
e. I, II e IV, apenas.
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 2/7
Questão 2
Completo
Atingiu 1,00 de 1,00
Continuando com o mesmo caso da questão anterior, relativa à aprovação, pelos bancos, de crédito na forma de cartão de crédito, como se
fazia, no passado, a aprovação da concessão de cartões de crédito pelos bancos? E, hoje em dia, como os bancos fazem essa aprovação?
 
 Reflita sobre essas perguntas e suas respostas, analise as afirmativas a seguir e assinale V
 para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
 
I. ( ) No passado, os bancos faziam, e ainda fazem, ao menos em parte, a aprovação da concessão de cartões de crédito através da
definição de regras que devem ser atendidas por cada cliente, tais como idade, emprego estável, renda fixa, dívidas pequenas, nome
limpo e casa própria.
II. ( ) Hoje em dia, dentre outras alternativas, uma que é frequentemente usada pelos bancos são algoritmos de aprendizagem
supervisionada que classificam se o cliente é um potencial bom ou mau pagador.
III. ( ) Para usarmos algoritmos de classificação com esse propósito de aprovar ou não cartões de crédito, precisamos de dados.
Ensinamos ao algoritmo, com base nos dados que lhe são passados, a predizer clientes que são maus pagadores potenciais das
faturas do cartão. Dessa forma, se o algoritmo, ao ser alimentado com os dados referentes a um novo cliente, classificar esse cliente
como um mau pagador potencial, o banco não aprovará o cartão.
IV. ( ) Para equipes de análise de crédito, poder contar com a ajuda de um software com a capacidade de recomendar a aprovação ou
não da concessão do cartão é de grande valor.
V. ( ) A recomendação feita pelo software poderá ser tratada ao lado de outras regras de crédito para uma decisão final sobre a
concessão de cartão para o cliente.
 
 Assinale a alternativa que apresenta a sequência correta.
 
 
a. F, F, F, F.
b. V, V, F, F.
c. F, V, F, V.
d. V, V, F, V.
e. V, V, V, V.
  
 
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 3/7
Questão 3
Completo
Atingiu 1,00 de 1,00
Um jovem cientista de dados realizou uma análise de agrupamento de apenas cinco estados americanos parte do famoso conjunto de
dados USArrests, o qual possue 50 observações (50 estados americanos) de 4 variáveis (Murder, Assault, UrbanPop e Rape).
 
 Obteve o resultado exibido na figura exibida adiante:
 
 
Figura - Dendrograma do agrupamento dos cinco estados
 Fonte: Elaborada pelo autor
 
 Relativamente à interpretação desta figura, assinale a alternativa correta:
 
 
a. É um dendrograma, ou seja, um gráfico na forma de uma árvore, que representa os vários grupos formados em cada estágio
do processo de agrupamento hierárquico.
b. É um dendrograma, ou seja, um gráfico na forma de uma árvore, que sugere serem os estados New Mexico e Oklahoma os
mais próximos em termos de violência urbana.
c. É um dendrograma, ou seja, um gráfico na forma de uma árvore, que lido de cima para baixo, na altura (height) 1,5 sugere a
formação de 10 grupos.
d. É um dendrograma, ou seja, um gráfico na forma de uma árvore, que sugere serem os estados Texas e Arkansas os mais
próximos em termos de violência urbana.
e. É um dendrograma, ou seja, um gráfico na forma de uma árvore, que lido de baixo para cima, na altura (height) 1,5 sugere a
formação de 6 grupos.
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 4/7
Questão 4
Completo
Atingiu 1,00 de 1,00
Questão 5
Completo
Atingiu 1,00 de 1,00
 Depois que formamos grupos de observações de um conjunto de dados (amostra), por meio de um algoritmo de agrupamento, podemos
dar nomes aos mesmos, e cada indivíduo de cada grupo será classificado de acordo com esse nome. O ser humano faz isso com
naturalidade, primeiro agrupar e, depois de formados os grupos, dar nomes aos grupos. Por exemplo, animais vertebrados ou
invertebrados, carros ou aviões, homens ou mulheres.
 
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. e assinale a alternativa correta:
 
 I. Ao usarmos de algoritmos de agrupamento, depois que formados e nomeados (classificados) os grupos de observações resultantes do
algoritmo, não é possível usar essas classes como variáveis respostas e, a partir desse ponto, executar tarefas preditivas com algoritmos de
classificação.
 Pois
 II. Algoritmos de agrupamento fazem parte dos métodos da chamada aprendizagem não supervisionada. Não são modelos preditivos.
 
a. As asserções I e II são proposições falsas.
b. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
c. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
d. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
e. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
Leia o excerto a seguir sobre as ideias-chave para agrupamento hierárquico:
 
 “Começa com todos os registros. Progressivamente, os grupos são unidos aos grupos próximos até que todos os registros pertençam a um
único grupo. O histórico de aglomeração é retido e plotado, e o usuário pode visualizar o número e a estrutura dos grupos em diferentes
estágios. As distâncias intergrupos são calculadas de jeitos diferentes, todas baseadas no conjunto de distância inter-registros.”
 
 BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p.
278.
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
 I. No agrupamento hierárquico, o usuário deve obrigatoriamente especificar o número de grupos que deseja ver o algoritmo formar.
 Pois
 II. O algoritmo começa com grupos formados por registros individuais e, progressivamente, os grupos são unidos aos grupos mais
próximos, até que todos os registros pertençam a um único grupo.
 
a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
c. As asserções I e II são proposições falsas.
d. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativada I.
e. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 5/7
Questão 6
Completo
Atingiu 1,00 de 1,00
Questão 7
Completo
Atingiu 1,00 de 1,00
O ser humano tem enorme facilidade em agrupar, por similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas
de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação
de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos:
 
I. a Netflix usa classificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes
assistirmos, maior será a sua receita;
II. o Facebook usa classificadores para recomendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor
desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita;
III. um banco de varejo usa classificadores para detectar se uma operação com cartão de débito ou crédito é ou não uma operação
fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operações fraudulentas forem detectadas, mais rapidamente
o banco pode agir para impedir perdas para seus clientes e para ele próprio;
IV. uma concessionária de distribuição de energia elétrica usa classificadores para identificar casos potenciais de roubo de energia da
rede, os famosos “gatos”. Para as concessionárias de distribuição de energia elétrica, o valor dessa aplicação é evitar prejuízo com o
furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas.
 
 Está correto o que se afirma em:
 
 
a. I e II, apenas.
b. III e IV, apenas.
c. I, II, III e IV.
d. I e III, apenas.
  
 
 
e. II e IV, apenas.
Os modelos de regressão são de enorme importância na estatística e na ciência dos dados. Dentre os diversos modelos de regressão que
existem, são justamente os modelos de regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais difundidos, com
aplicações nas mais diversas áreas.
 
 Considerando as técnicas discutidas de desenvolvimento de modelos preditivos pautados em modelos de regressão linear simples ou
múltipla, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
 I. ( ) Modelos de regressão linear podem ser empregados na predição do peso médio (massa corporal média) de uma pessoa em função da
sua altura, idade e sexo.
 II. ( ) Modelos de regressão linear podem ser empregados na predição do consumo médio de combustível de um carro em função da
potência do seu motor e do seu peso.
 III. ( ) Modelos de regressão linear podem ser empregados na predição da renda média mensal de uma pessoa em função da sua
escolaridade, idade, sexo e classe social.
 IV. ( ) Modelos de regressão linear podem ser empregados na predição da classe social de uma pessoa em função da sua renda média
mensal, escolaridade, idade e sexo.
 
 Assinale a alternativa que apresenta a sequência correta.
 
 
a. V, V, V, F.
b. V, V, F, F.
c. F, F, F, F.
d. V, V, V, V.
e. F, V, F, V.
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 6/7
Questão 8
Completo
Atingiu 1,00 de 1,00
Questão 9
Completo
Atingiu 0,00 de 1,00
Já sabemos o que são resumos ou sumários estatísticos, que fazem parte da análise descritiva dos dados, ao lado das técnicas gráficas
para a visualização dos dados. Nesta unidade, usamos pela primeira vez a função summary() do software estatístico R.
 
 Em relação ao output dessa função, aplicada a dados quantitativos, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F
para a(s) Falsa(s).
 
 I. ( ) A ordem do output é valor máximo, terceiro quartil, mediana, média, segundo quartil e valor mínimo observado.
 II. ( ) A ordem do output é valor mínimo, segundo quartil, mediana, média, terceiro quartil e valor máximo observado.
 III. ( ) O segundo quartil informa o valor da variável, acima do qual se encontram 25% dos dados observados.
 IV. ( ) A mediana informa o valor da variável, abaixo do qual se encontram 50% dos dados observados.
 
 Assinale a alternativa que apresenta a sequência correta:
a. F, F, F, F.
b. F, V, F, V.
c. V, V, V, V.
d. F, F, V, V.
e. F, V, V, F.
Leia o excerto a seguir:
 
 “Uma parte fundamental do kit de ferramentas do cientista de dados é a visualização de dados. Embora seja muito fácil criar visualizações é
bem mais difícil produzir algumas boas. Existem dois usos primários para a visualização de dados: - Para explorar dados. - Para comunicar
dados. Neste capítulo, nos concentraremos em construir habilidades das quais você precisará para começar a explorar seus próprios dados
e produzir visualizações que usaremos no decorrer do livro. Como a maioria dos nossos tópicos do capítulo, a visualização de dados é uma
rica área de estudos que merece seu próprio livro. Mas, mesmo assim, tentaremos mostrar o que é preciso e o que não é para uma boa
visualização.”
 
 GRUS, J. Data science do zero: primeiras regras com Python. Rio de Janeiro: Alta Books, 2016. p. 37.
 
 Considerando o excerto apresentado, em relação à visualização de dados, analise as afirmativas a seguir:
 
 I. O autor do texto considera a visualização de dados uma parte acessória ao trabalho do cientista de dados.
 II. O autor considera fácil criar visualizações de dados, porém acha difícil criar boas visualizações de dados.
 III. O autor considera que, por ser fácil criar visualizações de dados, não há razão para merecer seu próprio livro.
IV. O autor deixa claro que existem dois usos primários para a visualização de dados: explorar dados e comunicar dados.
 
 Está correto o que se afirma em:
a. I, II e IV, apenas.
b. II e III, apenas.
c. II, III e IV, apenas.
d. I, II e III, apenas.
e. II e IV, apenas.
23/06/2022 17:35 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=908366&cmid=343066 7/7
Questão 10
Completo
Atingiu 0,00 de 1,00
Muitos dos modelos ou algoritmos usados na estatística e na ciência dos dados são denominados modelos paramétricos, ou seja, que
possuem parâmetros. Esses parâmetros devem ser determinados quando se treina (se ajusta) o modelo ou algoritmo aos dados
amostrados. Na regressão linear simples ou múltipla, esses parâmetros são denominados coeficientes do modelo.
 
 A respeito dos coeficientes do modelo de regressão linear simples para o valor do imóvel em função da sua área, analise as afirmativas a
seguir.
 
 I. O estatístico usou o software R e obteve, para os coeficientes do modelo de regressão linear simples do valor do imóvel em função da sua
área, b0 = 27,22 e b1 = 5,15.
 II. Os coeficientes do modelo de regressão linear simples do valor do imóvel em função da sua área possuem unidades, que são,
respectivamente, kR$ (mil reais) para b0 e kR$/m2 (mil reais dividido pela área do imóvel) para b1.
 III. O coeficiente b0 é a intersecção da reta do modelo com o eixo vertical y quanto x1 = 0. Não tem um significado “real” nesse caso, pois
não há imóveis com área igual a zero. Deve ser entendido, nessa situação, apenas como um parâmetro de ajuste do modelo aos dados da
amostra.
 IV. O coeficiente b1 indica quanto varia o valor esperado do imóvel para um aumento de 1 metro quadrado da sua área. Graficamente, esse
coeficiente é a inclinação da reta que representa o modelo de regressão linear simples ajustado aos dados da amostra.
 Está correto o que se afirma em:
 
 
a. I e II, apenas.
b. II e III, apenas.
c. I, II, III e IV.
  
d. II, III e IV, apenas.
e. III e IV, apenas.

Continue navegando