Buscar

N2 (A5)_ Revisão da tentativa

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

16/12/2022 10:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 1/6
Minhas Disciplinas 222RGR1960A - MACHINE LEARNING PROVA N2 (A5) N2 (A5)
Iniciado em sexta, 16 dez 2022, 10:21
Estado Finalizada
Concluída em sexta, 16 dez 2022, 10:31
Tempo
empregado
10 minutos 3 segundos
Avaliar 9,00 de um máximo de 10,00(90%)
Questão 1
Completo
Atingiu 0,00 de 1,00
Em estatística, variáveis latentes são variáveis não observáveis. Elas se opõem às variáveis que são observáveis (ou seja, obtidas
diretamente por medidas). O método de mínimos quadrados parciais é baseado em variáveis latentes (fatores). Os mínimos quadrados
parciais são indicados quando temos mais variáveis do que observações.
 
Sobre a técnica de mínimos quadrados parciais (ou PLS) e como implementá-la no software R, analise as afirmativas a seguir e assinaleV
para Verdadeiro e F para Falso:
 
I. ( ) Uma variável latente é uma variável que, para ser observável, necessita de um processo de redução de dimensionalidade das
variáveis originais do problema.
II. ( ) O pacote do R que implementa o algoritmo de mínimos quadrados parciais é o PLS.
III. ( ) A técnica de mínimos quadrados parciais (ou PLS) é um método de reconhecimento de padrões e de classificação de dados
supervisionados que produz um crescimento exponencial dos preditores.
IV. ( ) A técnica de mínimos quadrados parciais (ou PLS) requer o conhecimento exato de todos os componentes presentes nas amostras.
 
Agora, assinale a alternativa que apresenta a sequência correta:
a. V, F, V, V.
b. V, V, F, F.
c. F, V, V, F.
d. F, V, F, F.
e. F, F, V, V.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=18504
https://ambienteacademico.com.br/course/view.php?id=18504&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=521143
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
16/12/2022 10:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 2/6
Questão 2
Completo
Atingiu 1,00 de 1,00
Questão 3
Completo
Atingiu 1,00 de 1,00
A tarefa de classificação é a tarefa que possui a maior quantidade de algoritmos na Mineração de Dados. Na classificação, pretende-se
determinar a classe de um objeto em uma base de dados. Os algoritmos de agrupamento pretendem particionar um conjunto de dados em k
grupos. Como exemplos de algoritmos de agrupamento, temos o k-médias, o k-medoid, o DBSCAN e o Hierárquico.
 
A respeito da classificação, agrupamento, predição discreta e contínua, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e
F para a(s) falsa(s).
 
I. ( ) Um exemplo de predição contínua é prever, com base em características do viajante (sexo, renda familiar, posse de automóvel), se ele
vai utilizar automóvel (transporte individual) ou ônibus (transporte coletivo).
II. ( ) Algoritmos de agrupamento caracterizam-se por agruparem os dados por similaridade. São exemplos recorrentes de aprendizado não
supervisionado.
III. ( ) As árvores de decisão constituem uma das mais difundidas famílias de classificadores. A classificação é considerada predição
discreta.
IV. ( ) Tarefas de classificação podem ser consideradas como casos particulares de uma estimação na qual a variável resposta é discreta.
Assim, qualquer algoritmo de estimação pode ser utilizado na classificação.
Assinale a alternativa que apresenta a sequência correta.
a. V, F, V, F.
b. F, F, V, V.
c. V, F, F, F.
d. F, V, V, V.
e. V, V, F, F.
O cientista de dados não conclui seu trabalho simplesmente entregando uma base de dados limpa. Para que o cientista de dados consiga
agregar valor para a organização na qual trabalha, são necessárias métricas para avaliação do desempenho dos algoritmos.
Sabe-se que a avaliação dos resultados aplicados no processo de mineração são elementos essenciais para a entrega de resultados para o
cliente. Assim, avaliar o desempenho da mineração de dados é parte relevante do processo.
 
De acordo com o exposto, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Há uma regra especificando a quantidade de elementos que devem ser distribuídos entre as bases de teste e de treino.
II. ( ) A medida de desempenho acurácia corresponde ao total de acertos dividido pelo total de dados do conjunto.
III. ( ) A medida de desempenho sensibilidade corresponde à divisão dos acertos positivos pelo total de positivos.
IV. ( ) A medida de desempenho especificidade corresponde à divisão dos verdadeiros negativos pela soma de verdadeiro negativo com
falso positivo.
 
Assinale a alternativa que apresenta a sequência correta.
a. V, F, F, V.
b. F, F, V, V.
c. V, V, F, F.
d. F, V, V, V.
e. F, V, F, V.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
16/12/2022 10:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 3/6
Questão 4
Completo
Atingiu 1,00 de 1,00
Questão 5
Completo
Atingiu 1,00 de 1,00
Na análise preditiva, pretendemos descobrir relações entre objetos de um conjunto de dados descritos por atributos (características) e os
rótulos associados a tais objetos. Na análise de agrupamentos, temos um processo que busca descobrir relações entre objetos de um
conjunto de dados descritos por atributos (ou características). Tanto a análise preditiva quanto a análise de agrupamentos possuem
relações, cada uma delas, com aprendizado supervisionado e não supervisionado.
 
Sobre as características dos aprendizados supervisionado e não supervisionado, assinale a alternativa correta.
a. No aprendizado não supervisionado, o algoritmo deve aprender a categorizar os objetos. O algoritmo deve partir de um
conjunto de dados sem rótulos e classi�car os objetos a partir de seus atributos.
b. Um exemplo de aprendizado supervisionado pode ser classi�car os clientes de uma empresa de seguro de automóveis pelo
risco de pagamento de acidentes, a partir do per�l de cada cliente (sexo, idade, escolaridade, número de �lhos, por exemplo).
c. A clusterização é considerada, tradicionalmente, como o melhor exemplo de aprendizagem supervisionada por exigir que a
base seja rotulada. Dentre os algoritmos de clusterização, o único que não exige que a base seja rotulada é o fuzzy k-médias.
d. No aprendizado não supervisionado, os rótulos dos objetos são conhecidos, sendo exemplos de algoritmos não
supervisionados os algoritmos de Regressão Ridge, Lasso e mínimos quadrados parciais.
e. No aprendizado supervisionado, as saídas desejadas não são conhecidas. São exemplos de aprendizado supervisionado: a
clusterização do tipo medoides e fuzzy k-médias; e a regressão linear múltipla e a regressão logística binomial.
Com o incremento de velocidade nos processadores, os problemas associados ao grande número de ajustes nas redes neurais artificiais
com muitas camadas foram mitigados. Assim, as redes profundas, a partir de um treinamento realizado por algoritmos de deep learning,
passaram a apresentar um desempenho muito superior ao de outros algoritmos de machine learning, principalmente em relação ao
processamento de imagens, voz e língua natural.
 
Sobre deep learning, analise as afirmativas a seguir e assinale (V) para a(s)Verdadeira(s) e(F)para a(s) Falsa(s).
 
I. ( ) A técnica de aprendizagem conhecida como deep learning se notabiliza pelo processamento de grande quantidade de dados não
estruturados.
II. ( ) O conceito de rede neural convolucional se aplica tanto às redes neurais usuais quanto ao processamento deep learning.
III. ( ) Na linguagem R, existem pacotes e, dentro desses pacotes, há muitas funções específicas para o tratamento de redes neurais e
deep learning, incluindo a função nn.train do pacote deepnet.
IV. ( ) Para utilizarmos o pacote deepnet no R, precisamos, primeiramente, efetuar o carregamento do pacote usando library(deepnet). Em
seguida, utilizamos install.packages(“deepnet”).
 
Assinale a alternativa que apresenta a sequência correta.
a. F, V, F, V.
b. V, F, V, F.
c. F, F, V, V.
d. V, V, V, F.
e. V, V, F, F.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
16/12/2022 10:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 4/6
Questão 6
Completo
Atingiu 1,00 de 1,00
Questão 7
Completo
Atingiu 1,00 de 1,00
O termo agrupamento é utilizado quando se estuda a similaridade entre objetos de uma base de dados, objetivando determinar como eles
estão organizados em um número de grupos. Em um agrupamento, busca-se particionar a base de dados em k grupos. Existem estratégias
de agrupamento denominadas de hierárquicas e não hierárquicas. Costuma-se denominar classificação o processo de determinar uma
função que indica a qual classe pertence um objeto de uma base de dados sob estudo.
 
Sobre aprendizado não supervisionado, clusterização e classificação, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e
F para a(s) falsa(s).
 
I. ( ) O agrupamento ou clusterização tem por objetivo a organização dos objetos em categorias de acordo com alguma métrica de
similaridade ou distância.
II. ( ) Nos algoritmos de classificação, a base não possui rótulos, sendo que cada objeto da base possui uma classe correspondente.
III. ( ) O objetivo dos algoritmos de classificação é identificar a classe à qual pertence um novo objeto ainda não apresentado e com rótulo
desconhecido.
IV. ( ) Na clusterização ou agrupamento, o objetivo é segmentar a base de dados (que já vem rotulada) em grupos com algum significado.
 
Assinale a alternativa que apresenta a sequência correta.
a. F, V, F, V.
b. F,F,F,V
c. V, F, V, F.
d. F, F, V, V.
e. V, V, F, F.
Em paralelo à proposição feita por Rosenblatt a respeito da estrutura do perceptron, Widrow e Hoff apresentaram o algoritmo dos
quadrados mínimos, também conhecido como regra delta. Trata-se de um mecanismo fundamental para a obtenção de um algoritmo de
treinamento em redes neurais simples, cuja saída seja linear. Desde então, inúmeros desenvolvimentos foram realizados na área de redes
neurais artificiais.
 
Sobre as redes neurais artificiais, assinale a alternativa correta.
a. Nas redes neurais do tipo Multilayer Perceptron, é utilizado um algoritmo de treinamento denominado "retropropagação do
erro". Nele, é realizada a propagação negativa do sinal funcional.
b. São características do modelo Multilayer Perceptron: a retropropagação, a alimentação adiante, a inexistência de camadas
intermediárias e o uso de funções sigmoidais nas camadas intermediárias.
c. Em uma rede neural arti�cial, quando duas ou mais camadas são utilizadas, um neurônio pode receber, em seus terminais
de entrada, valores de saída de um ou de mais neurônios da camada anterior.
d. Em detrimento de a maioria dos problemas que tratamos em data mining serem resolvidos por algoritmos do tipo
linearmente separável, o modelo perceptron carrega grande importância teórica e prática.
e. É característico das redes Multilayer Perceptron que, à medida que há o avanço para as últimas camadas da rede, o
processamento se torne cada vez mais simples até ser obtida a resolução do problema.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
16/12/2022 10:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 5/6
Questão 8
Completo
Atingiu 1,00 de 1,00
Questão 9
Completo
Atingiu 1,00 de 1,00
As redes neurais são muito usadas na classificação de dados. Assim como os neurônios biológicos, cada neurônio artificial tem dendritos,
axônios e um núcleo. Além disso, cada neurônio carrega um peso sináptico associado e um valor chamado “viés”. No núcleo do neurônio,
existe uma função somatória responsável por efetuar a soma ponderada dos dados de entrada.
 
Sobre as redes neurais artificiais, assinale a alternativa correta.
a. As redes neurais multicamadas, com funções de ativação não lineares nas camadas intermediárias, apresentam baixo
desempenho em tarefas de classi�cação.
b. Redes neurais arti�ciais realizam aprendizagem por hábito, e não por conceito. Diante disso, devemos treiná-las com dados
de entrada.
c. Se houver um erro de classi�cação, os pesos presentes na rede neural são ajustados por meio de um método denominado
"retropropagação".
d. A combinação de sistemas difusos com visão computacional e redes neurais não apresenta resultados animadores nas
aplicações industriais.
e. Para alguns autores, como Haykin, o comportamento do cérebro humano é similar ao de um computador digital
convencional.
Florestas aleatórias podem fazer uso do que se denomina “bagging”: tomar múltiplos subconjuntos do conjunto de dados de treinamento,
com o objetivo de construir um número de modelos de árvore de decisão independentes para, depois, tomar a média desses modelos, o
que possibilita a criação de um modelo preditivo com desempenho comparado ao modelo clássico CART. Outra técnica para melhorar o
desempenho das florestas aleatórias é o gradient boosted trees.
 
Sobre o gradient boosted trees, assinale a alternativa correta.
a. Na linguagem R, o parâmetro responsável pelo controle do número de árvores na modelagem GBM é chamado de numtrees,
presente na função gbm(). Esse parâmetro possibilita a redução do impacto de aprendizagem de cada árvore.
b. O método boosting é similar ao bagging. No entanto,no bagging, as árvores crescem de forma sequencial, ou seja, cada árvore
é construída a partir das informações da árvore anterior.
c. As árvores utilizadas em uma �oresta aleatória a partir do método bagging carregam sempre os mesmos parâmetros,
constituindo uma modelagem heterogênea. O número de quebras em cada árvore e a profundidade são dois desses
parâmetros.
d. O número de iterações na função gbm() é controlado pelo parâmetro shrinkage. Quanto maior for o valor, menor será o
impacto de aprendizagem de cada árvore de decisão em particular.
e. No modelo de aprendizado de máquina gradient boosted trees, a combinação das árvores de decisão é realizada com
amostras de boostrap. Essas amostras são de�nidas por uma função matemática do tipo sigmoide.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
16/12/202210:32 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1716589&cmid=521143 6/6
Questão 10
Completo
Atingiu 1,00 de 1,00
Existem diversas classificações das tarefas da Mineração de Dados. Alguns autores dividem as tarefas de Mineração de Dados em
preditivas e descritivas. Outros autores dividem as tarefas de Mineração de Dados em classificação e regressão; mineração de padrões
frequentes, associações e correlações, análise de agrupamentos e estudos sobre outliers.
 
Sobre os modelos e técnicas de aprendizado preditivo e descritivo, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F
para a(s) falsa(s).
 
I. ( ) As técnicas de aprendizado preditivo tem por objetivo desenvolver modelos e gerar conhecimento a partir de bases de dados e
experiências anteriores que possam ser utilizadas no futuro.
II. ( ) Tarefas descritivas seguem o paradigma de aprendizado não supervisionado, de tal forma que busca-se uma função a qual, a partir de
dados passados ou de treinamento, permita sua utilização para prever valores no futuro ou a previsão de um rótulo.
III. ( ) Algoritmos de aprendizado preditivo estão associados à hipótese por indução, seguindo o paradigma de aprendizado não
supervisionado e buscando regras de associação que relacionam um grupo de atributos a outro grupo de atributos.
IV. ( ) As tarefas preditivas são divididas em tarefas de classificação e regressão. As tarefas de classificação são chamadas de predição
discreta e as tarefas de regressão são chamadas de predição contínua.
 
Assinale a alternativa que apresenta a sequência correta.
a. F, F, V, V.
b. V, V, F, F.
c. V, F, V, F.
d. V, F, F, V.
e. F, V, V, F.
◄ Revisão Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=521142&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=521145&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando