Avaliação Machine Learning

•

UFSJ

Aline Silva Chaves Almeida

11/08/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.265 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Machine Learning
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da
média final. Você tem até cinco tentativas para “Enviar” as questões, que são
automaticamente corrigidas. Você pode responder as questões consultando o material
de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
1)
Um tipo de metodologia para o aprendizado de máquina é o AM preditivo baseado em
probabilidades.
A respeito dos métodos probabilísticos de AM, julgue os itens a seguir como
verdadeiros (V) ou falsos (F):
( ) Métodos probabilísticos são utilizados quando não há informação completa sobre
os dados a serem utilizados.
( ) Métodos probabilísticos utilizam probabilidades a priori e verossimilhança entre
eventos para poder fazer predições.
( ) O algoritmo mais popular que é baseado em métodos probabilístico que é o Naive
Bayes, também conhecido como Bayes Ingênuo ou Bayes simples.
Classifique as afirmações como verdadeiro (V) e falso (F) e assinale a alternativa que
contenha a sequência correta, respectivamente, de cima para baixo.

Alternativas:
 V – V – F.
 F – V – F.
 V – V – V. CORRETO
 V – F – F.
 V – F – V.
Resolução comentada:
todas as alternativas contêm afirmações corretas.
Código da questão: 49608
2)
O algoritmo kNN possui como característica principal a análise de distância entre
objetos. Você observou durante os estudos que o valor do parâmetro k pode
influenciar significativamente no desempenho do algoritmo e até mudar o resultado
obtido.
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo
kNN.

Alternativas:
 É o número de pontos existentes no domínio do problema.
 É o grau de liberdade computacional do algoritmo a ser implementado.
 É o número de vizinhos próximos que são considerados para tomar a decisão
sobre a definição da classe do objeto. CORRETO
 O parâmetro k representa o grau do polinômio criado pelo algoritmo.
 O parâmetro k representa a quantidade de objetos que o algoritmo consegue
processar simultaneamente.
Resolução comentada:
o parâmetro k representa o número de vizinhos próximos que são considerados para
tomar a decisão sobre a definição da classe do objeto.
Código da questão: 49610
3)
O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina.
Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode
observar um diagrama de dispersão, em que existem observações já rotuladas em três
classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação
não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para
poder então classificar esse objeto.

Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN,
3-NN e 5-NN.
Assinale a alternativa que representa corretamente a classificação obtida com cada um
dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN.

Alternativas:
 Bola, estrela e estrela. CORRETO
 Bola, estrela e quadrado.
 Quadrado, estrela e estrela.
 Bola, bola e estrela.
 Bola, quadrado e estrela.
Resolução comentada:
para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe
que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é
possível observar a quantidade de vizinhos completamente dentro dos círculos
relativos às redes 1-NN, 3-NN e 5-NN.

Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação
é “estrela” e para o caso 5-NN, a classificação também é “estrela”.
Código da questão: 49614
4)
A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de
suas características, identificar objetos similares. Esse tipo de algoritmo pode ser
classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados
em densidade ou baseados em erro quadrático.
Sobre os algoritmos de agrupamento, analise as afirmações a seguir:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster,
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse
processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos
começam com inúmeros clusters e fundem os grupos de maior similaridade até restar
apenas um grande grupo com os objetos.
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa
os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K,
e então poder proceder à etapa de teste.
Sendo assim, estão CORRETOS somente os itens:

Alternativas:
 II – III.
 I. CORRETO
 II.
 I – II.
 I – II – III.
Resolução comentada:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster,
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse
processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira oposta.
III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K
deve ser passado anteriormente.
Código da questão: 49620
5)
Técnicas de machine learning podem ser utilizadas para inúmeras finalidades. A seguir,
você pode verificar graficamente uma solução que relaciona estilos de escrita e alguns
livros famosos:
Figura 1 – Ilustração de metodologia de representação gráfica para a relação entre
objetos e suas características principais

Fonte: adaptada de Gormley (2017).
Descrição: esta figura contém uma representação utilizada para relacionar seis obras
literárias e seus respectivos estilos.
A Figura 1 contém a relação entre obras literárias e suas características; porém, elas
estão divididas em duas etapas, sendo que a segunda é uma aproximação da primeira,
utilizada para simplificar a análise.
Essa aproximação é uma técnica bastante
utilizada para a manipulação de dados em sistemas de recomendação. Sendo assim,
assinale a alternativa que contém o nome correto da técnica representada pela
Figura 1.

Alternativas:
 Recomendação por filtragem colaborativa baseada em métodos de inversão
matricial.
 Recomendação por filtragem baseada em conteúdo com métodos híbridos.
 Recomendação por filtragem colaborativa baseada em métodos de relações de
conteúdos.
 Recomendação por filtragem colaborativa baseada em métodos de fatoração
matricial. CORRETO
 Recomendação por filtragem colaborativa baseada em métodos de
aprendizado profundo.
Resolução comentada:
a figura contém claramente uma fatoração matricial. A matriz inicial, de dimensão
elevada, é manipulada de tal forma a ser fatorada para então poder ser representada
pela multiplicação entre as matrizes e . Com isso, a fatoração fica da seguinte forma:
Código da questão: 49634
6)

Alternativas:
 Naive Bayes.
 K vizinhos mais distantes.
 Regressão multivariável.
 K vizinhos mais próximos. CORRETO
 Regressão linear.
Resolução comentada:
a figura contém um algoritmo de uma técnica kNN, também conhecida como K
vizinhos mais próximos. A entrada do algoritmo é o conjunto de treinamento e o valor
de k a ser utilizado. A saída é o classificador a ser utilizado.
Código da questão: 49612
7)
A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a
seguir:
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder
organizar alfabeticamente os usuários.
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes
neurais relacionando usuários e objetos.
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos
baseados em conteúdo é que o primeiroestuda a interação entre usuários e objetos,
ao passo que o segundo analisa as suas características.
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário, mas não é capaz de gerar matrizes usuário-item.
Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V)
ou falsas (F).

Alternativas:
 V – V – V – F.
 F – F – V – F.'
 F – V – V – F. CORRETO
 V – V – F – F.
 F – V – V – V.
Resolução comentada:
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a
organização não é feita por ordem alfabética.
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes
neurais relacionando usuários e objetos.
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos
baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos,
ao passo que o segundo analisa as suas características.
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário e também é capaz de gerar matrizes usuário-item.
Código da questão: 49633
8)
Um _____________________ analisa similaridades entre as interações usuário-item, item-
item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue
fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros
usuários semelhantes gostaram.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.

Alternativas:
 Sistema de conteúdo baseado em recomendação.
 Sistema de recomendação por filtragem não colaborativa.
 Sistema de recomendação discriminativo.
 Sistema de recomendação baseado em conteúdo.
 Sistema de recomendação por filtragem colaborativa. CORRETO
Resolução comentada:
O correto é:
Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as
interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica
similaridades, ele consegue fazer recomendações a novos usuários. Geralmente,
usuários acessam itens dos quais outros usuários semelhantes gostaram.
Código da questão: 49631
9)
Uma determinada instituição bancária contratou um programador para desenvolver
algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de
acordo com saldo diário de sua conta durante um ano todo. Os clientes com
classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa,
o programador recebeu apenas um banco de dados com 10.000 clientes já classificados
pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365
campos de informação) e a classificação como “BOM” ou “MAU” cliente.
Considerando o cenário acima:
I. É aconselhável utilizar um algoritmo supervisionado.
PORQUE
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo
só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:

Alternativas:
 A primeira asserção está correta e a segunda está incorreta.
 A primeira asserção está incorreta e a segunda está correta.
 A primeira e a segunda asserção estão corretas, mas a segunda não justifica a
primeira.
 A primeira e a segunda asserção estão corretas e a segunda justifica a
primeira.CORRETO
 As duas asserções estão incorretas.
Resolução comentada:
ambas as asserções estão corretas e a segunda justifica a primeira.
Código da questão: 49604
10)
O Algoritmo Naive Bayes foi criado com sus estrutura baseada no Teorema de Bayes,
que diz o seguinte:

Considere a seguinte situação:

Alternativas:


CORRETO



Resolução comentada:

Código da questão: 49611