Buscar

Avaliação Machine Learning

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Machine Learning 
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A 
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da 
média final. Você tem até cinco tentativas para “Enviar” as questões, que são 
automaticamente corrigidas. Você pode responder as questões consultando o material 
de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 
1) 
Um tipo de metodologia para o aprendizado de máquina é o AM preditivo baseado em 
probabilidades. 
A respeito dos métodos probabilísticos de AM, julgue os itens a seguir como 
verdadeiros (V) ou falsos (F): 
( ) Métodos probabilísticos são utilizados quando não há informação completa sobre 
os dados a serem utilizados. 
( ) Métodos probabilísticos utilizam probabilidades a priori e verossimilhança entre 
eventos para poder fazer predições. 
( ) O algoritmo mais popular que é baseado em métodos probabilístico que é o Naive 
Bayes, também conhecido como Bayes Ingênuo ou Bayes simples. 
Classifique as afirmações como verdadeiro (V) e falso (F) e assinale a alternativa que 
contenha a sequência correta, respectivamente, de cima para baixo. 
 
Alternativas: 
 V – V – F. 
 F – V – F. 
 V – V – V. CORRETO 
 V – F – F. 
 V – F – V. 
Resolução comentada: 
todas as alternativas contêm afirmações corretas. 
Código da questão: 49608 
2) 
O algoritmo kNN possui como característica principal a análise de distância entre 
objetos. Você observou durante os estudos que o valor do parâmetro k pode 
influenciar significativamente no desempenho do algoritmo e até mudar o resultado 
obtido. 
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo 
kNN. 
 
Alternativas: 
 É o número de pontos existentes no domínio do problema. 
 É o grau de liberdade computacional do algoritmo a ser implementado. 
 É o número de vizinhos próximos que são considerados para tomar a decisão 
sobre a definição da classe do objeto. CORRETO 
 O parâmetro k representa o grau do polinômio criado pelo algoritmo. 
 O parâmetro k representa a quantidade de objetos que o algoritmo consegue 
processar simultaneamente. 
Resolução comentada: 
o parâmetro k representa o número de vizinhos próximos que são considerados para 
tomar a decisão sobre a definição da classe do objeto. 
Código da questão: 49610 
3) 
O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. 
Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode 
observar um diagrama de dispersão, em que existem observações já rotuladas em três 
classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação 
não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para 
poder então classificar esse objeto. 
 
 
 
Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 
3-NN e 5-NN. 
Assinale a alternativa que representa corretamente a classificação obtida com cada um 
dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN. 
 
Alternativas: 
 Bola, estrela e estrela. CORRETO 
 Bola, estrela e quadrado. 
 Quadrado, estrela e estrela. 
 Bola, bola e estrela. 
 Bola, quadrado e estrela. 
Resolução comentada: 
para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe 
que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é 
possível observar a quantidade de vizinhos completamente dentro dos círculos 
relativos às redes 1-NN, 3-NN e 5-NN. 
 
 
 
Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação 
é “estrela” e para o caso 5-NN, a classificação também é “estrela”. 
Código da questão: 49614 
4) 
A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de 
suas características, identificar objetos similares. Esse tipo de algoritmo pode ser 
classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados 
em densidade ou baseados em erro quadrático. 
Sobre os algoritmos de agrupamento, analise as afirmações a seguir: 
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, 
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse 
processo até o final do algoritmo. 
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos 
começam com inúmeros clusters e fundem os grupos de maior similaridade até restar 
apenas um grande grupo com os objetos. 
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa 
os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, 
e então poder proceder à etapa de teste. 
Sendo assim, estão CORRETOS somente os itens: 
 
Alternativas: 
 II – III. 
 I. CORRETO 
 II. 
 I – II. 
 I – II – III. 
Resolução comentada: 
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, 
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse 
processo até o final do algoritmo. 
II. O agrupamento divisivo e aglomerativo funciona de maneira oposta. 
III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K 
deve ser passado anteriormente. 
Código da questão: 49620 
5) 
Técnicas de machine learning podem ser utilizadas para inúmeras finalidades. A seguir, 
você pode verificar graficamente uma solução que relaciona estilos de escrita e alguns 
livros famosos: 
Figura 1 – Ilustração de metodologia de representação gráfica para a relação entre 
objetos e suas características principais 
 
Fonte: adaptada de Gormley (2017). 
Descrição: esta figura contém uma representação utilizada para relacionar seis obras 
literárias e seus respectivos estilos. 
A Figura 1 contém a relação entre obras literárias e suas características; porém, elas 
estão divididas em duas etapas, sendo que a segunda é uma aproximação da primeira, 
utilizada para simplificar a análise. 
Essa aproximação é uma técnica bastante 
utilizada para a manipulação de dados em sistemas de recomendação. Sendo assim, 
assinale a alternativa que contém o nome correto da técnica representada pela 
Figura 1. 
 
Alternativas: 
 Recomendação por filtragem colaborativa baseada em métodos de inversão 
matricial. 
 Recomendação por filtragem baseada em conteúdo com métodos híbridos. 
 Recomendação por filtragem colaborativa baseada em métodos de relações de 
conteúdos. 
 Recomendação por filtragem colaborativa baseada em métodos de fatoração 
matricial. CORRETO 
 Recomendação por filtragem colaborativa baseada em métodos de 
aprendizado profundo. 
Resolução comentada: 
a figura contém claramente uma fatoração matricial. A matriz inicial, de dimensão 
elevada, é manipulada de tal forma a ser fatorada para então poder ser representada 
pela multiplicação entre as matrizes e . Com isso, a fatoração fica da seguinte forma: 
Código da questão: 49634 
6)
 
 
Alternativas: 
 Naive Bayes. 
 K vizinhos mais distantes. 
 Regressão multivariável. 
 K vizinhos mais próximos. CORRETO 
 Regressão linear. 
Resolução comentada: 
a figura contém um algoritmo de uma técnica kNN, também conhecida como K 
vizinhos mais próximos. A entrada do algoritmo é o conjunto de treinamento e o valor 
de k a ser utilizado. A saída é o classificador a ser utilizado. 
Código da questão: 49612 
7) 
A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a 
seguir: 
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder 
organizar alfabeticamente os usuários. 
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes 
neurais relacionando usuários e objetos. 
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos 
baseados em conteúdo é que o primeiroestuda a interação entre usuários e objetos, 
ao passo que o segundo analisa as suas características. 
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação 
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário, mas não é capaz de gerar matrizes usuário-item. 
Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) 
ou falsas (F). 
 
Alternativas: 
 V – V – V – F. 
 F – F – V – F.' 
 F – V – V – F. CORRETO 
 V – V – F – F. 
 F – V – V – V. 
Resolução comentada: 
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a 
organização não é feita por ordem alfabética. 
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes 
neurais relacionando usuários e objetos. 
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos 
baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, 
ao passo que o segundo analisa as suas características. 
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação 
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário e também é capaz de gerar matrizes usuário-item. 
Código da questão: 49633 
8) 
Um _____________________ analisa similaridades entre as interações usuário-item, item-
item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue 
fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros 
usuários semelhantes gostaram. 
Assinale a alternativa que preenche corretamente a lacuna do trecho acima. 
 
Alternativas: 
 Sistema de conteúdo baseado em recomendação. 
 Sistema de recomendação por filtragem não colaborativa. 
 Sistema de recomendação discriminativo. 
 Sistema de recomendação baseado em conteúdo. 
 Sistema de recomendação por filtragem colaborativa. CORRETO 
Resolução comentada: 
O correto é: 
Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as 
interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica 
similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, 
usuários acessam itens dos quais outros usuários semelhantes gostaram. 
Código da questão: 49631 
9) 
Uma determinada instituição bancária contratou um programador para desenvolver 
algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de 
acordo com saldo diário de sua conta durante um ano todo. Os clientes com 
classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, 
o programador recebeu apenas um banco de dados com 10.000 clientes já classificados 
pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 
campos de informação) e a classificação como “BOM” ou “MAU” cliente. 
Considerando o cenário acima: 
I. É aconselhável utilizar um algoritmo supervisionado. 
PORQUE 
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo 
só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: 
 
Alternativas: 
 A primeira asserção está correta e a segunda está incorreta. 
 A primeira asserção está incorreta e a segunda está correta. 
 A primeira e a segunda asserção estão corretas, mas a segunda não justifica a 
primeira. 
 A primeira e a segunda asserção estão corretas e a segunda justifica a 
primeira.CORRETO 
 As duas asserções estão incorretas. 
Resolução comentada: 
ambas as asserções estão corretas e a segunda justifica a primeira. 
Código da questão: 49604 
10) 
O Algoritmo Naive Bayes foi criado com sus estrutura baseada no Teorema de Bayes, 
que diz o seguinte: 
 
Considere a seguinte situação: 
 
Alternativas: 
 
 
CORRETO 
 
 
 
Resolução comentada:
 
Código da questão: 49611

Continue navegando