Buscar

Machine Learning

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1) 
João aplicou um teste de múltipla escolha contendo 120 questões para um grande 
grupo de pessoas, e conseguiu perceber que houve uma grande variação na 
distribuição das notas. 
João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno 
pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele 
poderá elaborar trabalhos específicos para cada grupo. 
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse 
agrupamento. 
 
Alternativas: 
• Regressão linear. 
• Regressão logística. 
• K-means. 
checkCORRETO 
• Monte Carlo. 
• Regressão multivariável. 
Resolução comentada: 
dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k-
means. 
Código da questão: 49623 
2) 
Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro 
diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de 
regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes, 
como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e 
número de observações. 
 
 
 
A partir dos gráficos, analise as afirmativas a seguir: 
I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do 
tipo linear. 
II. O gráfico C ilustra a possível existência de uma observação outlier na regressão 
linear. 
III. O gráfico D ilustra a possível existência de uma observação outlier na regressão 
linear. 
Assinale a alternativa que julga corretamente essas afirmações: 
 
Alternativas: 
• Somente III está correta. 
• Somente II e III estão corretas. 
• Somente I e III estão corretas. 
• Somente I está correta. 
• Somente II está correta. 
checkCORRETO 
Resolução comentada: 
I. O gráfico B mostra observações que não são corretamente estimadas por meio do 
uso de uma regressão linear. 
II. A afirmativa está correta. 
III. O gráfico D não contém dados corretamente estimados por uma regressão linear. 
Código da questão: 49613 
3) 
Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de 
máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a 
quantidade de dados a ser processada aumenta. 
Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, 
julgue os itens a seguir: 
( ) O deep learning é bastante indicado para a classificação e detecção de objetos em 
fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada 
imagem. 
( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na 
criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em 
problemas de aprendizado de máquina não supervisionados. 
( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, 
pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um 
pré-processamento muito intenso na sequência de caracteres, o que acabaria 
inviabilizando sua utilização. 
( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada 
em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao 
final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira 
altamente abstrata. 
Assinale a alternativa que contenha a sequência correta: 
 
Alternativas: 
• F – F – F – V. 
• V – F – F – V. 
checkCORRETO 
• V – F – V – V. 
• V – F – F – F. 
• F – V – V – F. 
Resolução comentada: 
( V ) O deep learning é bastante indicado para a classificação e detecção de objetos em 
fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada 
imagem. 
( F ) O deep learning pode ser aplicado em problemas de aprendizado de máquina não 
supervisionados. 
( F ) O deep learning é utilizado para a criação de tradutores automáticos de texto, pois 
a implementação de tal algoritmo nessa aplicação é performada de tal forma a não 
necessitar pré-processamento da sequência de caracteres. 
( V ) Em algoritmos de deep learning, cada subcamada transforma seus dados de 
entrada em uma representação ligeiramente mais abstrata do que esses dados eram 
antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de 
maneira altamente abstrata. 
Código da questão: 49627 
4) 
Os algoritmos de aprendizado de máquina baseados em distância podem também ser 
rotulados como algoritmos “preguiçosos”. 
Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos 
algoritmos baseados em distância. 
 
Alternativas: 
• Pois eles analisam poucos dados para então fornecer a resposta. 
• Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a 
objetos pertencentes à classe deles, e não a real distância entre o objeto a ser 
analisado e qualquer outro ponto pertencente ao dataset. 
• Eles são preguiçosos pois não passam por uma etapa de treinamento. 
• Pois eles criam um modelo baseados nos dados do treinamento, memorizando 
os dados e criando uma função matemática que relaciona entradas e saídas 
fornecidas ao algoritmo. 
• Pois não aprendem ou criam um modelo baseados nos dados do treinamento, 
eles apenas memorizam os dados e criam um plano n-dimensional para 
possibilitar a análise das distâncias. 
checkCORRETO 
Resolução comentada: 
esses algoritmos são rotulados como “preguiçosos” (lazy) pois não aprendem ou criam 
um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e 
criam um plano n-dimensional para possibilitar a análise das distâncias. 
Código da questão: 49605 
5) 
O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. 
Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode 
observar um diagrama de dispersão, em que existem observações já rotuladas em três 
classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação 
não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para 
poder então classificar esse objeto. 
 
 
 
Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 
3-NN e 5-NN. 
Assinale a alternativa que representa corretamente a classificação obtida com cada um 
dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN. 
 
Alternativas: 
• Quadrado, estrela e estrela. 
• Bola, estrela e quadrado. 
• Bola, estrela e estrela. 
checkCORRETO 
• Bola, quadrado e estrela. 
• Bola, bola e estrela. 
Resolução comentada: 
para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe 
que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é 
possível observar a quantidade de vizinhos completamente dentro dos círculos 
relativos às redes 1-NN, 3-NN e 5-NN. 
 
 
 
Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação 
é “estrela” e para o caso 5-NN, a classificação também é “estrela”. 
Código da questão: 49614 
6) 
O aprendizado de máquina é uma área muito abrangente, que possui inúmeras 
técnicas que podem ser utilizadas para resolver problemas, classificar dados e/ou 
otimizar recursos. Analise as afirmativas a seguir, que tratam de técnicas de AM. 
( ) Máquinas de vetor de suporte (SVM – support vector machine) são técnicas de 
aprendizado de máquina preditivo de otimização que buscam encontrar algum 
hiperplano em um espaço N-dimensional capaz de fazer a separação ótima entre os 
dados. 
( ) Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do 
cérebro humano e executam as tarefas específicas para as quais foram projetados. 
( ) Classificadores do tipo Bayes Ingênuo (Naive Bayes) estimam a probabilidade de 
uma classificação correta e são uma alternativa competitiva para a classificação de 
textos. 
( ) Métodos de AM baseados em procura possuem umespaço de estados, que é o 
conjunto com os estados possíveis nos quais o problema pode se encontrar. 
( ) Um exemplo AM de busca não informada é o algoritmo Greedy Search. Essa técnica 
tenta expandir o nó mais próximo da solução desejada, utilizando uma função 
heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a 
distância entre o nó atual e o estado final. 
Assinale a alternativa que julga corretamente os itens acima como verdadeiro (V) ou 
falso (F): 
 
Alternativas: 
• V – V – V – V – F. 
• V – F – V – V – V. 
• V – V – V – F – V. 
• V – F – F – V – V. 
• V – F – V – V – F. 
checkCORRETO 
Resolução comentada: 
o correto para a segunda afirmativa seria: “Algoritmos de redes neurais artificiais são 
sistemas baseados no funcionamento do cérebro humano, e são capazes de aprender 
para executar tarefas sem terem que ser programados para nenhuma tarefa específica”. 
O correto para a quinta afirmativa seria: “Um exemplo AM de busca informada é o 
algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução 
desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a 
função heurística utilizada estima a distância entre o nó atual e o estado final”. 
Código da questão: 49609 
7) 
A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de 
suas características, identificar objetos similares. Esse tipo de algoritmo pode ser 
classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados 
em densidade ou baseados em erro quadrático. 
Sobre os algoritmos de agrupamento, analise as afirmações a seguir: 
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, 
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse 
processo até o final do algoritmo. 
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos 
começam com inúmeros clusters e fundem os grupos de maior similaridade até restar 
apenas um grande grupo com os objetos. 
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa 
os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, 
e então poder proceder à etapa de teste. 
Sendo assim, estão CORRETOS somente os itens: 
 
Alternativas: 
• II. 
• I – II. 
• I – II – III. 
• I. 
checkCORRETO 
• II – III. 
Resolução comentada: 
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, 
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse 
processo até o final do algoritmo. 
II. O agrupamento divisivo e aglomerativo funciona de maneira oposta. 
III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K 
deve ser passado anteriormente. 
Código da questão: 49620 
8)
 
 
Alternativas: 
• Os algoritmos de deep learning não podem ser aplicados a sistemas de 
recomendação que utilizam métodos de filtragem colaborativa. 
• Os algoritmos de recomendação baseados em filtragem colaborativa precisam, 
de alguma forma, manipular a matriz de preferências, e a recomendação 
baseada em conteúdo é uma técnica utilizada para realizar essa tarefa. 
• Os algoritmos de recomendação baseados em filtragem colaborativa precisam, 
de alguma forma, manipular a matriz de preferências, e a decomposição SVD 
(singular value decomposition) é uma técnica utilizada para realizar essa tarefa. 
checkCORRETO 
• As matrizes de preferências resultantes do estudo de grandes lojas virtuais, 
como a Amazon, costumam ser compostas por poucas linhas e colunas. 
• As entradas da matriz de preferência podem ser somente numéricas, e não 
binárias. 
Resolução comentada: 
a) A recomendação baseada em conteúdo é outra metodologia utilizada para fazer a 
recomendação 
c) Os algoritmos de deep learning podem ser aplicados a sistemas de recomendação 
que utilizam métodos de filtragem colaborativa. 
d) As entradas da matriz podem ser tanto numéricas (a nota dada para uma comida 
pelo aplicativo de celular) como binárias (se o cliente comprou determinado produto 
ou clicou em algum link). 
e) As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a 
Amazon, costumam ser compostas por poucas linhas e colunas. 
Código da questão: 49630 
9) 
O aprendizado de máquina (AM) preditivo segue o paradigma do aprendizado 
supervisionado. 
Sobre o AM preditivo e supervisionado, analise os itens a seguir: 
I. O AM preditivo possui como meta encontrar uma função a partir de objetos de 
treinamento, para então prever o rótulo de qualquer novo dado fornecido. 
II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas 
recebe os dados a serem analisados e os agrupa de acordo com padrões comuns 
identificados. 
III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para 
criar uma função matemática linear que represente, da melhor forma possível, os 
dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o 
algoritmo é do tipo não supervisionado. 
Assinale a alternativa que indica quais afirmações estão corretas. 
 
Alternativas: 
• I – II – III. 
• Somente I. 
checkCORRETO 
• Somente I e III. 
• Somente I e II. 
• Somente III. 
Resolução comentada: 
somente a afirmativa I está correta. 
O correto para a afirmativa II seria: “O AM de agrupamento é um método clássico de 
AM não supervisionado, pois apenas recebe os dados a serem analisados e os agrupa 
de acordo com padrões comuns identificados”. 
O correto para a afirmativa III seria: “A regressão linear, seja ela de 2 ou n variáveis, é 
uma técnica que utiliza dados para criar uma função matemática linear que represente, 
da melhor forma possível, os dados. A regressão é uma técnica de AM supervisionado”. 
Código da questão: 49607 
10) 
Considere o seguinte caso em que um sistema de recomendação é utilizado: 
Um website de streaming de filmes insere rótulos em cada um dos filmes de seu banco 
de dados. Toda vez que um usuário faz login, o sistema identifica as características do 
usuário e, baseado nos rótulos, faz indicações de novos filmes a serem assistidos. 
Assinale a alternativa que contém qual método de sistema de recomendação é 
utilizado no caso descrito pelo trecho acima. 
 
Alternativas: 
• Recomendação do tipo filtragem colaborativa baseada em aprendizado 
profundo. 
• Recomendação baseada em HTML. 
• Recomendação baseada em interação. 
• Recomendação do tipo filtragem colaborativa baseada em fatoração matricial. 
• Recomendação baseada em conteúdo. 
checkCORRETO 
Resolução comentada: 
o trecho descreve um sistema em que a recomendação é baseada em conteúdo. Ou 
seja, o algoritmo verifica qual filme possui conteúdo mais semelhante às características 
e aos gostos particulares de cada usuário que faz login no website. 
Código da questão: 49632

Continue navegando