Baixe o app para aproveitar ainda mais
Prévia do material em texto
1) João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo. Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento. Alternativas: • Regressão linear. • Regressão logística. • K-means. checkCORRETO • Monte Carlo. • Regressão multivariável. Resolução comentada: dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k- means. Código da questão: 49623 2) Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações. A partir dos gráficos, analise as afirmativas a seguir: I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear. II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear. III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear. Assinale a alternativa que julga corretamente essas afirmações: Alternativas: • Somente III está correta. • Somente II e III estão corretas. • Somente I e III estão corretas. • Somente I está correta. • Somente II está correta. checkCORRETO Resolução comentada: I. O gráfico B mostra observações que não são corretamente estimadas por meio do uso de uma regressão linear. II. A afirmativa está correta. III. O gráfico D não contém dados corretamente estimados por uma regressão linear. Código da questão: 49613 3) Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a quantidade de dados a ser processada aumenta. Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, julgue os itens a seguir: ( ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um pré-processamento muito intenso na sequência de caracteres, o que acabaria inviabilizando sua utilização. ( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Assinale a alternativa que contenha a sequência correta: Alternativas: • F – F – F – V. • V – F – F – V. checkCORRETO • V – F – V – V. • V – F – F – F. • F – V – V – F. Resolução comentada: ( V ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( F ) O deep learning pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( F ) O deep learning é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação é performada de tal forma a não necessitar pré-processamento da sequência de caracteres. ( V ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Código da questão: 49627 4) Os algoritmos de aprendizado de máquina baseados em distância podem também ser rotulados como algoritmos “preguiçosos”. Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos algoritmos baseados em distância. Alternativas: • Pois eles analisam poucos dados para então fornecer a resposta. • Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a objetos pertencentes à classe deles, e não a real distância entre o objeto a ser analisado e qualquer outro ponto pertencente ao dataset. • Eles são preguiçosos pois não passam por uma etapa de treinamento. • Pois eles criam um modelo baseados nos dados do treinamento, memorizando os dados e criando uma função matemática que relaciona entradas e saídas fornecidas ao algoritmo. • Pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n-dimensional para possibilitar a análise das distâncias. checkCORRETO Resolução comentada: esses algoritmos são rotulados como “preguiçosos” (lazy) pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n-dimensional para possibilitar a análise das distâncias. Código da questão: 49605 5) O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode observar um diagrama de dispersão, em que existem observações já rotuladas em três classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para poder então classificar esse objeto. Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 3-NN e 5-NN. Assinale a alternativa que representa corretamente a classificação obtida com cada um dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN. Alternativas: • Quadrado, estrela e estrela. • Bola, estrela e quadrado. • Bola, estrela e estrela. checkCORRETO • Bola, quadrado e estrela. • Bola, bola e estrela. Resolução comentada: para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é possível observar a quantidade de vizinhos completamente dentro dos círculos relativos às redes 1-NN, 3-NN e 5-NN. Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação é “estrela” e para o caso 5-NN, a classificação também é “estrela”. Código da questão: 49614 6) O aprendizado de máquina é uma área muito abrangente, que possui inúmeras técnicas que podem ser utilizadas para resolver problemas, classificar dados e/ou otimizar recursos. Analise as afirmativas a seguir, que tratam de técnicas de AM. ( ) Máquinas de vetor de suporte (SVM – support vector machine) são técnicas de aprendizado de máquina preditivo de otimização que buscam encontrar algum hiperplano em um espaço N-dimensional capaz de fazer a separação ótima entre os dados. ( ) Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do cérebro humano e executam as tarefas específicas para as quais foram projetados. ( ) Classificadores do tipo Bayes Ingênuo (Naive Bayes) estimam a probabilidade de uma classificação correta e são uma alternativa competitiva para a classificação de textos. ( ) Métodos de AM baseados em procura possuem umespaço de estados, que é o conjunto com os estados possíveis nos quais o problema pode se encontrar. ( ) Um exemplo AM de busca não informada é o algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a distância entre o nó atual e o estado final. Assinale a alternativa que julga corretamente os itens acima como verdadeiro (V) ou falso (F): Alternativas: • V – V – V – V – F. • V – F – V – V – V. • V – V – V – F – V. • V – F – F – V – V. • V – F – V – V – F. checkCORRETO Resolução comentada: o correto para a segunda afirmativa seria: “Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do cérebro humano, e são capazes de aprender para executar tarefas sem terem que ser programados para nenhuma tarefa específica”. O correto para a quinta afirmativa seria: “Um exemplo AM de busca informada é o algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a distância entre o nó atual e o estado final”. Código da questão: 49609 7) A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de suas características, identificar objetos similares. Esse tipo de algoritmo pode ser classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados em densidade ou baseados em erro quadrático. Sobre os algoritmos de agrupamento, analise as afirmações a seguir: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos. III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste. Sendo assim, estão CORRETOS somente os itens: Alternativas: • II. • I – II. • I – II – III. • I. checkCORRETO • II – III. Resolução comentada: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira oposta. III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K deve ser passado anteriormente. Código da questão: 49620 8) Alternativas: • Os algoritmos de deep learning não podem ser aplicados a sistemas de recomendação que utilizam métodos de filtragem colaborativa. • Os algoritmos de recomendação baseados em filtragem colaborativa precisam, de alguma forma, manipular a matriz de preferências, e a recomendação baseada em conteúdo é uma técnica utilizada para realizar essa tarefa. • Os algoritmos de recomendação baseados em filtragem colaborativa precisam, de alguma forma, manipular a matriz de preferências, e a decomposição SVD (singular value decomposition) é uma técnica utilizada para realizar essa tarefa. checkCORRETO • As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a Amazon, costumam ser compostas por poucas linhas e colunas. • As entradas da matriz de preferência podem ser somente numéricas, e não binárias. Resolução comentada: a) A recomendação baseada em conteúdo é outra metodologia utilizada para fazer a recomendação c) Os algoritmos de deep learning podem ser aplicados a sistemas de recomendação que utilizam métodos de filtragem colaborativa. d) As entradas da matriz podem ser tanto numéricas (a nota dada para uma comida pelo aplicativo de celular) como binárias (se o cliente comprou determinado produto ou clicou em algum link). e) As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a Amazon, costumam ser compostas por poucas linhas e colunas. Código da questão: 49630 9) O aprendizado de máquina (AM) preditivo segue o paradigma do aprendizado supervisionado. Sobre o AM preditivo e supervisionado, analise os itens a seguir: I. O AM preditivo possui como meta encontrar uma função a partir de objetos de treinamento, para então prever o rótulo de qualquer novo dado fornecido. II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados. III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o algoritmo é do tipo não supervisionado. Assinale a alternativa que indica quais afirmações estão corretas. Alternativas: • I – II – III. • Somente I. checkCORRETO • Somente I e III. • Somente I e II. • Somente III. Resolução comentada: somente a afirmativa I está correta. O correto para a afirmativa II seria: “O AM de agrupamento é um método clássico de AM não supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados”. O correto para a afirmativa III seria: “A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. A regressão é uma técnica de AM supervisionado”. Código da questão: 49607 10) Considere o seguinte caso em que um sistema de recomendação é utilizado: Um website de streaming de filmes insere rótulos em cada um dos filmes de seu banco de dados. Toda vez que um usuário faz login, o sistema identifica as características do usuário e, baseado nos rótulos, faz indicações de novos filmes a serem assistidos. Assinale a alternativa que contém qual método de sistema de recomendação é utilizado no caso descrito pelo trecho acima. Alternativas: • Recomendação do tipo filtragem colaborativa baseada em aprendizado profundo. • Recomendação baseada em HTML. • Recomendação baseada em interação. • Recomendação do tipo filtragem colaborativa baseada em fatoração matricial. • Recomendação baseada em conteúdo. checkCORRETO Resolução comentada: o trecho descreve um sistema em que a recomendação é baseada em conteúdo. Ou seja, o algoritmo verifica qual filme possui conteúdo mais semelhante às características e aos gostos particulares de cada usuário que faz login no website. Código da questão: 49632
Compartilhar