Baixe o app para aproveitar ainda mais
Prévia do material em texto
25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 1/6 Machine Learning Professor(a): Lucas dos Santos Araujo Claudino (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo. Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento. Alternativas: Monte Carlo. Regressão logística. K-means. CORRETO Regressão multivariável. Regressão linear. Código da questão: 49623 Um tipo de metodologia para o aprendizado de máquina é o AM preditivo baseado em probabilidades. A respeito dos métodos probabilísticos de AM, julgue os itens a seguir como verdadeiros (V) ou falsos (F): ( ) Métodos probabilísticos são utilizados quando não há informação completa sobre os dados a serem utilizados. ( ) Métodos probabilísticos utilizam probabilidades a priori e verossimilhança entre eventos para poder fazer predições. ( ) O algoritmo mais popular que é baseado em métodos probabilístico que é o Naive Bayes, também conhecido como Bayes Ingênuo ou Bayes simples. Classifique as afirmações como verdadeiro (V) e falso (F) e assinale a alternativa que contenha a sequência correta, respectivamente, de cima para baixo. Alternativas: F – V – F. V – V – F. V – V – V. CORRETO V – F – V. V – F – F. Código da questão: 49608 Resolução comentada: dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k-means. Resolução comentada: todas as alternativas contêm afirmações corretas. 25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 2/6 3) 4) Existem inúmeras técnicas de agrupamento para serem aplicadas na resolução de problema com machine learning e mineração de dados. Sobre as técnicas de agrupamento não hierárquico, analise as afirmativas a seguir: ( ) A escolha inicial dos objetos a serem utilizados no algoritmo K-means não influencia no resultado final, uma vez que essa técnica é robusta e imune a ótimos locais. ( ) No algoritmo K-médias, cada objeto do domínio pode mudar de cluster K vezes. ( ) Dendogramas são gráficos que mostram como foi a evolução dos clusters formados pelo K-means. Assinale a alternativa que julga corretamente os itens, na sequência: Alternativas: F – F – F. CORRETO V – F – F. V – V – F. V – F – V. F – V – V. Código da questão: 49622 A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de suas características, identificar objetos similares. Esse tipo de algoritmo pode ser classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados em densidade ou baseados em erro quadrático. Sobre os algoritmos de agrupamento, analise as afirmações a seguir: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos. III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste. Sendo assim, estão CORRETOS somente os itens: Alternativas: II. I – II – III. II – III. I. CORRETO I – II. Código da questão: 49620 Resolução comentada: a semente inicial influencia bastante no resultado obtido. No K-means, os objetos podem mudar de grupo quantas vezes forem necessárias, até que o critério de parada seja atingido. Dendograma é utilizado para visualizar o processo de clusterização passo a passo, assim como analisar os níveis de distância dos clusters formados. Resolução comentada: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira oposta. III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K deve ser passado anteriormente. 25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 3/6 5) 6) Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a quantidade de dados a ser processada aumenta. Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, julgue os itens a seguir: ( ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um pré- processamento muito intenso na sequência de caracteres, o que acabaria inviabilizando sua utilização. ( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Assinale a alternativa que contenha a sequência correta: Alternativas: V – F – F – V. CORRETO F – F – F – V. F – V – V – F. V – F – V – V. V – F – F – F. Código da questão: 49627 A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina. Sobre o AM de classificação binária, analise os itens a seguir: I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir. II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas. III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância. Assinale a alternativa que indica quais afirmações estão corretas. Alternativas: I – II – III. Somente III. Somente I e III. Somente I e II. CORRETO Somente II. Resolução comentada: ( V ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( F ) O deep learning pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( F ) O deep learning é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação é performada de tal forma a não necessitar pré-processamento da sequência de caracteres. ( V ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representaçãoligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Resolução comentada: 25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 4/6 7) 8) 9) Código da questão: 49602 Existe uma classe de aprendizado de máquina (AM) que busca analisar um conjunto de dados D={(x_i,f(x_i )),i=1,…,n}, sendo f(x_i ) uma função desconhecida, para poder criar uma aproximação f ̂(x_i ) capaz de estimar rótulos para novas entradas. Assinale a alternativa que afirma corretamente qual é essa classe de aprendizado de máquina. Alternativas: AM de agrupamento. AM descritivo. AM associativo. AM julgativo. AM preditivo. CORRETO Código da questão: 49606 Considere as seguintes afirmativas sobre algoritmos do tipo ensemble: A. Classificadores individuais podem estar "mais certos" sobre uma parte específica do domínio da função. B. Classificadores que estão "mais certos" podem ter seu voto com valor maior. C. Na maioria dos casos, agrupamentos possuem desempenho superior a classificadores individuais. Assinale a alternativa que contém as afirmativas CORRETAS: Alternativas: A – B. Somente A. A – B – C. CORRETO B – C A – C. Código da questão: 49616 O algoritmo kNN possui como característica principal a análise de distância entre objetos. Você observou durante os estudos que o valor do parâmetro k pode influenciar significativamente no desempenho do algoritmo e até mudar o resultado obtido. Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN. Alternativas: as afirmativas I e II estão corretas. O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema de correção de descolamento por covariância”. Resolução comentada: considere o conjunto de pares de dados como D={(x_i,f(x_i )),i=1,…,n}, sendo que f("x" _i ) é uma função desconhecida. O algoritmo de AM preditivo analisa então esse conjunto para criar uma aproximação f ̂ de f. Com essa aproximação, o algoritmo consegue, então, estimar os rótulos para qualquer nova entrada "x" Resolução comentada: todas as afirmativas estão corretas. 25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 5/6 10) É o número de pontos existentes no domínio do problema. É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. CORRETO O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente. O parâmetro k representa o grau do polinômio criado pelo algoritmo. É o grau de liberdade computacional do algoritmo a ser implementado. Código da questão: 49610 Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações. A partir dos gráficos, analise as afirmativas a seguir: I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear. II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear. III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear. Assinale a alternativa que julga corretamente essas afirmações: Alternativas: Somente III está correta. Somente II está correta. CORRETO Somente I e III estão corretas. Somente I está correta. Somente II e III estão corretas. Código da questão: 49613 Resolução comentada: o parâmetro k representa o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. Resolução comentada: I. O gráfico B mostra observações que não são corretamente estimadas por meio do uso de uma regressão linear. II. A afirmativa está correta. III. O gráfico D não contém dados corretamente estimados por uma regressão linear. 25/05/2022 15:40 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2554370/3954099 6/6 Arquivos e Links
Compartilhar