Machine Learning

•

Exatas

2

0

2

0

Bruno

03/12/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.264 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Machine Learning
Professor(a): Lucas dos Santos Araujo Claudino (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
Analise atentamente a afirmativa a seguir:
"Este algoritmo utiliza predições de muitos indivíduos aleatórios, cada uma podendo ter
variância diferente, e agrupa todas elas".
Assinale a alternativa que representa o algoritmo ao qual a afirmação acima se refere.
Alternativas:
Árvore de decisão.
Rede neural.
Support vector machine.
K nearest neighbors.
Floresta aleatória.  CORRETO
Código da questão: 49618
O algoritmo kNN possui como característica principal a análise de distância entre
objetos. Você observou durante os estudos que o valor do parâmetro k pode influenciar
significativamente no desempenho do algoritmo e até mudar o resultado obtido.
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo
kNN.
Alternativas:
O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar
simultaneamente.
É o grau de liberdade computacional do algoritmo a ser implementado.
O parâmetro k representa o grau do polinômio criado pelo algoritmo.
É o número de pontos existentes no domínio do problema.
É o número de vizinhos próximos que são considerados para tomar a decisão sobre a
definição da classe do objeto.  CORRETO
Código da questão: 49610
Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado
para um determinado tipo de dados. Existe um algoritmo que é normalmente sensível
quanto à posição das sementes iniciais, o que pode levar para uma convergência local. Esse
algoritmo é também sensível a ruídos, dado que ele leva em consideração os desvios dos
objetos em relação ao centroide de cada cluster calculado. Por último, esse algoritmo não é
indicado para o caso de os clusters possuírem forma não convexa.
Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima.
Alternativas:
Resolução comentada:
a floresta aleatória (Random Forest) é o algoritmo que utiliza predições de muitos
indivíduos aleatórios, cada uma podendo ter variância diferente, e agrupa todas elas.
Resolução comentada:
o parâmetro k representa o número de vizinhos próximos que são considerados para
tomar a decisão sobre a definição da classe do objeto.
4)
5)
Support vector machine.
Random Forest.
Algoritmo genético.
Rede neural.
K-means.  CORRETO
Código da questão: 49624
Existem inúmeras técnicas de agrupamento para serem aplicadas na resolução de
problema com machine learning e mineração de dados. Sobre as técnicas de agrupamento
não hierárquico, analise as afirmativas a seguir:
( ) A escolha inicial dos objetos a serem utilizados no algoritmo K-means não influencia no
resultado final, uma vez que essa técnica é robusta e imune a ótimos locais.
( ) No algoritmo K-médias, cada objeto do domínio pode mudar de cluster K vezes.
( ) Dendogramas são gráficos que mostram como foi a evolução dos clusters formados
pelo K-means.
Assinale a alternativa que julga corretamente os itens, na sequência:
Alternativas:
F – F – F.  CORRETO
V – F – F.
F – V – V.
V – F – V.
V – V – F.
Código da questão: 49622
Um _____________________ analisa similaridades entre as interações usuário-item, item-item
e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer
recomendações a novos usuários. Geralmente, usuários acessam itens que outros usuários
semelhantes gostaram.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas:
Sistema de recomendação discriminativo.
Sistema de recomendação baseado em conteúdo.
Sistema de conteúdo baseado em recomendação.
Sistema de recomendação por filtragem não colaborativa.
Sistema de recomendação por filtragem colaborativa.  CORRETO
Resolução comentada:
o trecho se refere ao algoritmo K-means.
Resolução comentada:
a semente inicial influencia bastante no resultado obtido.
No K-means, os objetos podem mudar de grupo quantas vezes forem necessárias,
até que o critério de parada seja atingido.
Dendograma é utilizado para visualizar o processo de clusterização passo a passo,
assim como analisar os níveis de distância dos clusters formados.
Resolução comentada:
O correto é:
Um sistema de recomendação por filtragem colaborativa analisa similaridades entre
as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema
identifica similaridades, ele consegue fazer recomendações a novos usuários.
Geralmente, usuários acessam itens dos quais outros usuários semelhantes
gostaram.
6)
7)
8)
Código da questão: 49631
João aplicou um teste de múltipla escolha contendo 120 questões para um grande
grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição
das notas.
João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno
pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá
elaborar trabalhos específicos para cada grupo.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse
agrupamento.
Alternativas:
Monte Carlo.
Regressão logística.
K-means.  CORRETO
Regressão linear.
Regressão multivariável.
Código da questão: 49623
Uma certa empresa selecionou profissionais para implementar um software de análise de
fraudes em sistemas de cartão de crédito. Um dos requisitos para a contratação era que o
profissional tivesse conhecimento sobre redes multilayer perceptrons. Nesse contexto,
perceptron é:
Alternativas:
Composto por duas redes simétricas que têm quatro ou cinco camadas rasas que
representam a metade da codificação (encoder) da rede.
Um algoritmo de rede neural artificial simples dedicado a efetuar uma análise binária
para identificar se determinada transação é fraude ou não fraude. CORRETO
O método-padrão em redes neurais artificiais para cálculo da contribuição de erro de
cada neurônio após processamento de um lote de dados.  INCORRETO
Um algoritmo de redes neurais artificiais composto de várias camadas ocultas e a função
sigmoide como função de saída.
Um algoritmo de rede neural artificial simples dedicado a efetuar uma análise de
regressão com valores de saída pertencentes ao conjunto dos reais positivos.
Código da questão: 49628
Uma determinada instituição bancária contratou um programador para desenvolver
algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de
acordo com saldo diário de sua conta durante um ano todo. Os clientes com classificação
“BOM” serão convidados para receber um cartão OURO. Para essa tarefa, o programador
recebeu apenas um banco de dados com 10.000 clientes já classificados pelos gerentes do
banco. O banco de dados contém o saldo diário da conta (365 campos de informação) e a
classificação como “BOM” ou “MAU” cliente.
Considerando o cenário acima:
I. É aconselhável utilizar um algoritmo supervisionado.
PORQUE
Resolução comentada:
dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o
k-means.
Resolução comentada:
perceptron é um algoritmo de rede neural artificial simples dedicado a efetuar uma
análise binária para identificar se a saída é {-1;1}.
9)
10)
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só
precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As duas asserções estão incorretas.
A primeira asserção está correta e a segunda está incorreta.
A primeira e a segunda asserção estão corretas, mas a segunda não justificaa primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. 
CORRETO
Código da questão: 49604
A classificação binária é um dos problemas mais utilizados e estudados em aprendizado
de máquina.
Sobre o AM de classificação binária, analise os itens a seguir:
I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e
estima qual valor uma variável aleatória binária y∈{±1} irá assumir.
II. Caso não haja informação completa sobre o conjunto X de observação, o problema é
conhecido como estimativa com variáveis desconhecidas.
III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto
X' utilizado na estimação, o problema é conhecido como um problema sem covariância.
Assinale a alternativa que indica quais afirmações estão corretas.
Alternativas:
Somente III.
I – II – III.
Somente I e II.  CORRETO
Somente II.
Somente I e III.
Código da questão: 49602
Um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que
tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá
utilizar o ________________, que é uma técnica de machine learning, e um de seus principais
algoritmos é o ________________.
Assinale a alternativa que preenche corretamente as lacunas.
Alternativas:
Mineração de dados; N-gram
Mineração de dados; HTML.
Processamento em linguagem natural; HTML.
Processamento em linguagem formal; Python.
Processamento em linguagem natural; N-gram.  CORRETO
Resolução comentada:
ambas as asserções estão corretas e a segunda justifica a primeira.
Resolução comentada:
as afirmativas I e II estão corretas.
O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento
seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é
conhecido como um problema de correção de descolamento por covariância”.
Resolução comentada:
Código da questão: 49621
um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot,
que tem como função simular o ser humano em uma conversação escrita. Para isso,
ele deverá utilizar o processamento em linguagem natural, que é uma técnica de
machine learning, e um de seus principais algoritmos é o N-gram.
Arquivos e Links