Logo Passei Direto
Buscar

Machine Learning (Prova)

Ferramentas de estudo

Questões resolvidas

A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir:
Assinale a alternativa que julga corretamente as afirmacoes acima como verdadeiras (V) ou falsas (F).
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários.
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos.
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características.
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário, mas não é capaz de gerar matrizes usuário-item.
V – V – V – F.
F – V – V – V.
V – V – F – F.
F – V – V – F.
F – F – V – F.

A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina.
Assinale a alternativa que indica quais afirmações estão corretas.
I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir.
II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas.
III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância.
Somente I e III.
I – II – III.
Somente III.
Somente II.
Somente I e II.

Considere os seguintes passos necessários para a implementação de uma árvore de decisão:
Assinale a alternativa que define corretamente a sequência dos passos.
A. Os dados são então divididos em seus diferentes atributos.
B. Calcule a entropia do resultado esperado.
C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser ainda mais dividida.
D. Escolha o atributo com o maior ganho de informação como o nó de decisão.
C – A – D – B.
D – B – C – A.
B – A – C – D.
A – B – C – D.
B – A – D – C.

Um _____________________ analisa similaridades entre as interações usuário-item, item-item e usuário-usuário.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Sistema de recomendação baseado em conteúdo.
Sistema de recomendação por filtragem colaborativa.
Sistema de conteúdo baseado em recomendação.
Sistema de recomendação discriminativo.
Sistema de recomendação por filtragem não colaborativa.

O algoritmo kNN possui como característica principal a análise de distância entre objetos.
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN.
O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente.
O parâmetro k representa o grau do polinômio criado pelo algoritmo.
É o grau de liberdade computacional do algoritmo a ser implementado.
É o número de pontos existentes no domínio do problema.
É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto.

Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado para um determinado tipo de dados.
Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima.
Support vector machine.
Random Forest.
Rede neural.
Algoritmo genético.
K-means.

Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
I. É aconselhável utilizar um algoritmo supervisionado.
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente.
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserção estão corretas, mas a segunda não justifica a primeira.
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão incorretas.

João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento.
Regressão linear.
Regressão multivariável.
Regressão logística.
Monte Carlo.
K-means.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir:
Assinale a alternativa que julga corretamente as afirmacoes acima como verdadeiras (V) ou falsas (F).
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários.
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos.
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características.
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário, mas não é capaz de gerar matrizes usuário-item.
V – V – V – F.
F – V – V – V.
V – V – F – F.
F – V – V – F.
F – F – V – F.

A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina.
Assinale a alternativa que indica quais afirmações estão corretas.
I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir.
II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas.
III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância.
Somente I e III.
I – II – III.
Somente III.
Somente II.
Somente I e II.

Considere os seguintes passos necessários para a implementação de uma árvore de decisão:
Assinale a alternativa que define corretamente a sequência dos passos.
A. Os dados são então divididos em seus diferentes atributos.
B. Calcule a entropia do resultado esperado.
C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser ainda mais dividida.
D. Escolha o atributo com o maior ganho de informação como o nó de decisão.
C – A – D – B.
D – B – C – A.
B – A – C – D.
A – B – C – D.
B – A – D – C.

Um _____________________ analisa similaridades entre as interações usuário-item, item-item e usuário-usuário.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Sistema de recomendação baseado em conteúdo.
Sistema de recomendação por filtragem colaborativa.
Sistema de conteúdo baseado em recomendação.
Sistema de recomendação discriminativo.
Sistema de recomendação por filtragem não colaborativa.

O algoritmo kNN possui como característica principal a análise de distância entre objetos.
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN.
O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente.
O parâmetro k representa o grau do polinômio criado pelo algoritmo.
É o grau de liberdade computacional do algoritmo a ser implementado.
É o número de pontos existentes no domínio do problema.
É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto.

Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado para um determinado tipo de dados.
Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima.
Support vector machine.
Random Forest.
Rede neural.
Algoritmo genético.
K-means.

Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
I. É aconselhável utilizar um algoritmo supervisionado.
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente.
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserção estão corretas, mas a segunda não justifica a primeira.
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão incorretas.

João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento.
Regressão linear.
Regressão multivariável.
Regressão logística.
Monte Carlo.
K-means.

Prévia do material em texto

1) 
A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a 
seguir: 
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder 
organizar alfabeticamente os usuários. 
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes 
neurais relacionando usuários e objetos. 
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos 
baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, 
ao passo que o segundo analisa as suas características. 
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação 
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário, mas não é capaz de gerar matrizes usuário-item. 
Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) 
ou falsas (F). 
 
Alternativas: 
• V – V – V – F. 
• F – V – V – V. 
• V – V – F – F. 
• F – V – V – F. 
checkCORRETO 
• F – F – V – F.' 
Resolução comentada: 
( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a 
organização não é feita por ordem alfabética. 
( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes 
neurais relacionando usuários e objetos. 
( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos 
baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, 
ao passo que o segundo analisa as suas características. 
( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação 
baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-
usuário e também é capaz de gerar matrizes usuário-item. 
Código da questão: 49633 
2) 
A classificação binária é um dos problemas mais utilizados e estudados em 
aprendizado de máquina. 
Sobre o AM de classificação binária, analise os itens a seguir: 
I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e 
estima qual valor uma variável aleatória binária y∈{±1} irá assumir. 
II. Caso não haja informação completa sobre o conjunto X de observação, o problema é 
conhecido como estimativa com variáveis desconhecidas. 
III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do 
conjunto X' utilizado na estimação, o problema é conhecido como um problema sem 
covariância. 
Assinale a alternativa que indica quais afirmações estão corretas. 
 
Alternativas: 
• Somente I e III. 
• I – II – III. 
• Somente III. 
• Somente II. 
• Somente I e II. 
checkCORRETO 
Resolução comentada: 
as afirmativas I e II estão corretas. 
O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento seja 
de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido 
como um problema de correção de descolamento por covariância”. 
Código da questão: 49602 
3) 
Considere os seguintes passos necessários para a implementação de uma árvore de 
decisão: 
A. Os dados são então divididos em seus diferentes atributos. 
B. Calcule a entropia do resultado esperado. 
C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser 
ainda mais dividida. 
D. Escolha o atributo com o maior ganho de informação como o nó de decisão. 
 
Alternativas: 
• C – A – D – B. 
• D – B – C – A. 
• B – A – C – D. 
• A – B – C – D. 
• B – A – D – C. 
checkCORRETO 
Resolução comentada: 
a sequência correta é B – A – D – C: 
B. Calcule a entropia do resultado esperado. 
A. Os dados são então divididos em seus diferentes atributos. 
D. Escolha o atributo com o maior ganho de informação como o nó de decisão. 
C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser 
ainda mais dividida. 
Código da questão: 49619 
4) 
Um _____________________ analisa similaridades entre as interações usuário-item, item-
item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue 
fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros 
usuários semelhantes gostaram. 
Assinale a alternativa que preenche corretamente a lacuna do trecho acima. 
 
Alternativas: 
• Sistema de recomendação baseado em conteúdo. 
• Sistema de recomendação por filtragem colaborativa. 
checkCORRETO 
• Sistema de conteúdo baseado em recomendação. 
• Sistema de recomendação discriminativo. 
• Sistema de recomendação por filtragem não colaborativa. 
Resolução comentada: 
O correto é: 
Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as 
interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica 
similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, 
usuários acessam itens dos quais outros usuários semelhantes gostaram. 
Código da questão: 49631 
5) 
O algoritmo kNN possui como característica principal a análise de distância entre 
objetos. Você observou durante os estudos que o valor do parâmetro k pode 
influenciar significativamente no desempenho do algoritmo e até mudar o resultado 
obtido. 
Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo 
kNN. 
 
Alternativas: 
• O parâmetro k representa a quantidade de objetos que o algoritmo consegue 
processar simultaneamente. 
• O parâmetro k representa o grau do polinômio criado pelo algoritmo. 
• É o grau de liberdade computacional do algoritmo a ser implementado. 
• É o número de pontos existentes no domínio do problema. 
• É o número de vizinhos próximos que são considerados para tomar a decisão 
sobre a definição da classe do objeto. 
checkCORRETO 
Resolução comentada: 
o parâmetro k representa o número de vizinhos próximos que são considerados para 
tomar a decisão sobre a definição da classe do objeto. 
Código da questão: 49610 
6) 
Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado 
para um determinado tipo de dados. Existe um algoritmo que é normalmente sensível 
quanto à posição das sementes iniciais, o que pode levar para uma convergência local. 
Esse algoritmo é também sensível a ruídos, dado que ele leva em consideração os 
desvios dos objetos em relação ao centroide de cada cluster calculado. Por último, esse 
algoritmo não é indicado para o caso de os clusters possuírem forma não convexa. 
Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto 
acima. 
 
Alternativas: 
• Support vector machine. 
• Random Forest. 
• Rede neural. 
• Algoritmo genético. 
• K-means. 
checkCORRETO 
Resolução comentada: 
o trecho se refere ao algoritmo K-means. 
Código da questão: 49624 
7) 
Uma determinada instituição bancária contratou um programador para desenvolver 
algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de 
acordo com saldo diário de sua conta durante um ano todo. Os clientes com 
classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, 
o programador recebeu apenas um banco de dados com 10.000 clientes já classificados 
pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 
campos de informação) e a classificação como “BOM” ou “MAU” cliente. 
Considerando o cenário acima: 
I. É aconselhável utilizar um algoritmo supervisionado. 
PORQUE 
II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo 
só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: 
 
Alternativas: 
• A primeira asserção está incorreta e a segunda está correta. 
• A primeira e a segunda asserção estão corretas, mas a segunda não justifica a 
primeira. 
• A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. 
checkCORRETO 
• A primeira asserção está correta e a segundaestá incorreta. 
• As duas asserções estão incorretas. 
Resolução comentada: 
ambas as asserções estão corretas e a segunda justifica a primeira. 
Código da questão: 49604 
8) 
O Algoritmo Naive Bayes foi criado com sus estrutura baseada no Teorema de Bayes, 
que diz o seguinte: 
 
Considere a seguinte situação: 
 
Alternativas: 
• 
• 
• 
• 
• 
checkCORRETO 
Resolução comentada:
 
Código da questão: 49611 
9) 
João aplicou um teste de múltipla escolha contendo 120 questões para um grande 
grupo de pessoas, e conseguiu perceber que houve uma grande variação na 
distribuição das notas. 
João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno 
pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele 
poderá elaborar trabalhos específicos para cada grupo. 
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse 
agrupamento. 
 
Alternativas: 
• Regressão linear. 
• Regressão multivariável. 
• Regressão logística. 
• Monte Carlo. 
• K-means. 
checkCORRETO 
Resolução comentada: 
dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k-
means. 
Código da questão: 49623 
10) 
Observe a figura que contém a estrutura de uma rede neural artificial: 
 
 
 
Fonte: elaborada pelo autor. 
Sobre a RNA descrita na figura, analise as afirmativas I a IV a seguir: 
I. A RNA admite quatro sinais de entrada (input layer). 
II. A RNA não possui camadas intermediárias. 
III. A RNA da figura é apropriada para aplicações deep learning. 
IV. A RNA possui três variáveis de bias. 
Sendo assim, estão CORRETOS somente os itens: 
 
Alternativas: 
• IV. 
checkCORRETO 
• II – III. 
• I – II – III. 
• I. 
• I – II. 
Resolução comentada: 
I. A RNA admite três sinais de entrada (input layer). 
II. A RNA possui duas camadas intermediárias. 
III. A RNA da figura não é apropriada para aplicações deep learning. 
IV. A RNA possui três variáveis de bias. 
Código da questão: 49625

Mais conteúdos dessa disciplina