Machine Learning

PITÁGORAS

Pedro Antunes

em 14/04/2022

Questões resolvidas

João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento.
K-means.
Regressão logística.
Regressão linear.
Regressão multivariável.
Monte Carlo.

Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações.
A partir dos gráficos, analise as afirmativas a seguir: I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear. II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear. III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear. Assinale a alternativa que julga corretamente essas afirmacoes:
I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear.
II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear.
III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear.
Somente III está correta.
Somente II e III estão corretas.
Somente I e III estão corretas.
Somente I está correta.
Somente II está correta.

Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a quantidade de dados a ser processada aumenta. Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, julgue os itens a seguir:
Assinale a alternativa que contenha a sequência correta:
( ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem.
( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em problemas de aprendizado de máquina não supervisionados.
( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um pré-processamento muito intenso na sequência de caracteres, o que acabaria inviabilizando sua utilização.
( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata.
F – V – V – F.
V – F – F – V.
V – F – V – V.
V – F – F – F.
F – F – F – V.

Os algoritmos de aprendizado de máquina baseados em distância podem também ser rotulados como algoritmos “preguiçosos”.
Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos algoritmos baseados em distância.
Pois eles analisam poucos dados para então fornecer a resposta.
Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a objetos pertencentes à classe deles, e não a real distância entre o objeto a ser analisado e qualquer outro ponto pertencente ao dataset.
Eles são preguiçosos pois não passam por uma etapa de treinamento.
Pois eles criam um modelo baseados nos dados do treinamento, memorizando os dados e criando uma função matemática que relaciona entradas e saídas fornecidas ao algoritmo.
Pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n-dimensional para possibilitar a análise das distâncias.

O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode observar um diagrama de dispersão, em que existem observações já rotuladas em três classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para poder então classificar esse objeto.
Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 3-NN e 5-NN. Assinale a alternativa que representa corretamente a classificação obtida com cada um dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN.
Quadrado, estrela e estrela.
Bola, estrela e quadrado.
Bola, estrela e estrela.
Bola, quadrado e estrela.
Bola, bola e estrela.

A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de suas características, identificar objetos similares. Esse tipo de algoritmo pode ser classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados em densidade ou baseados em erro quadrático.
Sobre os algoritmos de agrupamento, analise as afirmacoes a seguir: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos. III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste. Sendo assim, estão CORRETOS somente os itens:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos.
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste.
I – II.
I.
II.
I – II – III.
II – III.

O aprendizado de máquina (AM) preditivo segue o paradigma do aprendizado supervisionado.
Sobre o AM preditivo e supervisionado, analise os itens a seguir: I. O AM preditivo possui como meta encontrar uma função a partir de objetos de treinamento, para então prever o rótulo de qualquer novo dado fornecido. II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados. III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o algoritmo é do tipo não supervisionado. Assinale a alternativa que indica quais afirmações estão corretas.
I. O AM preditivo possui como meta encontrar uma função a partir de objetos de treinamento, para então prever o rótulo de qualquer novo dado fornecido.
II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados.
III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o algoritmo é do tipo não supervisionado.
I – II – III.
Somente I.
Somente I e III.
Somente I e II.
Somente III.

Considere o seguinte caso em que um sistema de recomendação é utilizado: Um website de streaming de filmes insere rótulos em cada um dos filmes de seu banco de dados. Toda vez que um usuário faz login, o sistema identifica as características do usuário e, baseado nos rótulos, faz indicações de novos filmes a serem assistidos.
Assinale a alternativa que contém qual método de sistema de recomendação é utilizado no caso descrito pelo trecho acima.
Recomendação do tipo filtragem colaborativa baseada em aprendizado profundo.
Recomendação baseada em HTML.
Recomendação baseada em interação.
Recomendação do tipo filtragem colaborativa baseada em fatoração matricial.
Recomendação baseada em conteúdo.

Conteúdos escolhidos para você

7 pág.

Machine Learning - Atividade 2

ESTÁCIO

17 pág.

Ordenação e pesquisa - eficiência de algoritmo

DOCTUM

4 pág.

Teste 16 Programação e Ciência de Dados

Perguntas dessa disciplina

A ordenação de dados é uma operação essencial em diversas aplicações computacionais. Para esse fim, diferentes algoritmos podem ser utilizados, cada u

A aplicação da lógica de programação no desenvolvimento de sistemas reais exige a combinação de diferentes estruturas de controle e organização de dad

FRBA

o machine learning emerge como uma ponta entre a complexidade dos dados e a capacidade de discernimento das maquinas, essa abordagem revolucionaria...

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

UNIP

O pré-processamento de dados para a execução do algoritmo FP-Growth envolve a transformação da base transacional em uma estrutura de lista de listas,

Uniasselvi

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento.
K-means.
Regressão logística.
Regressão linear.
Regressão multivariável.
Monte Carlo.

Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações.
A partir dos gráficos, analise as afirmativas a seguir: I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear. II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear. III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear. Assinale a alternativa que julga corretamente essas afirmacoes:
I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do tipo linear.
II. O gráfico C ilustra a possível existência de uma observação outlier na regressão linear.
III. O gráfico D ilustra a possível existência de uma observação outlier na regressão linear.
Somente III está correta.
Somente II e III estão corretas.
Somente I e III estão corretas.
Somente I está correta.
Somente II está correta.

Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a quantidade de dados a ser processada aumenta. Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, julgue os itens a seguir:
Assinale a alternativa que contenha a sequência correta:
( ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem.
( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em problemas de aprendizado de máquina não supervisionados.
( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um pré-processamento muito intenso na sequência de caracteres, o que acabaria inviabilizando sua utilização.
( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata.
F – V – V – F.
V – F – F – V.
V – F – V – V.
V – F – F – F.
F – F – F – V.

Os algoritmos de aprendizado de máquina baseados em distância podem também ser rotulados como algoritmos “preguiçosos”.
Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos algoritmos baseados em distância.
Pois eles analisam poucos dados para então fornecer a resposta.
Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a objetos pertencentes à classe deles, e não a real distância entre o objeto a ser analisado e qualquer outro ponto pertencente ao dataset.
Eles são preguiçosos pois não passam por uma etapa de treinamento.
Pois eles criam um modelo baseados nos dados do treinamento, memorizando os dados e criando uma função matemática que relaciona entradas e saídas fornecidas ao algoritmo.
Pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n-dimensional para possibilitar a análise das distâncias.

O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode observar um diagrama de dispersão, em que existem observações já rotuladas em três classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para poder então classificar esse objeto.
Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 3-NN e 5-NN. Assinale a alternativa que representa corretamente a classificação obtida com cada um dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN.
Quadrado, estrela e estrela.
Bola, estrela e quadrado.
Bola, estrela e estrela.
Bola, quadrado e estrela.
Bola, bola e estrela.

A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de suas características, identificar objetos similares. Esse tipo de algoritmo pode ser classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados em densidade ou baseados em erro quadrático.
Sobre os algoritmos de agrupamento, analise as afirmacoes a seguir: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos. III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste. Sendo assim, estão CORRETOS somente os itens:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos.
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste.
I – II.
I.
II.
I – II – III.
II – III.

O aprendizado de máquina (AM) preditivo segue o paradigma do aprendizado supervisionado.
Sobre o AM preditivo e supervisionado, analise os itens a seguir: I. O AM preditivo possui como meta encontrar uma função a partir de objetos de treinamento, para então prever o rótulo de qualquer novo dado fornecido. II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados. III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o algoritmo é do tipo não supervisionado. Assinale a alternativa que indica quais afirmações estão corretas.
I. O AM preditivo possui como meta encontrar uma função a partir de objetos de treinamento, para então prever o rótulo de qualquer novo dado fornecido.
II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas recebe os dados a serem analisados e os agrupa de acordo com padrões comuns identificados.
III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para criar uma função matemática linear que represente, da melhor forma possível, os dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o algoritmo é do tipo não supervisionado.
I – II – III.
Somente I.
Somente I e III.
Somente I e II.
Somente III.

Considere o seguinte caso em que um sistema de recomendação é utilizado: Um website de streaming de filmes insere rótulos em cada um dos filmes de seu banco de dados. Toda vez que um usuário faz login, o sistema identifica as características do usuário e, baseado nos rótulos, faz indicações de novos filmes a serem assistidos.
Assinale a alternativa que contém qual método de sistema de recomendação é utilizado no caso descrito pelo trecho acima.
Recomendação do tipo filtragem colaborativa baseada em aprendizado profundo.
Recomendação baseada em HTML.
Recomendação baseada em interação.
Recomendação do tipo filtragem colaborativa baseada em fatoração matricial.
Recomendação baseada em conteúdo.

Conteúdos escolhidos para você

7 pág.

Machine Learning - Atividade 2

ESTÁCIO

17 pág.

Ordenação e pesquisa - eficiência de algoritmo

DOCTUM

4 pág.

Teste 16 Programação e Ciência de Dados

Perguntas dessa disciplina

A ordenação de dados é uma operação essencial em diversas aplicações computacionais. Para esse fim, diferentes algoritmos podem ser utilizados, cada u

A aplicação da lógica de programação no desenvolvimento de sistemas reais exige a combinação de diferentes estruturas de controle e organização de dad

FRBA

o machine learning emerge como uma ponta entre a complexidade dos dados e a capacidade de discernimento das maquinas, essa abordagem revolucionaria...

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

UNIP

O pré-processamento de dados para a execução do algoritmo FP-Growth envolve a transformação da base transacional em uma estrutura de lista de listas,

Uniasselvi

Prévia do material em texto

1)
João aplicou um teste de múltipla escolha contendo 120 questões para um grande
grupo de pessoas, e conseguiu perceber que houve uma grande variação na
distribuição das notas.
João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno
pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele
poderá elaborar trabalhos específicos para cada grupo.
Assinale a alternativa que contém o algoritmo mais indicado para a realização desse
agrupamento.

Alternativas:
• Regressão linear.
• Regressão logística.
• K-means.
checkCORRETO
• Monte Carlo.
• Regressão multivariável.
Resolução comentada:
dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k-
means.
Código da questão: 49623
2)
Os gráficos a seguir ilustram um algoritmo de regressão linear aplicado a quatro
diferentes casos de dispersão de dados. Para todos os casos, tem-se a mesma reta de
regressão linear y = 4+ 0,5x, independente de quais sejam as estatísticas suficientes,
como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e
número de observações.

A partir dos gráficos, analise as afirmativas a seguir:
I. O gráfico B indica que os dados são propícios para a utilização de uma regressão do
tipo linear.
II. O gráfico C ilustra a possível existência de uma observação outlier na regressão
linear.
III. O gráfico D ilustra a possível existência de uma observação outlier na regressão
linear.
Assinale a alternativa que julga corretamente essas afirmações:

Alternativas:
• Somente III está correta.
• Somente II e III estão corretas.
• Somente I e III estão corretas.
• Somente I está correta.
• Somente II está correta.
checkCORRETO
Resolução comentada:
I. O gráfico B mostra observações que não são corretamente estimadas por meio do
uso de uma regressão linear.
II. A afirmativa está correta.
III. O gráfico D não contém dados corretamente estimados por uma regressão linear.
Código da questão: 49613
3)
Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de
máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a
quantidade de dados a ser processada aumenta.
Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning,
julgue os itens a seguir:
( ) O deep learning é bastante indicado para a classificação e detecção de objetos em
fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada
imagem.
( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na
criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em
problemas de aprendizado de máquina não supervisionados.
( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto,
pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um
pré-processamento muito intenso na sequência de caracteres, o que acabaria
inviabilizando sua utilização.
( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada
em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao
final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira
altamente abstrata.
Assinale a alternativa que contenha a sequência correta:

Alternativas:
• F – F – F – V.
• V – F – F – V.
checkCORRETO
• V – F – V – V.
• V – F – F – F.
• F – V – V – F.
Resolução comentada:
( V ) O deep learning é bastante indicado para a classificação e detecção de objetos em
fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada
imagem.
( F ) O deep learning pode ser aplicado em problemas de aprendizado de máquina não
supervisionados.
( F ) O deep learning é utilizado para a criação de tradutores automáticos de texto, pois
a implementação de tal algoritmo nessa aplicação é performada de tal forma a não
necessitar pré-processamento da sequência de caracteres.
( V ) Em algoritmos de deep learning, cada subcamada transforma seus dados de
entrada em uma representação ligeiramente mais abstrata do que esses dados eram
antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de
maneira altamente abstrata.
Código da questão: 49627
4)
Os algoritmos de aprendizado de máquina baseados em distância podem também ser
rotulados como algoritmos “preguiçosos”.
Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos
algoritmos baseados em distância.

Alternativas:
• Pois eles analisam poucos dados para então fornecer a resposta.
• Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a
objetos pertencentes à classe deles, e não a real distância entre o objeto a ser
analisado e qualquer outro ponto pertencente ao dataset.
• Eles são preguiçosos pois não passam por uma etapa de treinamento.
• Pois eles criam um modelo baseados nos dados do treinamento, memorizando
os dados e criando uma função matemática que relaciona entradas e saídas
fornecidas ao algoritmo.
• Pois não aprendem ou criam um modelo baseados nos dados do treinamento,
eles apenas memorizam os dados e criam um plano n-dimensional para
possibilitar a análise das distâncias.
checkCORRETO
Resolução comentada:
esses algoritmos são rotulados como “preguiçosos” (lazy) pois não aprendem ou criam
um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e
criam um plano n-dimensional para possibilitar a análise das distâncias.
Código da questão: 49605
5)
O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina.
Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode
observar um diagrama de dispersão, em que existem observações já rotuladas em três
classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação
não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para
poder então classificar esse objeto.

Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN,
3-NN e 5-NN.
Assinale a alternativa que representa corretamente a classificação obtida com cada um
dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN.

Alternativas:
• Quadrado, estrela e estrela.
• Bola, estrela e quadrado.
• Bola, estrela e estrela.
checkCORRETO
• Bola, quadrado e estrela.
• Bola, bola e estrela.
Resolução comentada:
para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe
que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é
possível observar a quantidade de vizinhos completamente dentro dos círculos
relativos às redes 1-NN, 3-NN e 5-NN.

Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação
é “estrela” e para o caso 5-NN, a classificação também é “estrela”.
Código da questão: 49614
6)
O aprendizado de máquina é uma área muito abrangente, que possui inúmeras
técnicas que podem ser utilizadas para resolver problemas, classificar dados e/ou
otimizar recursos. Analise as afirmativas a seguir, que tratam de técnicas de AM.
( ) Máquinas de vetor de suporte (SVM – support vector machine) são técnicas de
aprendizado de máquina preditivo de otimização que buscam encontrar algum
hiperplano em um espaço N-dimensional capaz de fazer a separação ótima entre os
dados.
( ) Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do
cérebro humano e executam as tarefas específicas para as quais foram projetados.
( ) Classificadores do tipo Bayes Ingênuo (Naive Bayes) estimam a probabilidade de
uma classificação correta e são uma alternativa competitiva para a classificação de
textos.
( ) Métodos de AM baseados em procura possuem umespaço de estados, que é o
conjunto com os estados possíveis nos quais o problema pode se encontrar.
( ) Um exemplo AM de busca não informada é o algoritmo Greedy Search. Essa técnica
tenta expandir o nó mais próximo da solução desejada, utilizando uma função
heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a
distância entre o nó atual e o estado final.
Assinale a alternativa que julga corretamente os itens acima como verdadeiro (V) ou
falso (F):

Alternativas:
• V – V – V – V – F.
• V – F – V – V – V.
• V – V – V – F – V.
• V – F – F – V – V.
• V – F – V – V – F.
checkCORRETO
Resolução comentada:
o correto para a segunda afirmativa seria: “Algoritmos de redes neurais artificiais são
sistemas baseados no funcionamento do cérebro humano, e são capazes de aprender
para executar tarefas sem terem que ser programados para nenhuma tarefa específica”.
O correto para a quinta afirmativa seria: “Um exemplo AM de busca informada é o
algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução
desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a
função heurística utilizada estima a distância entre o nó atual e o estado final”.
Código da questão: 49609
7)
A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de
suas características, identificar objetos similares. Esse tipo de algoritmo pode ser
classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados
em densidade ou baseados em erro quadrático.
Sobre os algoritmos de agrupamento, analise as afirmações a seguir:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster,
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse
processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos
começam com inúmeros clusters e fundem os grupos de maior similaridade até restar
apenas um grande grupo com os objetos.
III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa
os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K,
e então poder proceder à etapa de teste.
Sendo assim, estão CORRETOS somente os itens:

Alternativas:
• II.
• I – II.
• I – II – III.
• I.
checkCORRETO
• II – III.
Resolução comentada:
I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster,
depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse
processo até o final do algoritmo.
II. O agrupamento divisivo e aglomerativo funciona de maneira oposta.
III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K
deve ser passado anteriormente.
Código da questão: 49620
8)

Alternativas:
• Os algoritmos de deep learning não podem ser aplicados a sistemas de
recomendação que utilizam métodos de filtragem colaborativa.
• Os algoritmos de recomendação baseados em filtragem colaborativa precisam,
de alguma forma, manipular a matriz de preferências, e a recomendação
baseada em conteúdo é uma técnica utilizada para realizar essa tarefa.
• Os algoritmos de recomendação baseados em filtragem colaborativa precisam,
de alguma forma, manipular a matriz de preferências, e a decomposição SVD
(singular value decomposition) é uma técnica utilizada para realizar essa tarefa.
checkCORRETO
• As matrizes de preferências resultantes do estudo de grandes lojas virtuais,
como a Amazon, costumam ser compostas por poucas linhas e colunas.
• As entradas da matriz de preferência podem ser somente numéricas, e não
binárias.
Resolução comentada:
a) A recomendação baseada em conteúdo é outra metodologia utilizada para fazer a
recomendação
c) Os algoritmos de deep learning podem ser aplicados a sistemas de recomendação
que utilizam métodos de filtragem colaborativa.
d) As entradas da matriz podem ser tanto numéricas (a nota dada para uma comida
pelo aplicativo de celular) como binárias (se o cliente comprou determinado produto
ou clicou em algum link).
e) As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a
Amazon, costumam ser compostas por poucas linhas e colunas.
Código da questão: 49630
9)
O aprendizado de máquina (AM) preditivo segue o paradigma do aprendizado
supervisionado.
Sobre o AM preditivo e supervisionado, analise os itens a seguir:
I. O AM preditivo possui como meta encontrar uma função a partir de objetos de
treinamento, para então prever o rótulo de qualquer novo dado fornecido.
II. O AM de agrupamento é um método clássico de AM supervisionado, pois apenas
recebe os dados a serem analisados e os agrupa de acordo com padrões comuns
identificados.
III. A regressão linear, seja ela de 2 ou n variáveis, é uma técnica que utiliza dados para
criar uma função matemática linear que represente, da melhor forma possível, os
dados. Como ela cria uma função linear, pode-se falar que, após criada a função, o
algoritmo é do tipo não supervisionado.
Assinale a alternativa que indica quais afirmações estão corretas.

Alternativas:
• I – II – III.
• Somente I.
checkCORRETO
• Somente I e III.
• Somente I e II.
• Somente III.
Resolução comentada:
somente a afirmativa I está correta.
O correto para a afirmativa II seria: “O AM de agrupamento é um método clássico de
AM não supervisionado, pois apenas recebe os dados a serem analisados e os agrupa
de acordo com padrões comuns identificados”.
O correto para a afirmativa III seria: “A regressão linear, seja ela de 2 ou n variáveis, é
uma técnica que utiliza dados para criar uma função matemática linear que represente,
da melhor forma possível, os dados. A regressão é uma técnica de AM supervisionado”.
Código da questão: 49607
10)
Considere o seguinte caso em que um sistema de recomendação é utilizado:
Um website de streaming de filmes insere rótulos em cada um dos filmes de seu banco
de dados. Toda vez que um usuário faz login, o sistema identifica as características do
usuário e, baseado nos rótulos, faz indicações de novos filmes a serem assistidos.
Assinale a alternativa que contém qual método de sistema de recomendação é
utilizado no caso descrito pelo trecho acima.

Alternativas:
• Recomendação do tipo filtragem colaborativa baseada em aprendizado
profundo.
• Recomendação baseada em HTML.
• Recomendação baseada em interação.
• Recomendação do tipo filtragem colaborativa baseada em fatoração matricial.
• Recomendação baseada em conteúdo.
checkCORRETO
Resolução comentada:
o trecho descreve um sistema em que a recomendação é baseada em conteúdo. Ou
seja, o algoritmo verifica qual filme possui conteúdo mais semelhante às características
e aos gostos particulares de cada usuário que faz login no website.
Código da questão: 49632

Machine Learning

PITÁGORAS

Ferramentas de estudo

Conteúdos escolhidos para você

Machine Learning (Prova)

Machine Learning - Atividade 2

Ordenação e pesquisa - eficiência de algoritmo

Prova Machine Learning

Teste 16 Programação e Ciência de Dados

Perguntas dessa disciplina

A ordenação de dados é uma operação essencial em diversas aplicações computacionais. Para esse fim, diferentes algoritmos podem ser utilizados, cada u

A aplicação da lógica de programação no desenvolvimento de sistemas reais exige a combinação de diferentes estruturas de controle e organização de dad

o machine learning emerge como uma ponta entre a complexidade dos dados e a capacidade de discernimento das maquinas, essa abordagem revolucionaria...

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

O pré-processamento de dados para a execução do algoritmo FP-Growth envolve a transformação da base transacional em uma estrutura de lista de listas,

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Conteúdos escolhidos para você

Machine Learning (Prova)

Machine Learning - Atividade 2

Ordenação e pesquisa - eficiência de algoritmo

Prova Machine Learning

Teste 16 Programação e Ciência de Dados

Perguntas dessa disciplina

A ordenação de dados é uma operação essencial em diversas aplicações computacionais. Para esse fim, diferentes algoritmos podem ser utilizados, cada u

A aplicação da lógica de programação no desenvolvimento de sistemas reais exige a combinação de diferentes estruturas de controle e organização de dad

o machine learning emerge como uma ponta entre a complexidade dos dados e a capacidade de discernimento das maquinas, essa abordagem revolucionaria...

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

O pré-processamento de dados para a execução do algoritmo FP-Growth envolve a transformação da base transacional em uma estrutura de lista de listas,

Mais conteúdos dessa disciplina