Logo Passei Direto
Buscar

Inglês

Faculdade Descomplica
A aprendizagem por reforço procura perceber os padrões hipotéticos com base na experiência continuada, chamada de estratégia incremental. Com base na sentença que fala de aprendizagem por reforço, assinale a alternativa correta.
a.
A estratégia incremental se dá para os processos de aprendizagem em agentes que não têm acesso aos dados prévios ou à complexidade ao traçar estas variáveis e tão grande, que é mais fácil deixar o sistema as explorarem e identificarem seu melhor uso, através de duas abordagens: uma com o agente, conhecendo as ações, mas não sabendo como e quando usá-las; e, outra que os agentes precisam descobrir as ações e, posteriormente, como usá-las.

b.
A aprendizagem por esforço oculta a camada de treinamento e teste único para a criação de modelos eficientes, algo que faz com que os algoritmos supervisionados e não supervisionados sempre apresentem melhores resultados para uma mesma aplicação, só sendo válido o seu uso em aplicações onde a quantidade de hipóteses impede a criação de uma base prévia.

c.
A aprendizagem por reforço é similar às aprendizagens lógicas, apenas sendo adicionado o passo de experimentação contínua sobre os dados já treinados.

d.
A aprendizagem por reforço é similar à forma como os humanos aprendem, ou seja, possuem uma espécie de cérebro reptiliano, em que todas as ações e hipóteses já vêm prontas para serem usadas através do esforço repetitivo de acessá-las.

e.
Os especialistas em IA indicam o não uso do aprendizado por reforço, uma vez que o custo computacional é tão elevado que a sua aplicação ainda é teórica. Assim, precisamos esperar a construção de sistemas computacionais mais robustos e acessíveis para realizar experimento e aplicações com este tipo de aprendizado.
User badge image
Mauro Dine de Lima

há 2 semanas

Respostas

User badge image

Ed Verified user icon

há 2 semanas

Vamos analisar cada uma das alternativas para identificar a correta em relação à aprendizagem por reforço: a) A estratégia incremental se dá para os processos de aprendizagem em agentes que não têm acesso aos dados prévios ou à complexidade ao traçar estas variáveis e tão grande, que é mais fácil deixar o sistema as explorarem e identificarem seu melhor uso, através de duas abordagens: uma com o agente, conhecendo as ações, mas não sabendo como e quando usá-las; e, outra que os agentes precisam descobrir as ações e, posteriormente, como usá-las. - Esta alternativa descreve bem a essência da aprendizagem por reforço, onde os agentes aprendem através da exploração e identificação de ações. b) A aprendizagem por esforço oculta a camada de treinamento e teste único para a criação de modelos eficientes, algo que faz com que os algoritmos supervisionados e não supervisionados sempre apresentem melhores resultados para uma mesma aplicação, só sendo válido o seu uso em aplicações onde a quantidade de hipóteses impede a criação de uma base prévia. - Esta alternativa não se relaciona diretamente com a aprendizagem por reforço, mas sim com algoritmos supervisionados e não supervisionados. c) A aprendizagem por reforço é similar às aprendizagens lógicas, apenas sendo adicionado o passo de experimentação contínua sobre os dados já treinados. - Embora mencione a experimentação, não captura a essência da aprendizagem por reforço, que é mais sobre a interação com o ambiente. d) A aprendizagem por reforço é similar à forma como os humanos aprendem, ou seja, possuem uma espécie de cérebro reptiliano, em que todas as ações e hipóteses já vêm prontas para serem usadas através do esforço repetitivo de acessá-las. - Esta alternativa é imprecisa e não reflete corretamente o conceito de aprendizagem por reforço. e) Os especialistas em IA indicam o não uso do aprendizado por reforço, uma vez que o custo computacional é tão elevado que a sua aplicação ainda é teórica. Assim, precisamos esperar a construção de sistemas computacionais mais robustos e acessíveis para realizar experimento e aplicações com este tipo de aprendizado. - Embora mencione um ponto válido sobre custos, não é uma descrição correta da aprendizagem por reforço em si. Após essa análise, a alternativa correta é a) porque descreve adequadamente a estratégia incremental e o funcionamento da aprendizagem por reforço.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina