Logo Passei Direto
Buscar

Inteligência Artificial

Humanas / Sociais
Questão 07 O Deep Reinforcement Learning (DRL) combina técnicas de aprendizado por reforço com redes neurais profundas, permitindo que agentes aprendam a realizar tarefas complexas em ambientes dinâmicos, como jogos, robótica e controle de sistemas. Nesse contexto, leia o trecho a seguir: No Deep Reinforcement Learning, o agente aprende a maximizar recompensas cumulativas por meio da __________. Assinale a alternativa que preenche corretamente a lacuna. A Execução de tarefas sem a necessidade de explorar o ambiente B Interação com um ambiente, tomando ações e recebendo feedback em forma de recompensas C Aplicação de técnicas de aprendizado supervisionado com rótulos pré-definidos. D Utilização exclusiva de algoritmos de clustering para tomar decisões. E Geração de embeddings para representar estados do ambiente.
User badge image
Marco Tulio

ontem

Respostas

User badge image

Ed Verified user icon

ontem

Para preencher a lacuna na frase sobre Deep Reinforcement Learning (DRL), precisamos entender como os agentes aprendem nesse contexto. O DRL se baseia na interação do agente com o ambiente, onde ele toma ações e recebe feedback na forma de recompensas, o que é fundamental para o aprendizado por reforço. Vamos analisar as alternativas: A) Execução de tarefas sem a necessidade de explorar o ambiente - Isso não é correto, pois a exploração é essencial no aprendizado por reforço. B) Interação com um ambiente, tomando ações e recebendo feedback em forma de recompensas - Esta alternativa descreve exatamente como o aprendizado por reforço funciona. C) Aplicação de técnicas de aprendizado supervisionado com rótulos pré-definidos - Isso não se aplica ao DRL, que não utiliza rótulos pré-definidos. D) Utilização exclusiva de algoritmos de clustering para tomar decisões - Algoritmos de clustering não são utilizados no contexto de DRL. E) Geração de embeddings para representar estados do ambiente - Embora a geração de embeddings possa ser uma parte do processo, não é a descrição principal do aprendizado em DRL. Portanto, a alternativa correta que preenche a lacuna é: B) Interação com um ambiente, tomando ações e recebendo feedback em forma de recompensas.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina