Buscar

Questão 7: Aprendizagem de máquina (machine learning) é uma subárea da inteligência artificial, que se concentra em desenvolver técnicas e algoritm...

Questão 7: Aprendizagem de máquina (machine learning) é uma subárea da inteligência artificial, que se concentra em desenvolver técnicas e algoritmos. Aprendizagem de máquina é dividida em três categorias principais: aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. O que é aprendizado por reforço?


A) Treinar um algoritmo com dados rotulados.
B) Treinar um algoritmo com dados não rotulados.
C) Treinar um algoritmo por meio de uma série de ações e recompensas.
D) Fazer com que o algoritmo generalize as entradas dos dados.
E) Fazer com que o algoritmo aprenda a identificar padrões nos dados.

Essa pergunta também está no material:

Avaliação AP - Inteligência Artificial - UNIP
3 pág.

Inteligência Artificial Universidade PaulistaUniversidade Paulista

💡 1 Resposta

User badge image

Kevin

C) Treinar um algoritmo por meio de uma série de ações e recompensas.

O aprendizado por reforço é uma das categorias principais da aprendizagem de máquina. Nesse tipo de aprendizado, um algoritmo de aprendizado é treinado para tomar decisões sequenciais através de interações com um ambiente. O agente de aprendizado recebe feedback em forma de recompensas ou punições com base em suas ações e seu objetivo é aprender a tomar ações que maximizem a recompensa acumulada ao longo do tempo.

O aprendizado por reforço é inspirado no princípio de condicionamento operante, onde o agente aprende a associar ações com recompensas ou punições. O algoritmo de aprendizado por reforço utiliza técnicas como a aprendizagem de políticas, aprendizagem baseada em valor e algoritmos de busca para otimizar as ações tomadas pelo agente.

Esse tipo de aprendizado é frequentemente aplicado em problemas em que não há dados rotulados disponíveis, e o agente deve explorar o ambiente e aprender a partir das consequências de suas ações. Exemplos de aplicações do aprendizado por reforço incluem jogos de tabuleiro, robótica, controle de processos industriais e tomada de decisões em tempo real.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais