A alternativa correta é a letra B) V - V - F - V. Explicação: - (V) Usa as recompensas e punições como sinais e comportamento negativo e positivo: O reinforcement learning utiliza recompensas e punições para incentivar ou desencorajar determinados comportamentos. - (V) Funciona também de forma diferente do aprendizado não supervisionado: O reinforcement learning é um tipo de aprendizado de máquina que difere do aprendizado não supervisionado. - (F) Envolve encontrar um modelo de ação adequado que consiga maximizar a recompensa: O objetivo do reinforcement learning é encontrar a melhor ação possível para maximizar a recompensa, não necessariamente um modelo de ação adequado. - (V) Efetua mapeamento entre entrada e saída: O reinforcement learning envolve mapear uma entrada (situação) para uma saída (ação). Portanto, a sequência correta é V - V - F - V.
Para escrever sua resposta aqui, entre ou crie uma conta
Prática Oral em Língua Inglesa I
•UniCesumar
Compartilhar