A alternativa correta é: "Apenas as afirmativas II e III estão corretas." Explicação: O aprendizado por reforço clássico (RL) e o aprendizado por reforço profundo (DRL) são duas abordagens diferentes de aprendizado por reforço. Algumas diferenças entre elas são: I. O RL clássico usa uma tabela de valores para armazenar as recompensas esperadas para cada estado e ação possíveis, enquanto o DRL usa uma rede neural para estimar esses valores. II. O DRL é capaz de lidar com espaços de estados e ações maiores e mais complexos do que o RL clássico, graças à capacidade das redes neurais de generalizar a partir de exemplos. III. O DRL é mais adequado para lidar com entradas de alta dimensionalidade, como imagens, enquanto o RL clássico é mais adequado para entradas de baixa dimensionalidade, como valores numéricos. Portanto, apenas as afirmativas II e III estão corretas.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar