Questão 2/10 Introdução à Inteligência Artificial. O Aprendizado por Reforço (Reinforcement Learning) é uma abordagem em Inteligência Artificial onde um agente aprende a tomar decisões otimizadas ao interagir com um ambiente, buscando maximizar recompensas ao longo do tempo. Sobre O funcionamento geral desse processo, analise as afirmacoes abaixo. Selecione a alternativa que descreve corretamente como O Aprendizado por Reforço opera de modo geral. A o agente utiliza um conjunto fixo de regras programadas para reagir a situações específicas no ambiente, sem aprendizado a partir de experiências. B o agente aprende exclusivamente a partir de dados rotulados fornecidos previamente, sem interação direta com O ambiente. C o agente interage com O ambiente, toma ações, recebe recompensas ou punições, e ajusta seu comportamento para maximizar a recompensa acumulada ao longo do tempo. D O agente analisa dados históricos para prever ações futuras, sem necessidade de interação em tempo real com O ambiente. E o agente aplica algoritmos de busca exaustiva para encontrar a melhor ação possível em cada estado, sem considerar recompensas ou punições.