Buscar

O problema do desaparecimento ou explosão do gradiente é mais aparente em redes neurais recorrente do que nas redes em redes alimentadas adiante. Q...

O problema do desaparecimento ou explosão do gradiente é mais aparente em redes neurais recorrente do que nas redes em redes alimentadas adiante. Quais das afirmativas abaixo embasam, de forma correta, essa afirmação?
I. Ao contrário das redes alimentadas adiante, os parâmetros de neurônios de uma dada camada são replicados ao longo da sequência (unrolling/unfolding), logo, se um neurônio está saturado (derivada próxima a zero), esse valor será replicado diversas vezes, conduzindo ao desaparecimento do gradiente.
II. A profundidade em uma rede alimentada adiante está diretamente relacionada ao número de camadas, porém, em redes recorrentes a profundidade também está associada ao tamanho da sequência utilizada, logo, considerando a profundidade temporal (tamanho da sequência), uma rede recorrente pode ser muito mais profunda que a sua contrapartida alimentada adiante.
III. As redes recorrentes possuem mais parâmetros que as redes alimentadas adiante, o que agrava o problema do desaparecimento ou explosão do gradiente durante o treinamento do modelo.
A. Apenas a afirmação I está correta.
B. Apenas as afirmações II e III estão corretas.
C. Apenas as afirmações I e II estão corretas.
D. Apenas a afirmação II está correta.
E. Apenas as afirmações I e III estão corretas.

Essa pergunta também está no material:

AP Sem3 Atv10
6 pág.

Aprendizado Universidade Virtual do Estado de São PauloUniversidade Virtual do Estado de São Paulo

Respostas

User badge image

Ed Verified user icon

A alternativa correta é a letra C, apenas as afirmações I e II estão corretas. A afirmação I está correta, pois nas redes neurais recorrentes, os parâmetros de neurônios de uma dada camada são replicados ao longo da sequência, o que pode levar ao desaparecimento do gradiente se um neurônio estiver saturado. A afirmação II também está correta, pois em redes recorrentes, a profundidade está associada ao tamanho da sequência utilizada, o que pode tornar a rede muito mais profunda que a sua contrapartida alimentada adiante. A afirmação III está incorreta, pois as redes recorrentes não possuem necessariamente mais parâmetros que as redes alimentadas adiante.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image