O treinamento é realizado utilizando uma entrada e uma saída esperada. O Decoder recebe como parâmetro tanto o decoder inputs quanto o estado inicial dado pelo Encoder Vector (encoder_states). Este modelo utiliza uma arquitetura Encoder-Decoder, com um total de 22102 parâmetros. Este modelo pode ser utilizado para fazer inferências, ou seja, descobrir um valor de saída a partir de uma entrada. No Encoder são utilizadas células LSTM, porém não no Decoder