Prévia do material em texto
LÍNGUA BRASILEIRA DE SINAIS LIBRAS AULA – 6 TRADUÇÃO AUTOMÁTICA DO PORTUGUÊS BRASILEIRO PARA LIBRAS Prezado aluno, A tradução automática PB-Libras comporta em si significativa complexidade por envolver dois sistemas linguísticos que se apresentam em diferentes modalidades: oral-auditiva e visual-gestual. Nesse caso, além da complexidade envolvida em qualquer processo de tradução, há particularidades entre a língua- fonte e a língua-alvo, pois a primeira se apresenta por meio de palavras ou frases escritas em um código alfabético (que representa sons), e a segunda, por meio das mãos, face e corpo e em uma sintaxe organizada no espaço. Assim, pesquisas que tratam da tradução intermodal na tradução interlingual (SEGALA; QUADROS, 2015), mesmo que ainda não frequentemente explicitadas no campo da tradução automática PB-Libras por meio desta nomenclatura, representam um desafio científico a ser encarado, explorado e possivelmente expandido, enquanto campo de pesquisa. Depreende-se, portanto, que a oferta e o contato com aplicativos de tradução automática gratuitos poderão se consolidar pelo acesso a traduções adequadas de uma língua oral-gráfica (português brasileiro [PB]) para uma língua visual-gestual (Libras). Caso contrário, poderão ocorrer prejuízos na aprendizagem de sinais e/ou palavras e/ou no uso para fins de acessibilidade interacional entre surdos e ouvintes. Bons estudos! 6. TRADUÇÃO AUTOMÁTICA DO PORTUGUÊS BRASILEIRO PARA LIBRAS Os aplicativos de tradução automática ou tradução por máquina (do inglês machine translation), no escopo da pesquisa aqui apresentada, realizam traduções do PB escrito ou falado (via captura de voz) para a Libras por meio da sinalização apresentada por agentes animados em 3D, comumente denominados avatares. Esta última denominação inclusive foi adotada em parte das pesquisas apresentadas neste capítulo. Contudo, em pesquisas recentes foi encontrado o uso de “agente animado” ou “agente animado em 3D” para referir-se à entidade animada com forma humana que produz os sinais da Libras nos aplicativos. Para apresentar as diferenças conceituais entre “avatar” e “agente animado”, toma-se o conceito proposto por Badler (1997), que classifica a representação em 3D de humanos em ambientes virtuais/interfaces digitais em duas categorias: avatares e agentes animados/virtuais, os quais comportam similitudes, mas se diferenciam em relação ao controle e à representação. Na medida em que um avatar é representado por uma entidade humana real individual, que exerce controle direto sobre suas ações, os agentes animados/virtuais são entidades relativamente autômatas controladas por software. Desse modo, entende-se que o conceito de avatar (BADLER, 1997) é aplicado aos humanos virtuais que assumem física e psicologicamente a representação de um sujeito humano real, de aparência humana ou humanoide, sendo por ele completamente controlado quanto à interação, ao movimento, à aparência e à expressão. Portanto, o usuário tem autonomia, podendo guiar seu avatar dentro de um mundo digital, que lhe permite ir e vir, parar, conversar, construir, trocar sua caracterização física, etc., assim como interagir com objetos, cenários e outros avatares (MODESTO et al., 2006). Em contrapartida, um agente animado/virtual diferencia-se do conceito de avatar, pois este é autônomo aos comandos de seu usuário quanto à execução de movimentos, fala, nome, aparência e, sobretudo, às tomadas de decisões no espaço digital em que está inserido, embora possa permitir que o usuário interfira ligeiramente em algumas de suas funcionalidades (BADLER, 1997). O usuário, ao inserir uma informação, em caráter de código de entrada, faz a animação mobilizar ações para as quais fora previamente programada, como é o caso dos aplicativos de tradução automática PB-Libras, os quais apenas realizam sinalizações em Libras. O desafio nessas traduções automáticas diz respeito a traduções que contemplem a complexidade da Libras, seja quanto aos parâmetros manuais ou expressões não manuais, entendendo que nada pode ser desconsiderado ao traduzir digitalmente conteúdo de uma língua para outra. Na continuidade da conceituação sobre tradução automática, infere-se que ela está compreendida na literatura como uma subárea do processamento de línguas naturais (PLN) e direcionada aos estudos em linguagem (DIAS-DA-SILVA, 1996), abarcando o desenvolvimento, o (re) design e a análise da qualidade de sistemas computacionais. Há, sem dúvida, no encalço dessa subárea, o desejo de construir cada vez mais diálogos consistentes entre os cientistas das ciências da computação e da linguística aplicada (DIAS-DA-SILVA, 1996; DI FELIPPO, DIAS-DA-SILVA, 2009; BIDERMAN, 1978; BERBER SARDINHA, 2005). Diante de uma sociedade digital (CASTELLS, 1999), como é a contemporânea, há o despertar de um interesse no campo científico cada vez mais voltado à área do PLN, de modo a tornar os diferentes tipos de sistemas computacionais mais eficientes, muito embora esse segmento ainda seja visto como desafiador, sobretudo quanto à tradução automática (WINOGRAD, 1972; CHOWDHURY, 2003), sob o escopo das tecnologias de apoio à tradução (MELO, 2013). A área do PLN tem por objetivo dar conta de questões relativas às línguas naturais, utilizadas socialmente pelos indivíduos, por meio de linguagens de programação aplicadas a interfaces gráficas computacionais. O PLN marcou seu território nessa área do conhecimento a partir do surgimento dos primeiros sistemas de tradução automática (CHOWDHURY, 2003; DI FELIPPO; DIAS-DA-SILVA, 2009). Um sistema computacional de tradução automática, por exemplo, precisa considerar a ambiguidade (lexical e estrutural), a complexidade sintática e as estruturas agramaticais. Um exemplo de um obstáculo na tradução automática em um aplicativo seria o de traduzir apenas um sentido para uma palavra homógrafa perfeita quando inserida isoladamente ou em sentenças nas quais o sentido da palavra homógrafa não será o mesmo. De acordo com Gauche (2013), é possível afirmar que são restritas as pesquisas científicas que abordam investigações sobre a tradução automática de línguas orais para línguas de sinais; no entanto, considerando o contexto social tecnológico atual, a área vem conquistando o olhar dos pesquisadores, seja no âmbito nacional ou internacional (BIDARRA, 2015). A partir desse interesse pelo campo da tradução automática, ela configura-se como um campo próspero. Em geral, a tradução automática está dividida em três estratégias: 1.A tradução automática baseada em regras (RBMT, do inglês rule-based machine translation) (GALLEY et al., 2004; GÜVENIR; CICEKLI, 1998) é orientada por regras morfossintáticas elaboradas de forma manual por linguistas com expertise nas áreas das línguas envolvidas (alvo e fonte) na tradução automática. 2.A tradução automática estatística (SMT, do inglês statistical machine translation) (EL MAAZOUZI; EL MOHAJIR; AL ACHHAB, 2017; GULCEHRE et al., 2015) é caracterizada pelo processo de geração da tradução da língua-fonte para a língua-alvo, de modo a adequar coerentemente o significado das palavras/sentenças traduzidas, preservando a naturalidade da língua-alvo. A adequação está apoiada em um modelo de tradução a partir de frequências por número de incidência de palavras/sentenças na língua-alvo, tendo por base um corpus de treinamento. 3.A tradução automática neural (NMT, do inglês neural machine translation) (KALCHBRENNER; BLUNSOM, 2013; CHO et al., 2014; SUTSKEVER et al., 2014; LUONG; PHAM; MANNING, 2015; LUONG et al., 2015) conta com o uso de redes neurais artificiais, que se baseiam nos dados de treinamento e aspectos linguísticos, a fim de aprender a traduzir demaneira apropriada da língua-fonte para a língua-alvo. 1.1 Aplicativos brasileiros de tradução automática PB-LIBRAS No que tange à identificação desses aplicativos, a busca realizada em diferentes dispositivos móveis, smartphones (Samsung, Motorola, Windows Phone [Microsoft] e iPhone) e tablets (Samsung Galaxy, Apple e Lenovo), quando do acesso às lojas virtuais Google Play Store (Android), Apple Store (iPhone, iPad e iPod) e Windows Phone Store, a partir da palavra-chave “tradução automática para Libras”, permitiu a identificação de quatro aplicativos brasileiros gratuitos de tradução automática PB-Libras: Hand Talk, ProDeaf Móvel, Rybená e VLibras (FIGURA 1). Figura 1 - Aplicativos de tradução PB-LIBRAS disponíveis para dispositivos móveis. Fonte: adaptada Corrêa (2017). Os aplicativos em questão, que visam ao rompimento de barreiras linguísticas entre pessoas surdas e ouvintes, foram selecionados por serem gratuitos e por fazerem uso de agentes animados em 3D para fins de apresentação do processo tradutório de palavras ou frases do PB para Libras, quando da inserção de conteúdo digitado ou registrado por meio de captura de voz. Portanto, mediante um aplicativo de tradução automática, o estabelecimento de interações sociais pode se constituir de modo mais equânime, superando, assim, entraves de ordem linguística. Dessa forma, nessas interações está em jogo a concretização de contratos conversacionais entre usuários de códigos linguísticos distintos, mas que habitam espaços sociais comuns, nos quais a Libras, uma língua natural com origem na comunidade surda brasileira (QUADROS; KARNOPP, 2004), foi reconhecida como meio legal de comunicação e expressão pela Lei nº 10.436, de 24 de abril de 2002 (BRASIL, 2002). O aplicativo Hand Talk é proveniente de pesquisas realizadas na Universidade Federal de Alagoas (UFAL) e foi lançado em 2012 por uma startup de nome homônimo ao aplicativo. O Hand Talk diferencia-se dos outros três aplicativos identificados devido a sua gama de funcionalidades, conforme é apresentado na TABELA 1. O aplicativo ProDeaf Móvel, por sua vez, é oriundo de pesquisas conduzidas na Universidade Federal de Pernambuco (UFPE) e foi lançado em 2013 por uma startup que também utiliza nome homônimo ao aplicativo. Após o lançamento dos aplicativos Hand Talk e ProDeaf Móvel, os quais se tornaram precursores no mercado brasileiro de aplicativos gratuitos para dispositivos móveis, principalmente smartphones e tablets, houve o lançamento dos aplicativos Rybená e VLibras, sendo essas tecnologias digitais desenvolvidas com o mesmo propósito dos outros aplicativos, ou seja, a inclusão social e o rompimento de barreiras comunicacionais entre a comunidade ouvinte e surda. O aplicativo Rybená foi desenvolvido pelo Grupo de Usuários Java do Distrito Federal (DFJUG) em parceria com o Instituto CTS e CTS Ltda. e lançado em 2014. Por fim, tem-se o aplicativo VLibras, lançado oficialmente em 2016, e se originou de pesquisas desenvolvidas na Universidade Federal da Paraíba (UFPB), em parceria com o Ministério do Planejamento, Desenvolvimento e Gestão (MP), por meio da Secretaria de Tecnologia da Informação (STI), Laboratório de Aplicações de Vídeo Digital (LAVID/UFPB), Rede Nacional de Ensino e Pesquisa (RNP) e Laboratório de Sistemas Distribuídos (LSD). A pesquisa voltada à origem dos aplicativos possibilitou verificar que todos foram projetados por instituições localizadas em duas das cinco regiões do Brasil: Nordeste (Hand Talk, ProDeaf Móvel e VLibras) e Centro-Oeste (Rybená). Os aplicativos Hand Talk, ProDeaf Móvel e Rybená possuem versões compatíveis com sistemas operacionais e linguagem de programação para tradução automática de conteúdo de sites, porém esse serviço não é gratuito como as versões aqui descritas, sendo ele ofertado em pacotes de tradução automática pelas empresas desenvolvedoras. Já o aplicativo VLibras disponibiliza de forma gratuita uma versão para tradução automática de sites. Acredita-se que isso se deva à parceria com o Ministério do Planejamento, Desenvolvimento e Gestão. Após o levantamento e a identificação dos aplicativos brasileiros de tradução automática PB-Libras disponíveis, eles foram instalados nos dispositivos móveis mencionados anteriormente, a fim de viabilizar a elaboração de uma lista com as principais características e funcionalidades (TABELA 1), as quais constituem essas tecnologias digitais. A descrição das características e funcionalidades dos aplicativos teve como objetivo a apresentação de particularidades de cada um e, por isso, não foram realizadas análises relacionadas à qualidade da tradução automática PB-Libras. Na TABELA 1 é possível perceber que os aplicativos se diferenciam entre si pelas suas características e funcionalidades relativas à tradução automática PB- Libras. Quanto à compatibilidade com os sistemas operacionais listados na TABELA 1 que são disponibilizados em dispositivos móveis, apenas o ProDeaf Móvel pode ser utilizado no sistema Windows Phone 8. Com relação ao tipo de inserção de conteúdo (texto ou voz) a ser traduzido de PB para Libras, todos os aplicativos permitem que o conteúdo seja digitado ou falado, com exceção do aplicativo Rybená, que não possibilita captura de voz. Convém ressaltar que o processo de captura de voz é convertido em texto, mas não há distinção fonética entre vogais abertas e fechadas, como em “colher” (talher) e “colher” (verbo). Fonte: adaptada Corrêa (2017). Em relação à categorização de um vocabulário específico conforme regiões brasileiras, o aplicativo VLibras é o único a oferecer a opção de acesso a um conteúdo que, possivelmente, contemple a noção de regionalismos linguísticos. Em dissonância às demais tecnologias digitais, o aplicativo Rybená é o único a vocalizar o conteúdo digitado, sem permitir que este seja, em seguida, traduzido. Para que o conteúdo vocalizado seja traduzido, ele precisa ser digitado novamente, sem a ativação da funcionalidade de vocalização. Uma vez que os aplicativos em questão comportam duas línguas em seus sistemas computacionais, uma oral e seu registro escrito, o PB, e a outra visual-gestual, a Libras, torna-se interessante que permitam aos usuários recursos para ativar e desativar a legenda em PB. Entretanto, o aplicativo Rybená não possibilita que a ação mencionada seja realizada, gerando assim traduções automáticas que são visualizadas nas duas línguas. Os aplicativos ProDeaf Móvel e VLibras disponibilizam uma funcionalidade denominada “dicionário”. O aplicativo Hand Talk é o único a oferecer acesso à funcionalidade “Hugo Ensina”, que apresenta vídeos temáticos direcionados à aprendizagem da Libras. No formato de vídeos com curta duração, o agente animado Hugo sinaliza um conjunto de termos temáticos para cada vídeo. Convém ressaltar que a partir de 2018 o aplicativo Hand Talk parece estar se voltando cada vez mais para a oferta de conteúdos que possam auxiliar os usuários interessados não apenas em se comunicar por meio da Libras, mas também em aprendê-la. Tanto é que em 2018 a empresa desenvolvedora do aplicativo divulgou em sua página uma ação institucional, enquanto chamada para usuários voluntários, denominada “Catalogação de Sinais Educativos”, divulgada via aplicativo e fanpage1 da empresa na rede social Facebook. A tradução automática apresentada pelos aplicativos, em geral, pode ser pausada e retomada, sendo que o único aplicativo que apresenta botões específicos para isso é o Rybená. O pleno funcionamento dos aplicativos ocorre quando estão conectados à internet, mas o Hand Talk, o ProDeaf Móvel e o VLibras funcionam parcialmente sem conexão, informando por meio de uma mensagem na tela do aplicativo que o usuário está sem internet e que, portanto, será usada datilologia. Neste momento, o usuáriopode selecionar “Ok” ou “Cancelar”, dando ou não continuidade ao uso do aplicativo. Os agentes animados virtuais em 3D dos aplicativos Hand Talk, VLibras e Rybená podem ser rotacionados em um ângulo de 360º, o que permite visualizar melhor o sinal traduzido, sob vários ângulos, enquanto o ProDeaf Móvel permite rotação em apenas 180º. No que concerne à aparência dos agentes animados em 3D, é possível notar na FIGURA 1 que os aplicativos Hand Talk e VLibras possuem traços mais cartunescos, ou seja, remetem a personagens caricaturados, se comparados aos personagens dos aplicativos ProDeaf Móvel e Rybená. As expressões corporais e faciais dos aplicativos Hand Talk e ProDeaf Móvel mostram-se mais estético- realísticas em relação aos aplicativos VLibras e Rybená. A notificação de erros de sinalização, a solicitação de sinais novos e a realização de sugestões somente são possíveis no aplicativo Hand Talk e parecem ser representativas em se tratando de um sistema computacional disponível para diferentes usuários (surdos, ouvintes, intérpretes, professores). Os aplicativos identificados têm por objetivo romper barreiras na comunicação entre ouvintes e surdos e, não obstante, no caso do Hand Talk, também contribuir para a aprendizagem da Libras. Neste cenário, permitir a seleção de diferentes níveis da velocidade da sinalização em Libras apresentada pelos agentes animados virtuais em 3D é de significativa relevância, seja para fins de comunicação ou aprendizagem da Libras como primeira língua (L1) ou segunda língua (L2). No entanto, apenas os aplicativos Hand Talk e VLibras possibilitam que a velocidade selecionada seja escolhida livremente, ao passo que no aplicativo ProDeaf Móvel são disponibilizados apenas três níveis (lenta, normal e rápida). Acredita-se que a oferta de apenas três níveis não contemple a vasta gama de distintos estilos de comunicação e aprendizagem dos usuários. Já o aplicativo Rybená apresenta botões com os sinais mais (+) e menos (–), sem quaisquer informações sobre níveis e de que efetivamente se trata da velocidade da sinalização. Para o fácil acesso às últimas palavras inseridas, seja via digitação ou captura de voz, Hand Talk e ProDeaf Móvel oferecem um pequeno histórico de pesquisa e a seleção de palavras como favoritas, enquanto os demais aplicativos não ofertam tais funções. No que se refere à disponibilização de tutoriais para fins de utilização dos aplicativos, Hand Talk e ProDeaf Móvel – ao serem instalados e usados pela primeira vez – apresentam um breve tutorial aos usuários. O Hand Talk concede acesso a uma lista de “Perguntas Frequentes”, a fim de elucidar possíveis dúvidas de utilização. O aplicativo VLibras oferece um tutorial fixo que pode ser consultado de forma contínua. Já o aplicativo Rybená não apresenta tutorial inicial ao ser instalado nem dispõe dele de modo fixo. A função “Ajuda” está presente apenas no aplicativo Hand Talk, o que sugere que os demais também possam futuramente disponibilizar tais recursos em suas plataformas digitais de tradução automática. REFERÊNCIA BIBLIOGRÁFICA BADLER, N. I. Virtual humans for animation, ergonomics, and simulation. In: THE IEEE WORKSHOP ON NON-RIGID AND ARTICULATED MOTION, 1997. Proceedings … 1997, p. 28-36. BERBER SARDINHA, A. P. (Org.). A língua portuguesa no computador. Campinas/São Paulo: Mercado de Letras/FAPESP, 2005. 296 p. BIDARRA, J. First steps towards a bilingual parallel corpus geared to the treatment of lexical ambiguity on the interface Portuguese - Libras. Cad. Trad., v. 35, n. 1, p. 225-250, jan./jun. 2015. BIDERMAN, M. T. C. Teoria linguística: linguística quantitativa e computacional. Rio de Janeiro/São Paulo: LTC, 1978. 356 p. BRASIL. Lei 10.436, de 24 de abril de 2002. Dispõe sobre a língua brasileira de sinais - Libras e dá outras providências. Diário Oficial da União, Brasília, Seção 1, n. 79, p. 23, 25 abr. 2002. Disponível em https://www.planalto.gov.br/ccivil_03/leis/2002/l10436.htm. Acesso em: 13 de mai. 2023. CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999. v. 1. CHO, K. et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation. In: Conference Of Empirical Methods In Natural Language Processing, Doha. Proceedings …, Doha: EMNLP, 2014. CHOWDHURY, G. Natural language processing. Annual Review of Information Science and Technology, v. 37, 2003. CORRÊA, Y.; GOMES, R. P.; RIBEIRO, V. G. Aplicativos de tradução português- Libras na educação bilíngue: desafios frente à desambiguação. RENOTE - Revista Novas Tecnologias na Educação, v. 15, n. 2, p. 1-10, 2017. DI FELIPPO, A.; DIAS-DA-SILVA, B. C. O processamento automático de línguas naturais enquanto engenharia do conhecimento linguístico. Calidoscópio, v. 7, n. 3, p. 183-191, 2009. DIAS-DA-SILVA, B. C. A face tecnológica dos estudos da linguagem: o processamento automático das línguas naturais. 1996. Tese (Doutorado)- Universidade Estadual Paulista, Araraquara, 1996. EL MAAZOUZI, E. Z.; EL MOJAHIR, B. E.; AL ACHHAB, M. A systematic reading in statistical translation: from the statistical machine translation to the neural translation models. JourJournal of ICT, v. 16, n, 2, p. 408-441, 2017. GAUCHE, S. Aspectos linguísticos da tradução automática da língua portuguesa para a língua brasileira de sinais (Libras) - uma reflexão inicial. Monografia (Especialização em Revisão de Textos)- Centro Universitário de Brasília, Brasília, 2013. GULCEHRE, C. et al. On using monolingual corpora in neural machine translation. 2015. GÜVENIR, H. A.; CICEKLI, I. Learning translation templates from examples. Information Systems, v. 23, n. 6, p. 353-363, 1998. KALCHBRENNER, N.; BLUNSOM, P. Recurrent continuous translation models. In: Conference Of Empirical Methods In Natural Language Processing, Washington. Proceedings …, EMNLP, 2013. p. 1700-1709. LUONG, M.; PHAM, H.; MANNING, C. D. Effective approaches to attention based neural machine translation. In: Annual Meeting Of The Association For Computational Linguistics, 53, Lisboa. Proceedings …, ACL, 2015. LUONG, M. et al. Addressing the rare word problem in neural machine translation. In: Annual Meeting Of The Association For Computational Linguistics, 53, Lisboa. Proceedings …, ACL, 2015. p. 11-19. MELO, S. S. C. Tradução automática e competência tradutória: repensando interseções. Rónai: Revista de Estudos Clássicos e Tradutórios, v. 1. n. 1, p. 60- 72, 2013 MODESTO, F. et al. Humanos virtuais e avatares. In: TORI, R.; KIRNER, C.; SISCOUTTO, R. (Org.). Fundamentos e tecnologia de realidade virtual e aumentada. Belém: SBC, 2006. QUADROS, R. M.; KARNOPP, L. B. Língua de sinais brasileira: estudos linguísticos. Porto Alegre: Artmed, 2004. SEGALA, R. R.; QUADROS, R. M. Tradução intermodal, intersemiótica e interlinguística de textos escritos em português para a Libras oral. Cad. Trad., v. 35, n. especial 2, p. 354-386, 2015. SILVA, A. C. A representação social da surdez: entre o mundo acadêmico e o cotidiano escolar. In: LODI, A. C. B.; MÉLO, A. D. B.; FERNANDES, E. (Org.). Letramento, bilinguismo e educação de surdos. 2.ed. Porto Alegre: Mediação, 2015. SUTSKEVER, I.; VINYALS, O.; LE, Q. V. Sequence to sequence learning with neural networks. In: International Conference On Neural Information Processing Systems, 27, Montréal. Proceedings …, Montréal: NIPS, 2014. p. 3104-3112. VIEIRA, M. C. et al. Análise de expressões não manuais em avatares tradutores de língua portuguesa para Libras. Nuevas Ideas en Informática Educativa, v. 10. p. 172-183, 2014. WINOGRAD, T. Understanding natural language. New York: Academic Press, 1972.