Prévia do material em texto
1/3 AI traduz comprimidos cuneiformes de 5.000 anos de idade em inglês Cuneiforme é um dos primeiros sistemas de escrita da história humana. Os arqueólogos o rastrearam até 3400 aC, há 5.400 anos atrás. Também durou muito tempo, mais de 3.000 anos. Os pesquisadores encontraram milhares de textos escritos em cuneiforme nas línguas suméria e acadiana – agora, eles treinaram uma rede neural que pode traduzir esses textos para o inglês sem esforço. Cátules comprimidos cuneiformes em sumério. Créditos da imagem: David Morgan-Mar. Uma língua velha e misteriosa A língua acadiana é uma das primeiras línguas semíticas conhecidas, uma família que inclui línguas modernas, como árabe e hebraico. Foi falado na antiga Mesopotâmia, principalmente no Império Acadiano que estava situado na região que hoje é parte do Iraque e nordeste da Síria. A acadiano é nomeado após a antiga cidade de Akkad, um dos principais centros da civilização acadiana. O acadiano foi utilizado para uma ampla gama de propósitos, desde documentos administrativos e legais até literatura e textos científicos. Foi escrito usando escrita cuneiforme em tabuletas de argila, e sua decifração no século 19 abriu uma nova janela para o mundo antigo, proporcionando aos estudiosos informações valiosas sobre a história, cultura e realizações científicas da época. Enquanto isso, o sumério é uma das línguas mais antigas do mundo, e tem a distinção de ser uma língua isolada, o que significa que não tem parentes conhecidos. Foi falado na antiga Suméria, uma região localizada na parte sul do que é hoje o Iraque moderno. Os sumérios são creditados com o estabelecimento de uma das primeiras civilizações do mundo por volta de 4500 aC, e sua sociedade floresceu até cerca de 2000 aC. Ambas as línguas usavam o sistema de escrita cuneiforme, assim como várias outras línguas. Mas traduzir cuneiforme provou ser muito desafiador. A decifração completa de cuneiforme levou mais de 200 anos, de 1802 a 2022. A história começa com a chamada Inscrição de Behistun. Descoberto no Irã e que remonta ao tempo do rei Dario I da Pérsia (550 aC), esta inscrição multilíngue incluía três tipos de escrita: persa antiga, elamita e cuneiforme acadiano. O persa antigo foi decifrado primeiro, fornecendo pistas para os outros dois. Os estudiosos gradualmente trabalharam em decifrar e entender cuneiforme, e depois de alguns momentos Eureka e muito trabalho duro, eles finalmente alcançaram uma boa compreensão do cuneiforme. Para alguns pesquisadores, isso não foi suficiente. Eles queriam tornar a tradução mais uniforme mais disponível – então eles se voltaram para a inteligência artificial (IA). Cuneiforme, conheça a IA https://cdn.zmescience.com/wp-content/uploads/2023/10/4158.jpg.png https://www.zmescience.com/research/the-complete-akkadian-dictionary/ https://isac.uchicago.edu/sites/default/files/uploads/shared/docs/sumerians.pdf https://www.newworldencyclopedia.org/entry/Behistun_Inscription https://lrc.la.utexas.edu/eieol/aveol 2/3 Nos últimos anos, as traduções de idiomas já deram um longo caminho – e a IA está acelerando muito essas tendências em automação. As traduções de IA estão se aproximando de um momento decisivo, com algumas conquistas bastante impressionantes. No novo estudo, Shai Gordin e colegas da Universidade Ariel descreveram um modelo de IA que pode traduzir automaticamente o texto acadiano escrito em cuneiforme para o inglês. Por enquanto, isso só está disponível para esse idioma específico (nem todos os idiomas que usam o trabalho de script cuneiforme no momento), mas ainda é notável. Esta é uma continuação de um estudo anterior de Gordin e colegas que também analisou como a IA pode ser usada para traduzir cuneiformes. Desta vez, foram treinadas duas versões do modelo. O primeiro traduz o acadiano de representações cuneiformes em escrita de Lain (chamada transliteração). A outra versão se traduz em representações unicode de sinais cuneiformes (que é como cuneiforme é frequentemente digitalizado). Representação do processo de tradução. Créditos da imagem: Gutherz et al (2023). A primeira versão deu melhores resultados no estudo, alcançando uma pontuação de 37,47 no Melhor Estudo de Avaliação Bilíngue 4 (BLEU4). O escore de Substudio de Avaliação Bilíngue (BLEU) é uma métrica usada para avaliar a qualidade das traduções geradas por máquina. Ele mede o quão perto uma tradução automática de um texto corresponde a um conjunto de traduções de referência criadas por humanos. A pontuação varia de 0 a 1 (ou 0 a 100), com pontuações mais altas indicando melhores traduções. Mesmo tradutores humanos experientes geralmente não recebem 100, e para uma língua como cuneiforme, 37 é bom o suficiente para obter uma tradução decente. Um exemplo de tradução cuneiforme automática realizada pela nova IA. Crédito: Os curadores do Museu Britânico. https://www.timekettle.co/ https://www.zmescience.com/future/ai-for-speech-recognition-is-nearing-a-watershed-moment/ https://www.zmescience.com/science/ai-technology-can-now-translate-thoughts-into-words-and-this-is-incredibly-useful-in-some-situations/ https://www.zmescience.com/science/ai-reads-translates-cuneiform-052352/ https://cdn.zmescience.com/wp-content/uploads/2023/10/pgad096f1-scaled.jpeg https://towardsdatascience.com/bleu-bilingual-evaluation-understudy-2b4eab9bcfd1 https://cdn.zmescience.com/wp-content/uploads/2023/10/AI-translation.jpeg 3/3 Exemplo de uma tradução adequada do teste de 5 textos com a máquina. O modelo alcança os melhores resultados em frases de curta e média duração. Conforme as frases ficam mais longas, o modelo luta para entender todo o contexto – embora isso possa ser treinado no futuro, dizem os pesquisadores. Outra deficiência é que o modelo também “alucina” – cria resultados que são sintaticamente corretos, mas completamente dissociados do significado do texto original. Isso é algo que outros motores, principalmente ChatGPT, também fazem às vezes. Considere o seguinte exemplo: A sentença de 2.753 Fonte: UD 21-KAM2 LUGAL ina E2-DINGIR E2-DINGIR la ur-rad Tradução humana: “No dia 21 o rei não desce à Casa de Deus”. Tradução automática: “No dia 21, o rei desce à Casa de Deus”. Neste caso, a IA fez um ótimo trabalho de traduzir a maior parte do conteúdo. No entanto, um erro que provavelmente ocorreu ao limpar os dados para treinamento fez com que a IA perdesse a negação, alterando completamente o significado da frase. In the majority of cases, however, the translation was very useful as a first-pass of the text. Researchers say the AI can be used by scholars or even by students who want to study this language in more detail. Moreover, as this technology becomes more widespread, it’s not far-fetched to imagine its application in classrooms, museums, and even interactive historical experiences, allowing us to engage with the past in unprecedented ways. It’s a tantalizing glimpse of the potential that lies at the intersection of history and technology, a synthesis that could redefine our understanding of who we are and where we come from. The study was published in PNAS Nexus. Isso foi útil? Thanks for your feedback! Posts relacionados https://cdn.zmescience.com/wp-content/uploads/2023/10/m_pgad096f5.jpeg https://www.zmescience.com/science/student-ai-translate-sign-language-english-16022022/ https://academic.oup.com/pnasnexus/article/2/5/pgad096/7147349?login=false