Prévia do material em texto
LINGUÍSTICA FORENSE Rui Sousa-Silva, Malcolm Coulthard Rui Sousa-Silva é professor auxiliar convidado da Faculdade de Letras e investigador de pós-doutoramento do Centro de Linguística (CLUP) da Universidade do Porto, onde desenvolve atualmente a sua investigação em Linguística Forense e Cibercrime. É doutorado em Linguística Aplicada pela Aston University (Birmingham, Reino Unido), onde defendeu com máximo êxito a sua tese em Linguística Forense: “Detecting Plagiarism in the Forensic Linguistics Turn”. Nesta tese, investigou atitudes transculturais relativamente ao plágio e propôs uma abordagem à deteção de plágio translingue. É, também, autor e coautor de vários artigos sobre análise de autoria (computacional) e coeditor, com o Professor Malcolm Coulthard, da recém-criada revista internacional bilíngue Language and Law - Linguagem e Direito. Malcolm Coulthard é Professor Emérito de Linguística Forense da Aston University e Professor Visitante da Universidade Federal de Santa Catarina, Brasil. Apesar de ser, provavelmente, mais conhecido pelo seu trabalho sobre análise de discurso falado e escrito, desde o final dos anos 80 tem-se dedicado cada vez mais às aplicações forenses da linguística. Redigiu relatórios periciais de mais de 220 casos e foi testemunha pericial em casos de atribuição de autoria em tribunais de recurso de Londres, bem como em tribunais de primeira instância de Inglaterra, Alemanha, Hong Kong e Irlanda do Norte. Entre as suas publicações (com a Doutora Alison Johnson) na área da linguística forense, encontram-se (com a Doutora Alison Johnson) An Introduction to Forensic Linguistics, de 2007, e A Handbook of Forensic Linguistics, de 2010. É coeditor, com o Doutor Rui Sousa-Silva, da nova revista internacional Language and Law - Linguagem e Direito. CONCEITO A linguística é o estudo sistemático da linguagem, incluindo as suas estruturas e os seus usos. Esta área científica encontra-se dividida em duas subáreas principais: descritiva e aplicada. A Linguística Descritiva dedica-se ao estudo da estrutura da linguagem e à caracterização do conhecimento linguístico dos falantes e abrange: a fonologia, o estudo da organização dos sons da fala; a morfologia, o estudo da estrutura e formação das palavras; a sintaxe, o estudo da combinação das palavras e da sua organização na frase; e a semântica, o estudo do significado de determinadas palavras e combinações de palavras. Por contraponto, a Linguística Aplicada é a área da linguística que estuda e soluciona problemas da vida real, incluindo, entre outras, a Linguística Forense. A Linguística Forense pode definir-se no sentido lato ou no sentido mais restrito (Coulthard & Johnson, 2010). No sentido lato, inclui três subáreas: a) linguagem escrita da lei; b) interação verbal em contextos legais; e c) linguagem como prova. Em sentido restrito, a definição de Linguística Forense limita a disciplina à linguagem como prova. Neste capítulo, adotamos a definição restrita e concentramo-nos no trabalho do linguista forense como testemunha pericial. ABRANGÊNCIA Como referimos, uma das subáreas da linguística dedica-se ao estudo dos sons da fala, através da análise das unidades mínimas sonoras, os fones, a sua produção fisiológica, as suas propriedades acústicas, a sua perceção auditiva e o seu estado neurofisiológico. A Fonética Forense, que se desenvolveu independentemente da linguística forense, concentra-se nas gravações de áudio, tendo em vista um de dois objetivos: determinar ?ou aquilo que é dito ou quem o disse. Três outras áreas que são frequentemente, ainda que indevidamente, associadas à linguística são a fonoaudiologia, a acústica e a análise de escrita manual. A Fonoaudiologia é a ciência que estuda o modo como o sistema auditivo humano perceciona os sons da fala, diagnosticando e tratando distúrbios auditivos e articulatórios. A Acústica consiste no estudo de todos os tipos de som, focando em especial a sua produção, transmissão e síntese. O trabalho e as técnicas da investigação em acústica são regularmente utilizados por foneticistas forenses. Finalmente, a Análise da Escrita Manual detém-se no estudo das unidades mínimas de escrita, os grafemas, para determinar o produtor físico de uma determinada assinatura ou de um documento completo. O seu estatuto enquanto ciência é questionado por vários estudiosos e advogados. Estas áreas disciplinares complementam, por vezes, a linguística forense. Assim, perante um testamento manuscrito cuja autenticidade é questionada, cabe ao analista de escrita manual exprimir a sua opinião sobre quem terá escrito o texto e ao linguista investigar quem o compôs efetivamente. No caso de uma gravação de áudio clandestina, o especialista em acústica poderá “limpar” a gravação com o objetivo de eliminar o ruído de fundo, de modo a que o foneticista forense possa isolar melhor as características distintivas dos sons da fala. Nos últimos trinta anos, a frequência com que os linguistas e foneticistas forenses foram contratados como peritos aumentou consideravelmente, quer nos países anglo-saxónicos, quer do norte da Europa. Essas perícias versam temas tão diversos como violação de direito de autor e marcas comerciais, plágio, eficácia de rótulos de advertências (por exemplo, em produtos de consumo), identificação de falantes, país de origem de requerentes de asilo, competência linguística de suspeitos que são falantes não nativos, qualidade de tradução e interpretação em contextos legais, significado de trechos significativos ou, inclusivamente, de determinadas palavras, textos falados e escritos, bem como a autoria de mensagens de texto, emails, tweets, cartas de suicídio, testamentos e confissões policiais contestadas (Coulthard & Johnson, 2007 Capítulos 6-9). De seguida, discutimos três subáreas em particular: Análise de Autoria Forense, Determinação de Significados e Cibercrime. A Análise de Autoria Forense ocupa um lugar importante no paradigma das ciências forenses, constituindo uma área inerentemente interdisciplinar, que se encontra no cruzamento entre as disciplinas da Linguística e do Direito. Essencialmente, os linguistas procedem à análise de textos escritos com o objetivo de identificarem características linguísticas distintivas do estilo de determinado autor, executando uma de duas tarefas: Determinação do Perfil Sociolinguístico ou Atribuição de Autoria. A Determinação do Perfil Sociolinguístico é, geralmente, solicitada quando a polícia não possui hipóteses sólidas sobre a identidade do(s) autor(es), cabendo ao linguista procurar pistas linguísticas indicativas da idade, sexo e contexto social e regional do escritor. A título de exemplo, refira-se uma carta de reclamação contra o governo enviada ao então Primeiro Ministro Britânico, Tony Blair, escrita em papel timbrado oficial da Polícia de West Midlands por alguém que, explicitamente, alegava ser um agente policial de raça branca. A análise, porém, isolou algumas escolhas linguísticas típicas do inglês das Índias Ocidentais, tendo-se comprovado, após detenção do autor, tratar-se de um imigrante negro das Índias Ocidentais. A Análise de Autoria é realizada quando existirem um ou mais textos contestados e um ou mais potenciais autores. A análise de autoria forense consiste, neste caso, em identificar padrões linguísticos a todos os níveis: sintaxe, semântica, léxico-gramática e discurso, bem como ortografia, pontuação e estrutura gráfica – e, cada vez mais, no caso de comunicação mediada por tecnologias da informação e da comunicação, inicialismos (ou alfabetismos) e emojis. No seu conjunto, estas características linguísticas compõem as idiossincrasias distintivas de determinado autor nas quais se baseia qualquer atribuição de autoria. Normalmente, são fornecidos ao analista, não só o(s) texto(s) de autoria desconhecida ou contestada, mas também um conjunto de textos escritos pelo(s) suspeito(s). A tarefa do linguista consiste, então, em analisar, em primeiro lugar, o(s) texto(s)-problema no sentido de identificar características distintivase, de seguida, procurar a sua (não-)ocorrência nos textos de autoria conhecida e, com base nesta análise, em incluir ou excluir determinado autor. Os textos contestados podem ser testamentos, ameaças, cartas de suicídio, etc.; porém, a última década assistiu a um aumento exponencial da análise de emails, mensagens de texto e, mais recentemente, tweets, mensagens do Facebook e do WhatsApp. Esta tendência complicou o trabalho do linguista forense, uma vez que, quanto mais curto for o texto, menos distintiva é a informação nele contida. Contudo, investigação recente sobre análise de tweets revelou que é possível obter bons resultados com apenas 100 mensagens (Sousa-Silva et al., 2011). O método de análise adotado depende do volume de dados. Os textos de natureza forense são, normalmente, curtos e de número reduzido, exigindo, por isso, uma análise pormenorizada de natureza qualitativa. A função do linguista é, neste caso, procurar no(s) texto(s) todas as características distintivas e, de seguida, características linguísticas semelhantes nos textos dos autores candidatos. Quanto mais elevada for a quantidade de textos-problema e de textos cuja autoria é conhecida, melhor poderá o linguista caracterizar o estilo de escrita dos autores e, assim, sustentar os resultados da análise qualitativa com resultados quantitativos, reforçando desse modo a validade e a fiabilidade da sua perícia. Por conseguinte, não é de admirar que a análise linguística forense beneficie do contributo de outros domínios científicos, incluindo a estatística e a linguística computacional, que são particularmente úteis no caso da análise quantitativa de grandes volumes de dados, em que o processamento manual e a análise qualitativa são difíceis ou, mesmo, humanamente impossíveis. Embora não exista nenhum sistema informático capaz de substituir o linguista no reconhecimento e processamento de texto, bem como na avaliação de dados estatísticos, os programas informáticos são capazes de processar grandes quantidades de texto de forma rápida e consistente, evitando, simultaneamente, os erros resultantes da fadiga humana. Como seria de esperar, embora alguns métodos de análise sejam independentes da língua, como é o caso das frequências de palavras e da análise de N-gramas (a identificação de repetições de curtas sequências ? place here to avoid ambiguity? significativas de letras ou palavras significativas), outros são específicos da língua, pelo que, por exemplo, algumas medidas robustas decorrentes da extensa investigação em linguística forense aplicada ao inglês não podem ser adotadas na análise do português. Cada língua levanta questões novas e coloca desafios específicos, sobretudo no que diz respeito à identificação de marcadores de autoria robustos. Uma aplicação forense na qual os linguistas têm sido particularmente bem-sucedidos é a deteção de plágio, sobretudo decorrente da descoberta de que as sequências de palavras formuladas por determinada pessoa rapidamente se tornam produções únicas. Assim, atualmente o linguista pode presumir com elevado grau de confiança que, se dois textos partilharem uma sequência de 10 ou mais palavras idênticas, a probabilidade de essa sequência ter sido produzida independentemente da do outro texto é praticamente nula, o que significa que, ou um autor terá copiado a sequência de palavras do outro, ou então os dois copiaram a sequência de um terceiro autor. Esta observação foi utilizada, quer em casos de plágio académico, quer em recursos contra erros judiciais, em que se provou que a polícia falsificou depoimentos, copiando expressões, literalmente, de outros textos. A deteção de plágio em textos na mesma língua tornou-se cada vez mais simples e direta, sobretudo graças ao software de deteção de plágio colocado no mercado. Contudo, a deteção de plágio translingue, em que o texto retirado de um original noutra língua é traduzido e reutilizado numa segunda língua, é consideravelmente mais complexo, uma vez que não é possível estabelecer uma comparação direta com os possíveis originais. Para estes casos, Sousa-Silva (2014) propõe um método que deteta com êxito este tipo de plágio, método esse que consiste em traduzir o texto suspeito para a hipotética língua original e pesquisar na Internet sequências de palavras idênticas ou semelhantes, comparando, de seguida, os potenciais originais com o(s) texto(s) suspeitos para avaliar o grau de sobreposição textual e ideacional. Os linguistas forenses também são frequentemente contratados para recolherem elementos de prova em casos de Determinação de Significados, habitualmente de determinada palavra ou expressões curtas. Nesta matéria, os linguistas já contribuíram para a clarificação de significados em contratos legais, bem como para ajudar os tribunais a decidir se determinadas expressões constituem calúnia, injúria ou difamação, ou mesmo se determinados trechos linguísticos constituem uma ameaça ou são prova de crime de ódio. Existem, também, casos em que os suspeitos utilizam deliberadamente linguagem fora do comum ou codificada para disfarçar a natureza do crime em causa, baseando-se o linguista em dicionários urbanos e em comunicações de grupo para informar o tribunal. Uma área linguística relacionada com a determinação de significados, ainda que distinta, é a disputa de marcas comerciais, em que os linguistas avaliam os graus de semelhança e confusão linguística de duas marcas. Por exemplo, no Brasil a marca de whisky Johnny Walker processou e impediu a utilização do nome João Andante como marca de cachaça, e a Unilever impediu a Davene de utilizar a marca Dave como marca de sabonete, argumentando que o nome colidia com a sua internacionalmente conhecida marca Dove. A prova linguística forense também tem sido utilizada em casos de Cibercrime, ou seja, em casos de crimes cometidos online, utilizando tecnologias da informação e da comunicação como computadores, smartphones e outros equipamentos sem fios. O cibercrime engloba crimes de ódio, ameaça, injúria, calúnia e difamação, bem como fraude, roubo de identidade (sobretudo através da criação de perfis falsos nas redes sociais, como o Facebook), vandalismo eletrónico e violação de direitos de propriedade intelectual, quer em forma de crime organizado, quer em forma de crime não organizado. No combate a este tipo de crimes, os linguistas forenses colaboram com especialistas em ciências dos computadores. PERSPETIVAS FUTURAS O principal contributo dos linguistas forenses assume a forma de análise de autoria. Por exemplo, o inglês é atualmente a língua mais utilizada por criminosos, embora não seja, frequentemente, a sua primeira língua (basta pensarmos nos esquemas de extorsão financeira Nigerianos), pelo que se tem verificado um investimento significativo dos serviços de segurança de vários países na melhoria das técnicas informáticas de identificação da língua materna dos escritores. Até ao momento, o trabalho de linguística forense tem sido, maioritariamente, de natureza analítica; porém, recentemente um grupo de linguistas forenses no Reino Unido tem trabalhado com uma unidade policial de combate à pedofilia para ajudar os agentes a analisar e a sintetizar os textos. O objetivo é que os agentes consigam emular em tempo real a linguagem interativa online de adolescentes, de modo a que, quando tomarem [is this ambiguous between agente and adolescente?] o teclado a meio da interação, o pedófilo com quem a rapariga estava a interagir não perceba que já não está a comunicar com uma criança. REFERÊNCIAS Coulthard M, Johnson A. An Introduction to Forensic Linguistics. London: Routledge, 2007. Coulthard M, Johnson A (eds). The Routledge Handbook of Forensic Linguistics. London: Routledge, 2010. Coulthard M, Sousa-Silva R (eds). Bilingual journal: Language and Law, Linguagem e Direito. 2014. Downloadable free at http://llld.linguisticaforense.pt/ Sousa-Silva R. Detecting translingual plagiarism and the backlash against translation plagiarists. Language and Law / [we need consistencyLinguagem e Direito,1(1): 70-94, 2014. Sousa-Silva R, Laboreiro G, Sarmento L, Grant T, Oliveira E, Maia B. ‘Twazn me!!!’ Automatic authorship analysis of micro-blogging messages. Natural Language Processing and Information Systems, 161-168. Springer, 2011.