Prévia do material em texto
~rB (1999) CONCEITO LINGÜÍSTICa DE PALAVRA Maria Tereza Camargo Biderman,UNES?,Campus de Araraquara RESUMO o conceito de palavra é problema complexo em Lingüística, não sendo possível definir a palavra de modo universal. A definição de palavra, bem como sua identifi- cação no nível do discurso, tem que ser feita língua a língua. Discute-se aqui a problemática da segmentação do discurso em unidades léxicas, sua conceituação e a terminologia adequada a uma ciência lexicológica. Também se apontam as incoe- rências da tradição gráfica e da práxis lexicográfica. E propõe-se, ainda, uma análise das unidades complexas do sistema. 1. RElATIVIDADE DO CONCEITO DE PAlAVRA No VI Congresso Internacional de Lingüística, realizado em Paris, em 1948, onde se deveria discutir as noções fundamentais da Lingüística Clássica, tais como a Palavra, a Frase, a Morfologia, a Sintaxe, esses conceitos foram seriamente questionados. Assim aconteceu, por exemplo, com o conceito de palavra. Esse tópico dividiu, muitas vezes, a assembléia dos lingüistas presentes em posições conflitantes e radi- cais. Houve quem propusesse a proscrição definitiva deste termo da nomenclatura lingüística, devido à sua imprecisão e à impossibilidade de se chegar a um acordo sobre a sua definição ideal. Trnka, em seu "Relatório sobre o Congresso", teve que Constatar que não se chegara a um consenso sobre uma definição válida e aceitável de palavra. Alguns lingüistas, como Holt, até propuseram o banimento do conceito de palavra da Lingüística. Entretanto, uma vez abandonada a noção de palavra, todas as noções básicas, construídas em torno dela e sobre ela, perdem o pé. É o que acontece com a noção de frase, assim como a de morfologia e a de sintaxe, pois o sistema da gramática clássica foi montado em torno do eixo palavra-frase que, com o abandono de um de seus pólos, desmorona. Já bem antes de 1948, a obra clássica de Bloomfield sobre a linguagem, Language, não registrara sequer um capítulo sobre a palavra. Esse lingüista propôs como con- ceitos operacionais o morfema (forma significante mínima e recorrente) e a forma livre mínima. Para ele, nos sintagmas the writer, a book, teríamos quatro formas livres mínimas: the, a, writer, book. Se compararmos writer e writing temos aí duas formas livres mínimas; porém, os afixas -er e -ing são morfemas, formas presas ao ~ '"wo ãi o ~-c~-co ~ '"i:!! ~ '"-c~• ~g: :::<-c :::< Elío ã5 o <.!> '"<:::E-co ~ '"~ -c 12-c::E•= w>-a: êf ....,.~, radical writ-. Esses morfemas são sígnifícantes, indicando respectivamente o agente (-er) e o aspecto gerundial (-iniJ· Embora eu seja adepta de um relativismo lingüístico moderado, considero que o conceito de palavra não pode ter um valor absoluto; ele é relativo e varia de língua para língua. De fato, a afirmação mais geral que se pode fazer é que essa unidade psicolingüística se materializa, no discurso, com uma inegável individualidade. Os seus contornos formais situam-na entre uma unidade mínima gramatical significativa - o morfema - e uma unidade sintagmática maior - o sintagma. Pode-se afirmar também que a velha gramática grega não estava errada ao considerar que a sentença é composta de palavras. Especificando melhor: só se pode identificar a unidade léxica, delimitá-Ia e conceituá- Ia no interior de cada língua. Consideremos o latim, por exemplo. Tomemos um enunciado nesta língua: Mulier filio aquam dedit (A mulher deu água para o filho). Nessa oração identificamos quatro unidades léxicas: mulier, filio, aquam, dedit. No latim as desinências funcionam como morfemas classificatórios e funcionais, ou seja: indicam as funções sintáticas das palavras na frase. Assim: mulieré nominativo singular, função sujeito; em filio o morfe -o indica dativo singular, função objeto indireto; em aquam o morfe -am indica acusativo singular, função objeto direto. Quanto à forma verbal dedit, o morfe -it, associado à alternâncía vocálica (em que e longo alterna com e breve), indica tratar-se de 3ª pessoa do singular do pretérito perfeito do indicativo. Portanto, em latim, os morfemas desinenciais, tanto do nome como do verbo, indicam a classificação categorial da palavra dentro do sistema Iíngüístíco, e indicam também a função sintática da palavra no enunciado. Mais ainda: indicam os limites da palavra na cadeia do discurso. Onde existe uma dessas desinências, aí temos uma fronteira vocabular. Portanto, numa língua flexiva e sinté- tica como o latim, as funções sintáticas são registradas na desinência ou terminação da própria palavra, e essas marcas morfossintáticas indicam simultaneamente as fronteiras entre as palavras. Embora a noção empírica de palavra nas diversas línguas do globo refira vagamente um mesmo conceito psicolingüístico, os dados factuais de cada língua não permitem que formulemos uma única definição válida para todas, que seja suficientemente abrangente para recobrir as peculiaridades de cada uma e que nos permita ainda identificar e delimitar inequivocamente a unidade léxica em cada um desses idio- mas. Assim sendo, devemos concluir que não é possível definir a palavra de um modo universal. &! 2. DO MORFEMA AO ENUNCIADO (MORFEMA X PALAVRA) Em meio às correntes estruturalistas que marcaram a ciência lingüística da década de cinqüenta à de setenta, ninguém foi mais radical do que Zellig Harris. Em um artigo clássico, "From morpheme to utterance", Harris (968) ignora totalmente o conceito de palavra e considera que a análise lingüística deve utilizar o conceito de morfema como operador básico, e que os enunciados nada mais seriam que combinatórias e somatórios de morfemas. Dentro dessa ótica, a palavra não tem mais função como instrumento da descrição e da análise. Claro está que o conceito de morfema é mais preciso que o de palavra, além de ser bastante genérico para poder ser aplicado a toda e qualquer língua. Mas Harris estava errado em seu radicalismo. O fato de o morfema ser uma forma recorrente que mantém o seu significado explica, até certo ponto, que esse operador gramatical seja considerado um instrumento necessário e básico na descrição e análise de línguas. Mas existe outra unidade intermediária cuja existência é inequívoca e cujo status é preciso buscar, por mais difícil que isso seja. Uma das dificuldades pode-se assim explicitar: existem palavras que funcionam como morfemas em muitas línguas, embora não sejam formas presas. É o caso de preposições e artigos nas línguas latinas, por exemplo. Assim, a preposição de em várias línguas românicas tem a mesma função de uma desinência (morfema ou forma presa) do latim: cf. petri murus = porto muro depedra, esp. muro depiedra, fr. mur de pierre, ital. muro di pietra. Latim: murus = porto o muro, esp. el muro, fr. te mur, ital. il muro. O latim não tinha artigo definido, mas as línguas românicas, sim. Já no francês contemporâneo o uso do pronome sujeito é obrigatório como marca categorial de pessoa: cf. je cbante = porto canto; il a chanté = porto cantou. Nesse caso o português, como o latim, dispensa o uso redundante do pronome reto: cf. latim: canto, cantavit. E, tanto em português como em latim, o uso do pronome passa a ser enfático. Em português o pronome pode ter valor distintivo quando, e só quando, o contexto é ambígüo. Isso porque tanto o português como o latim possu- em essas marcas categoriais e funcionais como flexões verbais. 3. A DELIMITAÇÃO DA PAlAVRA. cRITÉRIO FONOLÓGICO, MORFOSSINTÁTICO E SEMÂNTICO Vários são os critérios com que podemos operar para delimitar a palavra, a saber: o critério fonológico, o critério morfossintático e o critério semântico. 3.1. Numa primeira abordagem, podemos considerar a palavra como um seqüência fonológica que recorre sempre com o mesmo significado. Dessa forma, uma palavra seria uma seqüência fônica que constituísse uma emissão completa e após a qual a pausa seria possível. Portanto, numa seqüêncialasuvakaíal a separação em unidades lêxicas é feita ancilarmente por outros níveis da interpretação da linguagem, a saber, 83 ~wo ã5 o ~..: o ~ '"I:" ~ '"~ • ~ if o nível morfossintático. Contudo, o acento próprio de cada palavra também corro- bora esse processo de segmentação. Assim, o acento tônico em Luva], palavra paroxítona em português, ajuda a identificar a palavra; o mesmo se pode dizer da outra unidade paroxítona dessa seqüência fônica [kaia], onde também existe um acento tônico na forma verbal, na vogal [i]. Por conseguinte, podemos afirmar que, em português, o primeiro nível da separação das unidades na cadeia sonora, bem como sua identificação, é feito através de critérios fônicos subsidiários que caracte- rizam as palavras do léxico português. Podemos ainda afirmar que o falante tem consciência das unidades silábicas da fala, mas reúne essas sílabas em palavras na sua mente, através de processos gramaticais e semânticos, e não fonéticos. Convém lembrar ainda que, sendo o português uma língua acentual, nesse idioma as pala- vras possuem as seguintes características: em sua maioria, são paroxítonas; há um grande número de palavras oxítonas e um número bem menor de proparoxítonas. Seja como for, a grande maioria das palavras registram essa marca acentual caracte- rística, o que auxilia enormemente num primeiro desbaste para segmentar o discur- so em unidades léxicas. Além disso, via de regra, fazem-se pausas na fala entre as unidades dos grupos fônicos que são, geralmente, grupos significan\es e com uma certa unidade morfossintática. Claro está que essa identificação preliminar é precária e insuficiente, dado o fato de que possuímos muitas palavras átonas que têm alta freqüência no discurso como artigos, pronomes, preposiçôes. É nessa altura que vêm em nosso socorro os demais níveis da análise lingüística, como acabei de mencionar, e que v~lTIOSconsiderar a seguir. Retomo um exemplo dado anteriormente (Biderman, 1978: 109): Penetra surdamente no reino das palavras. Nesse verso de Carlos Drummond de Andrade podemos fazer o seguinte pausamento: Penetra I I surda mente I I no: reino I das: palavras I I I Temos assim: uma pausa longa no fim da elocução do verso; duas pausas medianas após penetra e após surdamente; e ligeiríssimas pausas após no e das e uma pausa ligeira após reino. Esse pausamento é determinado por vários níveis da análise e da interpretação do enunciado. Mas a possibilidade de pausar após as unidades referi- das se deve ao fato de elas terem uma massa e uma autonomia fônica que as individualiza dentro do sistema do português. As pausas menores são devidas não só à atonicidade de segmentos como no e das mas também à dependência gramati- cal dessas unidades. Não quero me deter nessas questões por ora, só registrar o fato de que o critério fonológico contribui para a segmentação das unidades discursivas. 84 Aliás, como as palavras possuem acentos próprios que as individualizam, na maioria das línguas ocidentais desenvolveu-se o hábito de deixar espaços brancos na escrita para marcar as fronteiras entre as palavras. 3.2. O SEGUNDO cRITÉRIO É O GRAMATICAL OU MORFOSSINTÁTICO • Uma vez reconhecidas as unidades léxicas em potencial no interior do enunciado, atra- vés da análise fonológica Cpotencialidade de pausa, acento da palavra, outras regras fonológicas), devemos submeter os segmentos assim isolados às regras morfossintáticas que atuam no sistema lingüístico em consideração. Isso porque, embora haja correspon- dência entre um vocábulo fonológíco e um vocábulo mórfico, nem sempre existe entre ambos coincidência rigorosa. Nessa segunda etapa da análise haveria dois critérios atuan- do simultaneamente: a) a classificação gramatical da palavra, em função dos marcadores morfosssintáticos que ela apresenta e, portanto, a filiação a determinados paradigmas; b) a função exercida pela palavra na sentença. Por conseguinte, estaremos superpondo um critério formal a um critério funcional. No exemplo dado anteriormente, de Carlos Drummond de Andrade, a identificação de seis unidades - penetra, surdamente, no, reino, das, palavras- faz-se graças ao concurso de parâmetros morfológicos e sintáticos. Aqui é preciso lembrar que temos dois casos complexos: no e das. A despeito da consubstancialidade fônica desses segmentos, nos quais identificamos apenas uma sílaba, a análise morfológica e distribucional revela que temos aí unidades complexas do sistema, a saber: em+o = no e de+as = das. Inversamente, ocorre também no sistema do português que a língua não dispõe de recursos morfológicos simples para exprimir certas categorias lingüísticas e lança mão de esquemas vicários. É o caso vigente no sistema verbal, em que as categorias do aspecto e do modo são expressas por meio de formas perifrásticas em que dois ou mais segmen- tos morfofônicos carreiam uma só noção. Em outros termos: um único significado é expresso por dois segmentos morfofônicos, como em: Paulo tem trabalhado muito. I noção de aspecto iteratívo no passado o doente vai morrendo lentamente. I noção de aspecto durativo Cprogressivo o doente pode morrer amanhã. j noção moda I de probabilidade 85 ~c: ~ Cõ o ~« ::1:«o ~c: f!;! :;J; ~ ::1:• w::;: ~ Na análise dos macrossegmentos assinalados em cada um desses enuncia- dos - tem trabalhado, vai morrendo, pode morrer- nota-se a presença de dois segmentos fônicos. A análise gramatical de cada um deles no contexto do enunciado revela que as noções aspectual e modal que eles portam, segundo a explicação acima, são distribuídas por cada um dos seus seg- mentos componentes. De fato, em tem trabalhado, a noção aspectual de iteração é dada pelo verbo auxiliar ter, conjugado no presente, mais o par- ticípio passado trabalhado, formando a seqüência um pretérito perfeito composto. Em vai morrendo, igualmente, a noção aspectual de progressão é dada pelo concurso do verbo auxiliar ir e do verbo principal morrer no gerúndio. Enfim, em pode morrer, a probabilidade de ocorrer o processo de morrere no infinitivo) está expressa no auxiliar pode. Logo, esses exemplos evidenciam que, a despeito da riqueza mórfica de seus paradigmas verbais, o português quase não dispõe de morfemas próprios para indicar noções aspectuais e modais na conjugação dos verbos. O sistema do português, como, aliás, o de muitas línguas indo-européias, utiliza recursos híbridos para exprimir tais noções aspectuais e modais. Muitas línguas, porém, po- dem expressar noções aspectuais e modais através de morfemas que se incorporam ao radical léxico do verbo. Em outras línguas, como o inglês, nota-se uma complexidade a mais. O fato de as fronteiras morfemáticas entre as duas grandes classes de palavras - nome e verbo - serem muito tênues, as palavras podem. -circular mais ou menos livremente entre essas duas categorias morfossintáticas. Assim, um nome pode facilmente ter uso verbal e více-versa. Consideremos os seguin- tes exemplos: 1) He has a house in London. 2) The Castle now houses government receptions and congresses. 3) I love you. 4) Love is a rnany-splendored thing. Vemos aí que o substantivo house em 1) foi usado como verbo houses em 2) e que, inversamente, o verbo love em 3) foi usado como substantivo love em 4). É evidente a ausência de marcas categoriais - a única aqui presente é o morfema de terceira pessoa verbal em houses. É esse fato morfossintático e categorial que permite que, em inglês, se faça tão facilmente a conversão de uma classe ã outra. Há, porém, outra razão de natureza sintática: a posi- ção das palavras na frase. Como se sabe, em inglês, a ordem das palavras na frase é mais ou menos fixa, estando determinada previamente a posição de cada elemento em relação ã sua função sintática. &$ Nos exemplos acima, lembremos que o significado da palavra também é determina- do pelo seu valor funcional. As traduções emportuguês das frases acima tornam evidente esta afirmação. 1) Ele tem uma casa em Londres. 2) O Castelo agora abriga recepções governamentais e congressos. 3) Eu te amo. 4) O amor é uma coisa maravilhosa. A língua inglesa exemplifica muito bem a relevância da função. É igualmente importante o princípio da coesão interna da palavra. Embora o vocá- bulo possa ter grande mobilidade no discurso, dependendo das características estru- turais da língua, como sucede em português, internamente a palavra vem a ser uma seqüência coesa e estável. Passemos ao terceiro critério, o semântico. A despeito da importância dos critérios fonológico e morfossintático na delimitação e identificação da palavra, o critério decisório final é o semântico. Como Ullmann 0952:33), vamos considerar a palavra como uma unidade semântica indecomponível. "Se existem unidades gramaticais significantes menores do que a palavra, elas não têm significação autônoma." E ele define a palavra como "a unida- de semântica mínima do discurso." Concluindo: a fonologia e a morfossintaxe ajudam-nos a reconhecer segmentos fonicamente coesos e gramaticalmente pertinentes enquanto formas funcionais; con- tudo, só a dimensão semântica nos fornece a chave decisiva para identificar a unida- de léxica no discurso. Assim, no topo da hierarquia, a semântica vem congregar as demais informações de nível inferior para nos oferecer a chave do mistério da pala- vra. 4. AS UNIDADES DO SISTEMA. QUESTÕES FORMAIS E TERMINOLÓGlCAS No sistema abstrato que é a língua, distinguem-se dois módulos componentes: 1) o Léxico e 2) a Gramática. Assim, as palavras são elementos da língua e não da fala. Embora, na prática, o vocabulário seja indexado a partir de realizações discursivas, de fato as palavras são entidades abstratas que compõem o sistema Iíngüístíco. Por Sua vez, os discursos são atos de linguagem efêrneros, ao passo que a palavra é um elemento permanente da língua. 87 ::E« ~wo õ'i o ~ ~o ~ '"::: I• w õ< ~ Por conseguinte, a segmentação do discurso em vocábulos supõe a identificação das unidades léxicas no plano da língua. Essa operação, porém, não é simples. Longe disso. Os casos ambíguos são extremamente numerosos. Nesse processo, muitas vezes é preciso considerar não apenas o contexto, o enunciado, mas até mesmo o texto discursivo. Palavras há cuja identificação e classificação só se faz possível através da análise de uma unidade maior que a frase. Para ilustrar o problema da segmentação das unidades léxicas no discurso, darei dois exemplos de enunciados, já propondo uma segmentação para os mesmos. 1) Em vão I nós I procuramos I por I Carlos. Veja-se que, nessa seqüência, é preciso considerar em vão como uma palavra a despeito de ser grafada em dois segmentos. É a análise morfossintática e semântica que indica que estamos na presença de uma unidade lexical, a despeito da grafia. Vejamos o exemplo seguinte: - 2) Carlos I bateu as botas. Aqui será preciso considerar como unidade toda a seqüência bateu as botas. Esses exemplos apontam para um problema crucial da Lexicologia: quais são os fatores a serem considerados para determinar quando estamos diante de uma unida- de léxica e como ela se configura e define. Voltarei a essa questão mais abaixo abaixo Consideremos, antes de mais nada, questões terminológicas. Assim, termos como palavra e vocábulo se prestam a muitos equívocos por serem usuais na linguagem comum Vamos usar as palavras vocábulo e palavra para as realizações discursivas, continu- ando a longa tradição do português e respeitando a sinonímia implícita na mente dos falantes do idioma no que diz respeito a essas palavras. Contudo, devido à imprecisão desses termos, precisamos designar diferentemente as unidades do siste- ma e do discurso quando estivermos tratando cientificamente a língua. No caso da unidade lexical abstrata, será melhor utilizar o termo lexema para denominar as unidades virtuais que compõem o léxico e chamar de lema sua representação canônica no dicionário. Por conseguinte, estabeleceríamos as seguintes oposições e correla- ções: léxico é o conjunto abstrato das unidades lexicais da língua; vocabulário é o conjunto das realizações discursivas dessas mesmas unidades. No plano das realiza- ções discursivas, qualquer seqüência significativa será chamada indiferentemente e && imprecisamente de palavra ou vocábulo. A unidade denominativa para um conjunto de formas flexionadas, que compõem um paradigma, será denominada lexema/ lema. Lema é também a entrada canônica nos dicionários. O uso desses termos técnicos eliminaria as ambigüidades, indesejáveis em ciência. O termo palavra é operacional apenas como elemento da linguagem comum. Num uso não específico, é a designação pertinente, já que qualquer falante do idioma identifica o seu designatum sem problemas. O termo monema, proposto por Martinet, não me parece funcional em Lexicologia. Inversamente, o termo lexia; proposto por Pottier, é bastante útil, sobretudo por se tratar de um termo técnico. Por isso não corre o risco de ser maculado com as conotações discursivas, que podem gerar ambigüidade relativamente a palavra e! ou vocábulo. Assim, no plano da língua, o termo lexema refere a unidade abstrata do léxico. As manifestações discursivas dos lexemas devem ser referidas tecnica- mente como lexías. Por sua vez, as lexias se repartem em duas categorias: as lexias simples, graficamente constituídas de uma seqüência gráfica separada por dois bran- cos (cesta, guarda, dona, mãe) e lexias complexas, formadas por várias unidades separadas por brancos e não ligadas por hífen (cesta básica, dona de casa). E cha- maremos de lexias compostas aquelas que são ligadas por hífen (guarda-roupa, mãe-de-santo ). Há uma outra questão relevante em relação à configuração teórica do léxico. No léxico português podemos distinguir duas classes de lexemas: 1) as formas livres e 2) as formas dependentes, como os clíticos e os vocábulos instrumentais. As formas livres no português são geralmente substantivos, adjetivos e verbos. As formas de- pendentes são, de fato, vocábulos-morfema. As preposições, os pronomes pessoais, os artigos, as conjunções, etc, nada mais são que palavras instrumentais que articu- lam o discurso, sendo desprovidas de significação externa. 5. A IDENTIFICAÇÃO DA UNIDADE LÉXICA Numa primeira abordagem de uma seqüência discursiva identificamos um grande número de unidades léxicas que não colocam problemas. Trata-se das unidades que graficamente coincidem com um seqüência gráfica indecomponível. Incluem-se neste conjunto a maioria dos clíticos, bem como muitos outros pronomes, a maioria das palavras dependentes como artigos, preposições e conjunções, assim como um grande número de substantivos, adjetivos, verbos e advérbios. São exemplos dessas unida- des: o, os, a, as, um, uns, uma, umas, me, te, se, nos, de, em, com, e, mas, que, água, casa, dor, menino, homem, bom, grande, cantar, sair, mais, hoje, ontem, ete. Vamos chamar essas unidades de lexias simples. &' ~ '" ~ o ~-c () ~ '"~ ~ :::i:• ~g: Entretanto, nas realizações discursivas as fronteiras entre as palavras muitas vezes são difusas. Retomemos os exemplos acima referidos: Em vãoprocuramos por Carlos e Carlos bateu as botas. Como já foi apontado, as seqüências discursivas em vão e bater as botas devem ser consideradas como unidades léxicas, a despeito da aparên- cia em contrário. Para distinguir entre uma lexia complexa e uma seqüência discursiva variável podem-se aplicar dois testes: 1º) TESTE DA SUBSTITUIÇÃO. Em seqüências como as saudações bom dia ou boa noite não podemos substituir o primeiro vocábulo por um outro adjetivo mais ou menos sinônimo, dizendo: ótimo dia e ótima noite, por exemplo. Na seqüência bater as botas tampouco podemos substituir botas por sapatos. Por conseguinte, tudo leva a crer que bom dia, boa noitee bater as botas já estão lexicalizados no nível do sistema lexical. 2º) TESTE DA INSERÇÃO. • Numa seqüência como dor de cabeça não diremos dor "terrível" de cabeça mas "terrível" dor de cabeça, ou dor de cabeça "terrível". Também não se diria capa "bonita" de chuva mas capa de chuva "bonita". Tampouco se poderia inserir um advérbio entre os constituintes de mercado negro, resultando: mercado "muito" negro. Portanto, o teste de inserção demonstra que estão lexicalízados dor de cabe- ça, capa de chuva e mercado negro. No exemplo acima, não podemos inserir nada na seqüência bater as botas dizendo, por exemplo: Carlos bateu rapidamente as botas. Deve-se notar também que, nas lexias complexas já lexicalizadas, não mais ocorrem o artigo, a preposição e outros vocâbulos-morferna. Assim, em de cor, de soslaio, em vão já de muito ocorreu a elipse do artigo; do mesmo modo ocorreu a elipse da preposição (em) em à medida que. Infelizmente, esse problema apresenta-se mascarado e ambíguo no grande deposi- tário da tradição léxica e dos hábitos gráficos da língua, a saber, o dicionário. Geral- mente os falantes recorrem ao dicionário quando não sabem como escrever uma palavra e qual o seu significado. Contudo, no caso da comunidade brasileira, dificil- mente o consulente poderá resolver satisfatoriamente seu problema, pois a nossa produção lexicográfica não fornece parâmetros seguros no tratamento da unidade léxica, e a identificação dos lemas pelos nossos dicionários é extremamente criticável, não podendo ser acatada em grande número de casos. 90 Infelizmente, a Lexicografia brasileira constitui uma antiga prática com pequena ciência. Em geral, nossos dicionaristas foram apaixonados cultores da língua, com pequena ou nenhuma ciência lingüística. 6. AS UNIDADES COMPLEXAS Em seu estudo "Une classification des phrases figées du françaís", Gross (1982) afirma que os lingüistas geralmente atribuiram às expressões cristalizadas (que ele chama de expressions figées) um caráter de exceção, de anomalia lingüística, e não propuseram alternativas para tratar cientificamente essa questão. Contudo, trata-se de um fenômeno de grande envergadura e muito freqüente, que a Lingüística ignora pela ausência de estudos sobre essa matéria. O estudo dessas combinatórias lexicaís ou fraseológicas suscita muitos problemas teóricos e coloca em causa os papéis atribuídos tradicionalmente à sintaxe e ao léxico. A primeira questão que se põe é terminológica: vamos chamá-Ias de fraseologias, fraseolexemas, expressões cristalizadas, expressões idiomáticas? Outro problema formal importante é o ortográfico. Essas unidades complexas deve- riam ser grafados mais apropriadamente com hífen, como por exemplo fim-de- semana, jogo-do-bicho, indicando sua natureza de unidade. Por outro lado, quando se deve considerar que se trata de uma unidade lexical autônoma e quando se deve considerar que se trata de uma unidade subordinada à base que gerou essa lexia? Dizendo de outra forma: qual é o momento em que se consolida o processo de lexícalízação, de cristalização da lexia complexa, gerando um novo item lexical da língua? Veja-se o caso de palavras compostas sobre a base mãe como mãe-solteira e mãe-de-santo. Deve-se considerá-Ias como entradas de dicionário independentes ou como subentradas sob o lema de mãe? Nesses e em outros casos, um dicionário como o Aurélio não é coerente. Considera mãe-de- santo, mãe-benta e várias outras lexias como lemas independentes, incluindo outros sob a epígrafe de mãe. Mãe-solteira, por exemplo, deve subordinar-se a mãe, po- rém, não mãe-de-santo e outras mais. Como já enfatizamos anteriormente, nas realizações discursivas (orais e escritas) as fronteiras entre uma unidade lexical complexa e um sintagma discursivo são difusas. Existe toda uma gama de soldadura entre os elementos de uma combinatória lexical. Assim, podemos identificar sintagmas lexicalizados cujos elementos componentes estão perfeitamente soldados, e outros com um forte índice de coesão interna. Qua- se poderíamos afirmar que a freqüência do uso vai dando aos falantes um forte sentimento de cristalização da sequência discursiva. E aqui é fundamental o papel' da significação. Se a combinatória lexical refere um referente único e perfeitamente 91 ::;:-c ~ wo ã'i ~-c ~ ~ '"~ ~ ~::;:• w b: ~ identificável no universo extra-Iingüistico, é quase certo que o sentimento língüístíco dos falantes os induzirá a considerar esse sintagma lexicalizado como uma lexia complexa. É o caso de cesta básica, código de barras, dor de cabeça, mãe-de-santo, papel higiênico, zona franca. Em parte, esse problema se origina de uma característica fundamental da linguagem humana: a economia linguística. De um lado, unidades simples são utilizadas em vários domínios diferentes do conhecimento, multiplicando os valores semânticos da palavra e gerando o fenômeno da polissemia, por outro lado, unidades simples podem combinar-se entre si de modo quase infinito, resultando em unidades com- plexas. Em virtude de uma ortografia conservadora e inconsistente, numerosas unidades lexicais já categorizadas como tal no plano do sistema lexical são, contudo, grafadas como se fossem várias unidades, gerando ambigüidade. É o caso de: ar condiciona- do, bom dia, cesta básica, caixa eletrônico, código de barras, colcha de retalhos, curto circuito, dor de cabeça, fibra ótica, folha corrida, marcha à rf, papel higiêni- co, prata da casa, pressão atmosférica, pressão arterial, saneamento básico, tábua de salvação, título de eleitor, zona franca. Temos aí alguns exemplos de signos que remetem a referentes das mais variadas áreas do conhecimento e das atividades humanas, evidenciando o quanto este problema é pervasivo. Ademais, constatam-se muitas incoerências gráficas em dicionários e na práxis lingüística de usuários da língua, como, por exemplo, a imprensa. No tratamento lexicoestatístico de um gran- de corpus de 6 milhões de palavras para elaborar um dicionário de freqüências, constatei muitas e muitas vezes que há inconsistência na ortografia. Nesses casos em pauta, por vezes se grafa com hífen e por vezes sem hífen. Um exemplo é fim-de- semana. O Aurélio registra essa palavra como subentrada de fim, grafando essa lexia complexa sem hífen. No corpus informatizado do jornal Folha de São Paulo de 1997, publicado em 1998 como CR-ROM, encontramos as duas grafias: fim de sema- na e fim-de-semana. Julgo que a segunda seja melhor, em virtude de estar comple- tado o processo de lexicalização e de o falante sentir essa seqüência como unidade, isto é, atribuí-Ia a um referente. É também o caso de numerosas unidades complexas de valor gramatical e não referencial, como os acima citados. Veja-se, por exemplo, a extensa lista de unida- des complexas de cunho gramatical tradicionalmente chamadas de locuções por gramáticas e dicionários. Cf. locuções adverbiais - a gosto, ainda assim, a limpo, ao longe, cada vez mais, daqui a pouco, de acordo, de soslaio, por pouco, uma vez, etc.; locuções prepositivas - a cargo de, além de, a ponto de, com relação a, de cima de, à guisa de, em prol de, etc.; locuções conjuncionais - além de que, a menos que, assim que, cada vez que, da mesma maneira que, do mesmo modo que, logo que, nem que, por conseguinte, etc.; locuções pronominais - consigo mesmo '! (a, os, as), ele (s) mesmots), eleis) prôprio/s), fosse qual fosse, fossem quem fosse, onde quer que, seja onde for, seja o que for, seja qual for, etc. O problema das unidades complexas remete também à questão igualmente desafia- dora das seqüências de combinatórias lexicais ainda maiores. Duas categorias são típicas: os sintagmas nominais e os sintagmas verbais. No domínio das ciências e das técnicas, esses sintagmas são extremamente freqüentes; ademais, tais neologias Sur- gem continuamente nessas linguagens especializadas. Assim, esse problema torna- se altamente complexo,desafiando os lexicólogos, lexicógrafos e terminólogos. Os sintagmas colhidos no vocabulário de várias ciências, referidos, a seguir, constituem unidades léxicas? Cf: ácido desoxirribonucléico (ADN ou DNA), antena de freqüên- cia ultra-eleuada, buraco negro estelar; centro de alta pressão, centro de baixa pres- são, linha de campo magnético, fundo de curto prazo, fundo de renda fixa, foguete AR-Mar, glândula supra-renal, lêmur-de-cauda-listrada, mico-Ieão-dourado, iodeto de sódio pólo negativo, deficiência de enzima adenosina deaminase (doença), pro- teína C-reativa, proteína CD- 4, nadadeira dorsal anterior, padrão de qualidade do ar,parênquima armazenador de água, raio de luz incidente, reconhecimento ôptico de caracteres, relatório de impacto ambiental (rima), taxa de mortalidade infantil, título de dívida pública, ultra-alta freqüência, unidade central de processamento, zonas de pressão atmosférica, etc. Alguns exemplos na classe do verbo, para encerrar esse exemplário das unidades complexas: cair de quatro, dar murro em ponta de faca, fazer das suas, fazer das tripas coração, ficar de pés e mãos amarrados, passar desta para melhor, saber a quantas anda, saber de cor e salteado, sem tirar nem pôr, tirar o corpofora, etc. 6.1. Passemos à análise das combinatórias ou fraseologias. Consideremos mais de perto o caso de verbos compostos que ocorrem em muitas expressões idiomáticas. Vou considerar um exemplo acima referido, que foi tomado a Xatara (994), a saber: bater as botas A sintaxe desta seqüência cristalizada não difere da sintaxe de uma combinatória livre. Cf. as variações de tempo e modo possíveis: Carlos bateu as botas. (Carlos morreu) Todos sabiam que Carlos ia bater as botas. Temo que Carlos vá bater as botas. O sentido da seqüência bater as botas não é previsível a partir de bater (dar panca- das; chocar-se com) e de botas (tipo de calçado). De fato, temos aqui uma combinatória cristalizada, culturalmente herdada e registrada na memória coletiva com o significa- 93 ~;".: ~ if ::;: ~ '"euo ãl o ~ ~ U ~ '"~ ="~::;:• do de "morrer". Por isso, podemos afirmar que ela faz parte do acervo do léxico e não é uma combinatória discursiva qualquer. Entretanto, o verbo que ela comporta não é analisável segundo as regras que se aplicam a frases superficialmente idênti- cas. Modificações possíveis e aceitas em frases quaisquer são impossíveis no caso da expressão cristalizada. As variações possíveis, além daquelas acima referidas, seriam relativas à posição dos advérbios. Cf.Carlos bateu as botas muito cedo. Carlos bateu muito cedo as botas. É possível também fazer uma inserção: Carlos, desta vez, bateu as botas. As seqüências livres são aquelas em que sujeito e complemento têm distribuição livre; nesse caso, as únicas restrições e coerções são aquelas determinadas pela semântica. Inversamente, os sintagmas cristalizados são frases do mesmo tipoem que, porém, um ou vários dos actantes são lexicalmente invariáveis. Entre os sintagmas cristalizados como lexias complexas, as expressões idiomáticas exibem grande fixidez, típicas de unidades lexicalizadas. Isso evidencia que elas têm uma existência própria, fazendo parte do léxico da língua. Exemploziotável é forne- cido por uma crônica de Carlos Drummond de Andrade, "Antigamente", de que transcrevo o primeiro parágrafo, no qual o texto se constrói exatamente em torno do princípio do estereótipo das expressões idiomáticas: As pessoas, quando corriam, antigamente, era para tirar opai da forca, e não caíam de cavalo magro. Algumas jogavam verdepara colher maduro, e s,gbiam com quantos paus sefaz uma canoa. Por outro lado, o sentido individual das palavras de uma expressão idiomática não é pertinente, como nesse texto se evidencia. As palavras componentes de uma ex- pressão idiomática devem ser interpretadas globalmente. Sendo registradas no patrimônio cultural da comunidade como hábitos verbais, as expressões idiomáticas se caracterizam por ser parte da herança lexical e devem, por conseguinte, ser aprendidas de cor pelos falantes da língua. De fato, achamo-nos aqui não mais no domínio do sistema lingüístico, mas no domínio da norma. Ademais, essas seqüências cristalizadas geralmente não possuem correspondência em outra língua e são até mesmo exclusivas de uma variedade (norma) lingüística. Um exemplo característico seria em português quebrar o (um) galho. Cada termo deste sintagma perde sua identidade própria e se torna assim não-analisável. Por essa razão, os constituintes de uma expressão idiomática como essa se tornam indissociáveis, não permitindo a supressão ou acréscimo de um elemento. As ex- pressões idiomáticas são típicas de uma nação e estão enraizadas na sua cultura. O português europeu, por exemplo, não possui essa expressão idiomática. '" De fato, as expressões idiomáticas podem ser consideradas como uma lista de irre- gularidades fundamentais de um idioma e de uma norma lingüística. 6.2. Num estudo de 1992, "Phraseological Units", Ornella Corazzarí denomina as unidades lexicais complexas de unidades fraseológicas, lembrando que elas são geralmente negligenciadas por dicionários e gramáticas. Para Corazzari as unidades fraseológicas (UF) são seqüências de palavras que têm uma coesão interna do ponto de vista semântico e que possuem propriedades morfossintáticas específicas. Examinemos algumas características dessas UFs. As unidades fraseológicas são seqüências de pelo menos duas palavras separadas por brancos, hífens ou apóstrofos: mercado negro, caixa eletrônico, caixa preta, bomba-relógio, decreto-lei, mina d'água. Embora sejam compostas por mais de uma palavra, elas se classificam funcional- mente como uma única categoria lexico-gramatical. Assim, caixa eletrônico, com- posto de N+ Adj comporta-se semanticamente como substantivo e levar a cabo e levar grana comportam-se como verbo. Vejamos o que diz Corazzari (1992: 5) "De um ponto de vista sintático as UFs têm graus diferentes de cristalização, isto é, elas resistem a algumas manipulações morfossintáticas (transformações, inserção de modificadores, flexão) e comutações léxicas que são geralmente possíveis com construções equivalentes comuns." Em meio às unidades fraseológicas, as expressões idiomáticas são expressões se- manticamente opacas cujo significado não depende do sentido de cada um de seus componentes. Por outro lado, colocações são seqüências semanticamente transpa- rentes, formadas de itens lexicais que geralmente coocorrem. Exemplos de coloca- ções: custo astronômico, fundos de renda fixa, livre concorrência, pressão atmosfé- rica, queda livre, reação em cadeia, fazer a barba, fazer as malas, levar anos, levar um século, levar a vida toda (inteira), ter (um) enfarte, etc. As UFs possuem graus diversos de idioma ticidade e de cristalização. Assim, as lexias complexas dona de casa,fim-de-semana, jogo de cintura, mercado negro têm maior grau de lexicalização do que centro de alta pressão, jogo de cartas, livre fluxo de capitais, tecnologia de ponta. Na prática identificamos numerosos tipos de estrutura interna destas UFs. Vejamos alguns exemplos para o sintagma nominal: N de N: bodas de prata; prata da casa; jogo de cintura Na N: cara a cara; cheque ao portador '# ·;::., w E;: if ~ ~wo ã'i o ~ ~o ~o: ~ ~~ • Nem N: salto no escuro; olho no olho N Adj: cesta básica; circuito elétrico;jogo cênico; jogo duplo Adj N: baixo astral; livre arbítrio N N: efeito estufa; seguro desemprego N e N: parede e meia; unha e carne N Part Pres: água fervente (raro); conta corrente N Part Pas: corrente alternada; condomínio fechado; jogo de cartas marcadas V Conj V: leva e traz (raro); vai e vem V V: corre-corre (raro) N Prep Adj N: centro de alta pressão; direito de livre defesa; fio de alta tensão Adj N Prep N: livre flutuação de preços; livre fluxo de (da) informação Vale a pena reiterarque, embora as UFs sejam estruturalmente complexas, tanto sintática como semanticamente, elas se comportam como verbos, substantivos, ad- vérbios, adjetivos, preposições, etc. 6.3. Concluindo: a identificação e a caracterização dos diferentes tipos de unidades fraseolôgicas/ lexias complexas não é problema simples. A aplicação de testes mos- tra que a linha divisória entre classes diferentes não pode ser claramente determina- da. Entre construções totalmente cristalizadas (p. ex. bom dia, mãe-de-santo) e me- nos cristalizadas (p. ex. tomar uma decisão/ tomar uma importante decisão, tomar qualquer decisão) e entre expressões idiomáticas (p. ex. levar a ferro efogo) e não- idiomáticas (levar em conta, levar em consideração) há muitos casos intermediários que mostram graus diferentes de cristalização e de idiomaticidade. Como a língua está em perpétuo movimento, seu caráter de inacabado e de devir está sempre presente, sobretudo no léxico, visto que essa é a parte do sistema linguístico mais suscetível a mudanças por constituir um conjunto aberto. As combinatórias lexicais discursivas podem deixar de ser meras combinatórias fre- qüentes de unidades léxicas para se converterem em novas unidades do léxico da língua. Assim, tudo se passa na língua e no vocabulário como numa pista de corrida - muitos corredores já ultrapassaram a barreira de chegada, outros estão se aproxi- mando dela e outros vêm chegando de mais longe. Nessa imagem, retomada de minha tese de doutoramento, estou simbolizando o pódio de chegada como o tér- mino do processo da lexicalização. Em suma: o léxico de uma língua é formado por unidades extremamente heterogê- neas. Integram o léxico do português desde unidades simples monossilábicas, como as formas dependentes ( artigos: o, um; preposições: de, em, com; pronomes: me, te, se, 10, lhe) até unidades extremamente complexas, como as expressões idiomáticas. Observação: na elaboração deste texto foram utilizados trabalhos anteriores de mi- nha autoria (1978, 1998). '$ REFERÊNCIAS BmUOGRÁFIcAS Biderman, M.T.C. (1978). Lingaística teórica: lingüisttca quantitativa e computacional. Rio de Janeiro: Livros Técnicos e Científicos. (1998). Os dicionários na contemporaneidade: arquitetura, métodos e técnicas. In As ciên- cias do léxico: lextcologia, lexicografia e terminologia. Campo Grande: Editora da Universidade Federal do Mato Grosso do Sul, 129-142. Bloomfield, L. (1961; li ed. 1933). Language. New York: Rinehart and Winston. Corazzari, O. (1992). Phraseological untts, Consiglio Nacionale delle Richerche. Istituto di Linguistica Computazionale. Network of European Reference Corpora (NERC), serial nº 68. Pisa. Inédito. Ferreira, A. B.de H. (1986). Novo dicionário da língua portuguesa. Rio de Janeiro: Nova Fronteira. Gross, M. (1982). Une classification des phrases figées du français. Revue Québécoise de Linguistique, (11) 2, 151-185. Harris, Z. S. (1968). Ou morpheme à l'expression, Langages. les modeles en ltngutstique, 9, rnars., 23-50. Mikus, F. (1957). La syntagmatique et le sixiême congrês, In Misce/ánea: bomenaje a André Martinet, r. Biblioteca Filológica. Canarías: Universidad de Ia Laguna. Ullrnann, S. (1952). Prêcis de sêmanuque française. Paris: PUF. Xatara, C.M. (1994). As expressões idiomáticas de matriz comparativa. Dissertação de mestrado inédita. Araraquara: UNESP. '%