Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

~rB (1999)
CONCEITO LINGÜÍSTICa
DE PALAVRA Maria Tereza Camargo Biderman,UNES?,Campus de Araraquara
RESUMO
o conceito de palavra é problema complexo em Lingüística, não sendo possível
definir a palavra de modo universal. A definição de palavra, bem como sua identifi-
cação no nível do discurso, tem que ser feita língua a língua. Discute-se aqui a
problemática da segmentação do discurso em unidades léxicas, sua conceituação e
a terminologia adequada a uma ciência lexicológica. Também se apontam as incoe-
rências da tradição gráfica e da práxis lexicográfica. E propõe-se, ainda, uma análise
das unidades complexas do sistema.
1. RElATIVIDADE DO CONCEITO DE PAlAVRA
No VI Congresso Internacional de Lingüística, realizado em Paris, em 1948, onde se
deveria discutir as noções fundamentais da Lingüística Clássica, tais como a Palavra,
a Frase, a Morfologia, a Sintaxe, esses conceitos foram seriamente questionados.
Assim aconteceu, por exemplo, com o conceito de palavra. Esse tópico dividiu,
muitas vezes, a assembléia dos lingüistas presentes em posições conflitantes e radi-
cais. Houve quem propusesse a proscrição definitiva deste termo da nomenclatura
lingüística, devido à sua imprecisão e à impossibilidade de se chegar a um acordo
sobre a sua definição ideal. Trnka, em seu "Relatório sobre o Congresso", teve que
Constatar que não se chegara a um consenso sobre uma definição válida e aceitável
de palavra. Alguns lingüistas, como Holt, até propuseram o banimento do conceito
de palavra da Lingüística. Entretanto, uma vez abandonada a noção de palavra,
todas as noções básicas, construídas em torno dela e sobre ela, perdem o pé. É o
que acontece com a noção de frase, assim como a de morfologia e a de sintaxe, pois
o sistema da gramática clássica foi montado em torno do eixo palavra-frase que,
com o abandono de um de seus pólos, desmorona.
Já bem antes de 1948, a obra clássica de Bloomfield sobre a linguagem, Language,
não registrara sequer um capítulo sobre a palavra. Esse lingüista propôs como con-
ceitos operacionais o morfema (forma significante mínima e recorrente) e a forma
livre mínima. Para ele, nos sintagmas the writer, a book, teríamos quatro formas
livres mínimas: the, a, writer, book. Se compararmos writer e writing temos aí duas
formas livres mínimas; porém, os afixas -er e -ing são morfemas, formas presas ao
~
'"wo
ãi
o
~-c~-co
~
'"i:!!
~
'"-c~•
~g:
:::<-c
:::<
Elío
ã5
o
<.!>
'"<:::E-co
~
'"~
-c
12-c::E•=
w>-a:
êf
....,.~,
radical writ-. Esses morfemas são sígnifícantes, indicando respectivamente o agente
(-er) e o aspecto gerundial (-iniJ·
Embora eu seja adepta de um relativismo lingüístico moderado, considero que o
conceito de palavra não pode ter um valor absoluto; ele é relativo e varia de língua
para língua. De fato, a afirmação mais geral que se pode fazer é que essa unidade
psicolingüística se materializa, no discurso, com uma inegável individualidade. Os
seus contornos formais situam-na entre uma unidade mínima gramatical significativa
- o morfema - e uma unidade sintagmática maior - o sintagma. Pode-se afirmar
também que a velha gramática grega não estava errada ao considerar que a sentença
é composta de palavras.
Especificando melhor: só se pode identificar a unidade léxica, delimitá-Ia e conceituá-
Ia no interior de cada língua.
Consideremos o latim, por exemplo. Tomemos um enunciado nesta língua: Mulier
filio aquam dedit (A mulher deu água para o filho).
Nessa oração identificamos quatro unidades léxicas: mulier, filio, aquam, dedit. No
latim as desinências funcionam como morfemas classificatórios e funcionais, ou
seja: indicam as funções sintáticas das palavras na frase. Assim: mulieré nominativo
singular, função sujeito; em filio o morfe -o indica dativo singular, função objeto
indireto; em aquam o morfe -am indica acusativo singular, função objeto direto.
Quanto à forma verbal dedit, o morfe -it, associado à alternâncía vocálica (em que e
longo alterna com e breve), indica tratar-se de 3ª pessoa do singular do pretérito
perfeito do indicativo. Portanto, em latim, os morfemas desinenciais, tanto do nome
como do verbo, indicam a classificação categorial da palavra dentro do sistema
Iíngüístíco, e indicam também a função sintática da palavra no enunciado. Mais
ainda: indicam os limites da palavra na cadeia do discurso. Onde existe uma dessas
desinências, aí temos uma fronteira vocabular. Portanto, numa língua flexiva e sinté-
tica como o latim, as funções sintáticas são registradas na desinência ou terminação
da própria palavra, e essas marcas morfossintáticas indicam simultaneamente as
fronteiras entre as palavras.
Embora a noção empírica de palavra nas diversas línguas do globo refira vagamente
um mesmo conceito psicolingüístico, os dados factuais de cada língua não permitem
que formulemos uma única definição válida para todas, que seja suficientemente
abrangente para recobrir as peculiaridades de cada uma e que nos permita ainda
identificar e delimitar inequivocamente a unidade léxica em cada um desses idio-
mas. Assim sendo, devemos concluir que não é possível definir a palavra de um
modo universal.
&!
2. DO MORFEMA AO ENUNCIADO (MORFEMA X PALAVRA)
Em meio às correntes estruturalistas que marcaram a ciência lingüística da década de
cinqüenta à de setenta, ninguém foi mais radical do que Zellig Harris. Em um artigo
clássico, "From morpheme to utterance", Harris (968) ignora totalmente o conceito
de palavra e considera que a análise lingüística deve utilizar o conceito de morfema
como operador básico, e que os enunciados nada mais seriam que combinatórias e
somatórios de morfemas. Dentro dessa ótica, a palavra não tem mais função como
instrumento da descrição e da análise. Claro está que o conceito de morfema é mais
preciso que o de palavra, além de ser bastante genérico para poder ser aplicado a
toda e qualquer língua. Mas Harris estava errado em seu radicalismo. O fato de o
morfema ser uma forma recorrente que mantém o seu significado explica, até certo
ponto, que esse operador gramatical seja considerado um instrumento necessário e
básico na descrição e análise de línguas. Mas existe outra unidade intermediária cuja
existência é inequívoca e cujo status é preciso buscar, por mais difícil que isso seja.
Uma das dificuldades pode-se assim explicitar: existem palavras que funcionam
como morfemas em muitas línguas, embora não sejam formas presas. É o caso de
preposições e artigos nas línguas latinas, por exemplo. Assim, a preposição de em
várias línguas românicas tem a mesma função de uma desinência (morfema ou
forma presa) do latim: cf. petri murus = porto muro depedra, esp. muro depiedra, fr.
mur de pierre, ital. muro di pietra. Latim: murus = porto o muro, esp. el muro, fr. te
mur, ital. il muro. O latim não tinha artigo definido, mas as línguas românicas, sim.
Já no francês contemporâneo o uso do pronome sujeito é obrigatório como marca
categorial de pessoa: cf. je cbante = porto canto; il a chanté = porto cantou. Nesse
caso o português, como o latim, dispensa o uso redundante do pronome reto: cf.
latim: canto, cantavit. E, tanto em português como em latim, o uso do pronome
passa a ser enfático. Em português o pronome pode ter valor distintivo quando, e só
quando, o contexto é ambígüo. Isso porque tanto o português como o latim possu-
em essas marcas categoriais e funcionais como flexões verbais.
3. A DELIMITAÇÃO DA PAlAVRA. cRITÉRIO FONOLÓGICO,
MORFOSSINTÁTICO E SEMÂNTICO
Vários são os critérios com que podemos operar para delimitar a palavra, a saber: o
critério fonológico, o critério morfossintático e o critério semântico.
3.1. Numa primeira abordagem, podemos considerar a palavra como um seqüência
fonológica que recorre sempre com o mesmo significado. Dessa forma, uma palavra
seria uma seqüência fônica que constituísse uma emissão completa e após a qual a
pausa seria possível. Portanto, numa seqüêncialasuvakaíal a separação em unidades
lêxicas é feita ancilarmente por outros níveis da interpretação da linguagem, a saber,
83
~wo
ã5
o
~..:
o
~
'"I:"
~
'"~
•
~
if
o nível morfossintático. Contudo, o acento próprio de cada palavra também corro-
bora esse processo de segmentação. Assim, o acento tônico em Luva], palavra
paroxítona em português, ajuda a identificar a palavra; o mesmo se pode dizer da
outra unidade paroxítona dessa seqüência fônica [kaia], onde também existe um
acento tônico na forma verbal, na vogal [i]. Por conseguinte, podemos afirmar que,
em português, o primeiro nível da separação das unidades na cadeia sonora, bem
como sua identificação, é feito através de critérios fônicos subsidiários que caracte-
rizam as palavras do léxico português. Podemos ainda afirmar que o falante tem
consciência das unidades silábicas da fala, mas reúne essas sílabas em palavras na
sua mente, através de processos gramaticais e semânticos, e não fonéticos. Convém
lembrar ainda que, sendo o português uma língua acentual, nesse idioma as pala-
vras possuem as seguintes características: em sua maioria, são paroxítonas; há um
grande número de palavras oxítonas e um número bem menor de proparoxítonas.
Seja como for, a grande maioria das palavras registram essa marca acentual caracte-
rística, o que auxilia enormemente num primeiro desbaste para segmentar o discur-
so em unidades léxicas. Além disso, via de regra, fazem-se pausas na fala entre as
unidades dos grupos fônicos que são, geralmente, grupos significan\es e com uma
certa unidade morfossintática.
Claro está que essa identificação preliminar é precária e insuficiente, dado o fato de
que possuímos muitas palavras átonas que têm alta freqüência no discurso como
artigos, pronomes, preposiçôes. É nessa altura que vêm em nosso socorro os demais
níveis da análise lingüística, como acabei de mencionar, e que v~lTIOSconsiderar a
seguir.
Retomo um exemplo dado anteriormente (Biderman, 1978: 109):
Penetra surdamente no reino das palavras.
Nesse verso de Carlos Drummond de Andrade podemos fazer o seguinte pausamento:
Penetra I I surda mente I I no: reino I das: palavras I I I
Temos assim: uma pausa longa no fim da elocução do verso; duas pausas medianas
após penetra e após surdamente; e ligeiríssimas pausas após no e das e uma pausa
ligeira após reino. Esse pausamento é determinado por vários níveis da análise e da
interpretação do enunciado. Mas a possibilidade de pausar após as unidades referi-
das se deve ao fato de elas terem uma massa e uma autonomia fônica que as
individualiza dentro do sistema do português. As pausas menores são devidas não
só à atonicidade de segmentos como no e das mas também à dependência gramati-
cal dessas unidades. Não quero me deter nessas questões por ora, só registrar o fato
de que o critério fonológico contribui para a segmentação das unidades discursivas.
84
Aliás, como as palavras possuem acentos próprios que as individualizam, na maioria das
línguas ocidentais desenvolveu-se o hábito de deixar espaços brancos na escrita para
marcar as fronteiras entre as palavras.
3.2. O SEGUNDO cRITÉRIO É O GRAMATICAL OU MORFOSSINTÁTICO •
Uma vez reconhecidas as unidades léxicas em potencial no interior do enunciado, atra-
vés da análise fonológica Cpotencialidade de pausa, acento da palavra, outras regras
fonológicas), devemos submeter os segmentos assim isolados às regras morfossintáticas
que atuam no sistema lingüístico em consideração. Isso porque, embora haja correspon-
dência entre um vocábulo fonológíco e um vocábulo mórfico, nem sempre existe entre
ambos coincidência rigorosa. Nessa segunda etapa da análise haveria dois critérios atuan-
do simultaneamente: a) a classificação gramatical da palavra, em função dos marcadores
morfosssintáticos que ela apresenta e, portanto, a filiação a determinados paradigmas; b)
a função exercida pela palavra na sentença. Por conseguinte, estaremos superpondo um
critério formal a um critério funcional.
No exemplo dado anteriormente, de Carlos Drummond de Andrade, a identificação de
seis unidades - penetra, surdamente, no, reino, das, palavras- faz-se graças ao concurso
de parâmetros morfológicos e sintáticos. Aqui é preciso lembrar que temos dois casos
complexos: no e das. A despeito da consubstancialidade fônica desses segmentos, nos
quais identificamos apenas uma sílaba, a análise morfológica e distribucional revela que
temos aí unidades complexas do sistema, a saber: em+o = no e de+as = das.
Inversamente, ocorre também no sistema do português que a língua não dispõe de
recursos morfológicos simples para exprimir certas categorias lingüísticas e lança mão de
esquemas vicários. É o caso vigente no sistema verbal, em que as categorias do aspecto
e do modo são expressas por meio de formas perifrásticas em que dois ou mais segmen-
tos morfofônicos carreiam uma só noção. Em outros termos: um único significado é
expresso por dois segmentos morfofônicos, como em:
Paulo tem trabalhado muito.
I
noção de aspecto iteratívo no passado
o doente vai morrendo lentamente.
I
noção de aspecto durativo Cprogressivo
o doente pode morrer amanhã.
j
noção moda I de probabilidade
85
~c:
~
Cõ
o
~«
::1:«o
~c:
f!;!
:;J;
~
::1:•
w::;:
~
Na análise dos macrossegmentos assinalados em cada um desses enuncia-
dos - tem trabalhado, vai morrendo, pode morrer- nota-se a presença de
dois segmentos fônicos. A análise gramatical de cada um deles no contexto
do enunciado revela que as noções aspectual e modal que eles portam,
segundo a explicação acima, são distribuídas por cada um dos seus seg-
mentos componentes. De fato, em tem trabalhado, a noção aspectual de
iteração é dada pelo verbo auxiliar ter, conjugado no presente, mais o par-
ticípio passado trabalhado, formando a seqüência um pretérito perfeito
composto. Em vai morrendo, igualmente, a noção aspectual de progressão
é dada pelo concurso do verbo auxiliar ir e do verbo principal morrer no
gerúndio. Enfim, em pode morrer, a probabilidade de ocorrer o processo de
morrere no infinitivo) está expressa no auxiliar pode. Logo, esses exemplos
evidenciam que, a despeito da riqueza mórfica de seus paradigmas verbais,
o português quase não dispõe de morfemas próprios para indicar noções
aspectuais e modais na conjugação dos verbos. O sistema do português,
como, aliás, o de muitas línguas indo-européias, utiliza recursos híbridos
para exprimir tais noções aspectuais e modais. Muitas línguas, porém, po-
dem expressar noções aspectuais e modais através de morfemas que se
incorporam ao radical léxico do verbo.
Em outras línguas, como o inglês, nota-se uma complexidade a mais. O fato
de as fronteiras morfemáticas entre as duas grandes classes de palavras -
nome e verbo - serem muito tênues, as palavras podem. -circular mais ou
menos livremente entre essas duas categorias morfossintáticas. Assim, um
nome pode facilmente ter uso verbal e více-versa. Consideremos os seguin-
tes exemplos:
1) He has a house in London.
2) The Castle now houses government receptions and congresses.
3) I love you.
4) Love is a rnany-splendored thing.
Vemos aí que o substantivo house em 1) foi usado como verbo houses em 2)
e que, inversamente, o verbo love em 3) foi usado como substantivo love
em 4). É evidente a ausência de marcas categoriais - a única aqui presente
é o morfema de terceira pessoa verbal em houses. É esse fato morfossintático
e categorial que permite que, em inglês, se faça tão facilmente a conversão
de uma classe ã outra. Há, porém, outra razão de natureza sintática: a posi-
ção das palavras na frase. Como se sabe, em inglês, a ordem das palavras na
frase é mais ou menos fixa, estando determinada previamente a posição de
cada elemento em relação ã sua função sintática.
&$
Nos exemplos acima, lembremos que o significado da palavra também é determina-
do pelo seu valor funcional. As traduções emportuguês das frases acima tornam
evidente esta afirmação.
1) Ele tem uma casa em Londres.
2) O Castelo agora abriga recepções governamentais e congressos.
3) Eu te amo.
4) O amor é uma coisa maravilhosa.
A língua inglesa exemplifica muito bem a relevância da função.
É igualmente importante o princípio da coesão interna da palavra. Embora o vocá-
bulo possa ter grande mobilidade no discurso, dependendo das características estru-
turais da língua, como sucede em português, internamente a palavra vem a ser uma
seqüência coesa e estável.
Passemos ao terceiro critério, o semântico. A despeito da importância dos critérios
fonológico e morfossintático na delimitação e identificação da palavra, o critério
decisório final é o semântico.
Como Ullmann 0952:33), vamos considerar a palavra como uma unidade semântica
indecomponível. "Se existem unidades gramaticais significantes menores do que a
palavra, elas não têm significação autônoma." E ele define a palavra como "a unida-
de semântica mínima do discurso."
Concluindo: a fonologia e a morfossintaxe ajudam-nos a reconhecer segmentos
fonicamente coesos e gramaticalmente pertinentes enquanto formas funcionais; con-
tudo, só a dimensão semântica nos fornece a chave decisiva para identificar a unida-
de léxica no discurso. Assim, no topo da hierarquia, a semântica vem congregar as
demais informações de nível inferior para nos oferecer a chave do mistério da pala-
vra.
4. AS UNIDADES DO SISTEMA. QUESTÕES FORMAIS E
TERMINOLÓGlCAS
No sistema abstrato que é a língua, distinguem-se dois módulos componentes: 1) o
Léxico e 2) a Gramática. Assim, as palavras são elementos da língua e não da fala.
Embora, na prática, o vocabulário seja indexado a partir de realizações discursivas,
de fato as palavras são entidades abstratas que compõem o sistema Iíngüístíco. Por
Sua vez, os discursos são atos de linguagem efêrneros, ao passo que a palavra é um
elemento permanente da língua.
87
::E«
~wo
õ'i
o
~
~o
~
'":::
I•
w
õ<
~
Por conseguinte, a segmentação do discurso em vocábulos supõe a identificação
das unidades léxicas no plano da língua. Essa operação, porém, não é simples.
Longe disso. Os casos ambíguos são extremamente numerosos. Nesse processo,
muitas vezes é preciso considerar não apenas o contexto, o enunciado, mas até
mesmo o texto discursivo. Palavras há cuja identificação e classificação só se faz
possível através da análise de uma unidade maior que a frase.
Para ilustrar o problema da segmentação das unidades léxicas no discurso, darei
dois exemplos de enunciados, já propondo uma segmentação para os mesmos.
1) Em vão I nós I procuramos I por I Carlos.
Veja-se que, nessa seqüência, é preciso considerar em vão como uma palavra a
despeito de ser grafada em dois segmentos. É a análise morfossintática e semântica
que indica que estamos na presença de uma unidade lexical, a despeito da grafia.
Vejamos o exemplo seguinte:
-
2) Carlos I bateu as botas.
Aqui será preciso considerar como unidade toda a seqüência bateu as botas.
Esses exemplos apontam para um problema crucial da Lexicologia: quais são os
fatores a serem considerados para determinar quando estamos diante de uma unida-
de léxica e como ela se configura e define. Voltarei a essa questão mais abaixo
abaixo
Consideremos, antes de mais nada, questões terminológicas. Assim, termos como
palavra e vocábulo se prestam a muitos equívocos por serem usuais na linguagem
comum
Vamos usar as palavras vocábulo e palavra para as realizações discursivas, continu-
ando a longa tradição do português e respeitando a sinonímia implícita na mente
dos falantes do idioma no que diz respeito a essas palavras. Contudo, devido à
imprecisão desses termos, precisamos designar diferentemente as unidades do siste-
ma e do discurso quando estivermos tratando cientificamente a língua. No caso da
unidade lexical abstrata, será melhor utilizar o termo lexema para denominar as
unidades virtuais que compõem o léxico e chamar de lema sua representação canônica
no dicionário. Por conseguinte, estabeleceríamos as seguintes oposições e correla-
ções: léxico é o conjunto abstrato das unidades lexicais da língua; vocabulário é o
conjunto das realizações discursivas dessas mesmas unidades. No plano das realiza-
ções discursivas, qualquer seqüência significativa será chamada indiferentemente e
&&
imprecisamente de palavra ou vocábulo. A unidade denominativa para um conjunto
de formas flexionadas, que compõem um paradigma, será denominada lexema/
lema. Lema é também a entrada canônica nos dicionários. O uso desses termos
técnicos eliminaria as ambigüidades, indesejáveis em ciência. O termo palavra é
operacional apenas como elemento da linguagem comum. Num uso não específico,
é a designação pertinente, já que qualquer falante do idioma identifica o seu
designatum sem problemas.
O termo monema, proposto por Martinet, não me parece funcional em Lexicologia.
Inversamente, o termo lexia; proposto por Pottier, é bastante útil, sobretudo por se
tratar de um termo técnico. Por isso não corre o risco de ser maculado com as
conotações discursivas, que podem gerar ambigüidade relativamente a palavra e!
ou vocábulo. Assim, no plano da língua, o termo lexema refere a unidade abstrata
do léxico. As manifestações discursivas dos lexemas devem ser referidas tecnica-
mente como lexías. Por sua vez, as lexias se repartem em duas categorias: as lexias
simples, graficamente constituídas de uma seqüência gráfica separada por dois bran-
cos (cesta, guarda, dona, mãe) e lexias complexas, formadas por várias unidades
separadas por brancos e não ligadas por hífen (cesta básica, dona de casa). E cha-
maremos de lexias compostas aquelas que são ligadas por hífen (guarda-roupa,
mãe-de-santo ).
Há uma outra questão relevante em relação à configuração teórica do léxico. No
léxico português podemos distinguir duas classes de lexemas: 1) as formas livres e
2) as formas dependentes, como os clíticos e os vocábulos instrumentais. As formas
livres no português são geralmente substantivos, adjetivos e verbos. As formas de-
pendentes são, de fato, vocábulos-morfema. As preposições, os pronomes pessoais,
os artigos, as conjunções, etc, nada mais são que palavras instrumentais que articu-
lam o discurso, sendo desprovidas de significação externa.
5. A IDENTIFICAÇÃO DA UNIDADE LÉXICA
Numa primeira abordagem de uma seqüência discursiva identificamos um grande
número de unidades léxicas que não colocam problemas. Trata-se das unidades que
graficamente coincidem com um seqüência gráfica indecomponível. Incluem-se neste
conjunto a maioria dos clíticos, bem como muitos outros pronomes, a maioria das
palavras dependentes como artigos, preposições e conjunções, assim como um grande
número de substantivos, adjetivos, verbos e advérbios. São exemplos dessas unida-
des: o, os, a, as, um, uns, uma, umas, me, te, se, nos, de, em, com, e, mas, que, água,
casa, dor, menino, homem, bom, grande, cantar, sair, mais, hoje, ontem, ete. Vamos
chamar essas unidades de lexias simples.
&'
~
'"
~
o
~-c
()
~
'"~
~
:::i:•
~g:
Entretanto, nas realizações discursivas as fronteiras entre as palavras muitas vezes
são difusas. Retomemos os exemplos acima referidos: Em vãoprocuramos por Carlos
e Carlos bateu as botas. Como já foi apontado, as seqüências discursivas em vão e
bater as botas devem ser consideradas como unidades léxicas, a despeito da aparên-
cia em contrário. Para distinguir entre uma lexia complexa e uma seqüência discursiva
variável podem-se aplicar dois testes:
1º) TESTE DA SUBSTITUIÇÃO.
Em seqüências como as saudações bom dia ou boa noite não podemos substituir o
primeiro vocábulo por um outro adjetivo mais ou menos sinônimo, dizendo: ótimo
dia e ótima noite, por exemplo. Na seqüência bater as botas tampouco podemos
substituir botas por sapatos. Por conseguinte, tudo leva a crer que bom dia, boa
noitee bater as botas já estão lexicalizados no nível do sistema lexical.
2º) TESTE DA INSERÇÃO. •
Numa seqüência como dor de cabeça não diremos dor "terrível" de cabeça mas
"terrível" dor de cabeça, ou dor de cabeça "terrível". Também não se diria capa
"bonita" de chuva mas capa de chuva "bonita". Tampouco se poderia inserir um
advérbio entre os constituintes de mercado negro, resultando: mercado "muito"
negro. Portanto, o teste de inserção demonstra que estão lexicalízados dor de cabe-
ça, capa de chuva e mercado negro. No exemplo acima, não podemos inserir nada
na seqüência bater as botas dizendo, por exemplo: Carlos bateu rapidamente as
botas.
Deve-se notar também que, nas lexias complexas já lexicalizadas, não mais ocorrem
o artigo, a preposição e outros vocâbulos-morferna. Assim, em de cor, de soslaio, em
vão já de muito ocorreu a elipse do artigo; do mesmo modo ocorreu a elipse da
preposição (em) em à medida que.
Infelizmente, esse problema apresenta-se mascarado e ambíguo no grande deposi-
tário da tradição léxica e dos hábitos gráficos da língua, a saber, o dicionário. Geral-
mente os falantes recorrem ao dicionário quando não sabem como escrever uma
palavra e qual o seu significado. Contudo, no caso da comunidade brasileira, dificil-
mente o consulente poderá resolver satisfatoriamente seu problema, pois a nossa
produção lexicográfica não fornece parâmetros seguros no tratamento da unidade
léxica, e a identificação dos lemas pelos nossos dicionários é extremamente criticável,
não podendo ser acatada em grande número de casos.
90
Infelizmente, a Lexicografia brasileira constitui uma antiga prática com pequena
ciência. Em geral, nossos dicionaristas foram apaixonados cultores da língua, com
pequena ou nenhuma ciência lingüística.
6. AS UNIDADES COMPLEXAS
Em seu estudo "Une classification des phrases figées du françaís", Gross (1982)
afirma que os lingüistas geralmente atribuiram às expressões cristalizadas (que ele
chama de expressions figées) um caráter de exceção, de anomalia lingüística, e não
propuseram alternativas para tratar cientificamente essa questão. Contudo, trata-se
de um fenômeno de grande envergadura e muito freqüente, que a Lingüística ignora
pela ausência de estudos sobre essa matéria. O estudo dessas combinatórias lexicaís
ou fraseológicas suscita muitos problemas teóricos e coloca em causa os papéis
atribuídos tradicionalmente à sintaxe e ao léxico.
A primeira questão que se põe é terminológica: vamos chamá-Ias de fraseologias,
fraseolexemas, expressões cristalizadas, expressões idiomáticas?
Outro problema formal importante é o ortográfico. Essas unidades complexas deve-
riam ser grafados mais apropriadamente com hífen, como por exemplo fim-de-
semana, jogo-do-bicho, indicando sua natureza de unidade.
Por outro lado, quando se deve considerar que se trata de uma unidade lexical
autônoma e quando se deve considerar que se trata de uma unidade subordinada à
base que gerou essa lexia? Dizendo de outra forma: qual é o momento em que se
consolida o processo de lexícalízação, de cristalização da lexia complexa, gerando
um novo item lexical da língua? Veja-se o caso de palavras compostas sobre a base
mãe como mãe-solteira e mãe-de-santo. Deve-se considerá-Ias como entradas de
dicionário independentes ou como subentradas sob o lema de mãe? Nesses e em
outros casos, um dicionário como o Aurélio não é coerente. Considera mãe-de-
santo, mãe-benta e várias outras lexias como lemas independentes, incluindo outros
sob a epígrafe de mãe. Mãe-solteira, por exemplo, deve subordinar-se a mãe, po-
rém, não mãe-de-santo e outras mais.
Como já enfatizamos anteriormente, nas realizações discursivas (orais e escritas) as
fronteiras entre uma unidade lexical complexa e um sintagma discursivo são difusas.
Existe toda uma gama de soldadura entre os elementos de uma combinatória lexical.
Assim, podemos identificar sintagmas lexicalizados cujos elementos componentes
estão perfeitamente soldados, e outros com um forte índice de coesão interna. Qua-
se poderíamos afirmar que a freqüência do uso vai dando aos falantes um forte
sentimento de cristalização da sequência discursiva. E aqui é fundamental o papel'
da significação. Se a combinatória lexical refere um referente único e perfeitamente
91
::;:-c
~
wo
ã'i
~-c
~
~
'"~
~
~::;:•
w
b:
~
identificável no universo extra-Iingüistico, é quase certo que o sentimento língüístíco
dos falantes os induzirá a considerar esse sintagma lexicalizado como uma lexia
complexa. É o caso de cesta básica, código de barras, dor de cabeça, mãe-de-santo,
papel higiênico, zona franca.
Em parte, esse problema se origina de uma característica fundamental da linguagem
humana: a economia linguística. De um lado, unidades simples são utilizadas em
vários domínios diferentes do conhecimento, multiplicando os valores semânticos
da palavra e gerando o fenômeno da polissemia, por outro lado, unidades simples
podem combinar-se entre si de modo quase infinito, resultando em unidades com-
plexas.
Em virtude de uma ortografia conservadora e inconsistente, numerosas unidades
lexicais já categorizadas como tal no plano do sistema lexical são, contudo, grafadas
como se fossem várias unidades, gerando ambigüidade. É o caso de: ar condiciona-
do, bom dia, cesta básica, caixa eletrônico, código de barras, colcha de retalhos,
curto circuito, dor de cabeça, fibra ótica, folha corrida, marcha à rf, papel higiêni-
co, prata da casa, pressão atmosférica, pressão arterial, saneamento básico, tábua
de salvação, título de eleitor, zona franca. Temos aí alguns exemplos de signos que
remetem a referentes das mais variadas áreas do conhecimento e das atividades
humanas, evidenciando o quanto este problema é pervasivo. Ademais, constatam-se
muitas incoerências gráficas em dicionários e na práxis lingüística de usuários da
língua, como, por exemplo, a imprensa. No tratamento lexicoestatístico de um gran-
de corpus de 6 milhões de palavras para elaborar um dicionário de freqüências,
constatei muitas e muitas vezes que há inconsistência na ortografia. Nesses casos em
pauta, por vezes se grafa com hífen e por vezes sem hífen. Um exemplo é fim-de-
semana. O Aurélio registra essa palavra como subentrada de fim, grafando essa
lexia complexa sem hífen. No corpus informatizado do jornal Folha de São Paulo de
1997, publicado em 1998 como CR-ROM, encontramos as duas grafias: fim de sema-
na e fim-de-semana. Julgo que a segunda seja melhor, em virtude de estar comple-
tado o processo de lexicalização e de o falante sentir essa seqüência como unidade,
isto é, atribuí-Ia a um referente.
É também o caso de numerosas unidades complexas de valor gramatical e não
referencial, como os acima citados. Veja-se, por exemplo, a extensa lista de unida-
des complexas de cunho gramatical tradicionalmente chamadas de locuções por
gramáticas e dicionários. Cf. locuções adverbiais - a gosto, ainda assim, a limpo,
ao longe, cada vez mais, daqui a pouco, de acordo, de soslaio, por pouco, uma vez,
etc.; locuções prepositivas - a cargo de, além de, a ponto de, com relação a, de
cima de, à guisa de, em prol de, etc.; locuções conjuncionais - além de que, a
menos que, assim que, cada vez que, da mesma maneira que, do mesmo modo que,
logo que, nem que, por conseguinte, etc.; locuções pronominais - consigo mesmo
'!
(a, os, as), ele (s) mesmots), eleis) prôprio/s), fosse qual fosse, fossem quem fosse,
onde quer que, seja onde for, seja o que for, seja qual for, etc.
O problema das unidades complexas remete também à questão igualmente desafia-
dora das seqüências de combinatórias lexicais ainda maiores. Duas categorias são
típicas: os sintagmas nominais e os sintagmas verbais. No domínio das ciências e das
técnicas, esses sintagmas são extremamente freqüentes; ademais, tais neologias Sur-
gem continuamente nessas linguagens especializadas. Assim, esse problema torna-
se altamente complexo,desafiando os lexicólogos, lexicógrafos e terminólogos. Os
sintagmas colhidos no vocabulário de várias ciências, referidos, a seguir, constituem
unidades léxicas? Cf: ácido desoxirribonucléico (ADN ou DNA), antena de freqüên-
cia ultra-eleuada, buraco negro estelar; centro de alta pressão, centro de baixa pres-
são, linha de campo magnético, fundo de curto prazo, fundo de renda fixa, foguete
AR-Mar, glândula supra-renal, lêmur-de-cauda-listrada, mico-Ieão-dourado, iodeto
de sódio pólo negativo, deficiência de enzima adenosina deaminase (doença), pro-
teína C-reativa, proteína CD- 4, nadadeira dorsal anterior, padrão de qualidade do
ar,parênquima armazenador de água, raio de luz incidente, reconhecimento ôptico
de caracteres, relatório de impacto ambiental (rima), taxa de mortalidade infantil,
título de dívida pública, ultra-alta freqüência, unidade central de processamento,
zonas de pressão atmosférica, etc.
Alguns exemplos na classe do verbo, para encerrar esse exemplário das unidades
complexas: cair de quatro, dar murro em ponta de faca, fazer das suas, fazer das
tripas coração, ficar de pés e mãos amarrados, passar desta para melhor, saber a
quantas anda, saber de cor e salteado, sem tirar nem pôr, tirar o corpofora, etc.
6.1. Passemos à análise das combinatórias ou fraseologias. Consideremos mais de
perto o caso de verbos compostos que ocorrem em muitas expressões idiomáticas.
Vou considerar um exemplo acima referido, que foi tomado a Xatara (994), a saber:
bater as botas
A sintaxe desta seqüência cristalizada não difere da sintaxe de uma combinatória
livre. Cf. as variações de tempo e modo possíveis:
Carlos bateu as botas. (Carlos morreu)
Todos sabiam que Carlos ia bater as botas.
Temo que Carlos vá bater as botas.
O sentido da seqüência bater as botas não é previsível a partir de bater (dar panca-
das; chocar-se com) e de botas (tipo de calçado). De fato, temos aqui uma combinatória
cristalizada, culturalmente herdada e registrada na memória coletiva com o significa-
93
~;".:
~
if
::;:
~
'"euo
ãl
o
~
~
U
~
'"~
="~::;:•
do de "morrer". Por isso, podemos afirmar que ela faz parte do acervo do léxico e
não é uma combinatória discursiva qualquer. Entretanto, o verbo que ela comporta
não é analisável segundo as regras que se aplicam a frases superficialmente idênti-
cas. Modificações possíveis e aceitas em frases quaisquer são impossíveis no caso da
expressão cristalizada. As variações possíveis, além daquelas acima referidas, seriam
relativas à posição dos advérbios. Cf.Carlos bateu as botas muito cedo. Carlos bateu
muito cedo as botas. É possível também fazer uma inserção: Carlos, desta vez, bateu
as botas.
As seqüências livres são aquelas em que sujeito e complemento têm distribuição
livre; nesse caso, as únicas restrições e coerções são aquelas determinadas pela
semântica. Inversamente, os sintagmas cristalizados são frases do mesmo tipoem
que, porém, um ou vários dos actantes são lexicalmente invariáveis.
Entre os sintagmas cristalizados como lexias complexas, as expressões idiomáticas
exibem grande fixidez, típicas de unidades lexicalizadas. Isso evidencia que elas têm
uma existência própria, fazendo parte do léxico da língua. Exemploziotável é forne-
cido por uma crônica de Carlos Drummond de Andrade, "Antigamente", de que
transcrevo o primeiro parágrafo, no qual o texto se constrói exatamente em torno do
princípio do estereótipo das expressões idiomáticas:
As pessoas, quando corriam, antigamente, era para tirar opai da forca, e não caíam
de cavalo magro. Algumas jogavam verdepara colher maduro, e s,gbiam com quantos
paus sefaz uma canoa.
Por outro lado, o sentido individual das palavras de uma expressão idiomática não
é pertinente, como nesse texto se evidencia. As palavras componentes de uma ex-
pressão idiomática devem ser interpretadas globalmente. Sendo registradas no
patrimônio cultural da comunidade como hábitos verbais, as expressões idiomáticas
se caracterizam por ser parte da herança lexical e devem, por conseguinte, ser
aprendidas de cor pelos falantes da língua. De fato, achamo-nos aqui não mais no
domínio do sistema lingüístico, mas no domínio da norma.
Ademais, essas seqüências cristalizadas geralmente não possuem correspondência
em outra língua e são até mesmo exclusivas de uma variedade (norma) lingüística.
Um exemplo característico seria em português quebrar o (um) galho. Cada termo
deste sintagma perde sua identidade própria e se torna assim não-analisável. Por
essa razão, os constituintes de uma expressão idiomática como essa se tornam
indissociáveis, não permitindo a supressão ou acréscimo de um elemento. As ex-
pressões idiomáticas são típicas de uma nação e estão enraizadas na sua cultura. O
português europeu, por exemplo, não possui essa expressão idiomática.
'"
De fato, as expressões idiomáticas podem ser consideradas como uma lista de irre-
gularidades fundamentais de um idioma e de uma norma lingüística.
6.2. Num estudo de 1992, "Phraseological Units", Ornella Corazzarí denomina as
unidades lexicais complexas de unidades fraseológicas, lembrando que elas são
geralmente negligenciadas por dicionários e gramáticas.
Para Corazzari as unidades fraseológicas (UF) são seqüências de palavras que têm
uma coesão interna do ponto de vista semântico e que possuem propriedades
morfossintáticas específicas. Examinemos algumas características dessas UFs.
As unidades fraseológicas são seqüências de pelo menos duas palavras separadas
por brancos, hífens ou apóstrofos: mercado negro, caixa eletrônico, caixa preta,
bomba-relógio, decreto-lei, mina d'água.
Embora sejam compostas por mais de uma palavra, elas se classificam funcional-
mente como uma única categoria lexico-gramatical. Assim, caixa eletrônico, com-
posto de N+ Adj comporta-se semanticamente como substantivo e levar a cabo e
levar grana comportam-se como verbo.
Vejamos o que diz Corazzari (1992: 5) "De um ponto de vista sintático as UFs têm
graus diferentes de cristalização, isto é, elas resistem a algumas manipulações
morfossintáticas (transformações, inserção de modificadores, flexão) e comutações
léxicas que são geralmente possíveis com construções equivalentes comuns."
Em meio às unidades fraseológicas, as expressões idiomáticas são expressões se-
manticamente opacas cujo significado não depende do sentido de cada um de seus
componentes. Por outro lado, colocações são seqüências semanticamente transpa-
rentes, formadas de itens lexicais que geralmente coocorrem. Exemplos de coloca-
ções: custo astronômico, fundos de renda fixa, livre concorrência, pressão atmosfé-
rica, queda livre, reação em cadeia, fazer a barba, fazer as malas, levar anos, levar
um século, levar a vida toda (inteira), ter (um) enfarte, etc. As UFs possuem graus
diversos de idioma ticidade e de cristalização. Assim, as lexias complexas dona de
casa,fim-de-semana, jogo de cintura, mercado negro têm maior grau de lexicalização
do que centro de alta pressão, jogo de cartas, livre fluxo de capitais, tecnologia de
ponta.
Na prática identificamos numerosos tipos de estrutura interna destas UFs. Vejamos
alguns exemplos para o sintagma nominal:
N de N: bodas de prata; prata da casa; jogo de cintura
Na N: cara a cara; cheque ao portador
'#
·;::.,
w
E;:
if
~
~wo
ã'i
o
~
~o
~o:
~
~~
•
Nem N: salto no escuro; olho no olho
N Adj: cesta básica; circuito elétrico;jogo cênico; jogo duplo
Adj N: baixo astral; livre arbítrio
N N: efeito estufa; seguro desemprego
N e N: parede e meia; unha e carne
N Part Pres: água fervente (raro); conta corrente
N Part Pas: corrente alternada; condomínio fechado; jogo de cartas marcadas
V Conj V: leva e traz (raro); vai e vem
V V: corre-corre (raro)
N Prep Adj N: centro de alta pressão; direito de livre defesa; fio de alta tensão
Adj N Prep N: livre flutuação de preços; livre fluxo de (da) informação
Vale a pena reiterarque, embora as UFs sejam estruturalmente complexas, tanto
sintática como semanticamente, elas se comportam como verbos, substantivos, ad-
vérbios, adjetivos, preposições, etc.
6.3. Concluindo: a identificação e a caracterização dos diferentes tipos de unidades
fraseolôgicas/ lexias complexas não é problema simples. A aplicação de testes mos-
tra que a linha divisória entre classes diferentes não pode ser claramente determina-
da. Entre construções totalmente cristalizadas (p. ex. bom dia, mãe-de-santo) e me-
nos cristalizadas (p. ex. tomar uma decisão/ tomar uma importante decisão, tomar
qualquer decisão) e entre expressões idiomáticas (p. ex. levar a ferro efogo) e não-
idiomáticas (levar em conta, levar em consideração) há muitos casos intermediários
que mostram graus diferentes de cristalização e de idiomaticidade.
Como a língua está em perpétuo movimento, seu caráter de inacabado e de devir
está sempre presente, sobretudo no léxico, visto que essa é a parte do sistema
linguístico mais suscetível a mudanças por constituir um conjunto aberto. As
combinatórias lexicais discursivas podem deixar de ser meras combinatórias fre-
qüentes de unidades léxicas para se converterem em novas unidades do léxico da
língua. Assim, tudo se passa na língua e no vocabulário como numa pista de corrida
- muitos corredores já ultrapassaram a barreira de chegada, outros estão se aproxi-
mando dela e outros vêm chegando de mais longe. Nessa imagem, retomada de
minha tese de doutoramento, estou simbolizando o pódio de chegada como o tér-
mino do processo da lexicalização.
Em suma: o léxico de uma língua é formado por unidades extremamente heterogê-
neas. Integram o léxico do português desde unidades simples monossilábicas, como
as formas dependentes ( artigos: o, um; preposições: de, em, com; pronomes: me, te,
se, 10, lhe) até unidades extremamente complexas, como as expressões idiomáticas.
Observação: na elaboração deste texto foram utilizados trabalhos anteriores de mi-
nha autoria (1978, 1998).
'$
REFERÊNCIAS BmUOGRÁFIcAS
Biderman, M.T.C. (1978). Lingaística teórica: lingüisttca quantitativa e computacional. Rio de Janeiro:
Livros Técnicos e Científicos.
(1998). Os dicionários na contemporaneidade: arquitetura, métodos e técnicas. In As ciên-
cias do léxico: lextcologia, lexicografia e terminologia. Campo Grande: Editora da Universidade
Federal do Mato Grosso do Sul, 129-142.
Bloomfield, L. (1961; li ed. 1933). Language. New York: Rinehart and Winston.
Corazzari, O. (1992). Phraseological untts, Consiglio Nacionale delle Richerche. Istituto di Linguistica
Computazionale. Network of European Reference Corpora (NERC), serial nº 68. Pisa. Inédito.
Ferreira, A. B.de H. (1986). Novo dicionário da língua portuguesa. Rio de Janeiro: Nova Fronteira.
Gross, M. (1982). Une classification des phrases figées du français. Revue Québécoise de Linguistique,
(11) 2, 151-185.
Harris, Z. S. (1968). Ou morpheme à l'expression, Langages. les modeles en ltngutstique, 9, rnars., 23-50.
Mikus, F. (1957). La syntagmatique et le sixiême congrês, In Misce/ánea: bomenaje a André Martinet, r.
Biblioteca Filológica. Canarías: Universidad de Ia Laguna.
Ullrnann, S. (1952). Prêcis de sêmanuque française. Paris: PUF.
Xatara, C.M. (1994). As expressões idiomáticas de matriz comparativa. Dissertação de mestrado inédita.
Araraquara: UNESP.
'%

Mais conteúdos dessa disciplina