LINGUÍSTICA COMPARADA TIPOLOGIA

•

Humanas / Sociais

Cinthya Oliveira

06/10/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Linguística I

15.377 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

L I N G U Í S T I C A
PARA O ENSINO SUPERIOR 9
GIULIA BOSSAGLIA
LINGUÍSTICA
COMPARADA
e TIPOLOGIA
3Giulia Bossaglia
1CAPÍTULO
As línguas do mundo
@Famílias linguísticas do mundo
Como para as línguas do mundo, não há um número definido de famílias lin-
guísticas – talvez, aliás, seja mais difícil chegar a um consenso com relação a
um aproximado número de famílias que a um aproximado número de línguas:
há, de fato, estimativas que vão de poucas dezenas a centenas de famílias lin-
guísticas. Isso se deve ao fato de que reconstruir uma família de línguas é uma
operação muito mais complexa que calcular o número das línguas existentes,
tanto do ponto de vista teórico quanto metodológico (no que diz respeito à
comprovação da existência de relação genética entre línguas comparadas).
Sem querer discutir os detalhes dessa complexa questão, o objetivo desta se-
ção é apresentar algumas das principais famílias linguísticas que não foram
abordadas na introdução sobre línguas do mundo feita no Capítulo 1, nem nos
Capítulos 5 (línguas da África) ou 6 (línguas das Américas).
Eurásia
Além das famílias indo-europeia e sino-tibetana, há outras importantes fa-
mílias linguísticas na Eurásia. Uma é a família uralo-altaica (do nome dos
montes Urais, na Rússia, e Altai, na China, que delimitam uma ampla região
em que suas línguas são faladas). Na verdade, é bastante controverso que se
trate de uma única família, e é mais aceita, hoje em dia, a divisão entre família
urálica, por um lado, e família macroaltaica, por outro. A família urálica com-
preende línguas faladas da Europa centro-oriental até a Rússia setentrional.
Na Europa, húngaro, estoniano e finlandês compõem o grupo ugro-fínico da
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior4
família. Línguas urálicas são faladas por aproximadamente 25 milhões de pes-
soas hoje em dia.
Figura 1: Família urálica (fonte: lewis, 2009).
Não há consenso completo sobre a composição da família altaica. Alguns es-
tudiosos defendem que ela seja composta pelos grupos túrcico, tungúsico,
mongólico, coreano e japonês, outros assumem que só os primeiros três estão
geneticamente relacionados entre si, e que coreano e japônico constituem fa-
mílias separadas. Aqui, coreano e japônico serão tratados como famílias sepa-
radas, mas independentemente da perspectiva que se adote com relação à clas-
sificação das línguas altaicas, é oportuno apresentar cada um desses grupos.
Figura 2: Família altaica: grupo túrcico (fonte: LEWIS, 2009).
O grupo túrcico possui uma extensão geográfica notável, da Turquia até a Rús-
sia norte-oriental. As línguas túrcicas são faladas hoje em dia por cerca de 120
5Giulia Bossaglia
milhões de pessoas, 40% das quais são falantes de turco (PERELTSVAIG, 2012,
p. 86). Dentre as cerca de quarenta línguas do grupo, mencionam-se aqui o
turcomeno (Turcomenistão), o cazaque (Cazaquistão), o azeri (Azerbaijão), o
quirguiz (Quirguistão) e o uigur (falado na China).
Figura 3: Família altaica: grupo mongólico (fonte: lewis, 2009).
Cerca de 5 milhões de pessoas falam línguas do grupo mongólico, sendo que
aproximadamente 50% é falante de mongol. Outras línguas mongólicas são
faladas em regiões da China e da Rússia próximas à Mongólia. Perto da região
do Cáucaso, os cerca de 290 mil habitantes da República da Calmúquia falam
o calmuco, outra língua do grupo.
Figura 4: Família altaica: grupo tungúsico (fonte: lewis, 2009).
As línguas da família tungúsica são faladas por grupos muito pequenos de
pessoas, espalhados pela Sibéria. No total, esse grupo conta com pouco mais
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior6
de 50 mil falantes, correndo, portanto, fortes riscos de extinção. O manchu,
que foi uma das línguas principais do grupo, hoje em dia é falado por apenas
poucas dezenas de pessoas (pereltsvaig, 2012, p. 212).
Figura 5: Família japônica (fonte: lewis, 2009).
Dos cerca de 130 milhões de falantes de línguas japônicas, mais de 120 mi-
lhões falam japonês, enquanto as demais línguas da família são faladas por
comunidades menores — algumas são consideradas simples dialetos do japo-
nês. Existem posições divergentes sobre uma possível relação entre a família
japônica e a coreana.
Figura 6: Família coreana (fonte: lewis, 2009).
A família é composta apenas pelo coreano, que é então uma língua isolada,
falada por cerca de 50 milhões de pessoas principalmente nas Coreias, mas
também na China, Japão e Rússia.
7Giulia Bossaglia
Outras famílias linguísticas da Eurásia são as caucasianas. O Cáucaso se des-
taca por uma significativa diversidade linguística (em uma área geografica-
mente não muito extensa). São três as famílias caucasianas: caucasiana norte-
-ocidental (cf. o georgiano, entre várias outras línguas), caucasiana do sul ou
kartveliana (abcásio, entre outras) e caucasiana norte-oriental (lezgui, entre
outras). Trata-se de famílias linguísticas, a que pertencem cerca de 11 milhões
de falantes, muito antigas e diferentes do ponto de vista tipológico.
Figura 7: Famílias caucasianas (fonte: lewis, 2009).
No Sudeste asiático, encontram-se as famílias austroasiática — que com-
preende cerca de 170 línguas, com aproximadamente 100 milhões de falan-
tes, espalhadas entre Índia, Vietnã e Malásia continental (principais línguas:
vietnamita, mon, khmer) — e a tai-kadai, com aproximadamente 80 milhões
de falantes (principais línguas: tailandês, laociano).
Figura 8: Família austroasiática (fonte: lewis, 2009).
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior8
Figura 9: Família tai-kadai (fonte: lewis, 2009).
Na parte centro-meridional da Índia e no Sri Lanka, são faladas as línguas
dravídicas (cerca de 230 milhões de falantes), como tâmil, kânnada, télugu,
malayalam. No Paquistão, cerca de 2 milhões de pessoas falam o brahui, que
também pertence a essa família.
Figura 10: Família dravídica (fonte: lewis, 2009).
Oceania
Uma das famílias linguísticas mais ameaçadas do planeta está na Oceania: a
família australiana. Os efeitos da colonização foram particularmente letais
para as comunidades aborígenes, e estima-se que para as cerca de 380 línguas
da família o número de falantes gire em torno de 40 mil.
9Giulia Bossaglia
Figura 11: Família australiana (fonte: lewis, 2009).
Américas
Como se explica no Capítulo 6, a classificação genética das línguas nativas das
Américas é bastante complicada e até hoje controversa. Mencionam-se, portan-
to, apenas algumas das muitíssimas famílias classificadas para esse continente.
A família esquimó-aleutina compreende as línguas inuit, yupik, inuktikut e inupia-
tun, faladas por cerca de 90 mil pessoas entre Canadá, EUA, Groenlândia e Rússia.
De acordo com a classificação greenberguiana (cf. Figura 12), a família es-
quimó-aleutina faria parte da macrofamília euroasiática (junto com as famí-
lias indo-europeia e sino-tibetana, portanto).
Figura 12: Família esquimó-aleutina (fonte: lewis, 2009).
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior10
Dentro da controversa macrofamília dené-caucasiana, entraria a (reconhe-
cida) família na-dené da América do Norte, que compreende as línguas ata-
baskanas, como tlingit (Alaska e Canadá), navajo e apache (Califórnia e Méxi-
co norte-ocidental).
As principais famílias da América central são a uto-asteca (principal língua:
nahuatl), oto-mangueana (mixteco, zapoteco, entre outras), maia (maia, tsot-
sil, entre outras), mixe-zoqueana (mixe e zoque são as línguas principais). Em
sua maioria, essas línguas são faladas no México, mas também estão presen-
tes no Sudoeste dos EUA.
Figura 13: Macrofamílias linguísticas das Américas de acordo com Greenberg (1987).
GREENBERG, J. H. (1987). Language in the Americas. Stanford: Stanford University Press.
LEWIS, M. W. (2009). GeoCurrent. The People, Places & Languages shaping Current Events. Disponível
em: <http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-
-language-families>. Acesso em:09 mar. 2020.
PERELTSVAIG, A. (2012). Languages of the world: An introduction. Cambridge: Cambridge University
Press.
@história da escrita, sistemas de escrita
Com o termo “escrita” entende-se o processo (e seu resultado) de registrar a
língua sobre algum tipo de suporte físico, para que esta se torne visível — a
língua falada não o é.
http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-language-families
http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-language-families
11Giulia Bossaglia
No mundo contemporâneo, a escrita é algo extremamente corriqueiro. Todos
os dias, bilhões de pessoas leem e/ou escrevem placas de trânsito, cartazes,
mensagens nas telas dos celulares, dos computadores, livros, jornais, rótulos,
cardápios etc. Com poucos anos de idade, as pessoas aprendem a decifrar e
utilizar os caracteres de diversos sistemas de escrita em diferentes lugares do
mundo (cada vez mais, os governos dos países visam alfabetizar a totalidade
da população). Entretanto, a escrita não é nada “corriqueira”, e muito mudou
nas vidas das comunidades humanas após a invenção dessa tecnologia. Nas
próximas seções, serão esboçadas noções relativas ao surgimento da escrita,
às tipologias de sistemas de escrita e à sua evolução histórica.
1. Um pouco de história
As mais antigas atestações da escrita remetem ao final do IV milênio aEC e são
as tábuas de Uruk, antiga cidade suméria (no atual Iraque). Sumérios, assírios,
acadianos e elamitas foram as grandes civilizações do Crescente Fértil, que
viveram durante muito tempo em uma situação de intenso contato histórico e
cultural. Tratava-se, obviamente, de civilizações agrícolas, que desenvolveram
grandes comunidades urbanas e que precisavam da escrita para diversos fins
práticos, antes que literários ou caligráficos: contabilidade (por exemplo, em
atividades como construção de grandes obras — templos, palácios, pontes,
obras de irrigação — para as quais os responsáveis tivessem que prestar con-
ta ao poder central), fixação de leis, comunicação entre cidades diferentes etc.
As tábuas de Uruk são pequenas tábuas de argila seca, que contêm atestações
do sistema de escrita conhecido como cuneiforme. Esse nome evoca a típica
forma de “cunha” (do latim cuneus) de seus caracteres, porque eram marca-
dos com uma ferramenta pontiaguda, enquanto a argila estava ainda fresca, e
na tábua ficavam signos com essa forma.
Todas as civilizações mencionadas — e, não muito distante do Crescente Fértil,
em territórios que pertencem hoje à Turquia, a civilização hitita — se serviam
desse sistema de escrita para escrever suas línguas, que tinham procedências
genéticas diversas: a língua suméria e o elamita eram línguas isoladas, o as-
sírio e o acadiano línguas semíticas da família afro-asiática (como o árabe),
o hitita era uma língua indo-europeia. Fica claro, portanto, que o sistema de
escrita utilizado por uma comunidade linguística tem relação com o contexto
histórico-cultural daquela comunidade, e não necessariamente com a família
linguística à qual pertence sua língua.
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior12
O fato de todas essas civilizações do antigo Oriente Médio utilizarem o mesmo
sistema de escrita foi utilizado como prova de uma monogênese (i.e., uma ori-
gem única) da escrita, que teria sido inventada pelos sumérios e transmitida
por difusão cultural para outras civilizações antigas. Na Figura 1, apresenta-se
uma cronologia dos principais sistemas de escrita da antiguidade, tentando
também dar uma ideia (ainda que bastante aproximada) das recíprocas posi-
ções geográficas das civilizações:
Figura 1: Cronologia da escrita na antiguidade (adaptado de damerow, 1999, p. 4, e coulmas, 1996).
Como se vê, a escrita cuneiforme suméria foi rapidamente passada para a civi-
lização elamita (atual Irã) no começo do III milênio aEC, enquanto, na mesma
época, a escrita aparecia, em forma de hieróglifos, no antigo Egito. Na segun-
da metade do III milênio aEC, a escrita é encontrada na civilização de Harap-
pa (do nome de um de seus principais centros urbanos), no Vale do rio Indo
(atual Paquistão). Na virada para o II milênio aEC, surgiram os hieróglifos da
civilização minoica na ilha de Creta (o sistema de escrita conhecido como “Li-
near A”, ainda não decifrado), enquanto a escrita cuneiforme era utilizada pe-
los hititas. O ancestral do alfabeto fenício deve ter sido criado pouco depois,
por volta de 1800 aEC, e foi a partir do alfabeto fenício que mais tarde foi cria-
do o alfabeto grego, em torno do começo do I milênio aEC (o alfabeto latino foi
criado a partir dele: as primeiras atestações remetem ao VI séc. aEC). A mais
antiga escrita chinesa atestada, conhecida como escrita dos “ossos oracula-
res” — inscrições religiosas achadas em escápulas de boi e ovelha e em cascos
13Giulia Bossaglia
de tartaruga —, remete aproximadamente a 1300 aEC, mas pela convenciona-
lização dos caracteres utilizados acredita-se que a escrita tenha surgido bas-
tante antes (provavelmente, por volta do começo II milênio aEC). Sistemas de
escrita meso americanos, como o maia e o asteco, se desenvolveram bastante
mais tarde, por volta do V séc. aEC — pouquíssimos documentos sobrevive-
ram à invasão dos colonizadores espanhóis no séc. XVI.
É claro que na área do Crescente Fértil e do Mediterrâneo em geral seria mais
fácil defender a ideia de uma monogênese da escrita e de sua difusão por trans-
missão cultural, pois todas as civilizações dessas regiões estiveram em inten-
sas e prolongadas relações econômicas e culturais; ainda, há registros de con-
tatos entre civilizações da Mesopotâmia e do Vale do Indo. Entretanto, tanto a
China quanto a Mesoamérica não se encaixam nessa hipótese. Apesar de ser
certo que a cuneiforme suméria se difundiu por transmissão cultural para as
diferentes civilizações que adotaram tal sistema na Mesopotâmia e em regiões
limítrofes, para outros sistemas de escrita, como os hieróglifos egípcios e a es-
crita chinesa, não há registros de fases iniciais de seu desenvolvimento — eles
aparecem, nas atestações mais antigas que se tem, como sistemas já avança-
dos. Independentemente da possibilidade de obter mais informações acerca
disso, não há dúvida de que a hipótese mais plausível para o surgimento da
escrita seja aquela de uma poligênese (i.e., “muitas gêneses” vs. a ideia de uma
única; na verdade, houve poucas gêneses independentes, e mais transmissões
culturais: rogers, 2005, p. 4), em lugares diferentes, o mais antigo dos quais foi
aquele da escrita cuneiforme suméria no final do IV milênio aEC.
Entretanto, fica por explicar como e por que a escrita começou. Não é de to-
dos os sistemas da antiguidade (cf. escrita chinesa e hieróglifos egípcios) que
se tem atestações dos estágios mais primitivos, i.e., da protoescrita. Com este
termo (do grego prótos “primeiro” + “escrita”), entende-se o conjunto de re-
cursos visuais utilizados para comunicação e armazenamento de informação,
mas também decoração, próprios de muitas grandes civilizações do passado:
decorações em vasilhas e outros manufatos, tábuas de argila e selos indicando
propriedade, cordas com nós (o sistema de contabilidade inca, o quipu) etc.
Geralmente, a protoescrita se caracteriza como mais pictórica e icônica que os
sistemas de escrita propriamente ditos, e, efetivamente, a evolução “natural”
dos sistemas de escrita segue sempre um caminho que parte de estágios mais
icônicos para se tornar cada vez mais arbitrário, e nunca vice-versa (cf. seção
2). Em outros termos, o que se considera protoescrita é um sistema de signos
gráficos para o armazenamento de algum tipo de informação, mas não neces-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior14
sária e sistematicamente relacionado com a representação visual da língua —
muito pelo contrário, a interpretação linguística dos signos gráficos deve ter
ocorrido só em um segundo momento.Muitas das tábuas de argila de Uruk são documentos que atestam transa-
ções de natureza econômico-administrativa, relacionadas com a construção
de grandes obras (templos, principalmente) e o gerenciamento dos recursos
materiais e humanos. Os ancestrais dessas famosas tábuas foram pequenas
fichas de argila de formatos e tamanhos diferentes de acordo com o tipo de
bem ou medida que representavam (esféricas para azeite, cônicas e achatadas
para diferentes medidas de cevada, cilíndricas e redondas para animais do-
mésticos etc.: SCHMANDT-BESSERAT, 2014; SCHMANDT-BESSERAT; ERARD,
2008) e eram utilizadas para registrar bens, entre o VIII e o IV milênio aEC.
Para fazer contabilidade, não era estritamente necessária a mediação da lín-
gua, e por isso os estudiosos têm se concentrado cada vez mais na análise de
como se desenvolveram os grafemas para os números (para hipóteses sobre
a coevolução da capacidade de fazer cálculos e o letramento: ROBSON, 2007;
CHRISOMALIS, 2009). Estes seriam o elo de ligação entre a protoescrita e a
escrita propriamente dita: a partir de uma representação icônica em que uma
quantia x de um objeto y corresponde à repetição x vezes de um desenho de
y, chega-se, graças a um processo de abstração, a uma notação mais arbitrária
que associa o desenho de y a um símbolo para a quantia x, como mostra o
exemplo da Figura 2:
Figura 2: Exemplo de desenvolvimento dos grafemas para números.
15Giulia Bossaglia
Para armazenar a informação “cinco vacas”, em um estágio inicial (protoescri-
ta), desenhavam-se cinco vacas, sendo o grau de iconicidade máximo. Com o
passar do tempo, essa representação icônica foi substituída por outra, mais ar-
bitrária e econômica, em que ao desenho de uma vaca se associava um símbolo
indicando a quantidade “cinco”. A partir desse estágio intermediário, os grafe-
mas (detalhes sobre este termo na seção 2) para “vaca” e para “cinco” adqui-
rem independência: o primeiro, representando a palavra “vaca”, e o segundo, o
número “cinco” — assim começaria a escrita, entendida como sistema de signos
com o fim de representar entidades (abstratas) da língua (palavras, mas tam-
bém: morfemas, sílabas, fonemas) e do pensamento (números).
2. Sistemas de escrita: definição, tipos, evolução
Por “sistema de escrita”, entende-se um conjunto de signos gráficos utilizados
para representar de forma sistemática unidades da língua, no intuito de regis-
trar/armazenar informações e mensagens. Em um paralelismo terminológico
com a distinção entre fone e fonema, as menores unidades de escrita são os
grafes, enquanto os grafemas são os grafes ou grupos de grafes que represen-
tam unidades linguísticas (i.e., abstratas) de algum tipo — podem ser unida-
des de som, unidades morfológicas ou semânticas. Grafemas se transcrevem
utilizando os símbolos “<” e “>”. Por exemplo, o grafema <lh> do português
escrito é formado por dois grafes (l, h), que pertencem ao alfabeto latino, mas
representa uma única unidade linguística: o fonema /ʎ/; <s>, <ç>, <ss>, <x>,
e <z> podem ser considerados alógrafos do grafema para o fonema /s/, como
em sapo, aço, assar, máximo e paz; a palavra nhoque compreende seis grafes
<n, h, o, q, u, e>, mas apenas quatro grafemas <nh>, <o>, <qu>, <e>, um para
cada fonema da palavra /ˈɲɔki/.
Dependendo do tipo de unidade linguística à qual correspondem os grafemas
de um sistema de escrita, ele será um sistema cenêmico (do antigo grego ke-
nós “vazio”) ou plerêmico (do grego pléres “cheio”). Os sistemas cenêmicos
são sistemas cujos grafemas representam unidades de som apenas (são “es-
vaziados” de significado), como os alfabetos fonéticos e silábicos, enquanto os
sistemas plerêmicos, como os ideográficos, logográficos e logosilábicos, pos-
suem grafemas que representam unidades linguísticas de significado, lexical
ou gramatical, e não apenas de som.
Em seus estágios mais antigos, a escrita cuneiforme suméria era um sistema
de tipo logográfico (do grego lógos “palavra”), i.e., plerêmico: cada grafema
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior16
correspondia a uma palavra, principalmente nomes concretos, e mantinha
um razoável grau de iconicidade, como se mostra na Figura 3 (adaptada de
COULMAS, 1996, p. 100):
ave
peixe
asno
andar
grão
boi
Figura 3: Alguns grafemas sumérios em estágio arcaico da escrita cuneiforme.
A iconicidade dos grafemas acima permite que o significado (mas não o som!)
das palavras que eles representam seja facilmente interpretado também por
quem não conhece absolutamente nada da língua suméria.
Um sistema de escrita que consegue representar principalmente nomes con-
cretos é, claramente, limitado. Para ampliar o número de lexemas representá-
veis, era comum a cuneiforme suméria combinar mais grafemas. Por exemplo,
a palavra “comer” era escrita combinando os grafemas “boca” e “pão”:
+ =
boca pão comer
Preste-se atenção para o fato de que o que é combinado são os significados,
mas não os sons das duas palavras — o som da palavra “comer” não é fruto da
combinação dos sons de “boca” e “pão”.
Ainda, os grafemas que representavam determinadas palavras passaram a re-
presentar palavras de significado derivado ou próximo, mas de som diferente: o
grafema para a palavra “arado” (em sumério apin) começou a ser utilizado para
o verbo “lavrar” (uru), e mais tarde para “lavrador” (COULMAS, 1996, p. 101).
17Giulia Bossaglia
Aos poucos, portanto, esse sistema plerêmico foi se “esvaziando”, também de-
vido à mudança de suporte em que a cuneiforme era escrita. As tábuas de
Uruk, de fato, eram pequenas e quadradas, e escritas de baixo para cima, segu-
rando-as em uma mão. Quando começaram a ser utilizados suportes maiores
e retangulares, os grafemas subiram uma rotação de eixo, como se mostra na
Figura 4 (adaptada de COULMAS, 1996, p. 100):
A B C
ave
peixe
asno
andar
grão
boi
Figura 4: Evolução da cuneiforme suméria.
Na coluna B, são apresentados os grafemas da cuneiforme suméria após a ro-
tação de eixo, que, como se pode observar, reduziu o grau de iconicidade dos
grafemas. Na coluna C, mostra-se a evolução que os mesmos grafemas tiveram
na cuneiforme utilizada pelos assírios — civilização que se desenvolveu cerca
de 1.000 anos mais tarde que a suméria —, e os grafemas mostram ter perdido
toda a iconicidade com relação às palavras que originariamente representavam
na cuneiforme suméria. De fato, na cuneiforme assíria, os grafemas estão repre-
sentando sílabas, ou seja, o sistema cuneiforme se tornou um sistema cenêmico.
Já depois da rotação de eixo dos grafemas na cuneiforme suméria, eles tinham
começado a assumir, de vez em quando, uma função “fonética”: o grafema para
a palavra ti “flecha” era utilizado para escrever a palavra til “vida”, e assim por
diante. Assim, a perda de iconicidade dos grafemas com relação ao significa-
do das palavras que eles representavam impulsionou a evolução do sistema
cuneiforme para um sistema cenêmico de tipo silabográfico.
Sistemas de tipo cenêmico são mais econômicos, por serem arbitrários: eles
precisam de uma quantidade limitada de grafemas para representar os sons
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior18
da língua, mas podem ser combinados de maneira (potencialmente) ilimitada
para escrever todas as palavras existentes ou que serão eventualmente criadas
na língua. Por sua vez, sistemas plerêmicos são menos econômicos, pois cada
grafema tende a representar palavras ou morfemas, com maiores custos (na
escrita e na leitura) para a ampliação do conjunto de palavras representáveis.
Comparando o inventário grafêmico da cuneiforme nas muitas civilizações
que a utilizaram ao longo dos quatro milênios aEC, observa-se uma progres-
siva diminuição dos grafemas pertencentes ao sistema: de cerca de 2.000 na
suméria, a 800-700 na assírio-babilônia, a pouco mais que 100 na elamita, 41
na persa (VI-IV sécs. aEC), só para dar alguns exemplos.
Uma evolução parecida se observa no sistema de escritalogográfica chinesa,
como se pode ver comparando a escrita dos ossos oraculares (1400 aEC) com
seus desenvolvimentos mais recentes:
1400 aEC 1100 aEC 220 aEC 200 aEC 1950 EC
cavalo
ver
chuva
Figura 5: Evolução da escrita chinesa (adaptado de XIAO; TREIMAN, 2012).
Como na evolução da cuneiforme suméria, a escrita chinesa também perdeu
iconicidade ao longo do tempo — paralelamente, os grafemas ampliaram seu
leque funcional, afastando-se da simples representação dos significados das
palavras que representavam originalmente através da aquisição de novos va-
lores, até o uso fonético: o moderno grafema 马, na primeira linha da tabela
reportada na Figura 5, que representava a palavra ma3 “cavalo” (o número
indica o tipo de tom) no II milênio aEC, hoje, além de manter esse valor, é uti-
lizado em combinação com outro grafema (妈) para escrever a palavra ma1
“mãe”, servindo apenas com função fonética (indica o segmento [ma]). O ver-
bo “ver” era escrito com um signo muito semelhante a um olho, e “chuva” por
meio de um signo que lembra uma nuvem da qual caem gotas — dificilmente
podem-se reconhecer esses conceitos nas formas dos modernos grafemas,
que, inclusive, podem ser utilizados com outros valores semânticos, ou tam-
bém apenas como complementos fonéticos.
19Giulia Bossaglia
O próprio alfabeto latino não foge a esse processo, no que diz respeito à sua
história. Ele deriva do alfabeto grego, por sua vez desenvolvido do alfabeto fe-
nício, de origem semítica (do ponto de vista linguístico, pertencente à família
afro-asiática). As letras desse alfabeto possuíam os nomes semíticos das enti-
dades que seus grafemas originariamente representavam de forma icônica: a
primeira letra chamava-se ’alp (cf. grego alfa) “boi”, e sua forma correspondia
a uma cabeça de boi estilizada; bet (cf. grego beta) “casa”, e tinha uma forma
quadrada representando a estrutura básica de uma habitação; a letra digg
“peixe” possuía essa forma etc.:
’alp bet digg
’ b d
Figura 6: Alguns caracteres do alfabeto protossinaítico
(fonte: https://www.omniglot.com/writing/protosinaitc.htm).
O <A> do alfabeto latino nada é senão o desenvolvimento de um desenho de
uma cabeça de boi, e o mesmo vale para o <B>, o <D>, e todos os outros gra-
femas que o compõem. Nenhum usuário do alfabeto latino hoje seria capaz
de reconhecer nesses grafemas esses significados originários, e o mesmo vale
para os usuários dos alfabetos fenício e grego: em todos estes sistemas de
escrita, os grafemas são associados a unidades de som de maneira arbitrária.
O fato de todos os sistemas de escrita evoluírem de mais plerêmicos (mais
icônicos) para mais cenêmicos (mais arbitrários) demonstra, novamente, que
a arbitrariedade é vantajosa para o manuseio de um sistema de signos (nes-
se caso, gráficos) — decorando um número restrito de grafemas arbitrários,
pode ser escrito um número (potencialmente) altíssimo de palavras. Em um
sistema em que cada grafema corresponde a uma palavra, é previsível que o
número de grafemas tenda a aumentar à medida que o léxico da língua se ex-
pande. Contudo, um número demasiado alto de grafemas não seria facilmente
manuseável (desgastante do ponto de vista tanto da leitura quanto da escrita)
e, de fato, sistemas plerêmicos tendem a desenvolver estratégias arbitrárias
também (por exemplo, o uso fonético/cenêmico de grafemas que também têm
valor plerêmico, como vimos com ma1 na escrita chinesa contemporânea).
https://www.omniglot.com/writing/protosinaitc.htm
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior20
CHRISOMALIS, S. (2009). The origins and coevolution of literacy and numeracy. The Cambridge han-
dbook of literacy, v. 59, p. 59–74.
COULMAS, F. (1996). The Blackwell encyclopedia of writing systems (p. 469). Oxford: Blackwell.
DAMEROW, P. (1999). The Origins of Writing as a Problem of Historical epistemology. (versão pré-
-publicação, em https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF; acesso em: 09 mar.
2020).
ROBSON, E. (2007). Literacy, numeracy, and the state in early Mesopotamia. Literacy and the State in
the Ancient Mediterranean. Accordia Research Institute, London, p. 37-50.
ROGERS, H. (2005). Writing systems: A linguistic approach. Oxford: Blackwell.
SCHMANDT-BESSERAT, D. (2014). The evolution of writing. University of Texas at Austin, 25. (http://
sites.utexas.edu/dsb/tokens/the-evolution-of-writing/; acesso em: 09 mar. 2020)
SCHMANDT-BESSERAT, D.; ERARD, M. (2008). Origins and forms of writing. Handbook of research on
writing: History, society, school, individual, text, p. 7-22.
XIAO, W.; TREIMAN, R. (2012). Iconicity of simple Chinese characters. Behavior research methods, 44
(4), p. 954-60. (https://link.springer.com/article/10.3758/s13428-012-0191-3; acesso em: 09
mar. 2020).
https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF
http://sites.utexas.edu/dsb/tokens/the-evolution-of-writing/
http://sites.utexas.edu/dsb/tokens/the-evolution-of-writing/
https://link.springer.com/article/10.3758/s13428-012-0191-3
21Giulia Bossaglia
@ símbolo, ícone, índice
Uma das caraterísticas do signo linguístico é a arbitrariedade (ou seja, falta de
motivação) da relação entre o significado e o significante: não há uma razão
lógica ou natural pela qual ao significado de “recipiente cilíndrico utilizado
para beber líquidos etc.” em português esteja associado o significante “copo”.
Em todas as línguas naturais, a grande maioria das palavras corresponde a
signos arbitrários, mas há exceções.
O linguista americano Charles Sanders Peirce (1839-1914) foi um dos princi-
pais teóricos da semiótica (do grego seméion “signo”), a ciência que estuda os
signos. Com base no tipo de relação existente entre significado e significante,
Peirce distinguiu três tipos de signos: ícone, índice e símbolo.
Os ícones (do grego eikón “imagem”) são signos em que há uma relação de se-
melhança entre significante e significado. No jogo “pedra-papel-tesoura”, por
exemplo, os três gestos feitos com a mão para veicular o significado de “pe-
dra”, “papel” e “tesoura” imitam as formas desses objetos. Portanto, os ícones
são signos motivados (i.e., não arbitrários): o significado “tesoura” é associado
ao gesto com indicador e médio esticados, imitando as lâminas dessa ferra-
menta. No âmbito linguístico, o exemplo mais claro de ícones é o das onoma-
topeias, palavras que imitam sons da realidade (au au imita o latido de um ca-
chorro, tic tac o som de um relógio, cof cof a tosse etc.) e que, portanto, tendem
a ser parecidas no nível interlinguístico. Podem ser ícones também palavras
que não são onomatopeias, mas como elas imitam algum som, como o verbo
inglês to cough ([kɒf]) “tossir”, mas também, de alguma forma, palavras como
2CAPÍTULO
Dois olhares
sobre as línguas:
sistema e diassistema
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior22
os numerais do tipo de dezenove, cujo significado (“ideia de 19”) mantém uma
relação de semelhança com a soma de dez e nove, facilmente reconhecível no
significante (mas atenção: dez e nove não deixam de ser palavras arbitrárias!).
Os índices são signos motivados também, mas a relação entre significado e
significante é de proximidade física ou metafórica, logo, lógica, de causa-efei-
to. Pegadas no chão são índice da passagem de alguém — inclusive, a partir da
forma ou profundidade, quem vir as pegadas pode inferir que tipo de ser ou
veículo as deixou; o arco-íris é índice de que choveu; a fumaça é índice de fogo
— se ela for muito grande, de incêndio; se for pequena, de cigarro, e assim por
diante. Algumas categorias de palavras, como os advérbios de tempo e lugar,
os pronomes pessoais e os demonstrativos, podem ser assimiladas a índices,
por seus “significados” serem atrelados (i.e., manterem relação de proximida-
de) ao contexto específico da enunciação — em linguística são chamados, não
por acaso, de dêiticos (do grego déiknumi “indicar”). O advérbio ontem indica
dias diferentes se for pronunciado em 1 ou 2 de janeiro;aqui, falado em São
Paulo, indica um lugar diferente se for pronunciado em João Pessoa; quando
tratamos por tu ou você pessoas diferentes, esses pronomes têm valores dife-
rentes. É claro, portanto, que o valor que os dêiticos assumem varia de acordo
com os contextos específicos em que são utilizados. Por razões de precisão, é
importante sublinhar uma diferença entre signos linguísticos que são ícones
e signos que são índices: nos primeiros, a relação de semelhança existe efeti-
vamente entre significante e significado, entretanto, nos dêiticos a relação de
proximidade existe entre o signo como um todo (significado e significante) e
seu referente no mundo real. De fato, a relação entre o significante ontem e o
significado “dia logo anterior a hoje”, entre aqui e “este lugar”, e entre tu/você
e “segunda pessoa singular” etc. é completamente arbitrária — mas não a re-
lação desses signos com as entidades (lugar, tempo, pessoas) que designam
no momento da enunciação.
Os símbolos são, na distinção do Peirce, os únicos signos arbitrários, em que
a relação entre significado e significante não é motivada. Um exemplo por ex-
celência é o semáforo: não há uma razão pela qual a essas cores específicas
estejam associadas as respectivas ações, e todos (oxalá!) aprendemos que
vermelho significa “parar”, verde “seguir” etc. Os grafemas do nosso alfabeto
também são símbolos: o fonema /a/ ser representado graficamente por <A,
a> e o /f/ por <F, f> é fruto de uma convenção — poderia perfeitamente dar-se
o contrário, se a convenção fosse outra. A grande maioria das palavras nas lín-
guas naturais é composta por símbolos, por óbvias razões de economicidade.
23Giulia Bossaglia
Na linguística, o termo iconicidade (também: motivação) se opõe a arbi-
trariedade: ícones e índices são, portanto, signos icônicos; símbolos são
signos arbitrários.
É importante saber que, ao longo do tempo, signos icônicos podem se tor-
nar arbitrários. Os signos ♀ e ♂ utilizados na biologia para indicar os sexos
biológicos “feminino” e “masculino”, respectivamente, para nós são símbolos
como as letras do alfabeto, mas antigamente, no mundo romano, eles eram
ícones: ♀ representava o espelho da deusa do amor Vênus, sendo o espelho
o acessório culturalmente associado à vaidade feminina; enquanto ♂ repre-
sentava escudo e lança do deus da guerra Marte, pois a guerra era uma ativi-
dade culturalmente associada à masculinidade, assim como as características
de força, violência etc. Hoje em dia, ninguém pensa em Vênus e Marte quando
vê esses signos, que portanto passaram de icônicos a arbitrários.
De forma parecida, os números árabes originariamente não eram símbolos,
mas ícones (a quantidade numérica correspondia à quantidade de ângulos
detectáveis em cada dígito); as letras do alfabeto latino se originaram a partir
de ícones (o <A>, por exemplo, do desenho de uma cabeça de boi, o <E> da
figura estilizada de uma pessoa...) etc.
Fica claro, portanto, que a oposição entre iconicidade e arbitrariedade está
também associada a fatores culturais de determinadas comunidades de falan-
tes e sistemas linguísticos específicos.
Outro exemplo da evolução de icônico para arbitrário nas línguas pode ser
observado na diferença entre a atribuição de gênero gramatical em algumas
palavras: português, espanhol e italiano atribuem gênero masculino à palavra
“sol” e feminino à “lua” (o sol ~ a lua; el sol ~ la luna; il sole ~ la luna); o con-
trário se observa em alemão e lituano (die Sonne ~ der Mond; Saule ~ Menulis;
literalmente “a sol”, “o lua”). Essa diferença não é nada surpreendente, pois as
línguas atribuem o gênero gramatical de forma arbitrária na grande maioria
dos casos: não há uma razão pela qual copo seja uma palavra de gênero mas-
culino e cadeira feminino (não é o mesmo com as palavra pai e mãe, ou ho-
mem e mulher, às quais o gênero masculino e feminino é atribuído de maneira
icônica, por semelhança entre sexo biológico e gênero gramatical; mas esses
são casos muito menos frequentes nas línguas). À primeira vista, portanto,
poderíamos pensar que português, espanhol, italiano e alemão e lituano sim-
plesmente atribuem o gênero gramatical às palavras “sol” e “lua” de forma
arbitrária, assim como o fazem com muitas outras palavras.
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior24
Entretanto, é possível recuperar uma motivação (i.e., iconicidade) na diferen-
ça de atribuição de gênero para “sol” e “lua” nessas línguas. Não por acaso as
línguas em que ao sol é atribuído gênero masculino são línguas originárias do
sul da Europa, e aquelas que lhe atribuem gênero feminino do norte. Há uma
diferença climático-ambiental entre essas regiões do continente europeu que
faz com que o sol seja o elemento mais “forte” (a força era iconicamente asso-
ciada ao sexo masculino) no sul, e muito menos no norte (a fraqueza era iconi-
camente associada ao sexo feminino). Então, nas culturas primitivas originárias
dessas áreas, o sexo das divindades associadas a esses elementos foi escolhido
de forma icônica de acordo com a força (masculino) vs. fraqueza (feminino) des-
ses elementos nos respectivos ambientes. Vestígio dessa diferença é a diferen-
te atribuição de gênero gramatical para “sol” e “lua” nas línguas mencionadas.
Obviamente, nenhum falante nativo dessas línguas hoje tem consciência de tal
origem icônica (a não ser que se interesse por essas questões ou que alguém lhe
conte em uma aula...) e declina “sol” e “lua” pelo gênero masculino ou feminino
da mesma forma como declina “copo”, “cadeira”, “ônibus”, “pedra” etc.
Um dado interessante sobre a relação entre iconicidade e arbitrariedade pro-
vém da história dos sistemas de escrita, que se originaram todos como siste-
mas icônicos, evoluindo para parcial ou completamente arbitrários ao longo
do tempo — a evolução inversa nunca se deu (cf. @sistemas de escrita).
@ fonemas, fones, alofones
Aprofunda-se aqui a oposição entre os conceitos de fone, a menor unidade
sonora de uma língua, e fonema, a menor unidade da língua dotada de valor
distintivo — i.e., capaz de distinguir palavras de significado diferente. Soman-
do as pronúncias das palavras ‘porto’ [ˈpoɾtʊ] / [ˈpoʀtʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] /
‘posto’ [ˈpostʊ], obtêm-se cinco sequências fônicas diferentes, todas diferen-
ciadas pelo som (i.e., fone) situado no meio da sequência, entre a vogal tônica
[o] e a consonante [t] (em linguística, os fones são transcritos entre colche-
tes). Entretanto, às cinco diferentes sequências fônicas não correspondem
cinco diferentes palavras: [ˈpoɾtʊ] / [ˈportʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] são todas rea-
lizações distintas da mesma palavra ‘porto’, e [ˈpostʊ] de ‘posto’. Logo, os fones
[ɾ, r, ɻ, χ] não são fonemas, por não serem capazes de distinguir palavras de
significado diferente, mas são realizações distintas (tecnicamente, alofones:
do grego allós “diferente, outro” + phoné “som”) de um mesmo fonema /R/,
que se opõe ao fonema /s/, formando o par mínimo ‘porto ~ posto’, e também
‘caro ~ caço’, ‘arco ~ asco’ etc. (fonemas se transcrevem entre barras).
25Giulia Bossaglia
Ainda, na pronúncia de ‘porto’ e ‘posto’, existe uma diferença entre o primeiro
e o segundo ‘o’, devido à natureza tônica do primeiro, mas não do segundo,
realizado como [ʊ] (um pouco mais alto, frouxo e menos posterior que [o]).
Isso acontece porque a posição do segundo ‘o’ logo após a sílaba tônica da
palavra (sua porção mais “forte”) “enfraquece” sua pronúncia. Esses efeitos
fonéticos da realização do ‘o’ não lhe tiram o status de fonema: /o/ é capaz
de distinguir os pares mínimos ‘porto ~ parto’, ‘porto ~ porta’ etc. Ademais,
nenhum falante percebe facilmente a diferença fonética entre [o] e [ʊ], não só
por ela ser efetivamente pequena, mas sobretudo por existir, na mente dele,
o fonema /o/, que tem o efeito, na percepção dos sons, de deixar em segundo
plano a diferença concreta entre [o] e [ʊ].
De fato, frente à estabilidade dos fonemas na mente dos falantesde uma lín-
gua, os fones “flutuam”, não só, por exemplo, de dialeto para dialeto (cf. a di-
ferença entre as pronúncias ‘pr[o]blema’ e ‘pr[ɔ]blema’, ‘b[e]leza’ e ‘b[ɛ]leza’,
‘m[e]nino’ e ‘m[i]nino’ etc.), mas também dentro de um mesmo idioleto (do
grego ídios “privado, próprio” + légein “falar”), ou seja, a “língua” de um mes-
mo indivíduo. Nenhum falante pronuncia sempre da mesma idêntica maneira
os fonemas da sua língua, mas sim, todos os falantes dessa língua compar-
tilham as mesmas representações abstratas desses sons, que guiam tanto a
produção dos fones, quanto sua percepção (‘m[i]nino’ não é percebida como
palavra de significado diferente de ‘m[e]nino’, porque tanto [i] como [e] nessa
palavra correspondem, na mente de um falante de português brasileiro, ao
mesmo fonema /e/).
@negação pas (linguística diacrônica vs. sincrônica)
Tome-se como exemplo a história da evolução da negação pas, “não”, em fran-
cês, esquematizada abaixo:
(1) Je ne marche pas
Eu neg ando passo
‘Eu não ando (nem um) passo’ = ‘Eu não ando’
(2) Je ne veux/sais/mange/crois pas
Eu neg1 quero/sei/como/creio neg2
‘Eu não quero/sei/como/creio nem um passo’ = ‘Eu não quero/sei/como/creio’
(3) Je mange pas
Eu como neg
‘Eu não como’
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior26
Nos três exemplos acima, são esquematizados os três estágios de evolução
(o termo técnico para esse processo, em linguística, é gramaticalização) da
negação pas na língua francesa. A palavra pas, antes de se transformar em
negação, significava apenas “passo” em francês — de fato, ainda existe com
este significado (faire un faux pas “dar um passo em falso”). Com este sig-
nificado específico, pas era utilizado com verbos que indicam movimento
humano, como marcher “andar”. Em casos como (1), pas era utilizado con-
comitantemente com a negação ne, e, por seu significado indicar uma enti-
dade de pequena dimensão, com o tempo se perdeu a conotação específica
de “espaço percorrido cada vez que se estende ou se põe um pé adiante do
outro”, e pas foi reinterpretado como simples reforço da negação ne: ‘nem
um passo’ = ‘nem um pouco’. No italiano, aconteceu o mesmo, mas com ou-
tra palavra que indica algo pequeno, a palavra mica “migalha” (ou brisa,
“migalha” também, em algumas variedades regionais do Norte): Non hai
mica capito “você não entendeu” (< “você não entendeu nem uma migalha”,
“você não entendeu nada”). Perdendo-se a especificidade semântica da pa-
lavra pas, ela começou a ser utilizada como reforço da negação ne também
quando o verbo não indicava o movimento humano, como em (2). De fato,
nesse segundo estágio, pas não é reforço da negação, mas parte dela: em
vez de ficar antes do verbo, a negação em francês se “divide” em uma parte
anterior e outra posterior ao verbo — em português brasileiro, existe tam-
bém esse uso “duplo” da negação (isto eu não faço não). No francês falado
contemporâneo, por fim, o valor de negação pode ser codificado por pas
apenas, como mostra o exemplo (3) (cf. português brasileiro faço não). Essa
breve descrição da história da negação pas em francês é um exemplo de
olhar diacrônico sobre o sistema linguístico: ao longo do tempo, acontece-
ram algumas mudanças que levaram o sistema do francês contemporâneo
a ter uma nova unidade (uma nova peça de xadrez) — a negação pas. As
mudanças afetaram uma configuração do sistema anterior, em que pas não
era negação.
Na perspectiva sincrônica, ao contrário, o linguista analisaria a negação pas
como um elemento do sistema do francês em oposição a todos os outros ele-
mentos presentes em tal sistema em uma determinada época, mas se fosse
olhar para outro ponto do tempo, por exemplo anterior à época em que pas
se gramaticalizou como negação, poderia achar outro sistema do francês, no
qual a negação pas não existe, sendo, dentro de tal sistema, um outro tipo de
elemento (um substantivo).
27Giulia Bossaglia
@relações sintagmáticas e paradigmáticas
Relações entre signos
Os signos são os elementos que implementam, através de suas relações recí-
procas, a estrutura do sistema linguístico.
Para entender melhor a natureza de tais relações, tome-se como exemplo
a frase O carteiro entrega a encomenda. Nela, cada elemento possui uma
ligação específica com os outros que aparecem dentro da frase: o e carteiro
manifestam concordância de gênero gramatical e número, assim como a
e encomenda; o verbo entrega está flexionado na 3ª pessoa singular, con-
cordando com seu sujeito, que também é flexionado no número singular
etc. Trata-se, portanto, de relações que cada elemento tem com os outros
elementos presentes em um enunciado. Por essa razão, são chamadas de
relações “em presença” ou sintagmáticas (do grego sýn “junto com” + tás-
sein “ordenar, organizar”) e podem ser representadas no eixo horizontal,
no qual, inclusive, a todos os elementos é atribuída uma posição específica,
que não pode ser modificada (o asterisco no começo da frase indica sua
agramaticalidade):
o ----- carteiro ----- entrega ----- a ----- encomenda
* carteiro ----- o ----- a ----- entrega ----- encomenda
Relações sintagmáticas
As relações sintagmáticas não são as únicas que existem entre os signos.
Os elementos presentes na frase acima estabelecem relações de outro tipo
com elementos que estão ausentes dessa frase — trata-se das relações que
Saussure chama de “em ausência” ou associativas (ou, com um termo in-
troduzido posteriormente e mais consolidado na tradição, paradigmáticas,
do grego para “do lado” + déiknunai “mostrar”). As relações paradigmáti-
cas são relações de substituição: na frase acima, pode-se substituir o por
um, este, aquele ou os, uns etc.; carteiro por homem, indivíduo, professor
ou ainda carteiros, homens, mulheres etc.; entrega por dá, perde, quebra,
entregam, entregou etc. As substituições possíveis não são aleatórias, mas
têm a ver com elementos associados entre si dentro de uma mesma classe
paradigmática — por serem relações “em ausência”, elas são representá-
veis no eixo vertical, e não no horizontal, onde se distribuem as relações
“em presença”:
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior28
o carteiro entrega a encomenda
este homem dá esta coisa
aquele filho entregam aquela objeto
os mulher leva as presentes
uns professor rouba umas carta
a carteiros entregou o pacote
... ... ... ... ...
* come * o * carteiro * pessoa * fazer
* para * com * feliz * porque * para
Relações paradigmáticas ou associativas
Como se pode observar no quadro acima, as relações em ausência também
respondem a restrições ditadas pelas regras de cada sistema linguístico: ar-
tigos e demonstrativos, por exemplo, compartilham algumas propriedades
entre si — entrando assim dentro do “paradigma” dos determinantes —, mas
não com os verbos ou com as preposições (cf. a agramaticalidade de come ou
para, na primeira coluna), que pertencem a outros paradigmas.
Os elementos constitutivos do sistema linguístico adquirem um valor não só
em decorrência de seus significados específicos, mas também por suas rela-
ções com os outros elementos dentro do sistema. As relações sintagmáticas
funcionam na organização dos elementos quando combinados para a produ-
ção de enunciados. As relações paradigmáticas definem o valor dos signos
quanto a suas classes de pertencimento (por exemplo, nomes vs. verbos vs.
determinantes etc.) e quanto a seus significados específicos (cf. a diferença
entre entregar, dar e roubar).
As relações de oposição entre elementos distintos permeiam a concepção de
sistema linguístico também em níveis em que os elementos da estrutura são
“menores” que o signo. Os alofones [ɾ, r, ɻ, χ] estão em relação paradigmática
entre si para a realização do fonema /R/ (quando este se encontra em coda si-
lábica), ou seja, cada um pode substituir o outro na pronúncia da palavra ‘por-
to’ sem que o significado seja alterado, pois no sistema do português não exis-
te nenhuma oposição de valor entre [ɾ, r, ɻ,χ]. Por outro lado, a substituição de
[s] no lugar de um dos alofones levaria a uma mudança de significado, porque
existe oposição fonêmica entre /s/ e /R/ em português (porto ~ posto).
@Interface entre níveis
Frequentemente, fenômenos linguísticos pertencentes a determinado nível
podem influenciar elementos em outros — trata-se, portanto, de fenômenos
29Giulia Bossaglia
de interface. Em latim, os substantivos eram flexionados por gênero, número
(como em português) e caso (ou seja, função sintática: sujeito, objeto direto,
objeto indireto etc.) da palavra dentro da frase: -us e -um, por exemplo, eram
respectivamente desinências de nominativo (i.e., sujeito) e acusativo (objeto
direto) masculino singular (por razões de espaço e de simplicidade, o exem-
plo envolve apenas esses dois casos, mas o latim possuía um sistema que di-
ferenciava desinências de acordo com cinco diferentes classes de declinação
e para seis casos distintos, com marcas específicas para os números singular
e plural, e os gêneros feminino, masculino e neutro). Independentemente da
posição que a palavra ocupasse dentro da frase, sua função sintática se manti-
nha clara e constante, devido à presença de tais marcas flexionais:
“Paulo ama Mário” (não vice-versa) “Mário ama Paulo” (não vice-versa)
Paulus amat Marium. Marius amat Paulum.
Marium amat Paulus. Paulum amat Marius.
Amat Marium Paulus. Amat Paulum Marius.
Amat Paulus Marium. Amat Marius Paulum.
Paulus Marium amat. Marius Paulum amat.
Marium Paulus amat Paulum Marius amat.
No latim tardio, [s] e [m] em final de palavra já não eram pronunciados mais,
ou eram pronunciados de uma maneira muito enfraquecida. Devido a esse
fato, que afetava o nível fonético-fonológico, criou-se ambiguidade na distin-
ção das desinências de caso: Paulus amat Marium virava Paulu amat Mariu (e
todas as respectivas alternativas de posição), de maneira que não seria possí-
vel distinguir sujeito e objeto direto na frase. Uma mudança no nível fonético-
-fonológico havia transformado, portanto, a morfologia da língua, que já não
codificava de maneira clara a categoria flexional de caso. De fato, foi assim que
essa categoria flexional se perdeu na transição do latim para as línguas româ-
nicas, que retêm marcas morfológicas de caso apenas nos pronomes pessoais
(cf. eu sujeito, me objeto direto etc.). A perda das marcas morfológicas de caso
fez com que já não fosse possível entender “se era o Paulo que amava o Mário
ou vice-versa”, ou seja, as funções sintáticas das palavras. Portanto, as línguas
românicas tiveram que desenvolver outra estratégia para desambiguar essas
funções, através da fixação de uma ordem sintática básica de tipo svo (Sujeito
– Verbo – Objeto): assim, o sujeito é colocado como regra antes do verbo, e o
objeto direto depois (ordens diferentes desta requerem realizações prosódi-
cas específicas); consequentemente, a interpretação default (i.e., automática)
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior30
de Paulo ama Mário é que Paulo é o sujeito da frase — para dizer que é o Mário
que ama Paulo, é preciso alterar a ordem dos nomes na frase. Assim, algo que
afetou o nível fonético-fonológico de uma língua chegou a ter consequências
no nível sintático de suas línguas filhas, passando por modificações no nível
morfológico.
A mudança que levou à perda do sistema latino de marcação morfológica de
caso nas línguas românicas, como se viu, pode ser descrita como algo que
aconteceu inteiramente devido a dinâmicas de mudança dentro do sistema
linguístico, em diferentes níveis. Contudo, ficar em uma perspectiva interna
não dá conta de explicar as razões de tal mudança. Em outros termos, dizer
que a mudança aconteceu internamente ao sistema corresponde a uma abs-
tração, que separa as realizações concretas das regras do sistema (a perda de
[s] e [m] final foi algo que aconteceu na pronúncia dos falantes de latim tardio,
ou seja, aconteceu fora do sistema, fora da langue).
31Giulia Bossaglia
@ sobre opção de reconstruir um protofonema
diferente de todos os fonemas atestados
Nem sempre reconstruir um protofonema diferente de dois fonemas ates-
tados é a opção a ser descartada. Por exemplo, os fonemas a e i em grego
antigo e latim correspondem ora a a, ora a i no sânscrito: gre.ant. ágo, lat.
ago, sscr. ájami “conduzir”; gre.ant. dís, lat. bis, sscr. dvís “dois”; mas gre.ant.
patér, lat. pater, sscr. pitár. Neste caso, os protofonemas *a e *i são recons-
truídos para os cognatos que manifestam todos as mesmas vogais, e outro
protofonema vocálico *ə2 para os casos em que grego e latim possuem a, e
sscr. i (*a > a, *i > i, *ə2> a, i).
@grupos da famílias indo-europeia
A família indo-europeia é composta por nove grupos que possuem línguas
vivas atualmente (itálico, celta, germânico, albanês, helênico, eslavo, báltico,
armênio, indo-iraniano), mais dois grupos (anatólico e tocariano) formados
apenas por línguas extintas.
O mapa abaixo mostra a distribuição geográfica atual dos grupos de línguas
indo-europeias vivas e há dois símbolos que indicam as regiões onde exis-
tiram as línguas dos dois grupos extintos. Depois, fornecem-se informações
muito sucintas sobre esses diferentes grupos da família.
3CAPÍTULO
A linguística
histórico-comparada
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior32
Grupo itálico
As línguas extintas desse grupo eram todas antigas línguas faladas na Penín-
sula Italiana (por essa razão, o nome do grupo); entre elas, algumas das prin-
cipais foram o osco-umbro, o falisco e o latim. As línguas itálicas vivas hoje em
dia são todas filhas do latim: português, espanhol, catalão, francês, provençal,
italiano, romanche (ou ladino), sardo, romeno, entre outras, são conhecidas
como línguas neolatinas ou românicas.
Grupo céltico
Este grupo conta, hoje em dia, com poucas línguas faladas na Irlanda, Escócia,
Gales e, na França, na região da Bretanha: irlandês, manês (falado na ilha de
Man), gaélico escocês, bretão, córnico e gaulês. Antigamente, línguas desse
subgrupo da família eram faladas em uma região da Europa que se estendia
da Península Ibérica até a hodierna Turquia.
33Giulia Bossaglia
Grupo germânico
As línguas vivas deste grupo compreendem inglês, alemão, holandês, dinamar-
quês, sueco, norueguês, islandês, entre outras. Fora da Europa, uma das línguas
germânicas mais notáveis é o afrikaans, língua que se desenvolveu na África do
Sul a partir de um dialeto do holandês, que chegou lá entre os sécs. XVII-XVIII
com um grupo de colonos calvinistas conhecidos como bôeres.
Muitas línguas antigas desse grupo deixaram atestações: as mais antigas são as
do gótico, língua falada pelos Godos entre os sécs. V e VIII na Europa oriental
(entre Romênia e Turquia, aproximadamente), que nos chegaram através de uma
famosa tradução da Bíblia feita por um bispo de nome Wúlfila no V séc.
Grupos albanês, helênico, armênio
Albanês, grego e armênio são três línguas isoladas dentro da família indo-eu-
ropeia, ou seja, constituem grupo sozinhas, sem terem “línguas irmãs” (aten-
ção: uma língua isolada dentro de uma família não deixa de ter relações de
parentesco com as demais da família, diferentemente das línguas isoladas
stricto sensu, como o basco, para as quais não é comprovada nenhuma relação
genética com outras línguas).
Grupo eslavo
O grande grupo eslavo compreende as línguas balcânicas esloveno, croata, sér-
vio, bósnio, montenegrino, macedônio, búlgaro e, da Europa central até a Russia,
o tcheco, eslovaco, polonês, bielo-russo, ucraniano, russo. A língua eslava mais
antiga é o antigo eslavo eclesiástico, língua literária atestada a partir do séc. X.
Grupo báltico
Lituano e letão são as línguas bálticas faladas hoje em dia. Devido a razões
de contato, as línguas desse grupo apresentam muitas afinidades com as do
grupo eslavo. Não há atestações de línguas mais antigas.
Grupo indo-iraniano
Este grande grupo da família pode ser dividido em três subgrupos: indo-ário,iraniano e nuristano (este último, muito pequeno). Pertencem ao grupo indo-
-ário o híndi, o bengali, o romani (línguas dos ciganos, faladas em muitos paí-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior34
ses europeus, com ênfase na área balcânica), entre muitas outras. O sânscrito
é a língua mais antiga do subgrupo indo-ário. O subgrupo iraniano é o mais
ocidental, e compreende o farsi (persa moderno), o curdo, o osseto, entre ou-
tras línguas. A mais antiga língua do subgrupo iraniano é o avéstico ou zend,
língua dos textos sagrados da religião zoroastriana (o Avesta). As três línguas
nuristanas vivas hoje em dia são faladas no atual Afeganistão.
Grupo anatólico
O nome do grupo deriva de Anatólia, antigo nome da Turquia, a região onde
antigamente eram faladas estas línguas indo-europeias. Entre elas, a principal
é o hitita, língua da importante civilização que viveu entre II e I milênio aEC, e
que foi decifrado só no começo do séc. XX.
Grupo tocariano
No começo do século XX, foram descobertos documentos budistas no Turques-
tão chinês (ou Xinjang), atestando duas línguas irmãs conhecidas como tocá-
rio A e tocário B e reconhecidas depois como indo-europeias. O tocário, língua
indo-europeia mais oriental, apresenta características em comum com muitas
línguas ocidentais da família (grego, latim, línguas germânicas, hitita) — isto
teve consequências muito importantes para o reconhecimento de traços lin-
guísticos mais arcaicos (por isso, conservados nas periferias ocidental e orien-
tal) em oposição a traços inovadores achados em línguas centrais da família.
@mudança vs. analogia
A mudança é algo inerente a todas as línguas naturais, em todos os níveis de
análise linguística. Às vezes, as mudanças sofridas por uma língua são tão pro-
fundas que levam à formação de novas línguas: de variedades diferentes do
latim falado em diversas regiões do antigo império romano do Ocidente de-
senvolveram-se as línguas românicas, por exemplo.
Há muitos e diversos mecanismos que regulam a forma como as línguas mu-
dam, e, ainda, as mudanças que afetam um nível de análise podem ter conse-
quências em outros — é o caso das mudanças fonéticas que levaram o latim
vulgar a perder, progressivamente, o sistema de marcação morfológica de
caso (@interface entre níveis).
35Giulia Bossaglia
Uma força que age sobre as línguas levando-as a mudar é o fenômeno conhe-
cido como “analogia”. As mudanças que acontecem por analogia são fruto da
influência de algum outro elemento dentro do sistema, que age como “mode-
lo”, e que é imitado. Geralmente, os elementos que agem como modelo para fe-
nômenos analógicos pertencem a paradigmas regulares, mais simples e mais
frequentes, logo, mais disponíveis na mente dos falantes.
O pretérito imperfeito, no italiano antigo, possuía, na 1ª pessoa singular, uma
desinência em -a, sendo formalmente idêntico à forma de 3ª singular (como
acontece em português): ita. ant. amava “eu/ele amava”, aveva “eu/ele tinha”
etc. A partir do século XV, a desinência de 1ª pessoa singular foi progressiva-
mente mudada para -o, com a resultante oposição morfológica entre 1ª e 3ª
pessoa: amavo “eu amava” ~ amava “ele amava”, avevo “eu tinha” ~ aveva “ele
tinha”. Essa mudança foi fruto de um processo analógico, e o “modelo” foi a opo-
sição entre as desinências de 1ª (-o) e 3ª (-a) pessoa singular no paradigma do
presente indicativo: amo “eu amo” ~ ama “ele ama”, ho “eu tenho” ~ ha “ele tem”.
Processos analógicos estão na base de alguns “erros” que os falantes cometem.
Em fase de aquisição da linguagem, é comum as crianças produzirem formas
erradas criadas com base em modelos muito frequentes no sistema linguís-
tico: plurais como cãos por “cães” e limãos por “limões” derivam da sobrege-
neralização do -s dos paradigmas regulares; crianças que estão adquirindo o
inglês produzem formas de pretérito como he goed “ele foi” (forma correta: he
went, pretérito do verbo to go), pois nos verbos regulares –(e)d é o sufixo de
pretérito (to love “amar”, pretérito he loved “ele amou”). Não só as crianças em
fase de aquisição da linguagem produzem formas desviantes devido a fatores
analógicos: pense-se como, no português falado (até no português falado cul-
to), é cada vez mais comum o uso do infinitivo flexionado no lugar do futuro do
subjuntivo, em construções como se eu ver isso (forma correta: se eu vir isso),
se ele pôr isso (forma correta: se ele puser isso). Esse erro é fruto da influência
que os verbos dos paradigmas regulares, que possuem formas idênticas para
infinitivo flexionado e futuro do subjuntivo, exercitam na mente dos falantes,
que tendem então a “regularizar” os paradigmas irregulares — o verbo ver,
assim como ser, estar, querer, poder, fazer, etc. possui alomorfismo do radical
nos dois modos: ver ~ vir, estar ~ estiver, querer ~ quiser, poder ~ puder, fazer
~ fizer etc. Nada impede que “erros” como esses um dia se tornem uma nova
regra do português, ou de uma língua dele derivada — no inglês contemporâ-
neo, por exemplo, afirmou-se o plural regular em -s para palavras como cow
“vaca” e eye “olho”, que no inglês antigo pertenciam a declinações cujo sufixo
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior36
de plural continha uma consoante nasal (plurais originais: kine, eyen/eyne vs.
novos plurais “regularizados” cows, eyes).
A analogia, portanto, é um dos mecanismos que governam a mudança linguís-
tica. O linguista americano Edgar Howard Sturtevant (1875-1952) dá o nome
a um paradoxo muito famoso na linguística histórica, o “paradoxo de Sturte-
vant”, e que diz respeito à mudança e à analogia. Ele afirma que a mudança fo-
nética é regular, mas produz irregularidades, enquanto a analogia é irregular,
mas produz regularidades.
Assumir que a mudança fonética é regular significa assumir que ela ocorre em
todas as palavras que apresentam o contexto fonológico que desencadeia essa
mudança. Pode-se observar isso no paradigma do presente do indicativo do
verbo negare “negar” no italiano antigo:
Italiano antigo
1ªsg niego [ˈnjego]
2ªsg nieghi [ˈnjegi]
3ªsg niega [ˈnjega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl niegano [ˈnjegano]
O paradigma mostra alomorfismo no radical: na 1ª, 2ª, 3ª pessoa singular e
na 3ª plural o radical é nieg-, enquanto na 1ª e 2ª pessoa plural é neg-. Esta
irregularidade no presente do indicativo do verbo negare se produziu devido
à ocorrência regular da mudança fonética conhecida como “ditongação româ-
nica”: um originário e breve latino, quando em sílaba aberta e tônica, virou di-
tongo (ie) em italiano. Assim, na 1ª e 2ª plural não se dá a ditongação, porque
o e não está em sílaba tônica, como mostra a transcrição fonética. A mudança
fonética se aplicou regularmente em todos os contextos em que havia as con-
dições que a condicionavam, e não ocorreu onde não havia, deixando, assim, o
paradigma mais irregular.
No italiano contemporâneo, contudo, esse paradigma foi regularizado através
de um processo analógico:
Italiano contemporâneo
1ªsg nego [ˈnego]
2ªsg neghi [ˈnegi]
37Giulia Bossaglia
3ªsg nega [ˈnega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl negano [ˈnegano]
O modelo para a extensão do radical sem ditongação foram outros paradig-
mas em diferentes modos e tempos do mesmo verbo, como o infinitivo negare,
o particípio negato, o gerúndio negando, o pretérito perfeito (negai, negasti,
negò, negammo, negaste, negarono: o mesmo alomorfe em todas as seis pes-
soas verbais) etc., que não apresentam o ditongo no radical. A analogia, por-
tanto, produziu uma regularidade, eliminando o alomorfismo do radical no
presente indicativo do verbo negare, e deixando todos os paradigmas, consis-
tentemente, com o radical neg- apenas.
Contudo, no italiano contemporâneo existem casos como aquele do verbo se-
dere “sentar-se”, que manifesta o alomorfismo do radical provocado pela mes-
ma mudança que o criou no paradigma do verbo negare do italiano antigo:
Italiano contemporâneo1ªsg siedo [ˈsjedo]
2ªsg siedi [ˈsjedi]
3ªsg siede [ˈsjede]
1ªpl sediamo [seˈdjamo]
2ªpl sedete [seˈdete]
3ªpl siedono [ˈsjedono]
No paradigma acima, observa-se a ocorrência regular da ditongação, e a con-
sequente irregularidade no presente indicativo do verbo sedere, que apre-
senta os alomorfes sed- e sied- para o morfema lexical. Como negare, o verbo
sedere nos demais paradigmas modotemporais apresenta majoritariamente o
alomorfe sed-, entretanto, o processo analógico não foi desencadeado.
Este pequeno exemplo do italiano explica bem o paradoxo de Sturtevant. A
mudança fonética é regular, pois ocorre sistematicamente em todas as pala-
vras que apresentam o contexto fonológico que a condiciona; contudo, após
uma mudança fonética, os paradigmas de uma língua podem se tornar irregu-
lares. A analogia, por sua vez, apesar de produzir regularidade nos paradig-
mas, é irregular, pois não ocorre sistematicamente.
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior38
@ Lei das palatais
A lei das palatais explicou a aparente não correspondência fonética entre os siste-
mas vocálicos do antigo grego e do latim, compostos por cinco vogais breves (a, e,
i, o, u), em oposição àquele do sânscrito, composto por apenas três (a, i, u):
Sânscrito Grego ant. Latim
a a a
- e e
i i i
- o o
u u u
Tal discrepância era tradicionalmente explicada pela suposta perfeição e
maior antiguidade do sânscrito, ao refletir, em seu sistema trivocálico, outros
níveis em que seriam observadas as estruturas tripartidas no indo-europeu
(três gêneros gramaticais, três números, três tempos etc.). Contudo, mesmo
assumindo o preconceito de que o sânscrito refletisse o vocalismo mais antigo
e, portanto, mais próximo à protolíngua, não era possível achar padrões de
correspondências fonéticas coerentes que pudessem explicar o desenvolvi-
mento das duas novas vogais do grego e do latim.
O avanço coincidiu com a ampliação de escopo da análise dos dados compara-
tivos, ou seja, a observação não apenas dessas vogais, mas delas junto com as
oclusivas velares do latim e do grego, que mostravam corresponder, em sâns-
crito, ora a uma oclusiva velar, ora a uma africada palatal ([tʃ ], indicada por
convenção com c). Observando juntos esses dois fenômenos aparentemente
sem relação recíproca, obtém-se um novo quadro de correspondências:
Sânscrito Grego ant. Latim
ka ka ka
ca ke ke
ci ki ki
ka ko ko
ku ku ku
Nestas novas correspondências, vê-se que o sscr. apresenta a consoante palatal
na frente do a que corresponde a gre./lat. e, e na frente de i (que corresponde
também a i nas outras línguas). Nos demais casos, o sscr. apresenta uma corres-
pondência quase perfeita com grego e latim: a única diferença é sscr. ka : gre./
39Giulia Bossaglia
lat. ko. Em geral, observam-se as correspondências vocálicas: a : a, a: e, i : i, a : o,
u: u. Cruzando essas correspondências com a alternância entre k e c no sscr., foi
possível reconstruir o percurso que levou ao sistema trivocálico do sscr.:
Protoindo-
-iraniano
palatalização e, o > a Sânscrito
*ka *ka *ka ka
*ke *ce *ca ca
*ki *ci *ci ci
*ko *ko *ka ka
*ku *ku *ku ku
Reconstrói-se para a protolíngua do grupo indo-iraniano (ao qual pertence o
sânscrito) um sistema de cinco vogais breves, igual ao do grego e do latim — o
estágio mais antigo é, portanto, um estágio pentavocálico, mantido em grego e
latim. As vogais mais anteriores e e i condicionaram a palatalização da oclusi-
va velar (processo de assimilação: a consoante velar, que é fonema posterior, é
articulada mais anteriormente, no palato duro, devido ao efeito de vogais an-
teriores). Uma segunda mudança aconteceu depois da palatalização: as vogais
e e o da protolíngua se fundiram com a, e *ce e *ko passaram, respectivamente,
a ca e ka no sânscrito. A lei das palatais demonstrou, em primeiro lugar, que o
sânscrito não era a língua mais perfeita da família e que seu sistema trivocá-
lico era fruto de uma inovação a partir de um anterior pentavocálico — prova
definitiva de que o sânscrito não era mais antigo que o grego e o latim. Além
disso, foi um exemplo da importância, no nível metodológico, de fundar qual-
quer generalização apenas nos dados comparativos, e que, ainda, é desejável
que o olhar do linguista não fique limitado a um fenômeno específico (neste
caso, o sistema vocálico), mas amplie seu escopo para outros domínios (as
consoantes) que podem fornecer novas soluções para a reconstrução. A lei
das palatais mostra também a importância de saber reconstruir as mudanças
linguísticas na ordem cronológica certa: hipotetizando que a convergência de
e e o para a tivesse acontecido antes da palatalização, o sscr. apresentaria *ka,
*ka, *ci, *ka, *ku, o que não é verificado nos dados.
@Lei de Verner
No quadro abaixo, mostra-se como a lei de Verner explica a aparente discre-
pância nos reflexos de pie *t no gótico, que, em vez de serem ambos th ([θ]),
como a lei de Grimm prevê, são ora th, ora d:
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior40
pie Protogermânico Retração do acento
para a 1ª sílaba
th > d Gótico
*bhrāt́er *brāt́her não não bróthar
*pə2tḗr *fəthḗr sim sim fádar
No gót. bróthar, que procede do protogerm. *brá̄ther < pie *bhrá̄ter, o acento
tônico da palavra se encontrava na primeira sílaba já no pie e no protogermâ-
nico; portanto, th, o reflexo fricativo de *t, se manteve. Já em palavras como
gót. fádar, em vez de th há d [d]: no pie, a palavra é reconstruída com acento
na segunda sílaba, *pə2tḗr. No protogermânico, reconstrói-se uma aplicação
regular da lei de Grimm, que leva ao esperado th: *fəthḗr; em seguida, ocorreu
a retração do acento para a primeira sílaba, que acabou alterando a fricativa
th para d: fádar. A lei de Verner, portanto, conseguiu “consertar” os erros que
Grimm, no início do século, tinha cometido devido ao rudimentarismo teórico
e metodológico da disciplina àquela altura.
41Giulia Bossaglia
@ história da tipologia
Em 1660, era publicada a Grammaire générale et raisonnée (“Gramática geral e
razoada”), conhecida também simplesmente como “Gramática de Port-Royal”, do
nome do mosteiro de Port-Royal-des-Champs (não longe de Paris) ao qual per-
tenciam seus autores Claude Lancelot e Antoine Arnauld. Nesta obra, em que
se vê uma forte influência do racionalismo cartesiano, é possível encontrar as
raízes mais antigas da reflexão sobre universais linguísticos, tão importantes
em âmbito tipológico: de fato, a Gramática de Port-Royal é uma gramática da
língua francesa que tem como objetivo mais geral explicar “as razões daquilo
que é comum a todas as línguas”. As línguas, de acordo com a obra, são meios
para “explicar o pensamento através de signos”, e o pensamento (a “razão”) é
uma faculdade universal do homem. Logo, devem existir princípios universais
da linguagem, da qual as línguas são apenas realizações particulares. Assim,
na Gramática de Port-Royal, a língua francesa e seus princípios são tomados
como ponto de partida para deduzir os princípios da linguagem em geral (e
de todas as línguas). Essa abordagem dedutiva ao estudo das propriedades
universais da linguagem é assimilável à noção de gramática universal introdu-
zida por Noam Chomsky três séculos mais tarde, e é muito distante, do ponto
de vista teórico e metodológico, da tipologia moderna. Contudo, é significativo
individualizar, já na Gramática de Port-Royal, o interesse por princípios e res-
trições universais da linguagem humana.
O interesse tipológico recebeu um forte impulso ao longo dos sécs. XVII-
-XIX, graças à chamada “linguística missionária”, que se desenvolveu pelo
encontro de missionários europeus com línguas muito “exóticas”, surgin-
4CAPÍTULO
A tipologia linguística
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior42
do a exigência de conciliar a ideia de uma substancial unidade das línguas
como expressões da mente humana com a grandíssima variação interlin-
guística existente. Uma das respostas oriundas dessaexigência foi aquela
do alemão Wilhelm von Humboldt (1767-1835) que, em sua obra Über die
Verschiedenheit des menschlichen Sprachbaus und seinen Einfluss auf die geis-
tige Entwicklung des Menschengeschlechts “Sobre a diferença na estrutura
linguística humana e sua influência sobre o desenvolvimento intelectual da
humanidade” (publicada em 1836), defendia que as estruturas das línguas
refletem o espírito de suas comunidades de falantes, e que, portanto, a di-
versidade linguística fosse um espelho das diversidades intelectuais e es-
pirituais das culturas humanas. Longe de ser uma abordagem objetiva ao
estudo das línguas, é sem dúvida importante, no pensamento humboldtiano,
a ideia de que é necessário conhecer as particularidades das demais línguas
humanas para chegar aos princípios mais gerais da linguagem, que é organi-
zada de acordo com regras específicas.
Na primeira metade do século XIX, enquanto se desenvolviam os estudos
comparativistas na Europa, surgiram também as primeiras classificações das
línguas em “tipos”, com base em critérios morfológicos: os irmãos Friedrich
(1772-1829) e August Schlegel (1767-1845) classificavam as línguas em or-
gânicas, com estrutura (línguas indo-europeias) e não orgânicas (todas as ou-
tras). Essa classificação identificava línguas “sem estrutura” como o chinês,
línguas “com afixos” como o turco, e línguas “com flexão” como latim e grego
(“sintéticas”) ou o francês (“analítica”). Nas classificações em tipos morfológi-
cos da primeira metade do século XIX — Franz Bopp e Jacob Grimm também
se dedicaram a esse tipo de estudo —, havia uma forte relação entre critérios
genéticos e tipológicos: os tipos, que eram concebidos como imutáveis ao lon-
go da diacronia, eram associados a famílias linguísticas específicas — não sur-
preende que à família linguística indo-europeia fosse atribuído o tipo “mais
perfeito”, de acordo com certo ideologismo que caracterizou o surgimento dos
estudos linguísticos na Europa da época, e que se refletiram nessas classifica-
ções das línguas de natureza avaliativa.
O verdadeiro precursor da tipologia moderna é para todos os efeitos o alemão
Georg von Gabelentz (1840-1893). Sinólogo, fortemente influenciado pelos
desenvolvimentos das ciências naturais que caracterizaram a segunda meta-
de do século XIX (como muitos contemporâneos dele: pense-se em August
Schleicher, por exemplo), Gabelentz publicava, em 1891, a obra Die Sprach-
wissenschaft “Linguística”, da qual é particularmente programático e famoso
43Giulia Bossaglia
o seguinte trecho, não apenas porque nele se encontra, pela primeira vez, a
denominação “tipologia” para a disciplina:
Mas que conquista seria se pudéssemos confrontar uma língua e dizer-lhe
“Você tem tais e tais propriedades específicas e portanto tais e tais ulteriores
propriedades e tal e tal caráter geral” — se pudéssemos, como atrevidos bo-
tânicos têm de fato tentado, construir a tília inteira a partir da sua folha. Se se
pudesse dar o nome a uma criança ainda não nascida, eu escolheria tipologia*
(GABELENTZ, 2016 [1891], p. 510).
Como se observa pela analogia adotada, Gabelentz se inspirava no modelo cien-
tífico da botânica pós-darwinista, que visava classificações holísticas (do grego
hólos “tudo”), ou seja, que descrevessem as plantas em sua totalidade, e não
apenas em partes específicas: o objetivo da tipologia, de acordo com Gabelentz,
era “construir a tília inteira a partir da sua folha”. Gabelentz foi o primeiro,
ainda, a observar a possível existência de implicações entre propriedades das
línguas, de acordo com os princípios da correlação das partes — há relações
específicas entre as partes de um todo — e da subordinação dos caracteres —
as relações entre partes e propriedades são de natureza hierárquica: algumas
influenciam outras —, elaborados e aplicados pelo paleontólogo George Cuvier
(1769-1832) no estudo de fósseis. Assim, emergia, na obra de Gabelentz, a con-
cepção preditiva da tipologia linguística: a partir da observação de uma pro-
priedade de uma língua, deveria ser possível prever outras que a caracterizam
(cf. as correlações de parâmetros sintáticos, ou os universais implicacionais).
Com Gabelentz acabou, ainda, a tipologia “avaliativa”, que havia caracterizado
as classificações em tipos morfológicos durante a primeira metade do século
XIX, e a concepção da imutabilidade dos tipos linguísticos ao longo do tempo.
O autor também reforçou a necessidade de refinar a metodologia da disciplina
e introduziu o uso de questionários linguísticos para a coleta de dados.
Na transição entre os sécs. XIX e XX, os estudos de Franz Boas (1858-1942,
etnoantropólogo), Edward Sapir (1884-1939) e Benjamin Lee Whorf (1897-
-1941) se focaram principalmente nas línguas ameríndias, revelando a neces-
sidade de repensar as categorias da tradição linguística ocidental, construída
a partir das línguas indo-europeias, e ampliando os horizontes da compara-
ção interlinguística.
E é a partir de extensos trabalhos de comparação interlinguística que o ame-
ricano Joseph Greenberg (1915-2001) fundou a tipologia linguística moder-
na. Greenberg foi um dos linguistas mais controversos da história da linguís-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior44
tica. Na esteira dos estudos que, a partir do começo do séc. XX, buscaram
comprovar a hipótese monogenética das línguas, Greenberg havia passado
décadas aplicando métodos de comparação massiva aos demais continentes,
chegando às classificações genéticas das línguas da África e das Américas e,
mais em geral, a um amplo (ainda que nem sempre necessariamente profun-
do) conhecimento de línguas muito diferentes entre si. Em 1963, era publi-
cado o ensaio Some universals of grammar with particular reference to the
order of meaningful elements “Alguns universais da gramática com particular
referência à ordem dos elementos significativos”. Nele, Greenberg formulava
45 universais linguísticos, a partir da análise de uma amostra de 30 línguas
selecionadas em todos os continentes (Europa: basco, sérvio, galês, norue-
guês, neogrego, italiano, finlandês; Ásia: turco, burushaski, hebraico, híndi,
kannada, japonês, tailandês, birmanês, malayo; África: iorubá, suaíli, fulani,
massai, songhai, nubiano, berbere; Oceania: maori, luritja; Américas: qué-
chua, chipcha, maia, zapoteco, guarani).
A partir da classificação das línguas da amostra com base na ordem de sujei-
to, verbo e objeto direto (os “elementos significativos”), Greenberg formu-
lou universais sintáticos e morfológicos, absolutos e implicacionais. Inde-
pendentemente da validade deles hoje em dia — algumas correlações entre
parâmetros sintáticos não são mais tidas como efetivas, por exemplo — e
do viés areal e genético da amostra utilizada — predominância de línguas
europeias e indo-europeias — foi graças a esta obra que a concepção de uni-
versal linguístico mudou do simples conceito de “propriedade obrigatória
em todas as línguas” para ponto de partida ao medir as diferenças entre as
línguas naturais.
A tipologia greenberguiana se configurou como uma disciplina de orientação
empírica, indutiva, requerendo, assim, extensos trabalhos de comparação in-
terlinguistíca antes da formulação das generalizações (de maneira comple-
tamente contrária, portanto, à abordagem dedutiva do gerativismo chomsk-
yano, que vinha se desenvolvendo nos mesmos anos). Os estudos tipológicos
atuais, que se beneficiam de avanços teóricos, metodológicos e até tecnológi-
cos posteriores a Greenberg, continuam, contudo, na esteira dessa abordagem
empírica e baseada nos dados que ele iniciou.
*Original: Aber welcher Gewinn wäre es auch, wenn wir einer Sprache auf den
Kopf zusagen dürften: Du hast das und das Einzelmerkmal, folglich hast du die
und die weiteren Eigenschaften und den und den Gesammtcharakter! — wenn
wir, wie es kühne Botaniker wohl versucht haben, aus dem Lindenblatte den
45Giulia Bossaglia
Lindenbaum construiren konnten. Dürfte man ein