Buscar

LINGUÍSTICA COMPARADA TIPOLOGIA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

L I N G U Í S T I C A 
PARA O ENSINO SUPERIOR 9
GIULIA BOSSAGLIA
 LINGUÍSTICA 
 COMPARADA 
e TIPOLOGIA
3Giulia Bossaglia
1CAPÍTULO
As línguas do mundo
@Famílias linguísticas do mundo
Como para as línguas do mundo, não há um número definido de famílias lin-
guísticas – talvez, aliás, seja mais difícil chegar a um consenso com relação a 
um aproximado número de famílias que a um aproximado número de línguas: 
há, de fato, estimativas que vão de poucas dezenas a centenas de famílias lin-
guísticas. Isso se deve ao fato de que reconstruir uma família de línguas é uma 
operação muito mais complexa que calcular o número das línguas existentes, 
tanto do ponto de vista teórico quanto metodológico (no que diz respeito à 
comprovação da existência de relação genética entre línguas comparadas).
Sem querer discutir os detalhes dessa complexa questão, o objetivo desta se-
ção é apresentar algumas das principais famílias linguísticas que não foram 
abordadas na introdução sobre línguas do mundo feita no Capítulo 1, nem nos 
Capítulos 5 (línguas da África) ou 6 (línguas das Américas). 
Eurásia
Além das famílias indo-europeia e sino-tibetana, há outras importantes fa-
mílias linguísticas na Eurásia. Uma é a família uralo-altaica (do nome dos 
montes Urais, na Rússia, e Altai, na China, que delimitam uma ampla região 
em que suas línguas são faladas). Na verdade, é bastante controverso que se 
trate de uma única família, e é mais aceita, hoje em dia, a divisão entre família 
urálica, por um lado, e família macroaltaica, por outro. A família urálica com-
preende línguas faladas da Europa centro-oriental até a Rússia setentrional. 
Na Europa, húngaro, estoniano e finlandês compõem o grupo ugro-fínico da 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior4
família. Línguas urálicas são faladas por aproximadamente 25 milhões de pes-
soas hoje em dia.
Figura 1: Família urálica (fonte: lewis, 2009).
Não há consenso completo sobre a composição da família altaica. Alguns es-
tudiosos defendem que ela seja composta pelos grupos túrcico, tungúsico, 
mongólico, coreano e japonês, outros assumem que só os primeiros três estão 
geneticamente relacionados entre si, e que coreano e japônico constituem fa-
mílias separadas. Aqui, coreano e japônico serão tratados como famílias sepa-
radas, mas independentemente da perspectiva que se adote com relação à clas-
sificação das línguas altaicas, é oportuno apresentar cada um desses grupos.
Figura 2: Família altaica: grupo túrcico (fonte: LEWIS, 2009).
O grupo túrcico possui uma extensão geográfica notável, da Turquia até a Rús-
sia norte-oriental. As línguas túrcicas são faladas hoje em dia por cerca de 120 
5Giulia Bossaglia
milhões de pessoas, 40% das quais são falantes de turco (PERELTSVAIG, 2012, 
p. 86). Dentre as cerca de quarenta línguas do grupo, mencionam-se aqui o 
turcomeno (Turcomenistão), o cazaque (Cazaquistão), o azeri (Azerbaijão), o 
quirguiz (Quirguistão) e o uigur (falado na China).
Figura 3: Família altaica: grupo mongólico (fonte: lewis, 2009).
Cerca de 5 milhões de pessoas falam línguas do grupo mongólico, sendo que 
aproximadamente 50% é falante de mongol. Outras línguas mongólicas são 
faladas em regiões da China e da Rússia próximas à Mongólia. Perto da região 
do Cáucaso, os cerca de 290 mil habitantes da República da Calmúquia falam 
o calmuco, outra língua do grupo.
Figura 4: Família altaica: grupo tungúsico (fonte: lewis, 2009).
As línguas da família tungúsica são faladas por grupos muito pequenos de 
pessoas, espalhados pela Sibéria. No total, esse grupo conta com pouco mais 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior6
de 50 mil falantes, correndo, portanto, fortes riscos de extinção. O manchu, 
que foi uma das línguas principais do grupo, hoje em dia é falado por apenas 
poucas dezenas de pessoas (pereltsvaig, 2012, p. 212).
Figura 5: Família japônica (fonte: lewis, 2009).
Dos cerca de 130 milhões de falantes de línguas japônicas, mais de 120 mi-
lhões falam japonês, enquanto as demais línguas da família são faladas por 
comunidades menores — algumas são consideradas simples dialetos do japo-
nês. Existem posições divergentes sobre uma possível relação entre a família 
japônica e a coreana.
Figura 6: Família coreana (fonte: lewis, 2009).
A família é composta apenas pelo coreano, que é então uma língua isolada, 
falada por cerca de 50 milhões de pessoas principalmente nas Coreias, mas 
também na China, Japão e Rússia.
7Giulia Bossaglia
Outras famílias linguísticas da Eurásia são as caucasianas. O Cáucaso se des-
taca por uma significativa diversidade linguística (em uma área geografica-
mente não muito extensa). São três as famílias caucasianas: caucasiana norte-
-ocidental (cf. o georgiano, entre várias outras línguas), caucasiana do sul ou 
kartveliana (abcásio, entre outras) e caucasiana norte-oriental (lezgui, entre 
outras). Trata-se de famílias linguísticas, a que pertencem cerca de 11 milhões 
de falantes, muito antigas e diferentes do ponto de vista tipológico.
Figura 7: Famílias caucasianas (fonte: lewis, 2009).
No Sudeste asiático, encontram-se as famílias austroasiática — que com-
preende cerca de 170 línguas, com aproximadamente 100 milhões de falan-
tes, espalhadas entre Índia, Vietnã e Malásia continental (principais línguas: 
vietnamita, mon, khmer) — e a tai-kadai, com aproximadamente 80 milhões 
de falantes (principais línguas: tailandês, laociano).
Figura 8: Família austroasiática (fonte: lewis, 2009).
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior8
Figura 9: Família tai-kadai (fonte: lewis, 2009).
Na parte centro-meridional da Índia e no Sri Lanka, são faladas as línguas 
dravídicas (cerca de 230 milhões de falantes), como tâmil, kânnada, télugu, 
malayalam. No Paquistão, cerca de 2 milhões de pessoas falam o brahui, que 
também pertence a essa família.
Figura 10: Família dravídica (fonte: lewis, 2009).
Oceania
Uma das famílias linguísticas mais ameaçadas do planeta está na Oceania: a 
família australiana. Os efeitos da colonização foram particularmente letais 
para as comunidades aborígenes, e estima-se que para as cerca de 380 línguas 
da família o número de falantes gire em torno de 40 mil.
9Giulia Bossaglia
Figura 11: Família australiana (fonte: lewis, 2009).
Américas
Como se explica no Capítulo 6, a classificação genética das línguas nativas das 
Américas é bastante complicada e até hoje controversa. Mencionam-se, portan-
to, apenas algumas das muitíssimas famílias classificadas para esse continente. 
A família esquimó-aleutina compreende as línguas inuit, yupik, inuktikut e inupia-
tun, faladas por cerca de 90 mil pessoas entre Canadá, EUA, Groenlândia e Rússia.
De acordo com a classificação greenberguiana (cf. Figura 12), a família es-
quimó-aleutina faria parte da macrofamília euroasiática (junto com as famí-
lias indo-europeia e sino-tibetana, portanto). 
Figura 12: Família esquimó-aleutina (fonte: lewis, 2009).
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior10
Dentro da controversa macrofamília dené-caucasiana, entraria a (reconhe-
cida) família na-dené da América do Norte, que compreende as línguas ata-
baskanas, como tlingit (Alaska e Canadá), navajo e apache (Califórnia e Méxi-
co norte-ocidental).
As principais famílias da América central são a uto-asteca (principal língua: 
nahuatl), oto-mangueana (mixteco, zapoteco, entre outras), maia (maia, tsot-
sil, entre outras), mixe-zoqueana (mixe e zoque são as línguas principais). Em 
sua maioria, essas línguas são faladas no México, mas também estão presen-
tes no Sudoeste dos EUA. 
Figura 13: Macrofamílias linguísticas das Américas de acordo com Greenberg (1987).
GREENBERG, J. H. (1987). Language in the Americas. Stanford: Stanford University Press.
LEWIS, M. W. (2009). GeoCurrent. The People, Places & Languages shaping Current Events. Disponível 
em: <http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-
-language-families>. Acesso em:09 mar. 2020.
PERELTSVAIG, A. (2012). Languages of the world: An introduction. Cambridge: Cambridge University 
Press.
@história da escrita, sistemas de escrita
Com o termo “escrita” entende-se o processo (e seu resultado) de registrar a 
língua sobre algum tipo de suporte físico, para que esta se torne visível — a 
língua falada não o é.
http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-language-families
http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-language-families
11Giulia Bossaglia
No mundo contemporâneo, a escrita é algo extremamente corriqueiro. Todos 
os dias, bilhões de pessoas leem e/ou escrevem placas de trânsito, cartazes, 
mensagens nas telas dos celulares, dos computadores, livros, jornais, rótulos, 
cardápios etc. Com poucos anos de idade, as pessoas aprendem a decifrar e 
utilizar os caracteres de diversos sistemas de escrita em diferentes lugares do 
mundo (cada vez mais, os governos dos países visam alfabetizar a totalidade 
da população). Entretanto, a escrita não é nada “corriqueira”, e muito mudou 
nas vidas das comunidades humanas após a invenção dessa tecnologia. Nas 
próximas seções, serão esboçadas noções relativas ao surgimento da escrita, 
às tipologias de sistemas de escrita e à sua evolução histórica. 
1. Um pouco de história
As mais antigas atestações da escrita remetem ao final do IV milênio aEC e são 
as tábuas de Uruk, antiga cidade suméria (no atual Iraque). Sumérios, assírios, 
acadianos e elamitas foram as grandes civilizações do Crescente Fértil, que 
viveram durante muito tempo em uma situação de intenso contato histórico e 
cultural. Tratava-se, obviamente, de civilizações agrícolas, que desenvolveram 
grandes comunidades urbanas e que precisavam da escrita para diversos fins 
práticos, antes que literários ou caligráficos: contabilidade (por exemplo, em 
atividades como construção de grandes obras — templos, palácios, pontes, 
obras de irrigação — para as quais os responsáveis tivessem que prestar con-
ta ao poder central), fixação de leis, comunicação entre cidades diferentes etc. 
As tábuas de Uruk são pequenas tábuas de argila seca, que contêm atestações 
do sistema de escrita conhecido como cuneiforme. Esse nome evoca a típica 
forma de “cunha” (do latim cuneus) de seus caracteres, porque eram marca-
dos com uma ferramenta pontiaguda, enquanto a argila estava ainda fresca, e 
na tábua ficavam signos com essa forma. 
Todas as civilizações mencionadas — e, não muito distante do Crescente Fértil, 
em territórios que pertencem hoje à Turquia, a civilização hitita — se serviam 
desse sistema de escrita para escrever suas línguas, que tinham procedências 
genéticas diversas: a língua suméria e o elamita eram línguas isoladas, o as-
sírio e o acadiano línguas semíticas da família afro-asiática (como o árabe), 
o hitita era uma língua indo-europeia. Fica claro, portanto, que o sistema de 
escrita utilizado por uma comunidade linguística tem relação com o contexto 
histórico-cultural daquela comunidade, e não necessariamente com a família 
linguística à qual pertence sua língua. 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior12
O fato de todas essas civilizações do antigo Oriente Médio utilizarem o mesmo 
sistema de escrita foi utilizado como prova de uma monogênese (i.e., uma ori-
gem única) da escrita, que teria sido inventada pelos sumérios e transmitida 
por difusão cultural para outras civilizações antigas. Na Figura 1, apresenta-se 
uma cronologia dos principais sistemas de escrita da antiguidade, tentando 
também dar uma ideia (ainda que bastante aproximada) das recíprocas posi-
ções geográficas das civilizações:
Figura 1: Cronologia da escrita na antiguidade (adaptado de damerow, 1999, p. 4, e coulmas, 1996).
Como se vê, a escrita cuneiforme suméria foi rapidamente passada para a civi-
lização elamita (atual Irã) no começo do III milênio aEC, enquanto, na mesma 
época, a escrita aparecia, em forma de hieróglifos, no antigo Egito. Na segun-
da metade do III milênio aEC, a escrita é encontrada na civilização de Harap-
pa (do nome de um de seus principais centros urbanos), no Vale do rio Indo 
(atual Paquistão). Na virada para o II milênio aEC, surgiram os hieróglifos da 
civilização minoica na ilha de Creta (o sistema de escrita conhecido como “Li-
near A”, ainda não decifrado), enquanto a escrita cuneiforme era utilizada pe-
los hititas. O ancestral do alfabeto fenício deve ter sido criado pouco depois, 
por volta de 1800 aEC, e foi a partir do alfabeto fenício que mais tarde foi cria-
do o alfabeto grego, em torno do começo do I milênio aEC (o alfabeto latino foi 
criado a partir dele: as primeiras atestações remetem ao VI séc. aEC). A mais 
antiga escrita chinesa atestada, conhecida como escrita dos “ossos oracula-
res” — inscrições religiosas achadas em escápulas de boi e ovelha e em cascos 
13Giulia Bossaglia
de tartaruga —, remete aproximadamente a 1300 aEC, mas pela convenciona-
lização dos caracteres utilizados acredita-se que a escrita tenha surgido bas-
tante antes (provavelmente, por volta do começo II milênio aEC). Sistemas de 
escrita meso americanos, como o maia e o asteco, se desenvolveram bastante 
mais tarde, por volta do V séc. aEC — pouquíssimos documentos sobrevive-
ram à invasão dos colonizadores espanhóis no séc. XVI.
É claro que na área do Crescente Fértil e do Mediterrâneo em geral seria mais 
fácil defender a ideia de uma monogênese da escrita e de sua difusão por trans-
missão cultural, pois todas as civilizações dessas regiões estiveram em inten-
sas e prolongadas relações econômicas e culturais; ainda, há registros de con-
tatos entre civilizações da Mesopotâmia e do Vale do Indo. Entretanto, tanto a 
China quanto a Mesoamérica não se encaixam nessa hipótese. Apesar de ser 
certo que a cuneiforme suméria se difundiu por transmissão cultural para as 
diferentes civilizações que adotaram tal sistema na Mesopotâmia e em regiões 
limítrofes, para outros sistemas de escrita, como os hieróglifos egípcios e a es-
crita chinesa, não há registros de fases iniciais de seu desenvolvimento — eles 
aparecem, nas atestações mais antigas que se tem, como sistemas já avança-
dos. Independentemente da possibilidade de obter mais informações acerca 
disso, não há dúvida de que a hipótese mais plausível para o surgimento da 
escrita seja aquela de uma poligênese (i.e., “muitas gêneses” vs. a ideia de uma 
única; na verdade, houve poucas gêneses independentes, e mais transmissões 
culturais: rogers, 2005, p. 4), em lugares diferentes, o mais antigo dos quais foi 
aquele da escrita cuneiforme suméria no final do IV milênio aEC.
Entretanto, fica por explicar como e por que a escrita começou. Não é de to-
dos os sistemas da antiguidade (cf. escrita chinesa e hieróglifos egípcios) que 
se tem atestações dos estágios mais primitivos, i.e., da protoescrita. Com este 
termo (do grego prótos “primeiro” + “escrita”), entende-se o conjunto de re-
cursos visuais utilizados para comunicação e armazenamento de informação, 
mas também decoração, próprios de muitas grandes civilizações do passado: 
decorações em vasilhas e outros manufatos, tábuas de argila e selos indicando 
propriedade, cordas com nós (o sistema de contabilidade inca, o quipu) etc. 
Geralmente, a protoescrita se caracteriza como mais pictórica e icônica que os 
sistemas de escrita propriamente ditos, e, efetivamente, a evolução “natural” 
dos sistemas de escrita segue sempre um caminho que parte de estágios mais 
icônicos para se tornar cada vez mais arbitrário, e nunca vice-versa (cf. seção 
2). Em outros termos, o que se considera protoescrita é um sistema de signos 
gráficos para o armazenamento de algum tipo de informação, mas não neces-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior14
sária e sistematicamente relacionado com a representação visual da língua — 
muito pelo contrário, a interpretação linguística dos signos gráficos deve ter 
ocorrido só em um segundo momento.Muitas das tábuas de argila de Uruk são documentos que atestam transa-
ções de natureza econômico-administrativa, relacionadas com a construção 
de grandes obras (templos, principalmente) e o gerenciamento dos recursos 
materiais e humanos. Os ancestrais dessas famosas tábuas foram pequenas 
fichas de argila de formatos e tamanhos diferentes de acordo com o tipo de 
bem ou medida que representavam (esféricas para azeite, cônicas e achatadas 
para diferentes medidas de cevada, cilíndricas e redondas para animais do-
mésticos etc.: SCHMANDT-BESSERAT, 2014; SCHMANDT-BESSERAT; ERARD, 
2008) e eram utilizadas para registrar bens, entre o VIII e o IV milênio aEC. 
Para fazer contabilidade, não era estritamente necessária a mediação da lín-
gua, e por isso os estudiosos têm se concentrado cada vez mais na análise de 
como se desenvolveram os grafemas para os números (para hipóteses sobre 
a coevolução da capacidade de fazer cálculos e o letramento: ROBSON, 2007; 
CHRISOMALIS, 2009). Estes seriam o elo de ligação entre a protoescrita e a 
escrita propriamente dita: a partir de uma representação icônica em que uma 
quantia x de um objeto y corresponde à repetição x vezes de um desenho de 
y, chega-se, graças a um processo de abstração, a uma notação mais arbitrária 
que associa o desenho de y a um símbolo para a quantia x, como mostra o 
exemplo da Figura 2:
Figura 2: Exemplo de desenvolvimento dos grafemas para números.
15Giulia Bossaglia
Para armazenar a informação “cinco vacas”, em um estágio inicial (protoescri-
ta), desenhavam-se cinco vacas, sendo o grau de iconicidade máximo. Com o 
passar do tempo, essa representação icônica foi substituída por outra, mais ar-
bitrária e econômica, em que ao desenho de uma vaca se associava um símbolo 
indicando a quantidade “cinco”. A partir desse estágio intermediário, os grafe-
mas (detalhes sobre este termo na seção 2) para “vaca” e para “cinco” adqui-
rem independência: o primeiro, representando a palavra “vaca”, e o segundo, o 
número “cinco” — assim começaria a escrita, entendida como sistema de signos 
com o fim de representar entidades (abstratas) da língua (palavras, mas tam-
bém: morfemas, sílabas, fonemas) e do pensamento (números).
2. Sistemas de escrita: definição, tipos, evolução
Por “sistema de escrita”, entende-se um conjunto de signos gráficos utilizados 
para representar de forma sistemática unidades da língua, no intuito de regis-
trar/armazenar informações e mensagens. Em um paralelismo terminológico 
com a distinção entre fone e fonema, as menores unidades de escrita são os 
grafes, enquanto os grafemas são os grafes ou grupos de grafes que represen-
tam unidades linguísticas (i.e., abstratas) de algum tipo — podem ser unida-
des de som, unidades morfológicas ou semânticas. Grafemas se transcrevem 
utilizando os símbolos “<” e “>”. Por exemplo, o grafema <lh> do português 
escrito é formado por dois grafes (l, h), que pertencem ao alfabeto latino, mas 
representa uma única unidade linguística: o fonema /ʎ/; <s>, <ç>, <ss>, <x>, 
e <z> podem ser considerados alógrafos do grafema para o fonema /s/, como 
em sapo, aço, assar, máximo e paz; a palavra nhoque compreende seis grafes 
<n, h, o, q, u, e>, mas apenas quatro grafemas <nh>, <o>, <qu>, <e>, um para 
cada fonema da palavra /ˈɲɔki/. 
Dependendo do tipo de unidade linguística à qual correspondem os grafemas 
de um sistema de escrita, ele será um sistema cenêmico (do antigo grego ke-
nós “vazio”) ou plerêmico (do grego pléres “cheio”). Os sistemas cenêmicos 
são sistemas cujos grafemas representam unidades de som apenas (são “es-
vaziados” de significado), como os alfabetos fonéticos e silábicos, enquanto os 
sistemas plerêmicos, como os ideográficos, logográficos e logosilábicos, pos-
suem grafemas que representam unidades linguísticas de significado, lexical 
ou gramatical, e não apenas de som. 
Em seus estágios mais antigos, a escrita cuneiforme suméria era um sistema 
de tipo logográfico (do grego lógos “palavra”), i.e., plerêmico: cada grafema 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior16
correspondia a uma palavra, principalmente nomes concretos, e mantinha 
um razoável grau de iconicidade, como se mostra na Figura 3 (adaptada de 
COULMAS, 1996, p. 100):
ave
peixe 
asno
andar 
grão 
boi
Figura 3: Alguns grafemas sumérios em estágio arcaico da escrita cuneiforme.
A iconicidade dos grafemas acima permite que o significado (mas não o som!) 
das palavras que eles representam seja facilmente interpretado também por 
quem não conhece absolutamente nada da língua suméria. 
Um sistema de escrita que consegue representar principalmente nomes con-
cretos é, claramente, limitado. Para ampliar o número de lexemas representá-
veis, era comum a cuneiforme suméria combinar mais grafemas. Por exemplo, 
a palavra “comer” era escrita combinando os grafemas “boca” e “pão”:
 + = 
 boca pão comer
Preste-se atenção para o fato de que o que é combinado são os significados, 
mas não os sons das duas palavras — o som da palavra “comer” não é fruto da 
combinação dos sons de “boca” e “pão”. 
Ainda, os grafemas que representavam determinadas palavras passaram a re-
presentar palavras de significado derivado ou próximo, mas de som diferente: o 
grafema para a palavra “arado” (em sumério apin) começou a ser utilizado para 
o verbo “lavrar” (uru), e mais tarde para “lavrador” (COULMAS, 1996, p. 101). 
17Giulia Bossaglia
Aos poucos, portanto, esse sistema plerêmico foi se “esvaziando”, também de-
vido à mudança de suporte em que a cuneiforme era escrita. As tábuas de 
Uruk, de fato, eram pequenas e quadradas, e escritas de baixo para cima, segu-
rando-as em uma mão. Quando começaram a ser utilizados suportes maiores 
e retangulares, os grafemas subiram uma rotação de eixo, como se mostra na 
Figura 4 (adaptada de COULMAS, 1996, p. 100): 
A B C
ave
peixe
asno
andar
grão
boi
Figura 4: Evolução da cuneiforme suméria.
Na coluna B, são apresentados os grafemas da cuneiforme suméria após a ro-
tação de eixo, que, como se pode observar, reduziu o grau de iconicidade dos 
grafemas. Na coluna C, mostra-se a evolução que os mesmos grafemas tiveram 
na cuneiforme utilizada pelos assírios — civilização que se desenvolveu cerca 
de 1.000 anos mais tarde que a suméria —, e os grafemas mostram ter perdido 
toda a iconicidade com relação às palavras que originariamente representavam 
na cuneiforme suméria. De fato, na cuneiforme assíria, os grafemas estão repre-
sentando sílabas, ou seja, o sistema cuneiforme se tornou um sistema cenêmico. 
Já depois da rotação de eixo dos grafemas na cuneiforme suméria, eles tinham 
começado a assumir, de vez em quando, uma função “fonética”: o grafema para 
a palavra ti “flecha” era utilizado para escrever a palavra til “vida”, e assim por 
diante. Assim, a perda de iconicidade dos grafemas com relação ao significa-
do das palavras que eles representavam impulsionou a evolução do sistema 
cuneiforme para um sistema cenêmico de tipo silabográfico. 
Sistemas de tipo cenêmico são mais econômicos, por serem arbitrários: eles 
precisam de uma quantidade limitada de grafemas para representar os sons 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior18
da língua, mas podem ser combinados de maneira (potencialmente) ilimitada 
para escrever todas as palavras existentes ou que serão eventualmente criadas 
na língua. Por sua vez, sistemas plerêmicos são menos econômicos, pois cada 
grafema tende a representar palavras ou morfemas, com maiores custos (na 
escrita e na leitura) para a ampliação do conjunto de palavras representáveis.
Comparando o inventário grafêmico da cuneiforme nas muitas civilizações 
que a utilizaram ao longo dos quatro milênios aEC, observa-se uma progres-
siva diminuição dos grafemas pertencentes ao sistema: de cerca de 2.000 na 
suméria, a 800-700 na assírio-babilônia, a pouco mais que 100 na elamita, 41 
na persa (VI-IV sécs. aEC), só para dar alguns exemplos. 
Uma evolução parecida se observa no sistema de escritalogográfica chinesa, 
como se pode ver comparando a escrita dos ossos oraculares (1400 aEC) com 
seus desenvolvimentos mais recentes:
1400 aEC 1100 aEC 220 aEC 200 aEC 1950 EC
cavalo
ver
chuva
Figura 5: Evolução da escrita chinesa (adaptado de XIAO; TREIMAN, 2012).
Como na evolução da cuneiforme suméria, a escrita chinesa também perdeu 
iconicidade ao longo do tempo — paralelamente, os grafemas ampliaram seu 
leque funcional, afastando-se da simples representação dos significados das 
palavras que representavam originalmente através da aquisição de novos va-
lores, até o uso fonético: o moderno grafema 马, na primeira linha da tabela 
reportada na Figura 5, que representava a palavra ma3 “cavalo” (o número 
indica o tipo de tom) no II milênio aEC, hoje, além de manter esse valor, é uti-
lizado em combinação com outro grafema (妈) para escrever a palavra ma1 
“mãe”, servindo apenas com função fonética (indica o segmento [ma]). O ver-
bo “ver” era escrito com um signo muito semelhante a um olho, e “chuva” por 
meio de um signo que lembra uma nuvem da qual caem gotas — dificilmente 
podem-se reconhecer esses conceitos nas formas dos modernos grafemas, 
que, inclusive, podem ser utilizados com outros valores semânticos, ou tam-
bém apenas como complementos fonéticos. 
19Giulia Bossaglia
O próprio alfabeto latino não foge a esse processo, no que diz respeito à sua 
história. Ele deriva do alfabeto grego, por sua vez desenvolvido do alfabeto fe-
nício, de origem semítica (do ponto de vista linguístico, pertencente à família 
afro-asiática). As letras desse alfabeto possuíam os nomes semíticos das enti-
dades que seus grafemas originariamente representavam de forma icônica: a 
primeira letra chamava-se ’alp (cf. grego alfa) “boi”, e sua forma correspondia 
a uma cabeça de boi estilizada; bet (cf. grego beta) “casa”, e tinha uma forma 
quadrada representando a estrutura básica de uma habitação; a letra digg 
“peixe” possuía essa forma etc.:
’alp bet digg
’ b d
Figura 6: Alguns caracteres do alfabeto protossinaítico 
(fonte: https://www.omniglot.com/writing/protosinaitc.htm).
O <A> do alfabeto latino nada é senão o desenvolvimento de um desenho de 
uma cabeça de boi, e o mesmo vale para o <B>, o <D>, e todos os outros gra-
femas que o compõem. Nenhum usuário do alfabeto latino hoje seria capaz 
de reconhecer nesses grafemas esses significados originários, e o mesmo vale 
para os usuários dos alfabetos fenício e grego: em todos estes sistemas de 
escrita, os grafemas são associados a unidades de som de maneira arbitrária.
O fato de todos os sistemas de escrita evoluírem de mais plerêmicos (mais 
icônicos) para mais cenêmicos (mais arbitrários) demonstra, novamente, que 
a arbitrariedade é vantajosa para o manuseio de um sistema de signos (nes-
se caso, gráficos) — decorando um número restrito de grafemas arbitrários, 
pode ser escrito um número (potencialmente) altíssimo de palavras. Em um 
sistema em que cada grafema corresponde a uma palavra, é previsível que o 
número de grafemas tenda a aumentar à medida que o léxico da língua se ex-
pande. Contudo, um número demasiado alto de grafemas não seria facilmente 
manuseável (desgastante do ponto de vista tanto da leitura quanto da escrita) 
e, de fato, sistemas plerêmicos tendem a desenvolver estratégias arbitrárias 
também (por exemplo, o uso fonético/cenêmico de grafemas que também têm 
valor plerêmico, como vimos com ma1 na escrita chinesa contemporânea).
https://www.omniglot.com/writing/protosinaitc.htm
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior20
CHRISOMALIS, S. (2009). The origins and coevolution of literacy and numeracy. The Cambridge han-
dbook of literacy, v. 59, p. 59–74. 
COULMAS, F. (1996). The Blackwell encyclopedia of writing systems (p. 469). Oxford: Blackwell.
DAMEROW, P. (1999). The Origins of Writing as a Problem of Historical epistemology. (versão pré-
-publicação, em https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF; acesso em: 09 mar. 
2020).
ROBSON, E. (2007). Literacy, numeracy, and the state in early Mesopotamia. Literacy and the State in 
the Ancient Mediterranean. Accordia Research Institute, London, p. 37-50.
ROGERS, H. (2005). Writing systems: A linguistic approach. Oxford: Blackwell.
SCHMANDT-BESSERAT, D. (2014). The evolution of writing. University of Texas at Austin, 25. (http://
sites.utexas.edu/dsb/tokens/the-evolution-of-writing/; acesso em: 09 mar. 2020)
SCHMANDT-BESSERAT, D.; ERARD, M. (2008). Origins and forms of writing. Handbook of research on 
writing: History, society, school, individual, text, p. 7-22.
XIAO, W.; TREIMAN, R. (2012). Iconicity of simple Chinese characters. Behavior research methods, 44 
(4), p. 954-60. (https://link.springer.com/article/10.3758/s13428-012-0191-3; acesso em: 09 
mar. 2020). 
https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF
http://sites.utexas.edu/dsb/tokens/the-evolution-of-writing/
http://sites.utexas.edu/dsb/tokens/the-evolution-of-writing/
https://link.springer.com/article/10.3758/s13428-012-0191-3
21Giulia Bossaglia
@ símbolo, ícone, índice
Uma das caraterísticas do signo linguístico é a arbitrariedade (ou seja, falta de 
motivação) da relação entre o significado e o significante: não há uma razão 
lógica ou natural pela qual ao significado de “recipiente cilíndrico utilizado 
para beber líquidos etc.” em português esteja associado o significante “copo”. 
Em todas as línguas naturais, a grande maioria das palavras corresponde a 
signos arbitrários, mas há exceções.
O linguista americano Charles Sanders Peirce (1839-1914) foi um dos princi-
pais teóricos da semiótica (do grego seméion “signo”), a ciência que estuda os 
signos. Com base no tipo de relação existente entre significado e significante, 
Peirce distinguiu três tipos de signos: ícone, índice e símbolo.
Os ícones (do grego eikón “imagem”) são signos em que há uma relação de se-
melhança entre significante e significado. No jogo “pedra-papel-tesoura”, por 
exemplo, os três gestos feitos com a mão para veicular o significado de “pe-
dra”, “papel” e “tesoura” imitam as formas desses objetos. Portanto, os ícones 
são signos motivados (i.e., não arbitrários): o significado “tesoura” é associado 
ao gesto com indicador e médio esticados, imitando as lâminas dessa ferra-
menta. No âmbito linguístico, o exemplo mais claro de ícones é o das onoma-
topeias, palavras que imitam sons da realidade (au au imita o latido de um ca-
chorro, tic tac o som de um relógio, cof cof a tosse etc.) e que, portanto, tendem 
a ser parecidas no nível interlinguístico. Podem ser ícones também palavras 
que não são onomatopeias, mas como elas imitam algum som, como o verbo 
inglês to cough ([kɒf]) “tossir”, mas também, de alguma forma, palavras como 
2CAPÍTULO
Dois olhares 
sobre as línguas: 
sistema e diassistema
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior22
os numerais do tipo de dezenove, cujo significado (“ideia de 19”) mantém uma 
relação de semelhança com a soma de dez e nove, facilmente reconhecível no 
significante (mas atenção: dez e nove não deixam de ser palavras arbitrárias!). 
Os índices são signos motivados também, mas a relação entre significado e 
significante é de proximidade física ou metafórica, logo, lógica, de causa-efei-
to. Pegadas no chão são índice da passagem de alguém — inclusive, a partir da 
forma ou profundidade, quem vir as pegadas pode inferir que tipo de ser ou 
veículo as deixou; o arco-íris é índice de que choveu; a fumaça é índice de fogo 
— se ela for muito grande, de incêndio; se for pequena, de cigarro, e assim por 
diante. Algumas categorias de palavras, como os advérbios de tempo e lugar, 
os pronomes pessoais e os demonstrativos, podem ser assimiladas a índices, 
por seus “significados” serem atrelados (i.e., manterem relação de proximida-
de) ao contexto específico da enunciação — em linguística são chamados, não 
por acaso, de dêiticos (do grego déiknumi “indicar”). O advérbio ontem indica 
dias diferentes se for pronunciado em 1 ou 2 de janeiro;aqui, falado em São 
Paulo, indica um lugar diferente se for pronunciado em João Pessoa; quando 
tratamos por tu ou você pessoas diferentes, esses pronomes têm valores dife-
rentes. É claro, portanto, que o valor que os dêiticos assumem varia de acordo 
com os contextos específicos em que são utilizados. Por razões de precisão, é 
importante sublinhar uma diferença entre signos linguísticos que são ícones 
e signos que são índices: nos primeiros, a relação de semelhança existe efeti-
vamente entre significante e significado, entretanto, nos dêiticos a relação de 
proximidade existe entre o signo como um todo (significado e significante) e 
seu referente no mundo real. De fato, a relação entre o significante ontem e o 
significado “dia logo anterior a hoje”, entre aqui e “este lugar”, e entre tu/você 
e “segunda pessoa singular” etc. é completamente arbitrária — mas não a re-
lação desses signos com as entidades (lugar, tempo, pessoas) que designam 
no momento da enunciação. 
Os símbolos são, na distinção do Peirce, os únicos signos arbitrários, em que 
a relação entre significado e significante não é motivada. Um exemplo por ex-
celência é o semáforo: não há uma razão pela qual a essas cores específicas 
estejam associadas as respectivas ações, e todos (oxalá!) aprendemos que 
vermelho significa “parar”, verde “seguir” etc. Os grafemas do nosso alfabeto 
também são símbolos: o fonema /a/ ser representado graficamente por <A, 
a> e o /f/ por <F, f> é fruto de uma convenção — poderia perfeitamente dar-se 
o contrário, se a convenção fosse outra. A grande maioria das palavras nas lín-
guas naturais é composta por símbolos, por óbvias razões de economicidade.
23Giulia Bossaglia
Na linguística, o termo iconicidade (também: motivação) se opõe a arbi-
trariedade: ícones e índices são, portanto, signos icônicos; símbolos são 
signos arbitrários. 
É importante saber que, ao longo do tempo, signos icônicos podem se tor-
nar arbitrários. Os signos ♀ e ♂ utilizados na biologia para indicar os sexos 
biológicos “feminino” e “masculino”, respectivamente, para nós são símbolos 
como as letras do alfabeto, mas antigamente, no mundo romano, eles eram 
ícones: ♀ representava o espelho da deusa do amor Vênus, sendo o espelho 
o acessório culturalmente associado à vaidade feminina; enquanto ♂ repre-
sentava escudo e lança do deus da guerra Marte, pois a guerra era uma ativi-
dade culturalmente associada à masculinidade, assim como as características 
de força, violência etc. Hoje em dia, ninguém pensa em Vênus e Marte quando 
vê esses signos, que portanto passaram de icônicos a arbitrários. 
De forma parecida, os números árabes originariamente não eram símbolos, 
mas ícones (a quantidade numérica correspondia à quantidade de ângulos 
detectáveis em cada dígito); as letras do alfabeto latino se originaram a partir 
de ícones (o <A>, por exemplo, do desenho de uma cabeça de boi, o <E> da 
figura estilizada de uma pessoa...) etc.
Fica claro, portanto, que a oposição entre iconicidade e arbitrariedade está 
também associada a fatores culturais de determinadas comunidades de falan-
tes e sistemas linguísticos específicos.
Outro exemplo da evolução de icônico para arbitrário nas línguas pode ser 
observado na diferença entre a atribuição de gênero gramatical em algumas 
palavras: português, espanhol e italiano atribuem gênero masculino à palavra 
“sol” e feminino à “lua” (o sol ~ a lua; el sol ~ la luna; il sole ~ la luna); o con-
trário se observa em alemão e lituano (die Sonne ~ der Mond; Saule ~ Menulis; 
literalmente “a sol”, “o lua”). Essa diferença não é nada surpreendente, pois as 
línguas atribuem o gênero gramatical de forma arbitrária na grande maioria 
dos casos: não há uma razão pela qual copo seja uma palavra de gênero mas-
culino e cadeira feminino (não é o mesmo com as palavra pai e mãe, ou ho-
mem e mulher, às quais o gênero masculino e feminino é atribuído de maneira 
icônica, por semelhança entre sexo biológico e gênero gramatical; mas esses 
são casos muito menos frequentes nas línguas). À primeira vista, portanto, 
poderíamos pensar que português, espanhol, italiano e alemão e lituano sim-
plesmente atribuem o gênero gramatical às palavras “sol” e “lua” de forma 
arbitrária, assim como o fazem com muitas outras palavras. 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior24
Entretanto, é possível recuperar uma motivação (i.e., iconicidade) na diferen-
ça de atribuição de gênero para “sol” e “lua” nessas línguas. Não por acaso as 
línguas em que ao sol é atribuído gênero masculino são línguas originárias do 
sul da Europa, e aquelas que lhe atribuem gênero feminino do norte. Há uma 
diferença climático-ambiental entre essas regiões do continente europeu que 
faz com que o sol seja o elemento mais “forte” (a força era iconicamente asso-
ciada ao sexo masculino) no sul, e muito menos no norte (a fraqueza era iconi-
camente associada ao sexo feminino). Então, nas culturas primitivas originárias 
dessas áreas, o sexo das divindades associadas a esses elementos foi escolhido 
de forma icônica de acordo com a força (masculino) vs. fraqueza (feminino) des-
ses elementos nos respectivos ambientes. Vestígio dessa diferença é a diferen-
te atribuição de gênero gramatical para “sol” e “lua” nas línguas mencionadas. 
Obviamente, nenhum falante nativo dessas línguas hoje tem consciência de tal 
origem icônica (a não ser que se interesse por essas questões ou que alguém lhe 
conte em uma aula...) e declina “sol” e “lua” pelo gênero masculino ou feminino 
da mesma forma como declina “copo”, “cadeira”, “ônibus”, “pedra” etc.
Um dado interessante sobre a relação entre iconicidade e arbitrariedade pro-
vém da história dos sistemas de escrita, que se originaram todos como siste-
mas icônicos, evoluindo para parcial ou completamente arbitrários ao longo 
do tempo — a evolução inversa nunca se deu (cf. @sistemas de escrita). 
@ fonemas, fones, alofones
Aprofunda-se aqui a oposição entre os conceitos de fone, a menor unidade 
sonora de uma língua, e fonema, a menor unidade da língua dotada de valor 
distintivo — i.e., capaz de distinguir palavras de significado diferente. Soman-
do as pronúncias das palavras ‘porto’ [ˈpoɾtʊ] / [ˈpoʀtʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] / 
‘posto’ [ˈpostʊ], obtêm-se cinco sequências fônicas diferentes, todas diferen-
ciadas pelo som (i.e., fone) situado no meio da sequência, entre a vogal tônica 
[o] e a consonante [t] (em linguística, os fones são transcritos entre colche-
tes). Entretanto, às cinco diferentes sequências fônicas não correspondem 
cinco diferentes palavras: [ˈpoɾtʊ] / [ˈportʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] são todas rea-
lizações distintas da mesma palavra ‘porto’, e [ˈpostʊ] de ‘posto’. Logo, os fones 
[ɾ, r, ɻ, χ] não são fonemas, por não serem capazes de distinguir palavras de 
significado diferente, mas são realizações distintas (tecnicamente, alofones: 
do grego allós “diferente, outro” + phoné “som”) de um mesmo fonema /R/, 
que se opõe ao fonema /s/, formando o par mínimo ‘porto ~ posto’, e também 
‘caro ~ caço’, ‘arco ~ asco’ etc. (fonemas se transcrevem entre barras).
25Giulia Bossaglia
Ainda, na pronúncia de ‘porto’ e ‘posto’, existe uma diferença entre o primeiro 
e o segundo ‘o’, devido à natureza tônica do primeiro, mas não do segundo, 
realizado como [ʊ] (um pouco mais alto, frouxo e menos posterior que [o]). 
Isso acontece porque a posição do segundo ‘o’ logo após a sílaba tônica da 
palavra (sua porção mais “forte”) “enfraquece” sua pronúncia. Esses efeitos 
fonéticos da realização do ‘o’ não lhe tiram o status de fonema: /o/ é capaz 
de distinguir os pares mínimos ‘porto ~ parto’, ‘porto ~ porta’ etc. Ademais, 
nenhum falante percebe facilmente a diferença fonética entre [o] e [ʊ], não só 
por ela ser efetivamente pequena, mas sobretudo por existir, na mente dele, 
o fonema /o/, que tem o efeito, na percepção dos sons, de deixar em segundo 
plano a diferença concreta entre [o] e [ʊ]. 
De fato, frente à estabilidade dos fonemas na mente dos falantesde uma lín-
gua, os fones “flutuam”, não só, por exemplo, de dialeto para dialeto (cf. a di-
ferença entre as pronúncias ‘pr[o]blema’ e ‘pr[ɔ]blema’, ‘b[e]leza’ e ‘b[ɛ]leza’, 
‘m[e]nino’ e ‘m[i]nino’ etc.), mas também dentro de um mesmo idioleto (do 
grego ídios “privado, próprio” + légein “falar”), ou seja, a “língua” de um mes-
mo indivíduo. Nenhum falante pronuncia sempre da mesma idêntica maneira 
os fonemas da sua língua, mas sim, todos os falantes dessa língua compar-
tilham as mesmas representações abstratas desses sons, que guiam tanto a 
produção dos fones, quanto sua percepção (‘m[i]nino’ não é percebida como 
palavra de significado diferente de ‘m[e]nino’, porque tanto [i] como [e] nessa 
palavra correspondem, na mente de um falante de português brasileiro, ao 
mesmo fonema /e/).
@negação pas (linguística diacrônica vs. sincrônica)
Tome-se como exemplo a história da evolução da negação pas, “não”, em fran-
cês, esquematizada abaixo:
(1) Je ne marche pas 
 Eu neg	 ando passo 
 ‘Eu não ando (nem um) passo’ = ‘Eu não ando’ 
(2) Je ne veux/sais/mange/crois pas 
 Eu neg1 quero/sei/como/creio neg2 
 ‘Eu não quero/sei/como/creio nem um passo’ = ‘Eu não quero/sei/como/creio’ 
(3) Je mange pas
 Eu como neg
 ‘Eu não como’
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior26
Nos três exemplos acima, são esquematizados os três estágios de evolução 
(o termo técnico para esse processo, em linguística, é gramaticalização) da 
negação pas na língua francesa. A palavra pas, antes de se transformar em 
negação, significava apenas “passo” em francês — de fato, ainda existe com 
este significado (faire un faux pas “dar um passo em falso”). Com este sig-
nificado específico, pas era utilizado com verbos que indicam movimento 
humano, como marcher “andar”. Em casos como (1), pas era utilizado con-
comitantemente com a negação ne, e, por seu significado indicar uma enti-
dade de pequena dimensão, com o tempo se perdeu a conotação específica 
de “espaço percorrido cada vez que se estende ou se põe um pé adiante do 
outro”, e pas foi reinterpretado como simples reforço da negação ne: ‘nem 
um passo’ = ‘nem um pouco’. No italiano, aconteceu o mesmo, mas com ou-
tra palavra que indica algo pequeno, a palavra mica “migalha” (ou brisa, 
“migalha” também, em algumas variedades regionais do Norte): Non hai 
mica capito “você não entendeu” (< “você não entendeu nem uma migalha”, 
“você não entendeu nada”). Perdendo-se a especificidade semântica da pa-
lavra pas, ela começou a ser utilizada como reforço da negação ne também 
quando o verbo não indicava o movimento humano, como em (2). De fato, 
nesse segundo estágio, pas não é reforço da negação, mas parte dela: em 
vez de ficar antes do verbo, a negação em francês se “divide” em uma parte 
anterior e outra posterior ao verbo — em português brasileiro, existe tam-
bém esse uso “duplo” da negação (isto eu não faço não). No francês falado 
contemporâneo, por fim, o valor de negação pode ser codificado por pas 
apenas, como mostra o exemplo (3) (cf. português brasileiro faço não). Essa 
breve descrição da história da negação pas em francês é um exemplo de 
olhar diacrônico sobre o sistema linguístico: ao longo do tempo, acontece-
ram algumas mudanças que levaram o sistema do francês contemporâneo 
a ter uma nova unidade (uma nova peça de xadrez) — a negação pas. As 
mudanças afetaram uma configuração do sistema anterior, em que pas não 
era negação.
Na perspectiva sincrônica, ao contrário, o linguista analisaria a negação pas 
como um elemento do sistema do francês em oposição a todos os outros ele-
mentos presentes em tal sistema em uma determinada época, mas se fosse 
olhar para outro ponto do tempo, por exemplo anterior à época em que pas 
se gramaticalizou como negação, poderia achar outro sistema do francês, no 
qual a negação pas não existe, sendo, dentro de tal sistema, um outro tipo de 
elemento (um substantivo). 
27Giulia Bossaglia
@relações sintagmáticas e paradigmáticas
Relações entre signos
Os signos são os elementos que implementam, através de suas relações recí-
procas, a estrutura do sistema linguístico. 
Para entender melhor a natureza de tais relações, tome-se como exemplo 
a frase O carteiro entrega a encomenda. Nela, cada elemento possui uma 
ligação específica com os outros que aparecem dentro da frase: o e carteiro 
manifestam concordância de gênero gramatical e número, assim como a 
e encomenda; o verbo entrega está flexionado na 3ª pessoa singular, con-
cordando com seu sujeito, que também é flexionado no número singular 
etc. Trata-se, portanto, de relações que cada elemento tem com os outros 
elementos presentes em um enunciado. Por essa razão, são chamadas de 
relações “em presença” ou sintagmáticas (do grego sýn “junto com” + tás-
sein “ordenar, organizar”) e podem ser representadas no eixo horizontal, 
no qual, inclusive, a todos os elementos é atribuída uma posição específica, 
que não pode ser modificada (o asterisco no começo da frase indica sua 
agramaticalidade):
o ----- carteiro ----- entrega ----- a ----- encomenda
* carteiro ----- o ----- a ----- entrega ----- encomenda 
Relações sintagmáticas
As relações sintagmáticas não são as únicas que existem entre os signos. 
Os elementos presentes na frase acima estabelecem relações de outro tipo 
com elementos que estão ausentes dessa frase — trata-se das relações que 
Saussure chama de “em ausência” ou associativas (ou, com um termo in-
troduzido posteriormente e mais consolidado na tradição, paradigmáticas, 
do grego para “do lado” + déiknunai “mostrar”). As relações paradigmáti-
cas são relações de substituição: na frase acima, pode-se substituir o por 
um, este, aquele ou os, uns etc.; carteiro por homem, indivíduo, professor 
ou ainda carteiros, homens, mulheres etc.; entrega por dá, perde, quebra, 
entregam, entregou etc. As substituições possíveis não são aleatórias, mas 
têm a ver com elementos associados entre si dentro de uma mesma classe 
paradigmática — por serem relações “em ausência”, elas são representá-
veis no eixo vertical, e não no horizontal, onde se distribuem as relações 
“em presença”:
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior28
o carteiro entrega a encomenda
este homem dá esta coisa
aquele filho entregam aquela objeto
os mulher leva as presentes
uns professor rouba umas carta
a carteiros entregou o pacote
... ... ... ... ...
* come * o * carteiro * pessoa * fazer
* para * com * feliz * porque * para
Relações paradigmáticas ou associativas
Como se pode observar no quadro acima, as relações em ausência também 
respondem a restrições ditadas pelas regras de cada sistema linguístico: ar-
tigos e demonstrativos, por exemplo, compartilham algumas propriedades 
entre si — entrando assim dentro do “paradigma” dos determinantes —, mas 
não com os verbos ou com as preposições (cf. a agramaticalidade de come ou 
para, na primeira coluna), que pertencem a outros paradigmas.
Os elementos constitutivos do sistema linguístico adquirem um valor não só 
em decorrência de seus significados específicos, mas também por suas rela-
ções com os outros elementos dentro do sistema. As relações sintagmáticas 
funcionam na organização dos elementos quando combinados para a produ-
ção de enunciados. As relações paradigmáticas definem o valor dos signos 
quanto a suas classes de pertencimento (por exemplo, nomes vs. verbos vs. 
determinantes etc.) e quanto a seus significados específicos (cf. a diferença 
entre entregar, dar e roubar).
As relações de oposição entre elementos distintos permeiam a concepção de 
sistema linguístico também em níveis em que os elementos da estrutura são 
“menores” que o signo. Os alofones [ɾ, r, ɻ, χ] estão em relação paradigmática 
entre si para a realização do fonema /R/ (quando este se encontra em coda si-
lábica), ou seja, cada um pode substituir o outro na pronúncia da palavra ‘por-
to’ sem que o significado seja alterado, pois no sistema do português não exis-
te nenhuma oposição de valor entre [ɾ, r, ɻ,χ]. Por outro lado, a substituição de 
[s] no lugar de um dos alofones levaria a uma mudança de significado, porque 
existe oposição fonêmica entre /s/ e /R/ em português (porto ~ posto). 
@Interface entre níveis
Frequentemente, fenômenos linguísticos pertencentes a determinado nível 
podem influenciar elementos em outros — trata-se, portanto, de fenômenos 
29Giulia Bossaglia
de interface. Em latim, os substantivos eram flexionados por gênero, número 
(como em português) e caso (ou seja, função sintática: sujeito, objeto direto, 
objeto indireto etc.) da palavra dentro da frase: -us e -um, por exemplo, eram 
respectivamente desinências de nominativo (i.e., sujeito) e acusativo (objeto 
direto) masculino singular (por razões de espaço e de simplicidade, o exem-
plo envolve apenas esses dois casos, mas o latim possuía um sistema que di-
ferenciava desinências de acordo com cinco diferentes classes de declinação 
e para seis casos distintos, com marcas específicas para os números singular 
e plural, e os gêneros feminino, masculino e neutro). Independentemente da 
posição que a palavra ocupasse dentro da frase, sua função sintática se manti-
nha clara e constante, devido à presença de tais marcas flexionais:
“Paulo ama Mário” (não vice-versa) “Mário ama Paulo” (não vice-versa)
Paulus amat Marium. Marius amat Paulum.
Marium amat Paulus. Paulum amat Marius.
Amat Marium Paulus. Amat Paulum Marius.
Amat Paulus Marium. Amat Marius Paulum.
Paulus Marium amat. Marius Paulum amat.
Marium Paulus amat Paulum Marius amat.
No latim tardio, [s] e [m] em final de palavra já não eram pronunciados mais, 
ou eram pronunciados de uma maneira muito enfraquecida. Devido a esse 
fato, que afetava o nível fonético-fonológico, criou-se ambiguidade na distin-
ção das desinências de caso: Paulus amat Marium virava Paulu amat Mariu (e 
todas as respectivas alternativas de posição), de maneira que não seria possí-
vel distinguir sujeito e objeto direto na frase. Uma mudança no nível fonético-
-fonológico havia transformado, portanto, a morfologia da língua, que já não 
codificava de maneira clara a categoria flexional de caso. De fato, foi assim que 
essa categoria flexional se perdeu na transição do latim para as línguas româ-
nicas, que retêm marcas morfológicas de caso apenas nos pronomes pessoais 
(cf. eu sujeito, me objeto direto etc.). A perda das marcas morfológicas de caso 
fez com que já não fosse possível entender “se era o Paulo que amava o Mário 
ou vice-versa”, ou seja, as funções sintáticas das palavras. Portanto, as línguas 
românicas tiveram que desenvolver outra estratégia para desambiguar essas 
funções, através da fixação de uma ordem sintática básica de tipo svo (Sujeito 
– Verbo – Objeto): assim, o sujeito é colocado como regra antes do verbo, e o 
objeto direto depois (ordens diferentes desta requerem realizações prosódi-
cas específicas); consequentemente, a interpretação default (i.e., automática) 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior30
de Paulo ama Mário é que Paulo é o sujeito da frase — para dizer que é o Mário 
que ama Paulo, é preciso alterar a ordem dos nomes na frase. Assim, algo que 
afetou o nível fonético-fonológico de uma língua chegou a ter consequências 
no nível sintático de suas línguas filhas, passando por modificações no nível 
morfológico.
A mudança que levou à perda do sistema latino de marcação morfológica de 
caso nas línguas românicas, como se viu, pode ser descrita como algo que 
aconteceu inteiramente devido a dinâmicas de mudança dentro do sistema 
linguístico, em diferentes níveis. Contudo, ficar em uma perspectiva interna 
não dá conta de explicar as razões de tal mudança. Em outros termos, dizer 
que a mudança aconteceu internamente ao sistema corresponde a uma abs-
tração, que separa as realizações concretas das regras do sistema (a perda de 
[s] e [m] final foi algo que aconteceu na pronúncia dos falantes de latim tardio, 
ou seja, aconteceu fora do sistema, fora da langue).
31Giulia Bossaglia
@ sobre opção de reconstruir um protofonema 
diferente de todos os fonemas atestados
Nem sempre reconstruir um protofonema diferente de dois fonemas ates-
tados é a opção a ser descartada. Por exemplo, os fonemas a e i em grego 
antigo e latim correspondem ora a a, ora a i no sânscrito: gre.ant. ágo, lat. 
ago, sscr. ájami “conduzir”; gre.ant. dís, lat. bis, sscr. dvís “dois”; mas gre.ant. 
patér, lat. pater, sscr. pitár. Neste caso, os protofonemas *a e *i são recons-
truídos para os cognatos que manifestam todos as mesmas vogais, e outro 
protofonema vocálico *ə2 para os casos em que grego e latim possuem a, e 
sscr. i (*a > a, *i > i, *ə2> a, i).
@grupos da famílias indo-europeia
A família indo-europeia é composta por nove grupos que possuem línguas 
vivas atualmente (itálico, celta, germânico, albanês, helênico, eslavo, báltico, 
armênio, indo-iraniano), mais dois grupos (anatólico e tocariano) formados 
apenas por línguas extintas. 
O mapa abaixo mostra a distribuição geográfica atual dos grupos de línguas 
indo-europeias vivas e há dois símbolos que indicam as regiões onde exis-
tiram as línguas dos dois grupos extintos. Depois, fornecem-se informações 
muito sucintas sobre esses diferentes grupos da família.
3CAPÍTULO
A linguística 
histórico-comparada
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior32
Grupo itálico
As línguas extintas desse grupo eram todas antigas línguas faladas na Penín-
sula Italiana (por essa razão, o nome do grupo); entre elas, algumas das prin-
cipais foram o osco-umbro, o falisco e o latim. As línguas itálicas vivas hoje em 
dia são todas filhas do latim: português, espanhol, catalão, francês, provençal, 
italiano, romanche (ou ladino), sardo, romeno, entre outras, são conhecidas 
como línguas neolatinas ou românicas.
Grupo céltico
Este grupo conta, hoje em dia, com poucas línguas faladas na Irlanda, Escócia, 
Gales e, na França, na região da Bretanha: irlandês, manês (falado na ilha de 
Man), gaélico escocês, bretão, córnico e gaulês. Antigamente, línguas desse 
subgrupo da família eram faladas em uma região da Europa que se estendia 
da Península Ibérica até a hodierna Turquia. 
33Giulia Bossaglia
Grupo germânico
As línguas vivas deste grupo compreendem inglês, alemão, holandês, dinamar-
quês, sueco, norueguês, islandês, entre outras. Fora da Europa, uma das línguas 
germânicas mais notáveis é o afrikaans, língua que se desenvolveu na África do 
Sul a partir de um dialeto do holandês, que chegou lá entre os sécs. XVII-XVIII 
com um grupo de colonos calvinistas conhecidos como bôeres. 
Muitas línguas antigas desse grupo deixaram atestações: as mais antigas são as 
do gótico, língua falada pelos Godos entre os sécs. V e VIII na Europa oriental 
(entre Romênia e Turquia, aproximadamente), que nos chegaram através de uma 
famosa tradução da Bíblia feita por um bispo de nome Wúlfila no V séc. 
Grupos albanês, helênico, armênio
Albanês, grego e armênio são três línguas isoladas dentro da família indo-eu-
ropeia, ou seja, constituem grupo sozinhas, sem terem “línguas irmãs” (aten-
ção: uma língua isolada dentro de uma família não deixa de ter relações de 
parentesco com as demais da família, diferentemente das línguas isoladas 
stricto sensu, como o basco, para as quais não é comprovada nenhuma relação 
genética com outras línguas).
Grupo eslavo
O grande grupo eslavo compreende as línguas balcânicas esloveno, croata, sér-
vio, bósnio, montenegrino, macedônio, búlgaro e, da Europa central até a Russia, 
o tcheco, eslovaco, polonês, bielo-russo, ucraniano, russo. A língua eslava mais 
antiga é o antigo eslavo eclesiástico, língua literária atestada a partir do séc. X.
Grupo báltico
Lituano e letão são as línguas bálticas faladas hoje em dia. Devido a razões 
de contato, as línguas desse grupo apresentam muitas afinidades com as do 
grupo eslavo. Não há atestações de línguas mais antigas.
Grupo indo-iraniano
Este grande grupo da família pode ser dividido em três subgrupos: indo-ário,iraniano e nuristano (este último, muito pequeno). Pertencem ao grupo indo-
-ário o híndi, o bengali, o romani (línguas dos ciganos, faladas em muitos paí-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior34
ses europeus, com ênfase na área balcânica), entre muitas outras. O sânscrito 
é a língua mais antiga do subgrupo indo-ário. O subgrupo iraniano é o mais 
ocidental, e compreende o farsi (persa moderno), o curdo, o osseto, entre ou-
tras línguas. A mais antiga língua do subgrupo iraniano é o avéstico ou zend, 
língua dos textos sagrados da religião zoroastriana (o Avesta). As três línguas 
nuristanas vivas hoje em dia são faladas no atual Afeganistão. 
Grupo anatólico
O nome do grupo deriva de Anatólia, antigo nome da Turquia, a região onde 
antigamente eram faladas estas línguas indo-europeias. Entre elas, a principal 
é o hitita, língua da importante civilização que viveu entre II e I milênio aEC, e 
que foi decifrado só no começo do séc. XX.
Grupo tocariano
No começo do século XX, foram descobertos documentos budistas no Turques-
tão chinês (ou Xinjang), atestando duas línguas irmãs conhecidas como tocá-
rio A e tocário B e reconhecidas depois como indo-europeias. O tocário, língua 
indo-europeia mais oriental, apresenta características em comum com muitas 
línguas ocidentais da família (grego, latim, línguas germânicas, hitita) — isto 
teve consequências muito importantes para o reconhecimento de traços lin-
guísticos mais arcaicos (por isso, conservados nas periferias ocidental e orien-
tal) em oposição a traços inovadores achados em línguas centrais da família.
@mudança vs. analogia
A mudança é algo inerente a todas as línguas naturais, em todos os níveis de 
análise linguística. Às vezes, as mudanças sofridas por uma língua são tão pro-
fundas que levam à formação de novas línguas: de variedades diferentes do 
latim falado em diversas regiões do antigo império romano do Ocidente de-
senvolveram-se as línguas românicas, por exemplo. 
Há muitos e diversos mecanismos que regulam a forma como as línguas mu-
dam, e, ainda, as mudanças que afetam um nível de análise podem ter conse-
quências em outros — é o caso das mudanças fonéticas que levaram o latim 
vulgar a perder, progressivamente, o sistema de marcação morfológica de 
caso (@interface entre níveis). 
35Giulia Bossaglia
Uma força que age sobre as línguas levando-as a mudar é o fenômeno conhe-
cido como “analogia”. As mudanças que acontecem por analogia são fruto da 
influência de algum outro elemento dentro do sistema, que age como “mode-
lo”, e que é imitado. Geralmente, os elementos que agem como modelo para fe-
nômenos analógicos pertencem a paradigmas regulares, mais simples e mais 
frequentes, logo, mais disponíveis na mente dos falantes.
O pretérito imperfeito, no italiano antigo, possuía, na 1ª pessoa singular, uma 
desinência em -a, sendo formalmente idêntico à forma de 3ª singular (como 
acontece em português): ita. ant. amava “eu/ele amava”, aveva “eu/ele tinha” 
etc. A partir do século XV, a desinência de 1ª pessoa singular foi progressiva-
mente mudada para -o, com a resultante oposição morfológica entre 1ª e 3ª 
pessoa: amavo “eu amava” ~ amava “ele amava”, avevo “eu tinha” ~ aveva “ele 
tinha”. Essa mudança foi fruto de um processo analógico, e o “modelo” foi a opo-
sição entre as desinências de 1ª (-o) e 3ª (-a) pessoa singular no paradigma do 
presente indicativo: amo “eu amo” ~ ama “ele ama”, ho “eu tenho” ~ ha “ele tem”. 
Processos analógicos estão na base de alguns “erros” que os falantes cometem. 
Em fase de aquisição da linguagem, é comum as crianças produzirem formas 
erradas criadas com base em modelos muito frequentes no sistema linguís-
tico: plurais como cãos por “cães” e limãos por “limões” derivam da sobrege-
neralização do -s dos paradigmas regulares; crianças que estão adquirindo o 
inglês produzem formas de pretérito como he goed “ele foi” (forma correta: he 
went, pretérito do verbo to go), pois nos verbos regulares –(e)d é o sufixo de 
pretérito (to love “amar”, pretérito he loved “ele amou”). Não só as crianças em 
fase de aquisição da linguagem produzem formas desviantes devido a fatores 
analógicos: pense-se como, no português falado (até no português falado cul-
to), é cada vez mais comum o uso do infinitivo flexionado no lugar do futuro do 
subjuntivo, em construções como se eu ver isso (forma correta: se eu vir isso), 
se ele pôr isso (forma correta: se ele puser isso). Esse erro é fruto da influência 
que os verbos dos paradigmas regulares, que possuem formas idênticas para 
infinitivo flexionado e futuro do subjuntivo, exercitam na mente dos falantes, 
que tendem então a “regularizar” os paradigmas irregulares — o verbo ver, 
assim como ser, estar, querer, poder, fazer, etc. possui alomorfismo do radical 
nos dois modos: ver ~ vir, estar ~ estiver, querer ~ quiser, poder ~ puder, fazer 
~ fizer etc. Nada impede que “erros” como esses um dia se tornem uma nova 
regra do português, ou de uma língua dele derivada — no inglês contemporâ-
neo, por exemplo, afirmou-se o plural regular em -s para palavras como cow 
“vaca” e eye “olho”, que no inglês antigo pertenciam a declinações cujo sufixo 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior36
de plural continha uma consoante nasal (plurais originais: kine, eyen/eyne vs. 
novos plurais “regularizados” cows, eyes). 
A analogia, portanto, é um dos mecanismos que governam a mudança linguís-
tica. O linguista americano Edgar Howard Sturtevant (1875-1952) dá o nome 
a um paradoxo muito famoso na linguística histórica, o “paradoxo de Sturte-
vant”, e que diz respeito à mudança e à analogia. Ele afirma que a mudança fo-
nética é regular, mas produz irregularidades, enquanto a analogia é irregular, 
mas produz regularidades. 
Assumir que a mudança fonética é regular significa assumir que ela ocorre em 
todas as palavras que apresentam o contexto fonológico que desencadeia essa 
mudança. Pode-se observar isso no paradigma do presente do indicativo do 
verbo negare “negar” no italiano antigo:
Italiano antigo
1ªsg niego [ˈnjego]
2ªsg nieghi [ˈnjegi]
3ªsg niega [ˈnjega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl niegano [ˈnjegano]
O paradigma mostra alomorfismo no radical: na 1ª, 2ª, 3ª pessoa singular e 
na 3ª plural o radical é nieg-, enquanto na 1ª e 2ª pessoa plural é neg-. Esta 
irregularidade no presente do indicativo do verbo negare se produziu devido 
à ocorrência regular da mudança fonética conhecida como “ditongação româ-
nica”: um originário e breve latino, quando em sílaba aberta e tônica, virou di-
tongo (ie) em italiano. Assim, na 1ª e 2ª plural não se dá a ditongação, porque 
o e não está em sílaba tônica, como mostra a transcrição fonética. A mudança 
fonética se aplicou regularmente em todos os contextos em que havia as con-
dições que a condicionavam, e não ocorreu onde não havia, deixando, assim, o 
paradigma mais irregular.
No italiano contemporâneo, contudo, esse paradigma foi regularizado através 
de um processo analógico: 
Italiano contemporâneo
1ªsg nego [ˈnego]
2ªsg neghi [ˈnegi]
37Giulia Bossaglia
3ªsg nega [ˈnega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl negano [ˈnegano]
O modelo para a extensão do radical sem ditongação foram outros paradig-
mas em diferentes modos e tempos do mesmo verbo, como o infinitivo negare, 
o particípio negato, o gerúndio negando, o pretérito perfeito (negai, negasti, 
negò, negammo, negaste, negarono: o mesmo alomorfe em todas as seis pes-
soas verbais) etc., que não apresentam o ditongo no radical. A analogia, por-
tanto, produziu uma regularidade, eliminando o alomorfismo do radical no 
presente indicativo do verbo negare, e deixando todos os paradigmas, consis-
tentemente, com o radical neg- apenas.
Contudo, no italiano contemporâneo existem casos como aquele do verbo se-
dere “sentar-se”, que manifesta o alomorfismo do radical provocado pela mes-
ma mudança que o criou no paradigma do verbo negare do italiano antigo:
 Italiano contemporâneo1ªsg siedo [ˈsjedo]
2ªsg siedi [ˈsjedi]
3ªsg siede [ˈsjede]
1ªpl sediamo [seˈdjamo]
2ªpl sedete [seˈdete]
3ªpl siedono [ˈsjedono]
No paradigma acima, observa-se a ocorrência regular da ditongação, e a con-
sequente irregularidade no presente indicativo do verbo sedere, que apre-
senta os alomorfes sed- e sied- para o morfema lexical. Como negare, o verbo 
sedere nos demais paradigmas modotemporais apresenta majoritariamente o 
alomorfe sed-, entretanto, o processo analógico não foi desencadeado. 
Este pequeno exemplo do italiano explica bem o paradoxo de Sturtevant. A 
mudança fonética é regular, pois ocorre sistematicamente em todas as pala-
vras que apresentam o contexto fonológico que a condiciona; contudo, após 
uma mudança fonética, os paradigmas de uma língua podem se tornar irregu-
lares. A analogia, por sua vez, apesar de produzir regularidade nos paradig-
mas, é irregular, pois não ocorre sistematicamente.
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior38
@ Lei das palatais
A lei das palatais explicou a aparente não correspondência fonética entre os siste-
mas vocálicos do antigo grego e do latim, compostos por cinco vogais breves (a, e, 
i, o, u), em oposição àquele do sânscrito, composto por apenas três (a, i, u): 
Sânscrito Grego ant. Latim
a a a
- e e
i i i
- o o
u u u
Tal discrepância era tradicionalmente explicada pela suposta perfeição e 
maior antiguidade do sânscrito, ao refletir, em seu sistema trivocálico, outros 
níveis em que seriam observadas as estruturas tripartidas no indo-europeu 
(três gêneros gramaticais, três números, três tempos etc.). Contudo, mesmo 
assumindo o preconceito de que o sânscrito refletisse o vocalismo mais antigo 
e, portanto, mais próximo à protolíngua, não era possível achar padrões de 
correspondências fonéticas coerentes que pudessem explicar o desenvolvi-
mento das duas novas vogais do grego e do latim. 
O avanço coincidiu com a ampliação de escopo da análise dos dados compara-
tivos, ou seja, a observação não apenas dessas vogais, mas delas junto com as 
oclusivas velares do latim e do grego, que mostravam corresponder, em sâns-
crito, ora a uma oclusiva velar, ora a uma africada palatal ([tʃ ], indicada por 
convenção com c). Observando juntos esses dois fenômenos aparentemente 
sem relação recíproca, obtém-se um novo quadro de correspondências:
Sânscrito Grego ant. Latim
ka ka ka
ca ke ke
ci ki ki
ka ko ko
ku ku ku
Nestas novas correspondências, vê-se que o sscr. apresenta a consoante palatal 
na frente do a que corresponde a gre./lat. e, e na frente de i (que corresponde 
também a i nas outras línguas). Nos demais casos, o sscr. apresenta uma corres-
pondência quase perfeita com grego e latim: a única diferença é sscr. ka : gre./
39Giulia Bossaglia
lat. ko. Em geral, observam-se as correspondências vocálicas: a : a, a: e, i : i, a : o, 
u: u. Cruzando essas correspondências com a alternância entre k e c no sscr., foi 
possível reconstruir o percurso que levou ao sistema trivocálico do sscr.:
Protoindo- 
-iraniano
palatalização e, o > a Sânscrito
*ka *ka *ka ka
*ke *ce *ca ca
*ki *ci *ci ci
*ko *ko *ka ka
*ku *ku *ku ku
Reconstrói-se para a protolíngua do grupo indo-iraniano (ao qual pertence o 
sânscrito) um sistema de cinco vogais breves, igual ao do grego e do latim — o 
estágio mais antigo é, portanto, um estágio pentavocálico, mantido em grego e 
latim. As vogais mais anteriores e e i condicionaram a palatalização da oclusi-
va velar (processo de assimilação: a consoante velar, que é fonema posterior, é 
articulada mais anteriormente, no palato duro, devido ao efeito de vogais an-
teriores). Uma segunda mudança aconteceu depois da palatalização: as vogais 
e e o da protolíngua se fundiram com a, e *ce e *ko passaram, respectivamente, 
a ca e ka no sânscrito. A lei das palatais demonstrou, em primeiro lugar, que o 
sânscrito não era a língua mais perfeita da família e que seu sistema trivocá-
lico era fruto de uma inovação a partir de um anterior pentavocálico — prova 
definitiva de que o sânscrito não era mais antigo que o grego e o latim. Além 
disso, foi um exemplo da importância, no nível metodológico, de fundar qual-
quer generalização apenas nos dados comparativos, e que, ainda, é desejável 
que o olhar do linguista não fique limitado a um fenômeno específico (neste 
caso, o sistema vocálico), mas amplie seu escopo para outros domínios (as 
consoantes) que podem fornecer novas soluções para a reconstrução. A lei 
das palatais mostra também a importância de saber reconstruir as mudanças 
linguísticas na ordem cronológica certa: hipotetizando que a convergência de 
e e o para a tivesse acontecido antes da palatalização, o sscr. apresentaria *ka, 
*ka, *ci, *ka, *ku, o que não é verificado nos dados. 
@Lei de Verner
No quadro abaixo, mostra-se como a lei de Verner explica a aparente discre-
pância nos reflexos de pie *t no gótico, que, em vez de serem ambos th ([θ]), 
como a lei de Grimm prevê, são ora th, ora d: 
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior40
pie Protogermânico Retração do acento 
para a 1ª sílaba
th > d Gótico
*bhrāt́er *brāt́her não não bróthar
*pə2tḗr *fəthḗr sim sim fádar
No gót. bróthar, que procede do protogerm. *brá̄ther < pie *bhrá̄ter, o acento 
tônico da palavra se encontrava na primeira sílaba já no pie e no protogermâ-
nico; portanto, th, o reflexo fricativo de *t, se manteve. Já em palavras como 
gót. fádar, em vez de th há d [d]: no pie, a palavra é reconstruída com acento 
na segunda sílaba, *pə2tḗr. No protogermânico, reconstrói-se uma aplicação 
regular da lei de Grimm, que leva ao esperado th: *fəthḗr; em seguida, ocorreu 
a retração do acento para a primeira sílaba, que acabou alterando a fricativa 
th para d: fádar. A lei de Verner, portanto, conseguiu “consertar” os erros que 
Grimm, no início do século, tinha cometido devido ao rudimentarismo teórico 
e metodológico da disciplina àquela altura.
41Giulia Bossaglia
@ história da tipologia
Em 1660, era publicada a Grammaire générale et raisonnée (“Gramática geral e 
razoada”), conhecida também simplesmente como “Gramática de Port-Royal”, do 
nome do mosteiro de Port-Royal-des-Champs (não longe de Paris) ao qual per-
tenciam seus autores Claude Lancelot e Antoine Arnauld. Nesta obra, em que 
se vê uma forte influência do racionalismo cartesiano, é possível encontrar as 
raízes mais antigas da reflexão sobre universais linguísticos, tão importantes 
em âmbito tipológico: de fato, a Gramática de Port-Royal é uma gramática da 
língua francesa que tem como objetivo mais geral explicar “as razões daquilo 
que é comum a todas as línguas”. As línguas, de acordo com a obra, são meios 
para “explicar o pensamento através de signos”, e o pensamento (a “razão”) é 
uma faculdade universal do homem. Logo, devem existir princípios universais 
da linguagem, da qual as línguas são apenas realizações particulares. Assim, 
na Gramática de Port-Royal, a língua francesa e seus princípios são tomados 
como ponto de partida para deduzir os princípios da linguagem em geral (e 
de todas as línguas). Essa abordagem dedutiva ao estudo das propriedades 
universais da linguagem é assimilável à noção de gramática universal introdu-
zida por Noam Chomsky três séculos mais tarde, e é muito distante, do ponto 
de vista teórico e metodológico, da tipologia moderna. Contudo, é significativo 
individualizar, já na Gramática de Port-Royal, o interesse por princípios e res-
trições universais da linguagem humana.
O interesse tipológico recebeu um forte impulso ao longo dos sécs. XVII-
-XIX, graças à chamada “linguística missionária”, que se desenvolveu pelo 
encontro de missionários europeus com línguas muito “exóticas”, surgin-
4CAPÍTULO
A tipologia linguística
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior42
do a exigência de conciliar a ideia de uma substancial unidade das línguas 
como expressões da mente humana com a grandíssima variação interlin-
guística existente. Uma das respostas oriundas dessaexigência foi aquela 
do alemão Wilhelm von Humboldt (1767-1835) que, em sua obra Über die 
Verschiedenheit des menschlichen Sprachbaus und seinen Einfluss auf die geis-
tige Entwicklung des Menschengeschlechts “Sobre a diferença na estrutura 
linguística humana e sua influência sobre o desenvolvimento intelectual da 
humanidade” (publicada em 1836), defendia que as estruturas das línguas 
refletem o espírito de suas comunidades de falantes, e que, portanto, a di-
versidade linguística fosse um espelho das diversidades intelectuais e es-
pirituais das culturas humanas. Longe de ser uma abordagem objetiva ao 
estudo das línguas, é sem dúvida importante, no pensamento humboldtiano, 
a ideia de que é necessário conhecer as particularidades das demais línguas 
humanas para chegar aos princípios mais gerais da linguagem, que é organi-
zada de acordo com regras específicas. 
Na primeira metade do século XIX, enquanto se desenvolviam os estudos 
comparativistas na Europa, surgiram também as primeiras classificações das 
línguas em “tipos”, com base em critérios morfológicos: os irmãos Friedrich 
(1772-1829) e August Schlegel (1767-1845) classificavam as línguas em or-
gânicas, com estrutura (línguas indo-europeias) e não orgânicas (todas as ou-
tras). Essa classificação identificava línguas “sem estrutura” como o chinês, 
línguas “com afixos” como o turco, e línguas “com flexão” como latim e grego 
(“sintéticas”) ou o francês (“analítica”). Nas classificações em tipos morfológi-
cos da primeira metade do século XIX — Franz Bopp e Jacob Grimm também 
se dedicaram a esse tipo de estudo —, havia uma forte relação entre critérios 
genéticos e tipológicos: os tipos, que eram concebidos como imutáveis ao lon-
go da diacronia, eram associados a famílias linguísticas específicas — não sur-
preende que à família linguística indo-europeia fosse atribuído o tipo “mais 
perfeito”, de acordo com certo ideologismo que caracterizou o surgimento dos 
estudos linguísticos na Europa da época, e que se refletiram nessas classifica-
ções das línguas de natureza avaliativa. 
O verdadeiro precursor da tipologia moderna é para todos os efeitos o alemão 
Georg von Gabelentz (1840-1893). Sinólogo, fortemente influenciado pelos 
desenvolvimentos das ciências naturais que caracterizaram a segunda meta-
de do século XIX (como muitos contemporâneos dele: pense-se em August 
Schleicher, por exemplo), Gabelentz publicava, em 1891, a obra Die Sprach-
wissenschaft “Linguística”, da qual é particularmente programático e famoso 
43Giulia Bossaglia
o seguinte trecho, não apenas porque nele se encontra, pela primeira vez, a 
denominação “tipologia” para a disciplina:
Mas que conquista seria se pudéssemos confrontar uma língua e dizer-lhe 
“Você tem tais e tais propriedades específicas e portanto tais e tais ulteriores 
propriedades e tal e tal caráter geral” — se pudéssemos, como atrevidos bo-
tânicos têm de fato tentado, construir a tília inteira a partir da sua folha. Se se 
pudesse dar o nome a uma criança ainda não nascida, eu escolheria tipologia* 
(GABELENTZ, 2016 [1891], p. 510).
Como se observa pela analogia adotada, Gabelentz se inspirava no modelo cien-
tífico da botânica pós-darwinista, que visava classificações holísticas (do grego 
hólos “tudo”), ou seja, que descrevessem as plantas em sua totalidade, e não 
apenas em partes específicas: o objetivo da tipologia, de acordo com Gabelentz, 
era “construir a tília inteira a partir da sua folha”. Gabelentz foi o primeiro, 
ainda, a observar a possível existência de implicações entre propriedades das 
línguas, de acordo com os princípios da correlação das partes — há relações 
específicas entre as partes de um todo — e da subordinação dos caracteres — 
as relações entre partes e propriedades são de natureza hierárquica: algumas 
influenciam outras —, elaborados e aplicados pelo paleontólogo George Cuvier 
(1769-1832) no estudo de fósseis. Assim, emergia, na obra de Gabelentz, a con-
cepção preditiva da tipologia linguística: a partir da observação de uma pro-
priedade de uma língua, deveria ser possível prever outras que a caracterizam 
(cf. as correlações de parâmetros sintáticos, ou os universais implicacionais). 
Com Gabelentz acabou, ainda, a tipologia “avaliativa”, que havia caracterizado 
as classificações em tipos morfológicos durante a primeira metade do século 
XIX, e a concepção da imutabilidade dos tipos linguísticos ao longo do tempo. 
O autor também reforçou a necessidade de refinar a metodologia da disciplina 
e introduziu o uso de questionários linguísticos para a coleta de dados.
Na transição entre os sécs. XIX e XX, os estudos de Franz Boas (1858-1942, 
etnoantropólogo), Edward Sapir (1884-1939) e Benjamin Lee Whorf (1897- 
-1941) se focaram principalmente nas línguas ameríndias, revelando a neces-
sidade de repensar as categorias da tradição linguística ocidental, construída 
a partir das línguas indo-europeias, e ampliando os horizontes da compara-
ção interlinguística.
E é a partir de extensos trabalhos de comparação interlinguística que o ame-
ricano Joseph Greenberg (1915-2001) fundou a tipologia linguística moder-
na. Greenberg foi um dos linguistas mais controversos da história da linguís-
LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior44
tica. Na esteira dos estudos que, a partir do começo do séc. XX, buscaram 
comprovar a hipótese monogenética das línguas, Greenberg havia passado 
décadas aplicando métodos de comparação massiva aos demais continentes, 
chegando às classificações genéticas das línguas da África e das Américas e, 
mais em geral, a um amplo (ainda que nem sempre necessariamente profun-
do) conhecimento de línguas muito diferentes entre si. Em 1963, era publi-
cado o ensaio Some universals of grammar with particular reference to the 
order of meaningful elements “Alguns universais da gramática com particular 
referência à ordem dos elementos significativos”. Nele, Greenberg formulava 
45 universais linguísticos, a partir da análise de uma amostra de 30 línguas 
selecionadas em todos os continentes (Europa: basco, sérvio, galês, norue-
guês, neogrego, italiano, finlandês; Ásia: turco, burushaski, hebraico, híndi, 
kannada, japonês, tailandês, birmanês, malayo; África: iorubá, suaíli, fulani, 
massai, songhai, nubiano, berbere; Oceania: maori, luritja; Américas: qué-
chua, chipcha, maia, zapoteco, guarani). 
A partir da classificação das línguas da amostra com base na ordem de sujei-
to, verbo e objeto direto (os “elementos significativos”), Greenberg formu-
lou universais sintáticos e morfológicos, absolutos e implicacionais. Inde-
pendentemente da validade deles hoje em dia — algumas correlações entre 
parâmetros sintáticos não são mais tidas como efetivas, por exemplo — e 
do viés areal e genético da amostra utilizada — predominância de línguas 
europeias e indo-europeias — foi graças a esta obra que a concepção de uni-
versal linguístico mudou do simples conceito de “propriedade obrigatória 
em todas as línguas” para ponto de partida ao medir as diferenças entre as 
línguas naturais.
A tipologia greenberguiana se configurou como uma disciplina de orientação 
empírica, indutiva, requerendo, assim, extensos trabalhos de comparação in-
terlinguistíca antes da formulação das generalizações (de maneira comple-
tamente contrária, portanto, à abordagem dedutiva do gerativismo chomsk-
yano, que vinha se desenvolvendo nos mesmos anos). Os estudos tipológicos 
atuais, que se beneficiam de avanços teóricos, metodológicos e até tecnológi-
cos posteriores a Greenberg, continuam, contudo, na esteira dessa abordagem 
empírica e baseada nos dados que ele iniciou. 
*Original: Aber welcher Gewinn wäre es auch, wenn wir einer Sprache auf den 
Kopf zusagen dürften: Du hast das und das Einzelmerkmal, folglich hast du die 
und die weiteren Eigenschaften und den und den Gesammtcharakter! — wenn 
wir, wie es kühne Botaniker wohl versucht haben, aus dem Lindenblatte den 
45Giulia Bossaglia
Lindenbaum construiren konnten. Dürfte man ein

Continue navegando