Prévia do material em texto
2019 Indexação e Resumos Prof.a Fernanda de Sales 1a Edição Copyright © UNIASSELVI 2019 Elaboração: Prof.a Fernanda de Sales Revisão, Diagramação e Produção: Centro Universitário Leonardo da Vinci – UNIASSELVI Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri UNIASSELVI – Indaial. Impresso por: SA163i Sales, Fernanda de Indexação e resumos. / Fernanda de Sales. – Indaial: UNIASSELVI, 2019. 157 p.; il. ISBN 978-85-515-0312-6 1. Indexação e resumos - Brasil. II. Centro Universitário Leonardo Da Vinci. CDD 025.3 III apResentação A principal função da indexação, no âmbito bibliográfico, é a representação dos conteúdos contidos nos documentos, para fins de recuperação da informação. Esta operação, parece bastante corriqueira: folhear um livro, ler alguns trechos específicos deste volume e identificar os temas tratados pelos autores. No entanto, não se trata de um procedimento técnico simples, uma vez que esta identificação de conteúdo exige “conhecer” minimamente as diversas áreas do conhecimento, conhecer conceitos presentes nessas mesmas áreas, compreender as relações existentes entre eles, traduzir estes conceitos para uma linguagem documentária para que, enfim, o usuário possa utilizar este resultado para acessar fisicamente a informação desejada. Soma-se às etapas acima mencionadas o fato de a indexação ainda depender grandemente da intervenção humana, o que insere ao processo certa dose de subjetividade. O presente material tem o objetivo de apresentar, de maneira sistematizada, propostas teórico-metodológicas para minimizar as interferências que venham a prejudicar a prática da indexação, levando a buscas frustradas por informações em diversos tipos de unidades. Será possível conhecer os princípios, as etapas e a relevância da indexação dentro do processo técnico biblioteconômico; compreender a relação entre os princípios da organização do conhecimento e a indexação; conhecer propostas para elaboração de políticas, bem como relacionar esta atividade de gestão com os instrumentos que apoiam a prática da indexação, quais sejam, os vocabulários controlados. Por fim, será possível, a partir de exercícios, ter contato com a prática da indexação e da elaboração de resumos. A Unidade 1 – Princípios da indexação – é dividida em três tópicos: A indexação e a recuperação da informação; etapas práticas da indexação, e a tradução. No primeiro tópico, serão apresentadas aproximações conceituais acerca da atividade de indexação, bem como as suas subjetividades e ferramentas capazes de minimizar as subjetividades enfrentadas pelo indexador. O Tópico 2 – Etapas práticas da indexação – trará a normalização da atividade e autoatividades capazes de possibilitar ao aluno a compreensão da relação entre teoria e prática, com base no proposto pela Associação Brasileira de Normas Técnicas e de outros documentos oficiais. O Tópico 3 – A tradução – por sua vez, coloca em foco a tradução dos termos extraídos da linguagem natural para a linguagem documentária. A Unidade 2 trata das políticas de indexação. Sua estrutura é a seguinte: no Tópico 1, serão tratados os conceitos de linguagem natural e de linguagem documentária, bem como suas relações no âmbito da biblioteconomia, e, principalmente, no âmbito da organização e da IV Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há novidades em nosso material. Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um formato mais prático, que cabe na bolsa e facilita a leitura. O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova diagramação no texto, aproveitando ao máximo o espaço da página, o que também contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo. Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente, apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade de estudá-lo com versatilidade nas telas do celular, tablet ou computador. Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto em questão. Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa continuar seus estudos com um material de qualidade. Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de Desempenho de Estudantes – ENADE. Bons estudos! recuperação da informação. O Tópico 2 traz as relações entre as linguagens documentárias e as políticas de indexação a partir das ideias de autores do núcleo duro da biblioteconomia e da ciência da informação. Já, no Tópico 3 – Elaboração de políticas de informação – serão apresentados e discutidos alguns modelos possíveis para implantação em unidades de informação. A Unidade 3 – Prática de indexação e resumos – apresenta os diversos tipos de resumo, com especial foco aos resumos indicativo e informativo, por serem os mais utilizados atualmente. No entanto, são descritos também outros tipos de resumos, como o resumo crítico. Também é foco desta unidade apresentar vários elementos necessários à escrita de um bom resumo. Especialmente, permitirá ao aluno a resolução de uma série de exercícios que visam à indexação de documentos e elaboração de resumos. Boa leitura e bons estudos! Prof.a Fernanda de Sales NOTA V VI VII UNIDADE 1 – PRINCÍPIOS DA INDEXAÇÃO ................................................................................ 1 TÓPICO 1 – A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO ................................... 3 1 INTRODUÇÃO ..................................................................................................................................... 3 2 PRINCÍPIOS DA INDEXAÇÃO ........................................................................................................ 3 3 POR QUE INDEXAR? A ORGANIZAÇÃO DO CONHECIMENTO E A INDEXAÇÃO ...... 9 RESUMO DO TÓPICO 1........................................................................................................................ 11 AUTOATIVIDADE ................................................................................................................................. 12 TÓPICO 2 – ETAPAS DA PRÁTICA DA INDEXAÇÃO ................................................................. 13 1 INTRODUÇÃO ..................................................................................................................................... 13 2 NORMA BRASILEIRA PARA ANÁLISE DOCUMENTÁRIA .................................................... 14 3 INDEXAÇÃO DE IMAGENS ............................................................................................................. 20 RESUMO DO TÓPICO 2........................................................................................................................ 26 AUTOATIVIDADE ................................................................................................................................. 27 TÓPICO 3 – A TRADUÇÃO .................................................................................................................. 31 1 INTRODUÇÃO ..................................................................................................................................... 31 2 INDEXAÇÃO AUTOMÁTICA ..........................................................................................................32 3 INDEXAÇÃO POR EXTRAÇÃO ...................................................................................................... 34 4 INDEXAÇÃO POR ATRIBUIÇÃO ................................................................................................... 35 LEITURA COMPLEMENTAR ............................................................................................................... 37 RESUMO DO TÓPICO 3........................................................................................................................ 41 AUTOATIVIDADE ................................................................................................................................. 42 UNIDADE 2 – POLÍTICAS DE INDEXAÇÃO .................................................................................. 45 TÓPICO 1 – FUNDAMENTOS DA POLÍTICA DE INDEXAÇÃO ............................................... 47 1 INTRODUÇÃO ..................................................................................................................................... 47 2 POLÍTICA DE INDEXAÇÃO PARA UNIDADES DE INFORMAÇÃO .................................... 47 RESUMO DO TÓPICO 1........................................................................................................................ 52 AUTOATIVIDADE ................................................................................................................................. 53 TÓPICO 2 – LINGUAGEM NATURAL E LINGUAGEM DOCUMENTÁRIA ........................... 55 1 INTRODUÇÃO ..................................................................................................................................... 55 2 O QUE SÃO LINGUAGENS DOCUMENTÁRIAS? ..................................................................... 55 LEITURA COMPLEMENTAR ............................................................................................................... 58 3 LINGUAGENS DOCUMENTÁRIAS E SUAS RELAÇÕES COM AS POLÍTICAS DE INDEXAÇÃO ......................................................................................................................................... 68 RESUMO DO TÓPICO 2........................................................................................................................ 70 AUTOATIVIDADE ................................................................................................................................. 71 TÓPICO 3 – ELABORAÇÃO DE POLÍTICAS DE INDEXAÇÃO ................................................. 75 1 INTRODUÇÃO ..................................................................................................................................... 75 sumáRIo VIII 2 CARACTERÍSTICAS DA POLÍTICA DE INDEXAÇÃO ............................................................. 75 RESUMO DO TÓPICO 3........................................................................................................................ 87 AUTOATIVIDADE ................................................................................................................................. 88 UNIDADE 3 – INDEXAÇÃO E RESUMOS: PRÁTICA ................................................................... 91 TÓPICO 1 – RESUMOS: TIPOS E FUNÇÕES ................................................................................... 93 1 INTRODUÇÃO ..................................................................................................................................... 93 2 CARACTERÍSTICAS DOS RESUMOS ........................................................................................... 93 RESUMO DO TÓPICO 1........................................................................................................................ 98 AUTOATIVIDADE ................................................................................................................................. 99 TÓPICO 2 – PRÁTICA DE INDEXAÇÃO .......................................................................................... 109 1 INTRODUÇÃO ..................................................................................................................................... 109 2 POR QUE PRATICAR? ........................................................................................................................ 109 3 A ANÁLISE DOCUMENTÁRIA ........................................................................................................ 109 RESUMO DO TÓPICO 2........................................................................................................................ 115 AUTOATIVIDADE ................................................................................................................................. 116 TÓPICO 3 – PRÁTICA DE ELABORAÇÃO DE RESUMOS .......................................................... 119 1 INTRODUÇÃO ..................................................................................................................................... 119 2 ELABORAÇÃO DE RESUMOS ......................................................................................................... 119 LEITURA COMPLEMENTAR ............................................................................................................... 124 RESUMO DO TÓPICO 3........................................................................................................................ 132 AUTOATIVIDADE ................................................................................................................................. 133 REFERÊNCIAS ......................................................................................................................................... 155 1 UNIDADE 1 PRINCÍPIOS DA INDEXAÇÃO OBJETIVOS DE APRENDIZAGEM PLANO DE ESTUDOS A partir do estudo desta unidade, você deverá ser capaz de: • compreender os princípíos da indexação; • reconhecer a importância da atividade de indexação nas unidades de informação; • conhecer as etapas da indexação de documentos e de imagens; • conhecer as diferentes formas de indexação automática, segundo F. W. Lancaster; • distinguir linguagens naturais de documentária; • conhecer as possibilidades para a elaboração de uma política de indexação; • elaborar resumos informativos e indicativos; • indexar documentos e imagens. Esta unidade está dividida em três tópicos. No decorrer da unidade você encontrará autoatividades com o objetivo de reforçar o conteúdo apresentado. TÓPICO 1 – A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO TÓPICO 2 – ETAPAS PRÁTICAS DA INDEXAÇÃO TÓPICO 3 – A TRADUÇÃO 2 3 TÓPICO 1 UNIDADE 1 A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO 1 INTRODUÇÃO A indexação, segundo Dias (2007, p. 11), é a “terminologia mais usada para designar o trabalho de organização da informação quando realizado nos chamados serviços de indexação e resumo. Esses serviços têm por finalidade organizar informações”. Deste modo, as unidades de informação, por serem as ambiências que mais necessitam a utilização de facilitadores na organização de informações, são as organizações nas quais a indexação é profissionalmente realizada. Indexar é construir índices. No campo da informação, isso significa construir índices que referenciem os conteúdos dos documentos. Esta atividade faz parte de um conjunto maior de técnicas que visam ao tratamento temático da informação. Todas estas técnicas têm por função representar de forma sintética e coerente os conteúdos dos itens de uma unidade de informação (livros, documentos, imagens, por exemplo). Ou seja, a partir de ações específicas, o bibliotecário deve identificar o conteúdo de um item, traduzi-lo em palavras- chave que sejam coerentes ao usuário, identificar cada um dos itens para que eles possam ser encontrados dentro do acervo e, assim, possibilitar a recuperação das informações. O ato de traduzir o conteúdointegral em termos que o represente coerentemente é o cerne da atividade de indexação. Esta unidade se dispõe a caracterizar esta atividade e seus princípios, a detalhar suas etapas, a relacioná-la à organização da informação e do conhecimento, bem como a apresentar os tipos de indexação. É o que segue. 2 PRINCÍPIOS DA INDEXAÇÃO A indexação é comumente chamada de indexação de assuntos. Esta, segundo Lancaster (1997) visa indicar de que trata um documento. O resultado da indexação é a construção de termos de indexação. Segundo o autor, os termos devem proporcionar uma ideia “bastante razoável sobre o que é tratado” em um dado texto (LANCASTER, 1997, p. 5). Vejamos o seguinte exemplo: Centro de Informação Compartilhamento de recursos Catálogos coletivos Redes em linha Redes de bibliotecas UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 4 Esta lista de termos, que representam um dado livro, deve funcionar como um minirresumo. Imaginemos um usuário entrando em uma unidade de informação para buscar livros e outras fontes de informação, para desenvolver uma pesquisa sobre o tema Compartilhamento de dados em Catalogação. Este usuário, ao consultar o catálogo da unidade, utilizando termos de busca, deve chegar a uma série de itens que tratem do tema referido. Grande parte da dificuldade encontrada por bibliotecários, que trabalham com indexação, está na subjetividade que é inerente a esta atividade. Como saber se este usuário fará sua busca por informação utilizando exatamente os mesmos termos utilizados pelo pessoal técnico? Eis a resposta: não há como saber. A subjetividade está presente no dia a dia dos indexadores de maneira bastante marcante. Isso será tratado mais detalhadamente adiante na Unidade 2. No entanto, chamamos a atenção para este fato agora para ilustrar algumas situações que podem, perfeitamente, ser vivenciadas em um setor de referência em uma biblioteca. Vejamos um primeiro exemplo: tomemos o mesmo usuário citado anteriormente, aquele que busca fontes para desenvolver uma pesquisa sobre o tema Compartilhamento de dados em Catalogação. Se ele faz sua busca com termos como “biblioteca”, “recursos informacionais compartilhados”, “redes on-line” e “bibliotecas em rede”, ele não encontrará o livro indexado com os termos “centro de informação”, “compartilhamento de recursos”, “catálogos coletivos”, “redes em linha”, e “redes de bibliotecas”. Isso significa que o usuário busca por uma informação que existe nos estoques informacionais da biblioteca, mas ela não pode ser recuperada. Outra situação é trazida por Dias (2007), que convidou um grupo de bibliotecários atuantes como indexadores em bibliotecas especializadas para indexar todos eles, mas, separadamente, os mesmos livros. O resultado foi analisado e arquivado. Os mesmos bibliotecários foram convidados meses mais tarde para indexar os mesmos livros da atividade anterior. Os resultados, confrontados com os primeiros, mostraram que um mesmo bibliotecário indexou o mesmo livro de formas diferentes. O pesquisador atribuiu esta diferença a razões que se aproximam da subjetividade humana, tais como: conhecimento sobre o tema, humor e estresse nos dois dias das atividades, falta de atenção, falta de interesse na atividade. Estas duas situações são trazidas à tona para demonstrar que a indexação é uma atividade que, em um primeiro momento, pode parecer bastante simples, quase mecânica. No entanto, é envolvida de complexidades que são inerentes à condição humana, pois envolvem o componente intelectual, portanto, humano. Especialmente por se reconhecer estas complexidades é que alguns princípios são fixados quando da indexação de assuntos. Estes princípios visam a amenizar essas complexidades e a trazer o quanto de objetividade for possível nos resultados do processo de indexação. TÓPICO 1 | A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO 5 Os princípios dos quais trataremos a seguir são os seguintes: extensão do registro, atinência, e, tradução, propostos por Lancaster (1997); e qualidade da análise, interesse do usuário e características do acervo, simplicidade formal, coerência e uniformidade, controle da sinonímia, analogia, e, controle da ambiguidade, propostos por Mendes e Simões (2002). O princípio da extensão do registro sugere que quanto mais extensa for a representação de um item, mais pontos de acesso serão oferecidos aos usuários. Dito de outra forma, quanto mais termos de indexação forem construídos pelo bibliotecário sobre um livro, por exemplo, mais chances haverá deste mesmo livro ser encontrado pelos usuários em suas buscas realizadas por assunto. Lancaster (1997, p. 7) afirma que “na medida que se aumenta a extensão da representação [da informação], também se aumenta sua recuperabilidade”. Para tratar do princípio da atinência, o mesmo autor recorre à Teoria do Conceito, cunhada pela alemã Ingetraut Dahlberg, em 1979. Em sua teoria, a autora apresenta várias unidades que devem ser reconhecidas sobre um assunto para que se possa chegar ao seu conceito mais puro. Assim, a proposta daquele autor é que seja realizada uma análise conceitual de um dado item bibliográfico para que o resultado de sua indexação tenha atinência, ou seja, seja atinente à verdadeira necessidade de informação apresentada pelo usuário. Não se descarta, neste processo, a elaboração de resumos para que, a partir deles, seja identificada a atinência do conteúdo. Já para Naves (2001), a atinência é uma fase da análise de assunto (portanto, imediatamente anterior à indexação), na qual se inicia um processo linguístico complexo. Esta autora concorda, no entanto, que neste processo deve-se proceder à identificação de conceitos presentes no texto que está sendo indexado. Ainda há a possibilidade de o resultado final da busca pela atinência do texto ser uma frase de indexação, com elementos suficientes para a posterior elaboração de uma lista de termos. É importante frisar que, apesar destes esforços, nem sempre a exatidão esperada é alcançada, especialmente, pelos significados atribuídos aos conceitos que podem ser diferentes para autores, bibliotecários indexadores e usuários. A tradução envolve a conversão dos elementos encontrados nas etapas anteriores em um conjunto de termos de indexação. Estes termos serão os pontos de acesso aos itens bibliográficos quando os usuários fizerem sua busca nos índices de determinada unidade de informação, utilizando um assunto como referência. Mendes e Simões (2002) apontam como um primeiro princípio da indexação a qualidade da indexação, que depende da qualidade da análise, que deve ser realizada com fidelidade ao conteúdo total ou parcial do documento, e ao que exprime o pensamento do autor. Desta forma, minimiza-se a recuperação de informações não pertinentes, ou seja, reduz-se as possibilidades de ‘ruídos’ na recuperação da informação. UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 6 Ainda para as autoras: esta exigência pressupõe que o indexador desenvolva qualidades pessoais como as características de um espírito analítico-sintético; em primeiro lugar a objectividade, já que a análise é um campo onde o subjectivismo facilmente se insinua; deve possuir, ou propor-se adquirir, conhecimentos mínimos da área temática em que se move e contará sempre com o apoio regular de obras de referência [...]. Deverá notar-se que a utilização simultânea de uma linguagem de indexação combinatória, [...] de uma classificação, constitui um grande apoio para uma análise correcta, na medida em que, integrando o assunto concreto, num âmbito mais vasto, o torna mais claro e facilita a sua identificação (MENDES; SIMÕES, 2002, p. 18). Como se vê, as subjetividades da indexação também são motivos de preocupação para as autoras citadas anteriormente. Por isso, elas defendem o uso de linguagens documentárias especializadasem diversas áreas do conhecimento para que o trabalho possa resultar objetivo o quanto for possível. Aqui, não se pode deixar de mencionar a importância de programas de orientações ou de um serviço de referência atuante para que possa ser oferecido aos usuários uma educação quanto à consulta nos índices e/ou catálogos das bibliotecas, especialmente, pelo fato de não terem eles, os usuários, acesso a essas linguagens documentárias, já que se trata de materiais para uso profissional. No que tange ao interesse do usuário e das características do acervo, as autoras entendem que no processo de indexação, deve-se levar em conta os temas que constituam informação pertinente para a comunidade usuária a que a unidade de informação atende. Na representação da informação resultante da indexação, devem ser escolhidas as formas consagradas no uso corrente do meio a que se destinam. E isso também está presente na constituição do acervo, uma vez que a coleção de uma biblioteca se desenvolve de acordo com as características da comunidade usuária a quem pretende oferecer seus produtos e serviços de informação. Outro fato que está relacionado a este aspecto é que o acervo de uma biblioteca é sempre o primeiro fundo a ser consultado pelo bibliotecário indexador para que se mantenha certa uniformidade na linguagem empregada aos termos de indexação. As autoras não ignoram o fato de que, nos dias de hoje, os usuários podem apresentar um perfil diferente, conseguindo criar estratégias de busca diante de um catálogo de biblioteca em função da generalizada disponibilidade da informação em redes e através de meios e suportes técnicos acessíveis a um número maior nos últimos tempos. Todavia, mesmo assim, os indexadores não podem deixar de ter os seus objetivos bem claros e fundamentados para não transmitir a responsabilidade da recuperação da informação quase que totalmente para os usuários. TÓPICO 1 | A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO 7 Ao falarem sobre uma simplicidade formal, Mendes e Simões (2002) estabelecem que o termo de indexação deve ser tão simples quanto for possível. Aqui, pode-se inferir que o indexador deve possuir grande capacidade de síntese, mas, sem que essa característica impeça a elaboração de termos de indexação adequados para representar o conteúdo do item. No que se refere ao princípio da coerência e da uniformidade, espera-se que no processo de indexação haja coerência da aplicação dos mesmos princípios e da manutenção dos critérios de escolha para a solução de casos análogos. É o que as autoras chamam de uma uniformidade intrínseca. Deve-se também “manter uma uniformidade exterior, garantindo, para a representação de um mesmo conceito, a escolha de um mesmo termo” (MENDES; SIMÕES, 2002, p. 20). Dito de outra forma, espera-se que os itens de uma dada biblioteca que tratem dos mesmos termos em seus conteúdos sejam indexados de forma idêntica, para que todos possam ser recuperados em uma mesma busca. Quando, por outro lado, estes itens que tratam dos mesmos assuntos estiverem em bibliotecas diferentes, espera-se que a indexação seja feita de maneira bastante semelhante. As diferenças podem ficar por conta de características diferentes que podem aparecer nas diferentes comunidades usuárias. Em relação ao controle da sinonímia e à analogia, as autoras são bastante diretas: afirmam que para “um mesmo conceito deve escolher-se um único termo de indexação (termo preferencial ou descritor), permitindo-se através de uma relação de equivalência o acesso pelos seus sinônimos” (MENDES; SIMÕES, 2002, p. 21). Elas seguem: “em casos de dúvida na aplicação direta dos princípios e das normas, procurar-se-á uma solução análoga a alguma já encontrada para casos idênticos, fazendo assim valer a coerência e a uniformidade” (MENDES; SIMÕES, 2002, p. 22). UNI Sinonímia: relação de equivalência entre, pelo menos duas palavras [...]. De um lado, permite normalizar a polissemia, indicando que várias palavras, uma vez que compartilham significados próximos, expressa-se por meio de um mesmo descritor [termo de indexação]. De outro, permite compatibilizar a linguagem dos usuários com a linguagem do sistema [biblioteca], funcionando, assim, como operador de sentido (CINTRA et al., 2002). Por fim, sobre o princípio do controle de ambiguidade tem-se que “a escolha dos termos, em qualquer caso [...] deve ser cuidadosamente feita de modo que não resulte ambiguidade no momento da pesquisa” (MENDES; SIMÕES, 2002, p. 22). UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 8 UNI Ambiguidade: entendida como uma possibilidade de comunicação linguística prestar-se a mais de uma interpretação (CINTRA et al., 2002). A transcrição a seguir, apesar de extensa, ilustra bem este cenário: O caso mais evidente de ambiguidade deve-se a uma falta de controlo da polissemia; há que ter um cuidado especial com os homógrafos, pois o mesmo termo não pode representar dois conceitos, sob pena de provocar «ruído» na informação. Surgem, também, situações propícias à ambiguidade quando uma operação booleana é realizada no momento da pesquisa, em pós-coordenação, portanto, intercepcionando dois conceitos para obter um outro mais específico; a norma apresenta um exemplo que se tornou clássico: o produto da intercepção entre alimentação e plantas pode conduzir aos conceitos diferentes de alimentação de plantas e plantas como alimentação. Convém notar que o risco é efectivamente corrido ao nível da análise; ao optar por dois conceitos genéricos em vez de um específico, por razões muito próprias e expressamente permitidas nas normas, o indexador tem que prever as consequências que daí podem advir, neste caso os efeitos perniciosos da ambiguidade (MENDES; SIMÕES, 2002, p. 23, grifo nosso). UNI Polissemia: ocorre quando uma palavra pode comportar mais de um significado, “como em ‘Hoje trabalhei muito com ar condicionado’, em que o enunciador tanto pode dizer que trabalhou em aparelhos de ar condicionado, quanto em ambiente refrigerado ou aquecido por ar-condicionado” (CINTRA et al., 2002, p. 70-71). Vimos até aqui que a indexação é uma atividade de tratamento temático, desenvolvida em unidades de informação, que tem como objetivo identificar e representar os conteúdos de itens pertencentes a acervos de bibliotecas. Vimos também que esta é uma atividade permeada por complexidades advindas das subjetividades a que estão submetidos os elementos da linguagem e a própria condição interpretativa que cada pessoa – seja usuário ou bibliotecário – pode ter a respeito de um texto. Na continuação, veremos questões relacionadas à prática da indexação. TÓPICO 1 | A INDEXAÇÃO E A RECUPERAÇÃO DA INFORMAÇÃO 9 3 POR QUE INDEXAR? A ORGANIZAÇÃO DO CONHECIMENTO E A INDEXAÇÃO A resposta à pergunta acima poderia ser: para que a recuperação das informações seja possível. Uma biblioteca, geralmente, cumpre com seu papel se conseguir disseminar as informações que estão em seus acervos. Organiza-se informação para que ela se torne acessível. A indexação faz parte deste processo. Vejamos como Lima e Alvares (2012, p. 27) caracterizam a Organização do conhecimento: No sentido mais genérico do termo, organização do conhecimento é o modo como ele é disposto em assuntos em toda parte onde se deseja a sua sistematização ordenada para atingir determinado propósito [...] é estudada em outras áreas como Antropologia, Computação, filosofia, Linguística, Psicologia, Sociologia, entre outras. Na ciência da informação, é a área de estudos voltada às atividades de organização, representação e recuperação da informação. A biblioteconomia também se ocupa da organização da informação e do conhecimento, especialmente ao utilizar-se de ferramentas, técnicas e códigos que permitem: a) a organização física de um dado acervo; b) a representaçãodos conteúdos contidos nestes acervos; c) recuperação e uso da informação; e d) a constituição de novos conhecimentos a partir do acesso e uso de informação que produzam sentidos. Isto é possível a partir da prática da representação descritiva, que envolve a catalogação, e da representação temática, que envolve a análise de assunto, a indexação e a classificação. Cardozo Filho e Santos (2012, p. 185) ampliam as definições de indexação apresentadas até aqui, atribuindo-lhe a “função técnica de analisar documentos para que a informação significativa deles seja traduzida com a atribuição de termos selecionados da linguagem natural (utilizada na vida diária), ou por símbolos que mediarão a comunicação entre o documento e os usuários”. Portanto, temos aqui mais uma resposta à pergunta “para que indexar?”: para representar as informações significativas dos documentos. “A indexação agrega valor à informação” (CARDOZO FILHO; SANTOS, 2012, p. 188), uma vez que a torna acessível. Para além disso, é preciso ter em mente que toda a atividade técnica que está no cerne da prática bibliotecária, tem um alcance social relevante. Ao se indexar, classificar e catalogar os itens de uma dada biblioteca, é preciso entender que há uma ação social importante sendo desenvolvida, pois disponibilizar informação para uso garante a sua disseminação e, em última instância, e (não garante, mas) permite que o direito à informação como um bem comum seja exercido. Informar-se é um ato de cidadania e de participação social. Quando uma atividade técnica oferece aos cidadãos diversificados pontos de acesso à informação, o papel social da biblioteconomia está sendo ampliado. UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 10 É importante que o indexador tenha em mente que seu trabalho vai além se uma sala de ‘processamento’. Seu trabalho, de fato, chega na sociedade. Imaginemos a situação em que um pesquisador está investigando a cura para uma determinada doença e que sua pesquisa depende do acesso a informações técnicas específicas a respeito de nutrientes que reagem a vírus ou bactérias. Buscar por estas informações num catálogo de uma biblioteca e conseguir recuperá-las para o desenvolvimento dos testes necessários pode representar o sucesso da descoberta. Ou o insucesso. Imaginemos agora que a indexação realizada nesta biblioteca permita que o pesquisador encontre exatamente a informação de que necessita para finalizar seus estudos e, garanta assim, a cura de milhares de pessoas. Inegável a participação do profissional no processo e o alcance social do trabalho técnico. Então, podemos mais uma vez ampliar a resposta à pergunta que inicia esta subseção: indexa-se para que a sociedade possa se transformar a partir – não só, mas também – do acesso a informações pertinentes as suas necessidades. Veremos no tópico a seguir como se indexa. 11 Neste tópico, você aprendeu que: • Existem pricípios para a indexação. • A atividade de indexação nas unidades de informação é de extrema importância para a recuperação da informação. • Existem conceitos acerca da atividade de indexação e muitas subjetividades em torno dessa atividade. • Existem ferramentas capazes de minimizar as subjetividades enfrentadas pelo indexador. RESUMO DO TÓPICO 1 12 1 O que é indexação e qual sua relevância nas unidades de informação? 2 Quais são as principais dificuldades enfrentadas pelos bibliotecários/ indexadores quando da indexação? 3 Quais as relações existente entre a indexação e a recuperação da informação? 4 Qual sua percepção acerca da relevância social da atividade de indexação? AUTOATIVIDADE 13 TÓPICO 2 ETAPAS DA PRÁTICA DA INDEXAÇÃO UNIDADE 1 1 INTRODUÇÃO Embora a atividade pareça ser bastante fácil e corriqueira, indexar não é apenas folhear um determinado livro e, como que automaticamente, pinçar algumas das palavras que se encontram em seu conteúdo. Os itens de um documento a serem consultados para o levantamento dos termos de indexação devem ser estrategicamente escolhidos para que se possa, a partir deles, extrair os conceitos mais significativos do conteúdo e, assim, representá-los mediante os termos. É importante lembrar aqui que estes termos de indexação são aqueles que os usuários comumente chamam de palavras-chave, ou, dito de outra forma, são aqueles termos que estes mesmos usuários usarão para realizar suas buscas por informações nos catálogos das bibliotecas. Por isso há duas questões a se levar em conta: a primeira delas é a identificação mais precisa que for possível dos conteúdos, e, a segunda, é a representação adequada destes conteúdos de forma que os usuários não deixem de recuperar as informações. No primeiro caso, é preciso realizar uma apurada análise documentária para levantamento dos conceitos. No segundo, é preciso lançar mão do uso de ferramentas que ajudem na tradução destes conceitos em termos de indexação. Vejamos este processo na figura a seguir. Documento Ação 1: Análise documentária - Selecionar partes do livro/ documento para ser consultado. - Identificar nestas partes os conteúdos de que trata o livro/documento. Ação 2: Indexação - Consultar linguagens documentárias que apontem melhores formas de traduzir o conteúdo em termos de indexação. - Construir os termos de indexação. FIGURA 1 – ANÁLISE DOCUMENTÁRIA E INDEXAÇÃO FONTE: A autora UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 14 2 NORMA BRASILEIRA PARA ANÁLISE DOCUMENTÁRIA No Brasil a atividade de análise documentária é regulamentada pela ABNT (Associação Brasileira de Normas e Técnicas) a partir da NBR 12676/1992, que propõe métodos para análise de documentos – determinação de seus assuntos e seleção de termos de indexação. A NBR supracitada (que se encontra anexada a esta Unidade 1), “fixa as condições exigíveis para a prática normalizada do exame de documento, da determinação de seus assuntos e da seleção de termos de indexação” (ABNT, 1992). Vejamos, resumidamente algumas definições importantes estabelecidas pela norma: • Documento – qualquer unidade, impressa ou não, que possa ser catalogada ou indexada. • Conceito – é qualquer unidade de pensamento; tem conteúdo semântico; pode ser combinado com outros conceitos; e, ainda, pode variar de acordo com diferentes línguas ou culturas. • Assunto – tema representado num documento. • Indexar – identificar e descrever o conteúdo de um documento. • Termo preferido – termo utilizado consistentemente na indexação; também chamado de descritor. • Termo não preferido – sinônimo do termo preferido; não utilizado como termo preferido, mas que pode ser apontado como remissiva. Imaginemos o exemplo ilustrado na figura a seguir: Documento: Conceito identificado a partir da Análise documentária: Trata da Moderna Historiografia brasileira e das Ciências Sociais brasileiras. Trata também da construção da sociedade brasileira. Assuntos: Moderna historiografia brasileira Ciências sociais no Brasil História da sociedade Termos preferidos: História do Brasil Ciências sociais Sociedade brasileira Tradução FIGURA 2 – ETAPAS DA INDEXAÇÃO, SEGUNDO NRB 12676/1992 FONTE: A autora TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 15 Para que este processo seja realizado com êxito, o proposto pela ABNT é que a identificação dos conceitos seja realizada com base no exame do documento. Cada tipo de documento deve ser examinado de acordo com suas características físicas (impressos ou não impressos). Para livros, especificamente, devem ser analisadas as seguintes partes do todo: título e subtítulo, resumo (se houver), sumário, introdução, ilustrações, diagramas, tabelas, palavras em destaque e referências bibliográficas. Os documentos não impressos, como é o caso das imagens, e das realias,que não possuem em sua composição física tais elementos, pedem outros procedimentos, sendo estabelecidos de acordo com suas especificidades e de acordo com as políticas de indexação, que veremos mais adiante, na Unidade 2. No que tange à identificação de conceitos, o item 4.3 da NBR 12676/1992 sugere que o indexador tente responder a uma série de questões para que possa chegar às unidades de sentido. Veja as questões a seguir: a) Qual é o assunto de que trata o documento? b) Como se define o assunto em termos de teorias e hipóteses? c) O assunto contém uma ação, processo ou operação? d) O documento trata do agente desta ação? e) O documento se refere a métodos, técnicas especiais? f) Há um contexto local ou um ambiente especial na discussão? g) O assunto foi considerado de um ponto de vista interdisciplinar? Passemos ao entendimento de cada uma destas questões: Qual o assunto de que trata o documento? Trata-se de uma primeira aproximação com o conteúdo. Neste momento, o indexador pode registrar os primeiros conceitos identificados. Tomemos como exemplo um dado livro que trate sobre o passo a passo de pesquisas científicas. Neste momento, é provável que o indexador sugira que o assunto de que trata o livro é Metodologia Científica, ou Métodos e Técnicas de Pesquisa. Como se define o assunto em termos de teorias e hipóteses? Neste momento, o sumário e a introdução do livro podem apontar se existe, por exemplo, uma ou algumas abordagens teóricas da construção do conhecimento científico: positivismo, marxismo, fenomenologia, entre outros. Se tais características forem identificadas, o indexador deve apontá-las em seus registros. O assunto contém uma ação, processo ou operação? Livros de metodologia científica, geralmente, apontam várias possibilidades de etapas que constituem uma pesquisa. Falam de como essas etapas são distribuídas em processos, como elaboração de entrevistas, coleta de dados, transcrição ou de gravação de áudios, estabelecimento de formas de organização de dados coletados, para, enfim, se procederem às análises. Embora, neste exemplo, estas características possam sugerir um movimento, não se trata de responder afirmativamente à pergunta, UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 16 pois o conteúdo em si não é tratado com base em um movimento, em uma entrevista, em um estudo de caso. O livro traz estes temas como conteúdo, mas não como aplicação. O documento trata do agente desta ação? Se não há ação, não há agente da ação. No entanto, pensemos em outro exemplo. O livro apresenta o resultado de uma pesquisa desenvolvida por médicos de uma dada comunidade ribeirinha na região norte do Brasil, em que realizaram entrevistas com homens e mulheres em idade fértil, questionando-os sobre o acesso a informações relacionadas à contracepção e doenças sexualmente transmissíveis. Neste caso, ao responder à pergunta anterior, o indexador, diria: “sim! Há uma ação!”. Esta ação seria a entrevista. E, os agentes, os médicos (pesquisadores), e os homens e mulheres em idade fértil (respondentes, público-alvo da pesquisa). O documento se refere a métodos, técnicas especiais? No primeiro exemplo, o indexador pode considerar que sim, se o livro de metodologia apresentar diversos métodos de pesquisa. Já no segundo exemplo, o da pesquisa realizada pelos médicos, a própria entrevista pode ser considerada, além da ação, o método. Há um contexto local ou um ambiente especial na discussão? Parece- nos pouco provável que o livro de metodologia estabeleça um limite físico ou geográfico para o tratamento do conteúdo. Já a pesquisa dos médicos foi realizada no norte do Brasil, em comunidades ribeirinhas. O assunto foi considerado de um ponto de vista interdisciplinar? Seria imprudência não considerar a construção do conhecimento científico, interdisciplinar por si só. No entanto, temos de nos ater ao CONTEÚDO tratado em nosso livro hipotético. Ele trata apenas de metodologia científica. Já no segundo exemplo, se formos considerar que a pesquisa tenta identificar possíveis pontos de acesso à informação sobre um segundo tem (contracepção e DSTs), pode-se considerar que há interdisciplinaridade. Os conteúdos identificados seriam: acesso à informação e educação sexual. Esta norma, que já foi discutida e criticada por estudiosos do campo da Informação, pode não ser a única forma de se estabelecer critérios para a indexação em uma unidade de informação, mas pode sugerir algumas diretrizes importantes para a análise documentária. Vejamos um exemplo a seguir. Considere o livro Crítica da Razão Pura de Immanuel Kant. Suas informações temáticas são: uma das mais influentes e importantes obras da história ocidental. Ela é geralmente referida como a "primeira crítica" de Kant, uma vez que essa obra precede a Crítica da Razão. O autor tenta responder a três questões fundamentais: Que podemos saber? Que devemos fazer? Que nos é lícito esperar? Afirma que os pensamentos filosóficos correntes se utilizavam TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 17 de "juízos analíticos" a priori, isto é, apenas andavam em círculos sobre algum conhecimento, reproduzindo-o com palavras diferentes, chegando a conclusões que em nada diferiam daquilo que já estava contido no primeiro pensamento, sem produzir, assim, qualquer novo conhecimento a respeito das questões sobre as quais eram formuladas. Neste caso, quais seriam as respostas às questões seguintes propostas pela NBR 12676: Qual o assunto de que trata o documento? Filosofia. Crítica. Como se define o assunto em termos de teorias e hipóteses? Se desenvolve com a crítica da razão. O assunto contém uma ação, processo ou operação? Não. O documento trata do agente desta ação? Não se aplica. O documento se refere a métodos, técnicas especiais? Não. Há um contexto local ou um ambiente especial na discussão? Não. O assunto foi considerado de um ponto de vista interdisciplinar? Não. Outro aspecto bastante pertinente ao processo de indexação, e que também é tratada pelo documento nacional que orienta a atividade, está relacionado à exaustividade e à especificidade às quais o indexador deve estar atento. A exaustividade está relacionada ao número de conceitos representados pelos termos atribuídos a um documento. Segundo Lancaster (1997, p. 23), a “indexação exaustiva implica o emprego de termos em número suficiente para abranger o conteúdo temático do documento de modo bastante completo”. Seu oposto seria a indexação seletiva, que propõe a utilização de termos que representem apenas o conteúdo principal. Veremos mais adiante que estas orientações são imprescindíveis ao indexador, por isso devem estar presentes de maneira bastante clara na política de indexação da unidade de informação. Ainda a esse respeito, a NBR 12676/1992 alerta para que a abrangência na indexação não seja muito restrita, pois, apesar de ter-se sempre um determinado grupo de usuários como suposto público-alvo, sempre é possível que outros usuários, pertencentes a um grupo menos especializado, faça uso das mesmas informações. Por isso, não é recomendado que se estabeleça um número arbitrário de termos a serem empregados para cada item indexado numa unidade de informação. É o próprio documento, ou o conteúdo propriamente dito que pode nortear essa decisão. “A imposição deste tipo de limite pode levar a alguma perda de objetividade na indexação e à distorção de da informação que poderia vir a ser de valor na recuperação” (ABNT, 1992, p. 3). UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 18 No tangente à especificidade, ela é referente ao grau de precisão com que um termo de indexação define um conceito, ou dito de outra forma, se refere à certa exatidão entre o termo de indexação e o conceito que ele representa. Lancaster (1997) acredita que é mais adequado utilizar vários termos maisespecíficos para indicar um conteúdo do que termos muito genéricos que possam não significar todos os conceitos de um determinado tema. Ele dá o seguinte exemplo: se um documento descreve o cultivo de limões, limas e tangerinas, será melhor indexado sob estes três termos específicos do que sob o termo mais genérico FRUTAS CÍTRICAS, O termo FRUTAS CÍTRICAS será usado apenas para artigos de frutas cítricas em geral, e para aqueles que tratem de praticamente todas as frutas cítricas (LANCASTER, 1997, p. 27). O mesmo autor lembra, de forma bastante positiva, que é preciso ter em mente que é possível atingir uma adequada especificidade na indexação a partir da combinação de termos. Ele apresenta os seguintes exemplos: Literatura Medieval Francesa, indexado sob LITERATURA MEDIEVAL e LITERATURA FRANCESA Bibliotecas Médicas, indexado sob BIBLIOTECAS ESPECIALIZADAS e CIÊNCIAS MÉDICAS Literatura Canadense, indexado sob LITERATURA e CANADÁ Óleo de amendoim, indexado sob ÓLEOS VEGETAIS e AMENDOIM” (LANCASTER, 1997, p. 28). Evangelista, Simões e Guimarães (2016, p. 59) entendem que “para uma recuperação da informação satisfatória, que atenda às carências informacionais do utilizador é necessária uma indexação eficaz, que possibilite a triangulação entre o conteúdo do documento, a sua representação e a necessidade informacional do utilizador”. Eles concordam com as definições já apresentadas até aqui ao afirmarem que: No desenvolvimento deste processo há dois princípios que devem ser sempre considerados: a exaustividade e a especificidade. O primeiro relaciona-se com o número de assuntos de um documento que são selecionados, e que se traduz objetivamente na quantidade de termos representativos; o segundo tem a ver com o nível de pormenor com o qual um conceito é representado (EVANGELISTA; SIMÕES; GUIMARÃES, 2016, p. 59). Estes autores abordam um tema de extrema relevância para a qualidade de indexação, bem como o exercício imparcial do indexador: a ética. Considera- se relevante transcrever um excerto de seu trabalho, que, apesar de reconhecida extenso, trata do assunto ética na indexação de maneira considerada bastante apropriada. Vejamos: Devido a um conjunto de razões, de entre as quais se destaca a subjetividade do indexador, em geral a operação de indexação não é contextualizada no seu tempo e no seu espaço. Muitas vezes o profissional da informação não atende aos aspetos sociais, culturais, políticos, a todo um conjunto de valores, princípios, preconceitos TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 19 e crenças que envolvem o contexto desta operação. A observância desta concorrerá, inevitavelmente para o não reconhecimento de uma dimensão ética inerente à organização e representação do conhecimento. A Ética é um domínio no campo da Filosofia que visa a procura do bem-estar na convivência em sociedade, ideia que se encontra ancorada nos conceitos de bem e de mal, e que tem como objetivo uma harmoniosa coexistência social. É seu objeto a moral, que trata das ações relacionadas com o binómio bem/mal e que a partir de regras baseadas numa delimitação espacio-temporal, determina o que se deve ou não se deve fazer em sociedade (MALIANDI, 2004; JAPIASSÚ, 2008; GUIMARÃES et al., 2008). O campo da organização do conhecimento, por sua vez, encontra- se respaldado num conjunto de valores que são os fundamentos da moral, que se destacam em determinada sociedade, num dado espaço e num determinado tempo, com o objetivo de disciplinar a convivência dos membros que a constituem, buscando o bem-comum (JAPIASSÚ, 2008; GUIMARÃES et al., 2008). Dada a sua complexidade e afirmação na sociedade contemporânea, as questões relacionadas com a privacidade, a equidade, o acesso à informação, o respeito pelo utilizador e o princípio pela garantia cultural, têm vindo a ser destacadas como objeto de discussão na literatura da área da Ciência da Informação, em trabalhos académicos e científicos, desde meados do século XX. É o caso do que foi realizado por Guimarães et al. (2008), no qual, entre outras questões relacionadas com a ética na indexação, se apontam a especificidade e a exaustividade como valores éticos a serem considerados nesta operação. Esta nova abordagem leva a que conceitos direta ou indiretamente associados aos valores éticos, deixem de ser considerados apenas como simples medidas matemáticas usadas para determinar o sucesso ou insucesso de um sistema de recuperação de informação, no que se refere ao desempenho nos aspetos relacionados com a precisão e/ou revogação dos resultados de uma pesquisa, e passem a ser considerados também como medidas de natureza qualitativa que, na prática, concorrem para uma maior abrangência em termos de heterogeneidade cultural na recuperação da informação. Deste modo, pode inferir-se que a presença da exaustividade e da especificidade na representação da informação vai ao encontro de um compromisso ético com o utilizador (GUIMARÃES, 2000), que está patente no modo como o catálogo de assuntos ou o índice evidencia o mais adequadamente possível. A diversidade temática do documento (exaustividade) e a profundidade com a qual é abordada a realidade que manifesta (especificidade) (EVANGELISTA; SIMÕES; GUIMARÃES, 2016, p. 60). A pesquisa realizada pelos autores citados anteriormente verificou que a exaustividade e a especificidade são essenciais na prática de indexação, na medida em que agregam valor acrescentado ao documento, o que concorre para a existência de pesquisas mais consistentes e precisas, contribuindo para a construção de uma ponte sólida entre o documento e o utilizador, que se reflete em resultados da pesquisa mais eficazes (EVANGELISTA; SIMÕES; GUIMARÃES, 2016, p. 70). UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 20 DICAS Leitura integral da pesquisa citada no link: <http://ojs.letras.up.pt/index.php/ paginasaeb/article/view/1471>, acesso em: 29 abr. 2019, pois os autores colocam em evidência a natureza dos processos de organização da informação e destacam a necessidade da abordagem da dimensão ética destes na recuperação da informação. E, se, em última instância, o que se promove, ao gerir informação, é a consolidação de uma sociedade mais igualitária pelo viés do acesso à informação, então, o aspecto ético deve permear todas as etapas da elaboração e da oferta de produtos e de serviços de informação. 3 INDEXAÇÃO DE IMAGENS Hingst (2011, p. 11) concorda com a abordagem dada neste curso até aqui para o processo de indexação. Para a autora, “a indexação é um processo que requer estudo e aprimoramento constantes”. E, quando a indexação é de imagens, “o cuidado com este processo deve ser redobrado, uma vez que existe maior complexidade na extração de descritores para este tipo de documento” (HINGST, 2011, p. 11). A autora recorre à literatura para compreender as principais dificuldades encontradas ao se fazer indexação de imagens: A representação documental de itens não-escritos tem, de acordo com Guinchat e Menou (1994), problemas relativos a sua natureza e sua forma de consulta. Isso se deve ao fato da “multiplicidade das necessidades que eles são capazes de responder” (GUINCHAT; MENOU, 1994, p. 181). Para Lopes (2006, p. 201), a indexação de fotografias utilizando descritores “acrescenta um valor informativo e documental na imagem registrada por seus efeitos narrativos e linguísticos, sendo este processo de fundamental importância numa base de dados ou num banco de imagens constituído por fotografias (HINGST, 2011, p. 19). Uma das primeiras diferenças entre a indexação de textos para a indexação de imagens está nas características apresentadas pelo próprio documento. Uma imagem possui aspectos de denotação, que correspondem ao que a imagem é de fato, e de conotação, que são os valores atribuídos à imagem peloindexador ou pela comunidade usuária. Quando se observa este princípio da conotação, especialmente, infere-se que a indexação das imagens pode estar muito mais submetida a questões interpretativas do que um texto, pois a linguagem escrita, apesar de apresentar diferentes conceitos em diferentes línguas e culturas, ainda possui uma objetividade da qual o indexador pode se valer. Mas, será que todos os indexadores chegam a mesma seleção de conceitos ao verem a imagem a seguir? TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 21 FIGURA 3 – INDEXAÇÃO DE IMAGENS 1 FONTE: <https://www.climatempoconsultoria.com.br/wp-content/uploads/2016/05/outono1-1- 750x420.jpg>. Acesso em: 20 maio 2019. Pode-se aproveitar a oportunidade para fazermos um rápido exercício. 1 Descreva a forma como você: a) identificaria a denotação da Figura 3; b) como você identificaria a conotação da Figura 3. 2 Examine mais uma figura. Vejamos: AUTOATIVIDADE FONTE: <http://1.bp.blogspot.com/-vSW8KN4q2VI/ViZCs6wHsFI/AAAAAAAAA-E/ MCbC6Q7JqYg/s400/trem.png>. Acesso em: 8 maio 2019. a) Identifique a denotação desta imagem. b) Como você identificaria a conotação desta imagem. UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 22 3 Examine a figura a seguir: FONTE: <https://www.donamix.com.br/image/cache/data/Manequim/allegomes--0012- 400x570.jpg>. Acesso em: 8 maio 2019. a) Como você identificaria a denotação desta imagem? b) Como você identificaria a conotação desta imagem? 4 Examine a figura a seguir: FONTE: <http://www.olabahia.com.br/wp-content/uploads/2016/05/musica-640x366.jpg>. Acesso em: 8 maio 2019. a) Como você identificaria a denotação desta imagem? b) Como você identificaria a conotação desta imagem? Este rápido exercício mostra o quanto de subjetividade pode haver no exercício de indexar imagens. Para que se possa minimizar esta equação, estudiosos da área buscam estabelecer alguns critérios. Vejamos: TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 23 Sobre o que deve ser descrito na imagem, Smit (1996, p. 32) afirma que: As categorias QUEM, ONDE, QUANDO, COMO e O QUE, utilizadas por muitos estudiosos como parâmetros para grande variedade de análises de textos, inclusive a documentária, é também preconizada para a Análise Documentária da imagem (HINGST, 2011, p. 21). Quando olhamos para uma imagem e “perguntamos a ela” sobre características mais específicas, podemos chegar a respostas (portanto, a termos de indexação), mas específicos, e isso atende ao princípio da especificidade, como vimos anteriormente. 1 Voltemos às mesmas imagens e façamos as seguintes perguntas: AUTOATIVIDADE FONTE: <https://www.climatempoconsultoria.com.br/wp-content/uploads/2016/05/ outono1-1-750x420.jpg>. Acesso em: 20 maio 2019. Quem? Onde? Quando? Como? O quê? 2 FONTE: <http://1.bp.blogspot.com/-vSW8KN4q2VI/ViZCs6wHsFI/AAAAAAAAA-E/ MCbC6Q7JqYg/s400/trem.png>. Acesso em: 8 maio 2019. UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO 24 Quem? Onde? Quando? Como? O quê? 3 FONTE: <https://www.donamix.com.br/image/cache/data/Manequim/allegomes--0012- 400x570.jpg>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? 4 FONTE: <http://www.olabahia.com.br/wp-content/uploads/2016/05/musica-640x366.jpg>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? TÓPICO 2 | ETAPAS DA PRÁTICA DA INDEXAÇÃO 25 Hingst (2011) segue na empreitada de entender cada uma das questões, criando a partir delas, categorias, e se baseia em Smit (1996) para chegar às seguintes características: a) Na categoria QUEM, deve ser o objeto enfocado: seres vivos, artefatos, construções, acidentes naturais, entre outros. Exemplos: duas pessoas; ou, uma árvore; ou, um edifício de três andares. b) Em ONDE é realizada a localização da imagem no espaço geográfico ou espaço da imagem. Exemplos: Florianópolis; ou interior de uma farmácia; ou, num campo de trigo. c) Em QUANDO, busca-se localizar a imagem no tempo cronológico ou momento da imagem. Exemplos: 2019; ou, outono; ou, noite. d) E, em COMO/O QUE se realiza a descrição de atitudes ou detalhes relacionados ao objeto enfocado, quando este é um ser vivo. São exemplos: cavalo correndo, criança chorando (SMIT, 1996, p. 32 apud HINGST, 2011, p. 21). Manini (2002 apud HINGST, 2011) traz um importante avanço no que tange à elaboração destes critérios ao acrescentar a categoria recursos técnicos e suas variáveis. A partir desta categoria, pode-se chegar a uma segunda, qual seja, a dimensão expressiva. Os recursos técnicos a serem levantados quando da análise de imagens são: efeitos especiais, ótica, tempo de exposição, luminosidade, enquadramento, posição da câmera, composição e profundidade de campo. No critério efeitos especiais, são consideradas variáveis como fotomontagem; estroboscopia; alto-contraste; trucagens; esfumação. Em ótica as variáveis são: utilização de objetivas (fish-eye, lente normal, grande-angular, teleobjetiva); utilização de filtros. Tempo de exposição é o critério em que se avaliam as variáveis instantâneo; pose; longa exposição, e outras relacionadas. Em Luminosidade devem-se analisar variáveis como: luz diurna; luz noturna; contraluz; luz artificial; luz natural. Enquadramento. Critério que avalia o enquadramento do objeto fotografado, como vista parcial, vista geral: e, enquadramento de seres vivos. Posição da câmera, câmara alta; câmara baixa; vista aérea; vista submarina; vista subterrânea; microfotografia eletrônica; distância focal. Em Composição verificam-se as variáveis: retrato; paisagem; natureza morta, e outros. E, por fim, em profundidade de campo analisa-se se há profundidade; se todos os campos fotográficos estão nítidos (diafragma mais fechado). (MANINI, 2002, p. 91 apud HINGST, 2011, p. 25). Macambyra (2019) parece concordar com a necessidade de analisar elementos como os citados acima, uma vez que afirma que observar uma fotografia, por exemplo, implica identificar não apenas o objeto fotografado, mas também, em identificar uma séria de técnicas e de estáticas utilizadas pelo fotógrafo. 26 RESUMO DO TÓPICO 2 Neste tópico, você aprendeu que: • Existe uma norma da ABNT que propõem etapas para realizar a análise documentária. • A análise documentária pode ser realizada a partir dos seguintes questionamentos: a) Qual o assunto de que trata o documento? b) Como se define o assunto em termos de teorias e hipóteses? c) O assunto contém uma ação, processo ou operação? d) O documento trata do agente desta ação? e) O documento se refere a métodos, técnicas especiais? f) Há um contexto local ou um ambiente especial na discussão? g) O assunto foi considerado de um ponto de vista interdisciplinar? • As imagens também podem ser indexadas e que para isso é necessário levar em conta a denotação e a conotação que imagem oferece. Também é possível responder a perguntas específicas, que possibilitam maior uniformidade no resultado da indexação. Estas perguntas são: Quem? Onde? Quando? O que? Como? • Existem recursos técnicos a serem levantados no momento da análise de imagens. Eles são: efeitos especiais, ótica, tempo de exposição, luminosidade, enquadramento, posição da câmera, composição e profundidade de campo. 27 Passemos agora para mais alguns exercícios para melhor compreensão desta prática. Serão apresentadas algumas imagens e delas, algumas questões baseadas em todos os critérios apresentados até aqui. 1 AUTOATIVIDADE FONTE: <https://abrilveja.files.wordpress.com/2016/09/esportes. jpg?quality=70&strip=info&resize=680,453>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? Efeitos especiais? Ótica? Tempo de exposição? Luminosidade? Enquadramento? Posição da câmera? Composição? Profundidade de campo? 2 FONTE: <https://c.pxhere.com/photos/54/61/sunset_sun_sunlight_sunbeam_fireball_setting_sun_evening_sun_afterglow-918393.jpg!d>. Acesso em: 8 maio 2019. 28 Quem? Onde? Quando? Como? O quê? Efeitos especiais? Ótica? Tempo de exposição? Luminosidade? Enquadramento? Posição da câmera? Composição? Profundidade de campo? 3 FONTE: <https://static.gazetaonline.com.br/_midias/jpg/2019/02/05/050309_ra_8528- 5989420.jpg>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? Efeitos especiais? Ótica? Tempo de exposição? Luminosidade? Enquadramento? Posição da câmera? Composição? Profundidade de campo? 29 4 FONTE: <https://abrilexame.files.wordpress.com/2018/05/2018-05- 01t182503z_1354439875_rc1c4b315590_rtrmadp_3_may-day-france. jpg?quality=70&strip=info&resize=680,453>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? Efeitos especiais? Ótica? Tempo de exposição? Luminosidade? Enquadramento? Posição da câmera? Composição? Profundidade de campo? 5 FONTE: <https://certifiedhumanebrasil.org/wp-content/uploads/2016/10/ovelha-pxb- 300x199.jpg>. Acesso em: 8 maio 2019. Quem? Onde? Quando? Como? O quê? 30 Efeitos especiais? Ótica? Tempo de exposição? Luminosidade? Enquadramento? Posição da câmera? Composição? Profundidade de campo? 31 TÓPICO 3 A TRADUÇÃO UNIDADE 1 1 INTRODUÇÃO Cumprida esta etapa de análise documentária das imagens e da seleção dos conceitos que são extraídos a partir de todos os critérios apresentados anteriormente, passa-se à tradução para os termos de indexação. Veremos a importância do uso das linguagens documentárias na indexação na Unidade 2. No entanto, por ora, veremos um exemplo de como este processo se dá na prática. Tomemos a imagem a seguir, faremos a análise utilizando os mesmos critérios usados nos exercícios anteriores. A seguir, faremos a tradução de todos os elementos com a utilização de uma linguagem documentária. Vejamos. FIGURA 4 – SALA DE AULA FONTE: <https://www.bastidoresdapoliticapb.com.br/wp-content/uploads/2019/01/sala_de_ aula_vazia2_foto-walla_santos-738x355.jpg>. Acesso em: 8 maio 2019. Quem? Não é possível identificar. Onde? Em uma escola, ou sala de aula. Quando? Não é possível identificar. Como? Uma sala de aula vazia, com luz acesa e porta aberta. O quê? Uma sala de aula, ou, carteiras e cadeiras, ou arquitetura de salas de aula, ou, iluminação de sala de aula. Efeitos especiais? Não possui. Ótica? Não é possível definir. Tempo de exposição? Não é possível definir. Luminosidade? Luz artificial. Enquadramento? Vista parcial de uma sala de aula. 32 UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO Posição da câmera? Em diagonal. Composição? Retrato. Profundidade de campo? Possui profundidade. No primeiro plano, veem- se carteiras brancas e cadeiras azuis, ao fundo veem-se a mesa e a cadeira do professor, ambas em cor branca. Ainda ao fundo, veem-se um quadro branco, uma porta cinza aberta, uma janela de vidro no alto da parede do lado direito, parede branca, com detalhes em vermelho. Ao consultar o vocabulário controlado do INEP, o Thesaurus Brasileiro de Educação, vemos que os termos de indexação autorizados que melhor representam estes conceitos são: salas de aula e dependências da escola. Exploraremos melhor as possibilidades de utilização de vocabulários controlados mais adiante. Neste momento, o exemplo veio apenas ilustrar todas as etapas da indexação. 2 INDEXAÇÃO AUTOMÁTICA A indexação automática é um “processo estudado pelo campo da ciência da informação, que investiga a geração, coleta, organização, interpretação, armazenamento, recuperação, disseminação, transformação e uso da informação, com ênfase particular na aplicação de tecnologias modernas nestas atividades” (CAPURRO; HJØRLAND, 2007 apud LAPA; CORREA, 2014, p. 59). Em especial a recuperação da informação dá base para uma das correntes de constituição do campo da ciência da informação. Fazem parte da indexação automática operações matemáticas, linguísticas, de programação que visam à seleção de termos de um dado documento pelo processamento de seu conteúdo. Há duas formas de se proceder a indexação automatizada: por extração e por atribuição. Na indexação automática por atribuição, os termos não são interpretados por terceiros, são extraídos e ordenados de acordo com sua frequência em um texto. Já a indexação automática por atribuição “consiste numa representação temática por meio de termos selecionados de um vocabulário controlado (tesauro ou lista alfabética), onde um programa de computador desenvolve para cada termo a ser indexado um “perfil” de palavras ou expressões (LAPA; CORREA, 2014, p. 60). Borges e Lima (2015) nos explicam com clareza este cenário hoje permeado por possibilidades em termos de tecnologias de informação e comunicação e nos lembram que, mesmo com a inserção de sistemas automático na indexação, ainda assim a atividade intelectual do indexador não pode ser desconsiderada. Elas explicam que: TÓPICO 3 | A TRADUÇÃO 33 No âmbito das tecnologias para representação da informação, a indexação automática veio como alternativa para resolver os problemas da indexação manual, também denominada como indexação intelectual, desde a década 1950 com os estudos de H. P. Luhn. Embora a indexação automática possa não apresentar resultados totalmente satisfatórios, suas soluções podem contribuir para significativas melhoras no processo de indexação manual. Soluções estas que almejam realizar automaticamente a extração inicial de termos (palavras ou expressões) do documento indexado, deixando para o profissional o trabalho de selecionar aqueles mais adequados para representar seu conteúdo. Além disso, a técnica permite a redução da subjetividade, característica inerente à realização intelectual da atividade (BORGES; LIMA, 2015, p. 50). Faremos a seguir a transcrição de um longo trecho das mesmas autoras, em que é possível conhecer o histórico da indexação automática. Segue: De acordo com os trabalhos de Luhn (1957), e de Baxendale (1958), registra-se o início das pesquisas sobre indexação automática baseada em frequência de ocorrência de palavras no texto. Baxendale (1958 apud LANCASTER, 2004) sugere que, em substituição ao processo que analisa todo o texto, sejam analisados apenas o “tópico frasal” e as “palavras sugestivas”. Seus estudos demonstraram que era necessário o processamento apenas da primeira e da última frase de cada parágrafo, pois, em 85% das vezes, a primeira frase era o tópico frasal e em 7% dos casos a última frase o era. Considera-se como tópico frasal a parte do texto que provê o máximo de informações relativas ao conteúdo do texto. Ainda no decorre da década de 1950, desenvolveram-se métodos relativamente simples para a construção de índices a partir de textos, especialmente utilizando as palavras que ocorrem nos títulos dos documentos. O Keyword in Context – KWIC (Palavra-chave no Contexto) foi desenvolvido por H. P. Luhn, em 1959, e corresponde a um índice rotativo em que cada palavra-chave que aparece nos títulos dos documentos torna-se uma entrada do índice. O programa reconhece as palavras que não são palavras-chaves, baseando-se em uma lista de palavras proibidas, e impede que elas sejam adotadas na entrada. O Keyword out of Context – KWOC (Palavra-chave fora do Contexto) é um método semelhante ao KWIC, porém, as palavras- chave que se tornam pontos de acesso são repetidas fora do contexto, normalmente destacadas no canto esquerdo da página ou usadas como cabeçalhos de assunto. Além do KWIC e do KWOC, podemos citar o Selective Listing in Combination – SLIC (Listagem Seletiva em Combinação), criado por J. R. Sharp, em 1966, que organiza a sequência de termos de um documento em ordem alfabética e elimina as sequências redundantes, e o método Preserved Context Indexing System – PRECIS, criado peloDr. Derek Austin, em 1968, e que produz o índice impresso baseado na ordem alfabética e na alteração sistemática de termos para que ocupem a posição de entrada (LANCASTER, 2004). Outro importante sistema desenvolvido foi o Nested Phrase Indexing System – NEPHIS (Sistema de Indexação de Frase Encaixada), criado por T. C. Craven, em 1977, e corresponde a um índice articulado de assunto. 34 UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO De acordo com Garvin (1969 apud SALTON, 1973) e Salton (1973), já na década de 1960, percebia-se a intrínseca relação entre processamento da informação e aspectos linguísticos. Os esforços deviam ser voltados para estudos das propriedades estruturais e semânticas das línguas naturais. Contudo, percebe-se que grande parte das metodologias linguísticas da época geralmente produzia resultados decepcionantes. Segundo Salton (1970, 1973) e Swanson (1960), a indexação automática apresenta relativos méritos em relação às técnicas manuais. Os pesquisadores afirmavam que era possível extrair automaticamente de textos palavras-chave relevantes, e que, quando estas eram comparadas com aquelas atribuídas por indexadores, constatava-se um acordo entre 60 e 80% dos termos atribuídos. A partir da década de 1970, percebe-se uma intensificação das pesquisas na área, destacando- se dois dos importantes experimentos do período: (1) desempenho do SRI MEDlars, que operava no National Library of Medicine, em Washington, e (2) SRI experimental SMART, criado por Gerard Salton enquanto trabalhava na universidade de Cornell (SALTON, 1973) (BORGES; LIMA, 2015, p. 50-51). As formas conhecidas de indexação automática são por extração e por atribuição. 3 INDEXAÇÃO POR EXTRAÇÃO Segundo Lancaster (1997, p. 231), “na indexação automática por extração palavras ou expressões que aparecem num texto são extraídas e utilizadas para representar o conteúdo do texto como um todo.” Cabe ao bibliotecário indexador a seleção de expressões no texto que pareçam indicar a íntegra do conteúdo. Há influência da frequência de ocorrência das palavras e/ou termos no documento original. A posição dos termos no documento (se está no título, no sumário, na introdução, legendas, ilustrações) também são indicadores de representatividade. Textos eletrônicos, muito mais comuns hoje em dia, podem ser submetidos a programas façam esta seleção. (LANCASTER, 1997). O autor também fala em uma frequência relativa, onde é necessário um cálculo entre a frequência dos termos em toda a base de dados, ou seja, em todos os itens indexados. Ele acredita, portanto, que a indexação por extração deve levar em conta a frequência absoluta e a frequência relativa de palavras ou a combinação de ambas. Os sistemas baseados em indexação por extração automática cumprem as seguintes tarefas: (1) contar palavras num texto; (2) cotejá-las com uma lista de palavras proibidas; (3) eliminar palavras não significativas; e (4) ordenar as palavras de acordo com sua frequência. (BORGES; MACULAN; LIMA, 2008) TÓPICO 3 | A TRADUÇÃO 35 4 INDEXAÇÃO POR ATRIBUIÇÃO Ao explicar o que é indexação automática por atribuição, Lancaster (1997, p. 235) nos lembra que este é o tipo mais comum de indexação realizada por seres humanos, mas diz que a melhor maneira de executar esta atividade com emprego de computador é desenvolver um perfil de termos ou palavras que costumam aparecer com frequência nos “documentos aos quais um indexador humano atribuiria a este termo. Esse tipo de perfil, para o termo CHUVA ÁCIDA incluiria expressões como CHUVA ÁCIDA, PRECIPITAÇÃO ÁCIDA, POLUIÇÃO ATMOSFÉRICA”. Seria uma espécie de vocabulário controlado construído pelo bibliotecário indexador e utilizado por ele para futuras indexações de documentos aos quais possam ser atribuídos os mesmos termos. Borges, Maculan e Lima (2008) atentam para uma questão importante nos dias atuais: a importância da semântica no processo de indexação automática. Ou seja, mais do que considerar a incidência de palavras e termos em um texto, é preciso considerar os significados destas palavras, ou, em última instância, é preciso que estas palavras representem conceitos. Traremos mais um extenso excerto de artigo para esta apostila, por ilustrar perfeitamente o cenário em discussão. Trata-se de mais uma explanação de Borges, Maculan e Lima (2008). Segue: A indexação manual vem revelando-se inadequada para minimizar a subjetividade inerente à indexação, além de ser caracterizada como um processo relativamente moroso e caro. Vários fatores podem ser apontados como causa deste problema. O conhecimento que o indexador tem sobre o assunto indexado determina o grau de consistência atingido. Tem-se, ainda, a dinamicidade do conhecimento, que exige do indexador permanente atualização. Outro aspecto a considerar, segundo Borko (1977 apud GUEDES, 1994), refere-se à inconsistência interindexadores (diferentes indexadores atribuindo diferentes termos-índice a um mesmo conceito/documento) e intraindexador (o mesmo indexador atribuindo diferentes termos- índice a um mesmo conceito/documento, em diferentes momentos). A possibilidade de o indexador não dominar o idioma do documento também é um. Todos os problemas enumerados impulsionaram as pesquisas no campo da indexação automática, tornando-o bastante abordado pelos pesquisadores da Ciência da Informação. Alguns dos resultados dessas investigações apontam alternativas que podem trazer soluções interessantes para a área, sobretudo em ambientes digitais. Segundo Robredo (1982), o processo de indexação automática é similar ao processo de leitura-memorização humano, sendo seu princípio geral baseado na comparação de cada palavra do texto com uma relação de palavras vazias de significado, previamente estabelecida, que conduz, por eliminação, a considerar as palavras restantes do texto como palavras significativas. Ao ler um texto, não interessam, ao indivíduo, as letras, mas a ideia (sic) que elas representam quando organizadas em palavras ou em conjuntos de palavras. O olho, janela do cérebro, reconhece as palavras significativas e suas associações fixando-se nelas um tempo necessário para assegurar a memorização das ideias, pulando, praticamente, as palavras não significativas (ROBREDO, 1982). 36 UNIDADE 1 | PRINCÍPIOS DA INDEXAÇÃO Pode-se separar o processo de memorização humana em duas etapas principais: (1) memorização temporária e inconsciente, nessa etapa há a conservação das palavras significativas passando por uma modificação ou aperfeiçoamento das mesmas a partir da detecção de novos conceitos significativos; e (2) memorização permanente dos conceitos assim trabalhados, à qual se atribui o nome de memória. Depois de ocorridas as duas etapas, tem-se, no fim do processo, a fixação na memória de uma série de palavras-conceitos-descritores que representam as ideias (sic) básicas do documento que acabamos de ler (BORGES; MACULAN; LIMA, 2008, p. 183-184). Ao se atribuir a atividade de indexação a sistemas automáticos, é preciso levar em conta que a semântica deve ser mantida, ou, ao menos, considerada. A seleção dos conceitos, por exemplo, deve ser levada em conta para uma representação mais adequada dos conteúdos. Nesta unidade foi possível conhecer definições de indexação, compreender seus princípios e etapas e, principalmente, verificar que esta atividade não é simples como folhear um livro e buscar, aleatoriamente, termos que estejam contidos em seu conteúdo. Mais que isso, é necessário extrair, selecionar conceitos e traduzi- los de forma que possam alimentar o sistema de informação e, principalmente, de maneira que permita a recuperação da informação. Também foi possível realizar alguns exercícios iniciais que apontaram para o uso de algumas técnicas de análise documentária e de indexação que visam a minimizar questões