Baixe o app para aproveitar ainda mais
Prévia do material em texto
Faculdade de Ciência da Informação FCI Bacharelado em Arquivologia Disciplina: Seminários em Arquivística 1 [Arquivologia e Tecnologia] Professor: George Kuroki Jr ESTUDO DE CASO: USO DO SOFTWARE WORD SMITH TOOLS COMO FERRAMENTA DE INDEXAÇÃO DE UM VOCABULÁRIO CONTROLADO Fabiana Ribeiro dos Santos 14/0138145 Índice História Introdução Entendendo o problema Objetivo geral / Objetivo específico Justificativa Resultados Introdução 1.1. Contextualização e justificativa A intenção deste estudo de caso é averiguar o uso do software Word Smith Tools como ferramenta de indexação de vocabulário controlado. A recuperação da informação em repositórios digitais de forma qualitativa e quantitativa de acordo com as necessidades dos usuários. mineração de dados Teve início nos anos 80 e foi consolidado por Rakesh Agrawal, Gio Wiederhold, Robert Blum, Gregory Piatetsky-Shapiro e outros. software Word Smith Tools Criado e escrito por Mike Scott e publicado pela Oxford University Press em 1996 com a finalidade de verificar como as palavras ocorrem no texto. linguística de corpus (L.C) e Estudo de Corpora A L.C é o segmento da linguística que estuda o processo de coleta e análise de dados que possuem valor linguístico e que sirvam, ainda, como objeto de estudo e/ou pesquisa. O Estudo de Corpora consiste em extrair informações de material produzido espontaneamente na fala ou na escrita das pessoas recuperação da informação Termo criado por Calvin Mooers em 195, consiste em procedimentos de representação da informação para uma busca eficiente e eficaz em sistemas. Mooers atenta para a utilidade da informação que satisfaça o usuário e, por conseguinte, que resolva problemas de informação. linguagem natural É a linguagem comum, que comporta uma grande quantidade de unidades, adaptada à comunicação oral ou escrita. Indexação Surge após a II Guerra Mundial com a invenção da imprensa de Gutenberg em 1948. vocabulário controlado Busca facilitar a representação consistente dos assuntos, atribuídos por indexadores e utilizados por usuários na recuperação, evitando a dispersão de informações relacionadas. Procura, ainda, facilitar uma busca ampla sobre um determinado assunto (LANCASTER, 2002). Repositório Digital São bases de dados online que reúnem de maneira organizada a produção científica de uma instituição ou área temática. qualidade de dados Criado e desenvolvido no Japão por William Eduards Deming em 1950. Entendendo o Problema 01 Falhas na classificação documental Excesso de sinônimos Reclassificação documental 02 Dificuldade na recuperação da informação Imprecisão na recuperação da informação Descrição do assunto documental Problema Como sanar ou amenizar a ambiguidade nos metadados? Objetivo geral A intenção deste estudo de caso é verificar a precisão dos termos recuperados pelo software Word Smith Tools para a recuperação da informação e indexação de um vocabulário controlado. Objetivo específico Determinar um vocabulário controlado, a fim de sanar e ou amenizar ambiguidades e sinônimos na recuperação da informação. Justificativa O estudo da mineração de dados na Arquivologia é importante para conhecer os tipos documentais e estabelecer padrões de descrição representativa dos documentos arquivísticos, facilitando a busca e recuperação qualitativa e quantitativa das informações. Câmara dos Deputados Registro de Memória do Mundo: Bertha Lutz Política de Preservação Digital da Câmara dos Deputados RPD – Repositório Digital da Câmara dos Deputados Preservação e Difusão de Acervo Migração de suporte: LTO/ODA Sistemas Câmara dos Deputados Governança de Arquitetura de Informação Corporativa atua como um mecanismo de controle, estabelece políticas e regras que direcionam as condutas informacionais da Casa. Instituída em 2013 Objetivos: Garantir a continuidade e o aperfeiçoamento da gestão da arquitetura de informação; articular a gestão de processos de trabalho ; alinhar a arquitetura de informação corporativa com a gestão estratégica e com a arquitetura de tecnologias da informação e comunicação; organizar a informação em repositórios corporativos São levantados os metadados de negócio por meio da análise dos documentos que permeiam o fluxo do processo de trabalho. Sem uso de minerador de dados apenas com a inteligência/análise do profissional da informação. Metodologia pratica Durante o processo de modelagem, elabora-se um produto específico chamado glossário de negócio - que lista e define os termos mais utilizados na rotina de trabalho, de forma contextualizada. A questão da ambiguidade de dados é um problema recorrente em todo trabalho de gestão da informação. Pasta de trabalho do SILEG Matriz de governança de Informação – GRIC Gestor - Aquele que responde pela validação de seus atributos e pela sua atualidade, segurança, autenticidade e integridade. Responsável - responsáveis pela alimentação dos metadados no(s) sistema(s) utilizados no processo de trabalho ou pela alteração de seus atributos nos sistemas. Informado - pessoa que deverá ser informada sobre a situação do metadado em questão, sendo quem deve receber a informação de que um metadado e/ou seus atributos foram alterado. Consultado - pessoa que fornecerá conhecimentos ou informações para completar o trabalho Limitação de ambiguidades Descrição do SILEG Resultados A mineração de dados é facilitadora para a governança da informação É notório o uso do software Word Smith Tools como Instrumento indexador de vocabulário controlado É possível amenizar a ambiguação de dados O vocabulário controlado não precisa ser rígido e sim administrado REFERÊNCIAS Câmara dos Deputados –Câmara Net Disponível em: https://camaranet.camara.leg.br/web/arquitetura-de-informacao COMO ELABORAR VOCABULÁRIO CONTROLADO PARA APLICAÇÃO EM ARQUIVOS COMO FAZER VOL. 10. São Paulo.2003. Disponível em: http://www.arqsp.org.br/arquivos/oficinas_colecao_como_fazer/cf10.pdf REFERÊNCIAS DIAS, Cláudia Augusto apud Sonneveld. Terminologia: conceitos e aplicações. Brasília. 2000. Disponível em: http://www.scielo.br/pdf/ci/v29n1/v29n1a9 Acesso em: Mar/2019. Dicionário Brasileiro de Terminologia Arquivística. Disponível em: http://www.arquivonacional.gov.br/images/pdf/Dicion_Term_Arquiv.pdf Acesso em: Mar/2019. GOMES, Felipe Tassario. PARDO, Thiago Alexandre Salgueiro. CASELI, Helena de Medeiros. Visual REFERÊNCIAS LAND, Renate. Governança de Dados x Governança de Informação. 2017. disponível em: https://www.youtube.com/watch?v=dH7CcdjxgxQ TCA: uma ferramenta visual on-line para alinhamento sentencial de textos paralelos. Rio de Janeiro - RJ. 2007. Disponível em: http://www.nilc.icmc.usp.br/nilc/download/GoPaCaTIL2007.pdf Acesso em: Abr/2019. REFERÊNCIAS MACULAN, Benildes Coura. Guia de software para tratamento da informação: vocabulário controlado. 2010. Disponível em: http://glima.eci.ufmg.br/guiasoftware/pages/vocabulE1rio-controlado.php Acesso em: Abr/2019. Núcleo de Estudos de Linguagem e Sociedade, NELIS/UnB. Software: Word Smith Tools. Disponível em: http://www.ppgl.unb.br/41-eventos/159-oficina-sobre-o-wordsmith-tools. Acesso em: Abr/2019. REFERÊNCIAS Repositório Institucional da Universidade de Brasília. Disponível em:http://repositorio.unb.br/Acesso em: Mar/2019. SARDINHA, Tony Berber. Linguística de corpus. Ed. Manole Ltda. Barueri – SP. 2004. Obrigada!
Compartilhar