Buscar

Apresentação Seminário 1 Slides - em andamento (2)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Faculdade de Ciência da Informação FCI
Bacharelado em Arquivologia
Disciplina: Seminários em Arquivística 1 [Arquivologia e Tecnologia]
Professor: George Kuroki Jr
ESTUDO DE CASO: USO DO SOFTWARE WORD SMITH TOOLS COMO FERRAMENTA DE INDEXAÇÃO DE UM VOCABULÁRIO CONTROLADO
Fabiana Ribeiro dos Santos
14/0138145
Índice
História
Introdução
Entendendo o problema
Objetivo geral / Objetivo específico
 
Justificativa
Resultados
Introdução
 1.1. Contextualização e justificativa
 A intenção deste estudo de caso é averiguar o uso do software Word Smith Tools como ferramenta de indexação de vocabulário controlado. 
A recuperação da informação em repositórios digitais de forma qualitativa e quantitativa de acordo com as necessidades dos usuários.
 
mineração de dados
 Teve início nos anos 80 e foi consolidado por Rakesh Agrawal, Gio Wiederhold, Robert Blum, Gregory Piatetsky-Shapiro e outros.
 
software Word Smith Tools
Criado e escrito por Mike Scott e publicado pela Oxford University Press em 1996 com a finalidade de verificar como as palavras ocorrem no texto.
 
linguística de corpus (L.C) 
e Estudo de Corpora
 
 A L.C é o segmento da linguística que estuda o processo de coleta e análise de dados que possuem valor linguístico e que sirvam, ainda, como objeto de estudo e/ou pesquisa. 
 O Estudo de Corpora consiste em extrair informações de material produzido espontaneamente na fala ou na escrita das pessoas
recuperação da informação
 Termo criado por Calvin Mooers em 195, consiste em procedimentos de representação da informação para uma busca eficiente e eficaz em sistemas. Mooers atenta para a utilidade da informação que satisfaça o usuário e, por conseguinte, que resolva problemas de informação.
linguagem natural
 É a linguagem comum, que comporta uma grande quantidade de unidades, adaptada à comunicação oral ou escrita. 
 Indexação
 Surge após a II Guerra Mundial com a invenção da imprensa de Gutenberg em 1948.
vocabulário controlado
 Busca facilitar a representação consistente dos assuntos, atribuídos por indexadores e utilizados por usuários na recuperação, evitando a dispersão de informações relacionadas. Procura, ainda, facilitar uma busca ampla sobre um determinado assunto (LANCASTER, 2002). 
Repositório Digital
 São bases de dados online que reúnem de maneira organizada a produção científica de uma instituição ou área temática. 
qualidade de dados
 Criado e desenvolvido no Japão por William Eduards Deming em 1950.
Entendendo o Problema
01 Falhas na classificação documental
Excesso de sinônimos
Reclassificação documental 
02 Dificuldade na recuperação da informação
Imprecisão na recuperação da informação
Descrição do assunto documental
Problema
Como sanar ou amenizar a ambiguidade nos metadados?
Objetivo geral
 A intenção deste estudo de caso é verificar a precisão dos termos recuperados pelo software Word Smith Tools para a recuperação da informação e indexação de um vocabulário controlado.
Objetivo específico
 Determinar um vocabulário controlado, a fim de sanar e ou amenizar ambiguidades e sinônimos na recuperação da informação.
Justificativa
 O estudo da mineração de dados na Arquivologia é importante para conhecer os tipos documentais e estabelecer padrões de descrição representativa dos documentos arquivísticos, facilitando a busca e recuperação qualitativa e quantitativa das informações.
Câmara dos Deputados
Registro de Memória do Mundo: Bertha Lutz
Política de Preservação Digital da Câmara dos Deputados 
RPD – Repositório Digital da Câmara dos Deputados
Preservação e Difusão de Acervo
Migração de suporte: LTO/ODA
Sistemas 
Câmara dos Deputados
Governança de Arquitetura de Informação Corporativa atua como um mecanismo de controle, estabelece políticas e regras que direcionam as condutas informacionais da Casa. Instituída em 2013
Objetivos:
 Garantir a continuidade e o aperfeiçoamento da gestão da arquitetura de informação; articular a gestão de processos de trabalho ; alinhar a arquitetura de informação corporativa com a gestão estratégica e com a arquitetura de tecnologias da informação e comunicação; organizar a informação em repositórios corporativos
São levantados os metadados de negócio por meio da análise dos documentos que permeiam o fluxo do processo de trabalho.
 Sem uso de minerador de dados apenas com a inteligência/análise do profissional da informação.
Metodologia pratica
Durante o processo de modelagem, elabora-se um produto específico chamado glossário de negócio - que lista e define os termos mais utilizados na rotina de trabalho, de forma contextualizada.
A questão da ambiguidade de dados é um problema recorrente em todo trabalho de gestão da informação.
Pasta de trabalho do SILEG
Matriz de governança de Informação – GRIC 
Gestor - Aquele que responde pela validação de seus atributos e pela sua atualidade, segurança, autenticidade e integridade.
Responsável - responsáveis pela alimentação dos metadados no(s) sistema(s) utilizados no processo de trabalho ou pela alteração de seus atributos nos sistemas. 
Informado - pessoa que deverá ser informada sobre a situação do metadado em questão, sendo quem deve receber a informação de que um metadado e/ou seus atributos foram alterado.
Consultado - pessoa que fornecerá conhecimentos ou informações para completar o trabalho
Limitação de ambiguidades
Descrição do SILEG
Resultados
A mineração de dados é facilitadora para a governança da informação
É notório o uso do software Word Smith Tools como Instrumento indexador de vocabulário controlado
É possível amenizar a ambiguação de dados
O vocabulário controlado não precisa ser rígido e sim administrado
REFERÊNCIAS
Câmara dos Deputados –Câmara Net
Disponível em: https://camaranet.camara.leg.br/web/arquitetura-de-informacao 
COMO ELABORAR VOCABULÁRIO CONTROLADO PARA APLICAÇÃO EM ARQUIVOS COMO FAZER VOL. 10. São Paulo.2003. 
Disponível em: http://www.arqsp.org.br/arquivos/oficinas_colecao_como_fazer/cf10.pdf
REFERÊNCIAS
DIAS, Cláudia Augusto apud Sonneveld. Terminologia: conceitos e aplicações. Brasília. 2000. 
Disponível em: http://www.scielo.br/pdf/ci/v29n1/v29n1a9 Acesso em: Mar/2019.
Dicionário Brasileiro de Terminologia Arquivística. Disponível em: http://www.arquivonacional.gov.br/images/pdf/Dicion_Term_Arquiv.pdf Acesso em: Mar/2019.
GOMES, Felipe Tassario. PARDO, Thiago Alexandre Salgueiro. CASELI, Helena de Medeiros. Visual
REFERÊNCIAS
LAND, Renate. Governança de Dados x Governança de Informação. 2017. disponível em: https://www.youtube.com/watch?v=dH7CcdjxgxQ
TCA: uma ferramenta visual on-line para alinhamento sentencial de textos paralelos. Rio de Janeiro - RJ. 2007. 
Disponível em: http://www.nilc.icmc.usp.br/nilc/download/GoPaCaTIL2007.pdf Acesso em: Abr/2019.
REFERÊNCIAS
MACULAN, Benildes Coura. Guia de software para tratamento da informação: vocabulário controlado. 2010. 
Disponível em: http://glima.eci.ufmg.br/guiasoftware/pages/vocabulE1rio-controlado.php Acesso em: Abr/2019.
Núcleo de Estudos de Linguagem e Sociedade, NELIS/UnB. Software: Word Smith Tools. 
Disponível em: http://www.ppgl.unb.br/41-eventos/159-oficina-sobre-o-wordsmith-tools. Acesso em: Abr/2019.
REFERÊNCIAS
Repositório Institucional da Universidade de Brasília. Disponível em:http://repositorio.unb.br/Acesso em: Mar/2019.
SARDINHA, Tony Berber. Linguística de corpus. Ed. Manole Ltda. Barueri – SP. 2004.
Obrigada!

Continue navegando