Buscar

GOVERNO ABERTO MOD III

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Módulo 3 – Aspectos técnicos e legais.
Feedback
Com relação a ambientes on-line que podem ser usados para a realização de atividades de pesquisa, indique qual das alternativas abaixo não é uma característica dos ambientes de pesquisa virtual?
a. Gerenciamento dos fluxos de trabalho de pesquisa. 
b. Modelo de dados. 
c. Colaborações entre pesquisadores. 
d. Conexão de dados aos serviços de software. 
e. Publicação de trabalhos acadêmicos. 
O gabarito da questão é a alternativa ‘b’. Modelo de dados não é uma característica dos ambientes de pesquisa virtual.
Esses ambientes, ou APVs, reúnem Dados Abertos, software adequado e a comunicação dos pesquisadores, usando meios imediatos (videoconferência, mídias sociais) e não imediatos (publicações acadêmicas). Normalmente, o pesquisador segue um ou mais fluxos de trabalho ou conjuntos de passos do processo, conectando conjuntos de dados com serviços de software para alcançar os resultados da pesquisa. Ao longo do caminho, o pesquisador interage com os colegas e registra o trabalho feito (idealmente de maneira eletrônica), o qual, posteriormente, é apresentado como uma publicação acadêmica.
Feedback
Julgue em Verdadeiro (V) ou falso (F) as duas afirmações a seguir.
1. Afirmação 1: Conexão é o processo no qual o software está conectado aos dados. Verdadeira 
2. Afirmação 2: Análise é o processo no qual os pesquisadores procuram por conjuntos de dados relevantes. Falsa 
O gabarito da questão é: V, F. O processo pelo qual o software está conectado aos dados é chamado de “conexão” (afirmação 1). O processo no qual os investigadores procuram conjuntos de dados relevantes (afirmação 2) não é chamado de "análise", mas de "descoberta".
Primeiro, um conjunto de dados relevantes tem de ser descoberto. Este processo é denominado "descoberta". Quando um ou mais são descobertos, eles requerem a "contextualização", a fim de assegurar ao utilizador final que o conjunto de dados é de domínio relevante (por exemplo, biomédico), tem a cobertura adequada nas dimensões espaciais e temporais, apresenta precisão suficiente e adequada para o fim a que se destina, sua qualidade é suficiente, normalmente baseada em informações sobre o método de pesquisa e dos próprios pesquisadores. O próximo passo é a "conexão" do software aos dados; isso pode ser feito com uma API (Application Programming Interface) ou precisará da conversão dos dados para um formato adequado para o software. Então, a "análise" pode começar a usar técnicas estatísticas apropriadas para a redução de dados e caracterização, para detecção de correlações ou propriedades do conjunto de dados e previsões.
Feedback
Quais são os cinco Vs dos Dados Abertos?
a. Validade, Volume, Visibilidade, Variedade, Velocidade. 
b. Validade, Volume, Valor, Variedade, Viscosidade. 
c. Validade, Volume, Valor, Variedade, Velocidade. 
Está correta a alternativa ‘c’.
É comumente dito que Dados Abertos têm 5 Vs como características, referindo-se à validade, volume, valor, variedade e velocidade.
A Validade diz respeito a como os dados representam o mundo real e, normalmente, é controlada por várias verificações de restrição de integridade ou validação. Como exemplo, uma verificação de validade pode indicar que a temperatura na superfície da terra não pode ser superior a 100 graus centígrados ou inferior a -100 graus centígrados.
O Volume é o tamanho quando armazenados ou transmitidos, de kilobytes (milhares de bytes) para Yottabytes.
O Valor define como o conjunto de dados é útil para os usuários finais e pode ser medido por comentários ou "likes", como usado na comunicação social.
A Variedade refere-se à heterogeneidade de representação (conjunto de caracteres), linguagem, sintaxe (estrutura) e semântica (significado), bem como ao formato de representação e ao meio utilizado para o armazenamento de dados.
A Velocidade refere-se à velocidade de aquisição ou transmissão dos dados e tem implicações no processamento. Por exemplo, consultar dados convencionais requer um conjunto estático. Assim, para dados transmitidos, a consulta tem que ser feita sobre janelas definidas e intervalos no fluxo de dados.
Assim, as alternativas ‘a’ e ‘b’ estão incorretas.
Feedback
Joe está procurando por conjuntos de dados relativos às vítimas da criminalidade. Ele encontra uma descrição de um conjunto de dados sobre o tema dos crimes. O conjunto de dados foi criado por um Escritório de Estatística. O conjunto de dados descreve as vítimas da criminalidade, em Maryland, no período de 1990-2010. Qual é o metadado neste exemplo?
a. Tópico (dados do crime) e a descrição. 
b. Cobertura geográfica (Maryland). 
c. Cobertura Temporal (período de tempo). 
d. Escritório de Estatística (criador). 
e. Todas as anteriores. 
O gabarito da questão é a alternativa ‘e’, pois todos os dados mencionados nas alternativas podem ser vistos como metadados: Tópico (dados do crime) e a descrição, Cobertura Geográfica (Maryland), Cobertura Temporal (período de tempo) e Escritório de Estatística (criador). Eles descrevem os dados e, de alguma forma, os recursos da internet para o usuário final.
Feedback
No vídeo foram mencionadas três questões principais que precisam ser abordadas para tornar possível o uso de Dados Governamentais Abertos. Qual das seguintes não é uma destas três principais questões?
a. Os dados precisam ser conhecidos e fáceis de achar. 
b. Os dados devem ser protegidos. 
c. Os dados devem estar disponíveis tanto do ponto de vista jurídico como do financeiro. 
d. Os dados devem satisfazer as necessidades técnicas do usuário. 
Está correta a alternativa ‘b’.
Se nós falamos sobre o uso de dados, três principais questões têm de ser abordadas. Primeiro, os dados precisam ser conhecidos e fáceis de achar. Em segundo lugar, os dados devem estar disponíveis tanto do ponto de vista jurídico como do financeiro e, terceiro, os dados devem satisfazer as necessidades técnicas do utilizador. Para cada questão, a lei pode ter um papel a desempenhar. Para a primeira questão, exigindo a publicação dos dados na internet. Para a segunda questão, maximizando o preço dos dados, definindo restrições para o seu uso e exigindo o seu acesso através de determinados serviços. E, finalmente, para a terceira questão, exigindo documentação referente aos metadados, especificações harmônicas dos dados e a sua publicação em certos formatos, por exemplo. A lei, portanto, tem um papel importante a desempenhar com relação aos Dados Governamentais Abertos. No entanto, proteger os dados não está relacionado a permitir a utilização de Dados Governamentais Abertos e não é, portanto, uma das três principais questões.
Assim, as alternativas ‘a’, ‘c’ e ‘d’ estão incorretas.
Feedback
Por que a legislação sobre a proteção de dados abertos é uma questão desafiadora?
a. Porque, muitas vezes, Dados Abertos são dados pessoais. 
b. Porque dados pessoais estão sujeitos à legislação que restringe o seu uso. 
c. Porque existem muitas licenças abertas disponíveis. 
Está correta a alternativa ‘b’. Conjuntos de dados individuais podem não ter ligação direta com os indivíduos. Estes conjuntos de dados podem ser fornecidos como Dados Abertos. No entanto, com mais e mais Dados Abertos, e avançadas tecnologias para a seleção de dados nas mãos de um número cada vez maior de pessoas, todos esses conjuntos de dados anônimos podem, em conjunto, construir uma boa imagem de um indivíduo. E, por conseguinte, cada conjunto de dados que contribui para este perfil pode ser considerado como dados pessoais. Dados pessoais estão sujeitos à legislação que restringe o seu uso. Dados pessoais nunca podem ser Dados Abertos.
A alternativa ‘a’ está incorreta. Conjuntos de Dados Abertos não podem ser dados pessoais. No vídeo é explicado que a lei é importante no que diz respeito aos objetivos dos Dados Abertos e tem um importante papel na promoção do acesso e da reutilização de informações do setor público. No entanto, por outro lado, a lei sobre a proteção de dados desafia a filosofia dos Dados Abertos e pode reduzirsignificativamente o número de conjuntos de Dados Abertos. Conjuntos de dados individuais podem não ter ligação direta com os indivíduos. Estes conjuntos de dados podem ser fornecidos como Dados Abertos.
A alternativa ‘c’ está incorreta. Embora a disponibilidade de muitas licenças de Dados Abertos seja, de fato, um desafio legal, não é a razão pela qual a legislação em matéria de proteção de dados está desafiando os Dados Abertos.
Feedback
Resource Description Framework (RDF) é uma tríplice expressão que consiste de sujeito-predicado-objeto. Na declaração a seguir, qual é o sujeito, qual é o predicado e qual é o objeto?
Um hackathon de Dados Abertos foi organizado na cidade de Nova Iorque.
a. "Um hackathon". Sujeito 
b. "Foi organizado em". Predicado 
c. "Nova Iorque". Objeto 
"Um hackathon" corresponde a sujeito. "Foi organizado em" se refere a predicado. E "Nova Iorque" corresponde a objeto.
O sujeito indica o recurso, o predicado denota aspectos do recurso e exprime uma relação entre o sujeito e o objeto. Um objeto pode ser um recurso ou um valor literal. Por exemplo, um crime ocorreu em Chicago. "Crime" é o recurso, ocorreu "em" é o predicado, e a localização "Chicago" é o objeto.
Feedback
Qual das seguintes não é um princípio de Linked Data (Dados Interligados)?
a. Uso de Identificadores Uniformes de Recurso (IURs) como nomes para coisas e dados. 
b. Uso de metadados para consultar esses nomes. 
c. Fornecimento de informações úteis, usando os padrões (RDF, SPARQL), quando alguém procura um IUR. 
d. Inclusão de links para outros IURs, de modo a para permitir que outros descubram mais. 
O gabarito da questão é a alternativa ‘b’. O segundo princípio que o Linked Data defende é o uso de IURs e HTTP para procurar os nomes para as coisas e dados a que o princípio 1 se refere. Não defende o uso de metadados para consultar esses nomes. No vídeo é explicado que a internet usa o Hypertext Transfer Protocol, HTTP e IURs, como protocolos para procurar páginas na rede. HTTP é um protocolo de comunicação, enquanto que o IUR é um ponteiro para o local. O segundo princípio defende o uso de IURs e HTTP para identificar objetos e conceitos abstratos. Isto permite que estes IURs sejam procurados, através do protocolo HTTP, com base em uma descrição do objeto identificado ou conceito.
a) Use Identificadores Uniformes de Recurso (IURs) como nomes para coisas e dados: o primeiro princípio que o Linked Data defende é a utilização de Identificadores Uniformes de Recurso (IUR), referências para identificar dados. Os dados podem ser documentos, conjuntos de dados, conteúdo digital, mas também objetos do mundo real e conceitos abstratos. Identificador Uniforme de Recurso (IUR) é um nome usado para identificar um determinado recurso. Ter um IUR permite a interação com representações do recurso através de uma rede. O IUR mais conhecido é, provavelmente, o Uniform Resource Locator, ou URL, em outras palavras, um endereço da web.
c) Quando alguém procura um IUR, fornece informações úteis, usando os padrões (RDF, SPARQL): Este é o terceiro princípio de Linked Data de Berners-Lee. A fim de compreender o significado, é necessário chegar a um acordo sobre o vocabulário dos formatos de conteúdo padronizado. O terceiro princípio de Linked Data, portanto, defende a utilização de um único modelo de dados para publicação de dados estruturados na rede, usando o Resource Description Framework. RDF é um simples modelo de dados baseado em gráfico que foi projetado para uso no contexto da rede.
d) Inclua links para outros IURs para permitir que outros descubram mais: o quarto princípio de Linked Data sugere a utilização de hiperlinks para ligar qualquer tipo de coisa. Por exemplo, um hiperlink pode ser estabelecido entre uma pessoa e um endereço ou entre um endereço e uma empresa.

Continue navegando

Outros materiais