Prévia do material em texto
Texto 01: Sobre dados estruturados, consideramos todo tipo de dado que pertence a um esquema, um tipo de estrutura pré-definida, uma forma rápida e simples de recuperação, armazenados e organizados em tabelas e registros de forma indexada. Sobre dados semiestruturados, podemos considerar todo tipo de dado que possui uma “certa” estrutura que permite usar artifícios para facilitar a sua recuperação, que ocorre através de buscas por palavras chaves na internet. Estão geralmente armazenados no formato de arquivo e possui certa estrutura para visualização. Por último, temos os dados não estruturados que englobam toda classe de dado que não possui nenhum tipo de estruturação ou forma rápida de recuperação e por isso, a identificação de padrões utilizados em algoritmos, softwares e metodologias são requeridas para retirar deles conhecimento. Autor. Texto 02: Hadoop é uma das ferramentas para processamento de dados em larga escala. Para que isto tudo surta efeito, ele conta com a tecnologia de clusters: um conjunto de computadores que trabalham baixo o conceito da computação distribuída. Com o Hadoop, dados dos tipos não estruturados são processados facilmente. Esta ferramenta conta com um conjunto de componentes internos como o HDFS e o Map Reduce, entre outros, por isso é chamado de framework. No Hadoop, a recuperação de conhecimento é feita através da linguagem HIVE que realiza pesquisas diretamente no clusters, de igual forma como na linguagem SQL que recupera dados em bancos de dados, esta linguagem também possui seu formato de escrita. Autor. Considerando os textos apresentados, avalie as asserções a seguir e a relação proposta entre elas. I. Possibilitar a extração de conhecimentos de dados não estruturados não é tarefa fácil e tampouco se imaginava essa façanha até pouco tempo atrás. Com Big Data, isto se tornou possível e ferramentas como Hadoop chegaram para tornar tudo isto realidade. Hoje é possível extrair conhecimento de vídeos, mensagens de WhatsApp, de e-mails, redes sociais e tantos outros recursos. PORQUE II. Somente dados do tipo estruturado possui uma estrutura única e uma forma de leitura. Ele pode pertencer ou não a um esquema pré-definido e pode ou não ter formas de recuperação ou por assim dizer, de extração de conhecimento. Big Data vem para ampliar o conceito de tratamento de dados que antes se concentrava apenas nos grandes bancos de dados. A respeito destas asserções, assinale a opção correta · A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. · As asserções I e II são proposições falsas. · Resposta correta A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. · As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. · As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. SUA RESPOSTA ESTÁ CORRETA Correto. Hadoop é um exemplo prático de framework que proporciona a ambientes Big Data extrair conhecimento de dados onde até então não se imaginava poder, como vídeos, conversas de whatsap entre outros mencionados. Se trata de uma ferramenta completa que armazena e processa de forma distribuída grandes conjuntos de dados. Os serviços do Hadoop fornecem armazenamento, processamento, acesso, governança, segurança e operações de dados. Já a asserção II é falsa porque os dados do tipo estruturado SIM pertencem a um banco de dados com esquema e estrutura pré-definidas. São de fácil manuseio ou recuperação através da linguagem SQL e, portanto, se caracteriza como o tipo de dado mais fácil de se tratar considerando dados semi ou não estruturados.