Buscar

fundamentos de big data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1.
	A mineração de dados é uma solução que pode ser proveitosa às organizações que querem melhor explorar os dados que possuem em seus repositórios. Utilizando o processo de KDD, a mineração permite extrair conhecimento sobre os dados armazenados. Sobre o processo de KDD, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) Os algoritmos genéticos consistem em modelos preditivos não lineares que aprendem por meio do treinamento e se assemelham às redes neurais biológicas.
(    ) O método do vizinho mais próximo é a técnica que classifica cada registro em um conjunto de dados combinando os registros mais semelhantes.
(    ) A indução de regras consiste na extração baseada em regras condicionais a partir da significância estatística.
(    ) As redes neurais artificiais consistem em modelos preditivos não lineares que aprendem por meio do treinamento e se assemelham às redes neurais biológicas.
Assinale a alternativa que apresenta a sequência CORRETA:
	 a)
	F - V - V - V.
	 b)
	V - F - V - V.
	 c)
	V - V - V - F.
	 d)
	F - F - F - V.
	2.
	Agora, pela primeira vez, podemos começar a tomar decisões com base no todo, com 100% de informação. Escreve Michael Malone, professor da Universidade Santa Clara, no Vale do Silício: "A humanidade viveu 10000 gerações fazendo escolhas impregnadas de incerteza. Eram grandes saltos no desconhecido". Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da agricultura. Sobre o Big Data, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) O Big Data trata de um pequeno volume de dados.
(    ) Mineração de dados não faz parte do cenário de Big Data.
(    ) O Big Data trata de um grande volume de dados.
(    ) KDD faz parte do cenário de Big Data.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, v. 2321, n. 20, p. 71-76, abr., 2013.
	 a)
	F - F - V - V.
	 b)
	V - F - F - V.
	 c)
	F - V - V - F.
	 d)
	V - V - F - F.
	3.
	O processo de KDD é um conjunto de atividades contínuas que compartilham o conhecimento descoberto a partir de bases de dados. Esse processo é composto por várias etapas. Sobre as etapas do KDD, associe os itens, utilizando o código a seguir:
I- Seleção.
II- Pré-processamento.
III- Transformação.
IV- Mineração de Dados.
(    ) Etapa responsável por selecionar os atributos que serão utilizados.
(    ) Etapa em que os dados são transformados.
(    ) Etapa em que os dados são limpos e preparados.
(    ) Etapa que executa os algoritmos para extrair conhecimento dos dados.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: STEINER, Maria Teresinha Arns et al. Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados. Gestão & Produção, v. 13, n. 2, p. 325-337, 2006.
	 a)
	I - III - II - IV.
	 b)
	IV - III - II - I.
	 c)
	I - II - IV - III.
	 d)
	I - IV - III - II.
	4.
	O Big Data é um advento tecnológico de processamento de grandes volumes de dados que vem ganhando notoriedade por conta de oportunidades e desafios em torno de sua utilidade no apoio aos negócios. Sobre o Big Data, classifique V para as sentenças verdadeiras e F para a falsas:
(    ) O objetivo do KDD é a extração de relações implícitas e desconhecidas nas bases de dados para geração de conhecimento útil.
(    ) A ciência de dados não pode consumir o volume de dados gerado por Big Data.
(    ) Um cientista de dados é o profissional que usa Big Data para gerar insights.
(    ) Um dataset é um conjunto de dados sobre determinado tema.
Assinale a alternativa que apresenta a sequência CORRETA:
	 a)
	V - V - F - F.
	 b)
	V - F - V - F.
	 c)
	V - F - F - V.
	 d)
	F - V - V - F.
	5.
	A ciência dos dados permite transformar o dado bruto em poderosos insights para as mais diversas áreas do conhecimento. Durante o processo da ciência de dados, existe um princípio que afirma que uma análise dos dados em seu ciclo de vida mantém a atenção em como o valor dos dados pode diminuir de acordo com o seu envelhecimento. Assim, o dado tem mais valor quanto mais recente for. A maioria das organizações não pode operar no máximo de seu desempenho tendo pontos cegos, isto é, falta de dados disponíveis, de 30 dias ou mais. Sobre esse princípio apresentado, assinale a alternativa CORRETA:
	 a)
	Princípio da redução do valor de dados.
	 b)
	Princípio dos grandes dados.
	 c)
	Princípio do uso de dados 90/90.
	 d)
	Princípio de dados em contexto.
	6.
	Big Data e ciência de dados são termos que caminham em conjunto no desenvolvimento de novas tecnologias. A ciência de dados é devotada à extração de informação útil a partir de imensas, complexas e dinâmicas bases de dados (Big Data). Sobre os princípios da ciência de dados, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) O princípio da redução do valor de dados trata do caso de quando uma análise dos dados em seu ciclo de vida mantém a atenção em como o valor dos dados pode diminuir de acordo com o seu envelhecimento.
(    ) O princípio do uso de dados 90/90 trata de uma atuação em tempo real ou quase em tempo real sobre dados operacionais que podem trazer vantagens importantes. De acordo com esse princípio, a maioria dos dados armazenados raramente é acessada após 90 dias (exceto para fins de auditoria).
(    ) O princípio das formas normais trata de sempre se aplicar formas normais nos dados em um cenário de dados, as formas normais são técnicas de modelagem de dados que permitem essa demanda em situações inviáveis de processamento.
(    ) Para capturar, processar, formatar e distribuir dados rapidamente e quase em tempo real, é necessário um grande investimento em infraestrutura de gerenciamento de dados para fazer a ligação remota dos sistemas presentes nos pontos de venda (PDVs) para armazenamento de dados, sistemas de análise de dados e aplicativos que geram relatórios.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: RAUTENBERG, Sandro; CARMO, Paulo Ricardo Viviurka. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de decisão. Brazilian Journal of Information Science, v. 13, n. 1, p. 56-67, 2019.
	 a)
	F - V - F - F.
	 b)
	F - F - V - V.
	 c)
	V - F - V - F.
	 d)
	V - V - F - V.
	7.
	A imensidão de informações é composta, numa pequena parte, de dados limpos, corretos, checados, como urna pesquisa do ruGE. São os "dados estruturados". No entanto, a grande novidade do Big Data, o elemento verdadeiramente novo e transformador, são os "dados não estruturados". Os dados sujos, incompletos, caóticos. Sobre o universo de Big Data, associe os itens, utilizando o código a seguir:
I- Cientista de Dados.
II- Ciência de Dados.
III- Dados.
IV- Dataset.
(    ) Conjunto de dados sobre um tema específico.
(    ) Matéria-prima da informação, que sozinho não faz sentido.
(    ) Profissional da área de Big Data responsável por trabalhar com dados.
(    ) Área do conhecimento que utiliza Big Data para resolver os mais diversos problemas.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013.
	 a)
	I - III - IV - II.
	 b)
	III - I - IV - II.
	 c)
	I - II - IV - III.
	 d)
	IV - III - I - II.
	8.
	A Mineração de Dados é uma das tecnologias mais promissoras da atualidade. Um dos fatores deste sucesso é o fato de dezenas e, muitas vezes, centenas de milhões de reais serem gastos pelas companhias na coleta dos dados e, no entanto, nenhuma informação útil é identificada. Sobre a mineração de dados, associe os itens, utilizando o código a seguir:
I- Algoritmos genéticos.
II- Método do vizinho mais próximo.
III- Indução de regras.
IV- Visualização de dados.
(    ) A partir de ferramentas que utilizam gráficos, é possível realizarinterpretações visuais de relações complexas.
(    ) Técnicas de otimização baseadas em combinação genética e seleção natural.
(    ) É a técnica que classifica cada registro em um conjunto de dados combinando os registros mais semelhantes.
(    ) Consiste na extração baseada em regras condicionais a partir da significância estatística.
Assinale a alternativa que apresenta a sequência CORRETA:
	 a)
	IV - I - II - III.
	 b)
	IV - III - II - I.
	 c)
	I - IV - III - II.
	 d)
	I - II - III - IV.
	9.
	A Mineração de Dados é responsável pela busca e análise dos dados primitivos, com o objetivo de extrair informações deles. A partir das informações extraídas, a análise pode ser potencializada com a utilização de recursos visuais representativos, por meio de técnicas de Visualização de Informação, e com uma interface rica e interativa para facilitar o processo analítico. Sobre o processo de KDD, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) A seleção é responsável por escolher onde os dados serão armazenados.
(    ) A transformação é responsável por transformar os dados para um único padrão.
(    ) O pré-processamento é responsável pela limpeza e preparação dos dados.
(    ) A seleção é responsável por aplicar os métodos de machine learning.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: CARMO, Alisson Fernando Coelho do. Exploração e análise de dados coletados pelo sistema integrado de monitoramento ambiental utilizando técnicas de visual analytics. 2015. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/138391/000863678.pdf?sequence=1&isAllowed=y. Acesso em: 6 mar. 2020.
	 a)
	V - F - F - V.
	 b)
	F - V - V - F.
	 c)
	V - V - F - V.
	 d)
	F - F - F - F.
	10.
	O tema Big Data tem despertado interesse nos profissionais que trabalham com a Gestão da Informação. Ao tratar dessa temática, é importante discutir os 3 Vs do Big Data e as fases de Discovery, Data Preparation, Model Planning e Analytics. Assinale a alternativa CORRETA que apresenta os 3Vs do Big Data:
FONTE: RIBEIRO, Claudio José Silva. Big Data: os novos desafios para o profissional da informação. Informação & Tecnologia, v. 1, n. 1, p. 96-105, 2014.
	 a)
	Vacância, velocidade e variedade.
	 b)
	Volume, velocidade e variedade.
	 c)
	Volume, vontade e vácuo.
	 d)
	Vapor, velocidade e válvulas.

Continue navegando