Logo Passei Direto
Buscar

AV1 - Tópicos de Big Data em Python

Ferramentas de estudo

Questões resolvidas

Podemos definir a fórmula que estrutura o Big Data como:
Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade.
Volume + oportunidade + segurança + veracidade, tudo agregando + valor.
Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.
Volume + variedade + velocidade + veracidade + variabilidade + valor + visualização.
Volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.

As principais características dos serviços de BigData na nuvem são:
Economia de recursos e segurança dos dados.
Serviços sob demanda, Amplo Acesso à Rede, Pool de recursos, Escalabilidade ilimitada e rápida.
Rapidez e pouca flexibilidade.
Ausência de infraestrutura de TI e custo alto, baixa escalabilidade.
Escalabilidade e necessidade de conhecimento técnico.

Big data necessita de algoritmos de computação mais robustos em comparação aos algoritmos tradicionais de banco de dados, que não são capazes de lidar com os volumes de dados representados em big data.
Certo
Errado

Um dos três Vs de big data refere-se à variedade, que está relacionada a métodos para identificar se um conjunto de dados pode ser considerado big data.
Certo
Errado

João é um cientista de dados que iniciou o processo de estudo dos dados de sua empresa com o objetivo de identificar um diferencial competitivo diante de seus concorrentes. Como resultado, João decidiu implementar um Big Data na nuvem. Diante das possibilidades dos serviços, considerando os requisitos de escalabilidade e elasticidade, em caso de aumento de demanda pontual, aliados à tecnologia de Big Data, a alternativa que melhor descreve o tipo de serviço em nuvem a ser contratado por João é:
infraestrutura como serviço (IaaS), que consiste na entrega de funções de computação, incluindo hardware, redes, armazenamento e espaço de Datacenter com base em um modelo de aluguel;
plataforma como serviço (PaaS), que oferece um conjunto consistente de serviços que garantem que os desenvolvedores tenham um modo integrado para a criação de aplicativos em nuvem;
software como serviço (SaaS), que consiste em um aplicativo de negócios criado e hospedado por um provedor em um modelo de múltiplos usuários;
Big Data como serviço (BDaaS), que é um serviço de Big data baseado em nuvem;
infraestrutura como código (IaC), que consiste em uma abordagem baseada na agilidade para entregar uma infraestrutura de forma muito mais rápida, com uma codificação objetiva e simples.

Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o DataWarehouse para a obtenção de conhecimento a partir da manipulação desses dados.
Certo
Errado

Em Big Data, a premissa volume refere-se à capacidade de processar, em um ambiente computacional, diferentes tipos e formatos de dados, como fotos, vídeos e geolocalização.
Certo
Errado

Os fatores críticos de sucesso da análise de Big Data incluem uma sólida infraestrutura de dados, além de ferramentas analíticas e pessoal habilitado para lidar com elas.
Certo
Errado

Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões “V” de avaliação de um Big Data, se refere
(A) ao valor.
(B) à variedade.
(C) à veracidade.
(D) à velocidade.
(E) ao volume.

Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.
A) Banco de dados NoSQL.
B) Banco de dados Extensível.
C) Banco de dados MultiRelacional.
D) Banco de dados Multivalorados.
E) Banco de dados Redimensional.

Uma empresa possui uma coleção de conjuntos de dados cujo volume, velocidade e variedade é grande e difícil de armazenar, gerenciar, processar e analisar. Esse conjunto de dados é definido atualmente como
A) Big data.
B) Data base.
C) Business analytics.
D) Cloud computer.
E) Business Intelligence.

Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que
A) pode ser considerado um repositório de dados relacionados, sendo, portanto, um armazém de dados orientado por assunto.
B) pode ser considerado um conjunto de bancos de dados relacionais e com relacionamentos entre tabelas de diferentes esquemas de bancos de dados.
C) é o resultado de sucessivas operações de mineração de dados, sendo um ambiente no qual é possível ter relatórios e dashboards de maneira amigável para os analistas de negócio.
D) é projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens.

Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir.
I O volume de dados é uma característica importante de Big Data.
II Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os negócios.
III A característica de velocidade de entrada dos dados impacta o modelo de processamento e armazenamento.
IV A variedade dos dados não é característica intrínseca nos fundamentos de Big Data.
A) I e II.
B) I e III.
C) II e IV.
D) I, III e IV.
E) II, III e IV.

Assinale a alternativa que apresenta o conceito de Big Data.
A) Conjuntos de dados de grande volume que se utilizam de ferramentas especiais de processamento, pesquisa e análise, e que podem ser aproveitados no tempo necessário, com precisão e grande velocidade.
B) São bancos de dados de fácil acesso e rápida velocidade, operados como computadores pessoais.
C) Manuseio de informações necessárias às empresas e aos negócios do mundo moderno, que podem ser armazenadas em computadores pessoais, utilizando-se a técnica de nuvem de dados.
D) São apenas grandes volumes de dados que precisam ainda ser mais bem aproveitados pelo mundo corporativo.
E) Refere-se a um grande número de computadores pessoais (PC) interligados entre si em uma grande rede de informação.

Situação hipotética: Um órgão público pretende fazer uma análise de big data com o objetivo de realizar mineração em grandes conjuntos de dados corporativos para localizar ou encontrar padrões ocultos, o que exigirá uma grande quantidade de processamento.
Assertiva: Nesse caso, há necessidade de contratação de um SaaS (software como serviço), que acrescentará uma camada adicional de integração com frameworks de desenvolvimento de aplicativos, recursos de middleware e funções como bancos de dados.
Certo
Errado

Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado — buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se
A) a um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros.
B) a banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança.
C) a um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis.
D) aos data centers físicos que transformam os dados em informações pertinentes ao negócio.
E) ao controle de dados semiestruturados de formatos definidos como texto e números.

O termo Big Data é bastante conhecido pelos profissionais de tecnologia da informação, especialmente aqueles envolvidos com bancos de dados, inteligência de negócios, sistemas de informações e sistemas de apoio à decisão. Uma característica inerente a esse conceito é a da
A) complexidade das suas fontes de informação, o que demanda a necessidade de sua prévia limpeza, integração e transformação.
B) estabilidade da taxa de geração desses dados, o que garante sua utilização confiável na geração analítica de informação com independência temporal.
C) heterogeneidade do conjunto de dados, empregada em dados originalmente estruturados ou semiestruturados.
D) qualidade das fontes de dados, por conta dos padrões de expansão e de retenção reveladores da ordem existente nos dados.
E) escalabilidade, que, na sua forma original, possui alto valor granular quando comparado ao de seu volume.

Tecnologias que recuperam dados de muitas fontes, limpando-os e carregando-os em data warehouse, e que fazem parte de qualquer projeto centrado em dados denominam-se
A) Depósitos de Dados Operacionais (ODS).
B) ETL ( Extract, Transform and Load).
C) BPM ( Business Performance Management).
D) OLTP ( online transaction processing).
E) KPI ( Key Performance Indicators).

Um data warehouse (DW), via de regra, possui grande quantidade de dados advindos tanto de fontes homogêneas quanto heterogêneas. Dentro desse cenário, em relação às ferramentas de ETL, assinale a alternativa correta.
A) Possuem a função de efetuar toda a limpeza dos dados heterogêneos e definir as regras de negócio para que os filtros sejam aplicados.
B) As ferramentas de ETL modernas são capazes de fazer a extração e a carga dos dados de forma simultânea no DW.
C) Possuem a função de fazer a extração e possível limpeza e reformatação dos dados, para que estes possam ser carregados no DW.
D) Possuem a função de estabelecer regras de filtragem multidimensional dos dados, gerando visões específicas de acordo com as regras de negócio.
E) Possuem a função de gerar metadados que poderão alimentar ferramentas de data minning, OLAP e Big Data.

Um banco comercial deseja obter um tipo de banco de dados NoSQL que trate os dados extraídos de redes sociais, de modo a formar uma coleção (collection) interconectada. Nessa coleção (collection), os dados são organizados em vértices ou objetos (O) e em relacionamentos, que são relações (R) ou arestas.
A) Distributed Hashing
B) Consistent Hashing
C) Document Oriented
D) Graph Oriented
E) Vector Clock

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Podemos definir a fórmula que estrutura o Big Data como:
Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade.
Volume + oportunidade + segurança + veracidade, tudo agregando + valor.
Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.
Volume + variedade + velocidade + veracidade + variabilidade + valor + visualização.
Volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.

As principais características dos serviços de BigData na nuvem são:
Economia de recursos e segurança dos dados.
Serviços sob demanda, Amplo Acesso à Rede, Pool de recursos, Escalabilidade ilimitada e rápida.
Rapidez e pouca flexibilidade.
Ausência de infraestrutura de TI e custo alto, baixa escalabilidade.
Escalabilidade e necessidade de conhecimento técnico.

Big data necessita de algoritmos de computação mais robustos em comparação aos algoritmos tradicionais de banco de dados, que não são capazes de lidar com os volumes de dados representados em big data.
Certo
Errado

Um dos três Vs de big data refere-se à variedade, que está relacionada a métodos para identificar se um conjunto de dados pode ser considerado big data.
Certo
Errado

João é um cientista de dados que iniciou o processo de estudo dos dados de sua empresa com o objetivo de identificar um diferencial competitivo diante de seus concorrentes. Como resultado, João decidiu implementar um Big Data na nuvem. Diante das possibilidades dos serviços, considerando os requisitos de escalabilidade e elasticidade, em caso de aumento de demanda pontual, aliados à tecnologia de Big Data, a alternativa que melhor descreve o tipo de serviço em nuvem a ser contratado por João é:
infraestrutura como serviço (IaaS), que consiste na entrega de funções de computação, incluindo hardware, redes, armazenamento e espaço de Datacenter com base em um modelo de aluguel;
plataforma como serviço (PaaS), que oferece um conjunto consistente de serviços que garantem que os desenvolvedores tenham um modo integrado para a criação de aplicativos em nuvem;
software como serviço (SaaS), que consiste em um aplicativo de negócios criado e hospedado por um provedor em um modelo de múltiplos usuários;
Big Data como serviço (BDaaS), que é um serviço de Big data baseado em nuvem;
infraestrutura como código (IaC), que consiste em uma abordagem baseada na agilidade para entregar uma infraestrutura de forma muito mais rápida, com uma codificação objetiva e simples.

Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o DataWarehouse para a obtenção de conhecimento a partir da manipulação desses dados.
Certo
Errado

Em Big Data, a premissa volume refere-se à capacidade de processar, em um ambiente computacional, diferentes tipos e formatos de dados, como fotos, vídeos e geolocalização.
Certo
Errado

Os fatores críticos de sucesso da análise de Big Data incluem uma sólida infraestrutura de dados, além de ferramentas analíticas e pessoal habilitado para lidar com elas.
Certo
Errado

Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões “V” de avaliação de um Big Data, se refere
(A) ao valor.
(B) à variedade.
(C) à veracidade.
(D) à velocidade.
(E) ao volume.

Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.
A) Banco de dados NoSQL.
B) Banco de dados Extensível.
C) Banco de dados MultiRelacional.
D) Banco de dados Multivalorados.
E) Banco de dados Redimensional.

Uma empresa possui uma coleção de conjuntos de dados cujo volume, velocidade e variedade é grande e difícil de armazenar, gerenciar, processar e analisar. Esse conjunto de dados é definido atualmente como
A) Big data.
B) Data base.
C) Business analytics.
D) Cloud computer.
E) Business Intelligence.

Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que
A) pode ser considerado um repositório de dados relacionados, sendo, portanto, um armazém de dados orientado por assunto.
B) pode ser considerado um conjunto de bancos de dados relacionais e com relacionamentos entre tabelas de diferentes esquemas de bancos de dados.
C) é o resultado de sucessivas operações de mineração de dados, sendo um ambiente no qual é possível ter relatórios e dashboards de maneira amigável para os analistas de negócio.
D) é projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens.

Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir.
I O volume de dados é uma característica importante de Big Data.
II Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os negócios.
III A característica de velocidade de entrada dos dados impacta o modelo de processamento e armazenamento.
IV A variedade dos dados não é característica intrínseca nos fundamentos de Big Data.
A) I e II.
B) I e III.
C) II e IV.
D) I, III e IV.
E) II, III e IV.

Assinale a alternativa que apresenta o conceito de Big Data.
A) Conjuntos de dados de grande volume que se utilizam de ferramentas especiais de processamento, pesquisa e análise, e que podem ser aproveitados no tempo necessário, com precisão e grande velocidade.
B) São bancos de dados de fácil acesso e rápida velocidade, operados como computadores pessoais.
C) Manuseio de informações necessárias às empresas e aos negócios do mundo moderno, que podem ser armazenadas em computadores pessoais, utilizando-se a técnica de nuvem de dados.
D) São apenas grandes volumes de dados que precisam ainda ser mais bem aproveitados pelo mundo corporativo.
E) Refere-se a um grande número de computadores pessoais (PC) interligados entre si em uma grande rede de informação.

Situação hipotética: Um órgão público pretende fazer uma análise de big data com o objetivo de realizar mineração em grandes conjuntos de dados corporativos para localizar ou encontrar padrões ocultos, o que exigirá uma grande quantidade de processamento.
Assertiva: Nesse caso, há necessidade de contratação de um SaaS (software como serviço), que acrescentará uma camada adicional de integração com frameworks de desenvolvimento de aplicativos, recursos de middleware e funções como bancos de dados.
Certo
Errado

Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado — buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se
A) a um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros.
B) a banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança.
C) a um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis.
D) aos data centers físicos que transformam os dados em informações pertinentes ao negócio.
E) ao controle de dados semiestruturados de formatos definidos como texto e números.

O termo Big Data é bastante conhecido pelos profissionais de tecnologia da informação, especialmente aqueles envolvidos com bancos de dados, inteligência de negócios, sistemas de informações e sistemas de apoio à decisão. Uma característica inerente a esse conceito é a da
A) complexidade das suas fontes de informação, o que demanda a necessidade de sua prévia limpeza, integração e transformação.
B) estabilidade da taxa de geração desses dados, o que garante sua utilização confiável na geração analítica de informação com independência temporal.
C) heterogeneidade do conjunto de dados, empregada em dados originalmente estruturados ou semiestruturados.
D) qualidade das fontes de dados, por conta dos padrões de expansão e de retenção reveladores da ordem existente nos dados.
E) escalabilidade, que, na sua forma original, possui alto valor granular quando comparado ao de seu volume.

Tecnologias que recuperam dados de muitas fontes, limpando-os e carregando-os em data warehouse, e que fazem parte de qualquer projeto centrado em dados denominam-se
A) Depósitos de Dados Operacionais (ODS).
B) ETL ( Extract, Transform and Load).
C) BPM ( Business Performance Management).
D) OLTP ( online transaction processing).
E) KPI ( Key Performance Indicators).

Um data warehouse (DW), via de regra, possui grande quantidade de dados advindos tanto de fontes homogêneas quanto heterogêneas. Dentro desse cenário, em relação às ferramentas de ETL, assinale a alternativa correta.
A) Possuem a função de efetuar toda a limpeza dos dados heterogêneos e definir as regras de negócio para que os filtros sejam aplicados.
B) As ferramentas de ETL modernas são capazes de fazer a extração e a carga dos dados de forma simultânea no DW.
C) Possuem a função de fazer a extração e possível limpeza e reformatação dos dados, para que estes possam ser carregados no DW.
D) Possuem a função de estabelecer regras de filtragem multidimensional dos dados, gerando visões específicas de acordo com as regras de negócio.
E) Possuem a função de gerar metadados que poderão alimentar ferramentas de data minning, OLAP e Big Data.

Um banco comercial deseja obter um tipo de banco de dados NoSQL que trate os dados extraídos de redes sociais, de modo a formar uma coleção (collection) interconectada. Nessa coleção (collection), os dados são organizados em vértices ou objetos (O) e em relacionamentos, que são relações (R) ou arestas.
A) Distributed Hashing
B) Consistent Hashing
C) Document Oriented
D) Graph Oriented
E) Vector Clock

Prévia do material em texto

Podemos definir a fórmula que estrutura o Big Data como: 
Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade.
Volume + oportunidade + segurança + veracidade, tudo agregando + valor.
Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.
Volume + variedade + velocidade + veracidade + variabilidade + valor + visualização.
Volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.
As principais características dos serviços de BigData na nuvem são:
Economia de recursos e segurança dos dados.
Serviços sob demanda, Amplo Acesso à Rede, Pool de recursos, Escalabilidade ilimitada e rápida
Rapidez e pouca flexibilidade.
Ausência de infraestrutura de TI e custo alto, baixa escalabilidade.
Escalabilidade e necessidade de conhecimento técnico.
Big data necessita de algoritmos de computação mais robustos em comparação aos algoritmos tradicionais de banco de dados, que não são capazes de lidar com os volumes de dados representados em big data.
Certo
Errado
Um dos três Vs de big data refere-se à variedade, que está relacionada a métodos para identificar se um conjunto de dados pode ser considerado big data.
Certo
Errado
João é um cientista de dados que iniciou o processo de estudo dos dados de sua empresa com o objetivo de identificar um diferencial competitivo diante de seus concorrentes. Como resultado, João decidiu implementar um Big Data na nuvem. Diante das possibilidades dos serviços, considerando os requisitos de escalabilidade e elasticidade, em caso de aumento de demanda pontual, aliados à tecnologia de Big Data, a alternativa que melhor descreve o tipo de serviço em nuvem a ser contratado por João é:
infraestrutura como serviço (IaaS), que consiste na entrega de funções de computação, incluindo hardware, redes, armazenamento e espaço de Datacenter com base em um modelo de aluguel;
plataforma como serviço (PaaS), que oferece um conjunto consistente de serviços que garantem que os desenvolvedores tenham um modo integrado para a criação de aplicativos em nuvem;
software como serviço (SaaS), que consiste em um aplicativo de negócios criado e hospedado por um provedor em um modelo de múltiplos usuários;
Big Data como serviço (BDaaS), que é um serviço de Big data baseado em nuvem;
infraestrutura como código (IaC), que consiste em uma abordagem baseada na agilidade para entregar uma infraestrutura de forma muito mais rápida, com uma codificação objetiva e simples.
Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o DataWarehouse para a obtenção de conhecimento a partir da manipulação desses dados.
Certo
Errado
Em Big Data, a premissa volume refere-se à capacidade de processar, em um ambiente computacional, diferentes tipos e formatos de dados, como fotos, vídeos e geolocalização.
Certo
Errado
Os fatores críticos de sucesso da análise de Big Data incluem uma sólida infraestrutura de dados, além de ferramentas analíticas e pessoal habilitado para lidar com elas.
Certo
Errado
Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões “V” de avaliação de um Big Data, se refere
A) ao valor.
B) à variedade.
C) à veracidade.
D) à velocidade.
E) ao volume.
Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.
A) Banco de dados NoSQL.
B) Banco de dados Extensível.
C) Banco de dados MultiRelacional.
D) Banco de dados Multivalorados.
E) Banco de dados Redimensional.
	
Uma empresa possui uma coleção de conjuntos de dados cujo volume, velocidade e variedade é grande e difícil de armazenar, gerenciar, processar e analisar. Esse conjunto de dados é definido atualmente como
A) Big data.
B) Data base.
C) Business analytics.
D) Cloud computer.
E) Business Intelligence.
Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que
A) pode ser considerado um repositório de dados relacionados, sendo, portanto, um armazém de dados orientado por assunto.
B) pode ser considerado um conjunto de bancos de dados relacionais e com relacionamentos entre tabelas de diferentes esquemas de bancos de dados.
C) é o resultado de sucessivas operações de mineração de dados, sendo um ambiente no qual é possível ter relatórios e dashboards de maneira amigável para os analistas de negócio.
D) é projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens.
Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir.
I O volume de dados é uma característica importante de Big Data.
II Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os negócios.
III A característica de velocidade de entrada dos dados impacta o modelo de processamento e armazenamento.
IV A variedade dos dados não é característica intrínseca nos fundamentos de Big Data.
Estão certos apenas os itens
A) I e II.
B) I e III.
C) II e IV.
D) I, III e IV.
E) II, III e IV.
Assinale a alternativa que apresenta o conceito de Big Data.
A) Conjuntos de dados de grande volume que se utilizam de ferramentas especiais de processamento, pesquisa e análise, e que podem ser aproveitados no tempo necessário, com precisão e grande velocidade.
B) São bancos de dados de fácil acesso e rápida velocidade, operados como computadores pessoais.
C) Manuseio de informações necessárias às empresas e aos negócios do mundo moderno, que podem ser armazenadas em computadores pessoais, utilizando-se a técnica de nuvem de dados.
D) São apenas grandes volumes de dados que precisam ainda ser mais bem aproveitados pelo mundo corporativo.
E) Refere-se a um grande número de computadores pessoais (PC) interligados entre si em uma grande rede de informação.
Situação hipotética: Um órgão público pretende fazer uma análise de big data com o objetivo de realizar mineração em grandes conjuntos de dados corporativos para localizar ou encontrar padrões ocultos, o que exigirá uma grande quantidade de processamento. Assertiva: Nesse caso, há necessidade de contratação de um SaaS (software como serviço), que acrescentará uma camada adicional de integração com frameworks de desenvolvimento de aplicativos, recursos de middleware e funções como bancos de dados.
Certo
Errado
Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado — buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se
A) a um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros.
B) a banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança.
C) a um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis.
D) aos data centers físicos que transformam os dados em informações pertinentes ao negócio.
E) ao controle de dados semiestruturados de formatos definidos como texto e números.
O termo Big Data é bastante conhecido pelos profissionais de tecnologia dainformação, especialmente aqueles envolvidos com bancos de dados, inteligência de negócios, sistemas de informações e sistemas de apoio à decisão.
Uma característica inerente a esse conceito é a da
A) complexidade das suas fontes de informação, o que demanda a necessidade de sua prévia limpeza, integração e transformação.
B) estabilidade da taxa de geração desses dados, o que garante sua utilização confiável na geração analítica de informação com independência temporal.
C) heterogeneidade do conjunto de dados, empregada em dados originalmente estruturados ou semiestruturados.
D) qualidade das fontes de dados, por conta dos padrões de expansão e de retenção reveladores da ordem existente nos dados.
E) escalabilidade, que, na sua forma original, possui alto valor granular quando comparado ao de seu volume.
Tecnologias que recuperam dados de muitas fontes, limpando-os e carregando-os em data warehouse, e que fazem parte de qualquer projeto centrado em dados denominam-se
A)	Depósitos de Dados Operacionais (ODS).
B)	ETL ( Extract, Transform and Load).
C)	BPM ( Business Performance Management).
D)	OLTP ( online transaction processing).
E)	KPI ( Key Performance Indicators).
Um data warehouse (DW), via de regra, possui grande quantidade de dados advindos tanto de fontes homogêneas quanto heterogêneas. Dentro desse cenário, em relação às ferramentas de ETL, assinale a alternativa correta.
A)	Possuem a função de efetuar toda a limpeza dos dados heterogêneos e definir as regras de negócio para que os filtros sejam aplicados.
B)	As ferramentas de ETL modernas são capazes de fazer a extração e a carga dos dados de forma simultânea no DW.
C)	Possuem a função de fazer a extração e possível limpeza e reformatação dos dados, para que estes possam ser carregados no DW.
D)	Possuem a função de estabelecer regras de filtragem multidimensional dos dados, gerando visões específicas de acordo com as regras de negócio.
E)	Possuem a função de gerar metadados que poderão alimentar ferramentas de data minning, OLAP e Big Data.
Um banco comercial deseja obter um tipo de banco de dados NoSQL que trate os dados extraídos de redes sociais, de modo a formar uma coleção (collection) interconectada. Nessa coleção (collection), os dados são organizados em vértices ou objetos (O) e em relacionamentos, que são relações (R) ou arestas.
Nesse modelo de banco de dados NoSQL, os dados seriam apresentados da seguinte forma:
O:Usuario{u1:Joao, u2:Jose, u3:Maria, u4:Claudio}
O:Escola{e1:UFRJ, e2:URGS, e3:IFB}
R:Estudaem{re1=u1:e2;re2=u2:e2;re3=u3:e1;re4=u4:e3}
R:Amigode{ra1=u1:u2;ra2=u1:u3;ra3=u2:u3}
O banco de dados NoSQL que representa essa situação deve ter uma estrutura do tipo
A) Distribuided Hashing
B) Consistent Hashing
C) Document Oriented
D) Graph Oriented
E) Vector Clock

Mais conteúdos dessa disciplina