Logo Passei Direto
Buscar
Material

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

fundamentos big data
Se diferencia do Machine Learning, pois faz uso de uma rede neural artificial, cujo funcionamento
parecido com a rede de neurônios do cérebro humano.
- Deep Learning
Sua premissa é uma argumentação ativa, isto é, em vez do usuário definir o problema, selecionar os
dados e as ferramentas para analisar tais dados, as suas ferramentas pesquisam automaticamente os
mesmos a procura de anomalias e possíveis relacionamentos, identificando assim problemas que não
tinham sido identificados pelo usuário:
- Data Mining
REZENDE (2002) o(a) definiu como a habilidade de criar um modelo mental que descreve os objetos que
estão ao redor do homem:
- conhecimento;
Armazena dados consolidados de diversas fontes, mas interligados 
pelo ambiente de uma corporação:
- Data Warehouse;
Qual dos exemplos abaixo não apresenta os dados de forma estruturada:
- documentos de texto.
São os dados gerados por: geladeiras, carros, TVs e outros dispositivos que estão conectados à internet
e conversam entre si:
- Personal Data;
Que conceito corresponde a seguinte definição, criada por James Dixon, CTO do Pentaho?
"São os dados em grandes volumes e em seu estado natural, vindos de todos os tipos de fontes, onde os
usuários podem 'mergulhar' e tirar amostras".
- Data Lake;
São os dados gerados por empresas a todo momento, que podem ser essenciais para medir
produtividade das equipes e descobrir alguns gargalos:
- Enterprise Data.
Processo analítico projetado para explorar grandes quantidades de
dados (tipicamente relacionados a negócios, mercado ou pesquisas
científicas), na busca de padrões consistentes e/ou relacionamentos
sistemáticos entre variáveis e, então, validá-los aplicando os padrões
detectados a novos subconjuntos de dados:
- Data Mining
Processo orientado a negócios para a detecção de padrões e
anormalidades por meio da visualização de dados:
- Data Discovery
No que se refere a aprendizagem não supervisionada, analise as
sentenças a seguir:
I - Na aprendizagem não supervisionada não existe um resultado
específico esperado.
II - Nesse tipo de aprendizagem os dados são agrupados e os
resultados mudam de acordo com as variáveis.
III - Não é possível prever os resultados do cruzamento das informações.
Estão corretas as sentenças:
- I, II e III
No que se refere a aprendizagem supervisionada, analise as sentenças
a seguir:
I - Na aprendizagem supervisionada existe um conjunto prévio de dados
inseridos na máquina.
II - As informações são usadas para prever um resultado esperado pelo
usuário ou para fazer a classificação de elementos usados.
III - As sugestões que serão dadas ao usuário não necessitam ser
parecidas com os dados registrados.
Estão corretas as sentenças:
- I e II, apenas
Suas ferramentas analisam os dados, descobrem problemas ou
oportunidades escondidas nos relacionamentos dos dados, e então
diagnosticam o comportamento dos negócios, requerendo a mínima
intervenção do usuário. Assim, ele se dedicará somente a ir em busca
do conhecimento e produzir mais vantagens competitivas.
- Data Mining
Utilização de dados de uma empresa para rotinas de inteligência de
negócio:
- Business Intelligence errada
é analise aprimorafa de dados brutos, objetivando apresentar conclusões
sobre as informações estudadas:
- data analytics
para LE COADIC (2004), eles são uma representação composta de
informação codificada de uma forma a permitir coloca-las sob
processamento eletronico:
- dados
um banco de dados de big data deve possuir pelo menos 3
aspectos, os chamados 3vs do big data que são:
- velocidade, volume, variedade
Os termos Business Intelligence (BI) e Big Data confundem-se em certos
aspectos. Uma conhecida abordagem para identificação dos pontos
críticos de cada paradigma é conhecida como 3V, e destaca:
- variedade, velocidade, volume;
No que se refere a NoSQL, analise as sentenças a seguir:
I - Os sistemas NoSQL não suportam totalmente essas regras ACID,
além de não existir um conceito de transação em muitos sistemas
NoSQL.
II - Os dados nos sistemas de gerenciamento de banco de dados
relacionais estão localizados em tabelas e colunas fixas enquanto os
sistemas NoSQL não dependem de tabelas e colunas fixas.
III - Os sistemas NoSQL não acessam os dados através das chaves
primárias.
Estão corretas as sentenças:
- I e II apenas
são dados basicamente oriundos das pessoas e tipos de informações
que decifram comportamentos:
- social data
No que se refere a bancos de dados orientados a chave-valor, analise
as sentenças a seguir:
I - Uma chave pode apontar para qualquer tipo de dado.
II - A desvantagem do uso de armazenamento valor-chave é que eles
são difíceis de implementar e adicionar dados.
III - A vantagem é que você consegue encontrar elementos com base
nos valores armazenados.
Estão corretas as sentenças:
- I apenas
segundo ZEMAM ( 1970) ele da forma e representa uma ideia
- informação
para processamento de grandes massas de dados, no contexto de
big data, é muito utilizada uma plataforma de software em java, de
computação distribuida, voltada para clusters, inspirada no map reduce
e no googlefs, esta plataforma é o
- hadoop
Extensão do conceito de conhecimento; na verdade, ele(a) é o
conhecimento acrescido de ética e valores:
- sabedoria
tem como objetivo não apenas reportar e monitorar a performance da
organização, mas tambem explorar todo o valor dos dados na
otimização de processos de negocios:
- data discovery
Extensão do conceito de conhecimento; na verdade, ele(a) é o
conhecimento acrescido de ética e valores:
- dados;
Conjuga Inteligência Artificial e Computação Cognitiva para a solução
de problemas com base em banco de dados confiável, testado
exaustivamente e com robustos algoritmos para combinação de
informações:
- Machine Learning
A principal definição de Big Data parte de três características,
conhecidas como 3Vs do Big Data, a saber: velocidade, variedade e
volume. O termo velocidade refere-se, principalmente, à:
- necessidade das aplicações de gerar respostas rapidamente, a partir
de grandes massas de dados.
Campo que abrange as atividades relacionadas à limpeza, preparação
e análise de dados:
- Data Science;
Plataforma de software de código aberto para o armazenamento e
processamento distribuído de grandes conjuntos de dados, utilizando
clusters de computadores com hardware commodity, isto é,
computadores de baixo custo:
- Hadoop;
Componente de Data Warehouse que realiza a leitura, gravação e
gerenciamento de grandes conjuntos de dados em um ambiente
distribuído usando uma interface semelhante a SQL.
- Hive
Qual benefício do Apache Hadoop é atendido pelo armazenamento de
dados em qualquer formato, incluindo formatos semiestruturados e não
estruturados?
- Flexibilidade;
Qual benefício do Apache Hadoop é atendido pelo armazenamento dos 
dados em cada nó em um cluster Hadoop?
- Confiabilidade;
Qual benefício do Apache Hadoop é atendido pelo fato do Hadoop ser
um software open source e executado em hardware commodity de baixo
custo?
- Baixo Custo;
Qual benefício do Apache Hadoop é atendido pelo redirecionamento e
replicação dos dados entre os nós do cluster Hadoop?
- Confiabilidade;
No que se refere ao ecossistema do Hadoop, analise as sentenças a
seguir:
I - O Apache Solr é baseado em Java, o que também ajuda na
verificação ortográfica
II - O Apache Lucene usa a biblioteca de pesquisa do Solr Java como
um núcleo para pesquisa e indexação completa
O Apache Atlas é um conjunto escalável e extensível de serviços
fundamentais de governança de base
III - O Apache Ranger é um framework para ativar, monitorar e
gerenciar a segurança abrangente de dados na plataforma Hadoop.
Estão corretas as sentenças:
- III, apenas
No que se refere ao ecossistema do Hadoop, analise as sentenças a
seguir:
I - O Hadoop Distributed File System (HDFS) fornece armazenamento
escalável
e tolerante a falhas, o custo-eficiente para o seu Data Lake.
II - O MapReduce é o quadro original para escrever aplicações
massivamente paralelas que processam grandes quantidades de
dados estruturados e não estruturados armazenados no HDFS.
III - O HIVE é um componente de Data Warehouse que realiza a
leitura, gravação e gerenciamento de grandes conjuntos de dados em
um ambiente distribuído usando uma interface semelhante a SQL.
Estão corretas as sentenças:
- I, II e III
No que se refere ao ecossistema do Hadoop, analise as sentenças a seguir:
I - A visão do Ranger é fornecer segurança abrangente em todo o ecossistema do Apache Hadoop.
II - O Apache Atlas é um conjunto escalável e extensível de serviços fundamentais de governança de
base.
III - O HIVE fornece um único ponto de acesso para todas as interações REST e HTTP com os clusters
do Apache Hadoop.
Estão corretas as sentenças:
- I e II, apenas
No que se refere a bancos de dados de armazenamento de documento, analise as sentenças a seguir:
I - Os bancos de dados orientado a documentos aplicam uma abordagem orientada a documentos para armazenar
dados.
II - Inclui a capacidade de ter subdocumentos.
III - Sua forma de armazenamento evita que ocorra redundância e inconsistência.
Estão corretas as sentenças:
- I e II, apenas
TURBAN (2003) os considerou com a matéria prima da informação:
- dados;
discursivas
Defina Social Data:
A Social Data são dados que veio das pessoas são dados diversos
com diversas informações que nos mostra translucidando o
comportamento do indivíduo. Ou seja, aqui conseguimos identificar
perfis para trabalhar de forma mais direcionada. Há inúmeros exemplo
no dia a dia sobre esses dados como: Pesquisas na internet, curtidas
nas redes social, compartilhamentos entre outras coisas.
Cite 2 (DUAS) diferenças entre Big Data e BI (Business Intelligence):
Mesmo sabendo que os 2 se completam, as diferença são que,
enquanto o Big Data serve para minerar dados mais preciso o BI
analisam e condensam esses dados para tomada de decisões, uma
trabalha de forma sistémica e contínua e a outra trabalha com um
objetivo específico.
O BI foca na coleta, organização, transformação, disponibilização dos
dados já estruturados para a tomada de decisões já o foco do Big Data
é o processamento de dados em um curto prazo para descobrir as
correlações e caminhos antes desconhecidas nos grandes volumes de
dados. Assim a empresa consegue uma vantagem altamente
competitiva.
cite 3 exemplos de dados estruturados
planilhas eletronicas excel
arquivos xml
banco de dados
Cite 3 (TRÊS) exemplos de dados semiestruturados:
Vídeos, imagens e arquivos de texto são exemplos de dados
semiestruturados.
O que significa o termo o termo Big Data Analytics?
Trata-se de uma união de soluções de Businnes Intelligence (BI), Data
Mining e Datawarehouse, as quais estão presentes no cotidiano
empresarial. Onde o Data Analytics trouxe a valorização dos resultados
da aplicação dessas tecnologias para todas as vertentes da gestão de
um negócio, como na área financeira, de marketing, de logística, no
jurídico e no relacionamento com o cliente. Esta é baseado em algoritmos
complexos, que consideram o maior número possível de variáveis de
interesse do negócio/empresam, a qual ainda considera, fórmulas para
responder a questões estratégicas e antecipar movimentos e tendências
no mercado.
cite 3 serviços fornecidos pelo hadoop
MAP REDUCE
Computação Distribuída (Cluster, conjunto de computadores)
HDFS - 
Hadoop Distributed File System (HDFS), é responsável por gerenciar o
disco das máquinas que compõem o Cluster. HDFS também serve
para leitura e gravação dos dados.
Spark
Apache Spark, é uma ferramenta Big Data para o processamento de
grandes conjuntos de dados. Foi desenvolvido para substituir o
MapReduce, pois processa 100x mais rápido que o MapReduce
defina enterprise data
São os dados gerados por empresas a todo momento (dados do
financeiro, recursos humanos, operações etc). Muitos não dão a
devida importância para esses dados, mas eles podem medir
produtividade das equipes e descobrir alguns gargalos

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Mais conteúdos dessa disciplina