Buscar

Fundamentos de Big Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Fundamentos de Big Data (17322) 
Nota: 9.5 
Prova: 39161851
 A integração de bases de dados diferentes pode apresentar ruídos, informações ambíguas, con�itantes ou mesmo errôneas. Portanto, a qualidade do
processo de análise dos dados dependerá da qualidade dos dados armazenados nas bases.
 
Neste contexto, quais das alternativas abaixo apresentam características importantes para se garantir a qualidade dos dados?
Marque a opção correta: 
A)  Integridade; E�ciência; E�cácia; Precisão; Consistência; Flexibilidade.
B)  Integridade; Granularidade; Con�abilidade; Funcionabilidade; Consistência; Flexibilidade.
C)  Integridade; Granularidade; Tempestividade; Precisão; Consistência; Flexibilidade. 
D)  Integridade; Portabilidade; Tempestividade; Precisão; Usabilidade; Flexibilidade. 
Uma outra ferramenta importante para o Universo Big Data é o HBase, um grande Banco de Dados distribuídos, que permite acessar grande volume de dados
de maneira rápida.
 
Ainda sobre o HBase, podemos a�rmar:
 
( ) Tolerante a falhas;
 
( ) Realiza pesquisas somente em dados arquivados o�ine;
 
( ) Faz exportações de métricas através de plug-ins de arquivo e ganglia;
 
( ) Modelo de dados acomoda ampla gama de casos de uso.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: 
A)   V; V; V; V. 
B)  F; F; V; F.
C)   V; F; V; V.
D)  F; V; V; F.
   Hoje na Internet encontramos um grande volume de dados com conteúdos relacionados à educação, ciência, varejo, a indústria do entretenimento, governo,
social, �nanças, transporte, saúde. Todos estes dados, são fontes de Big Data. Mas entender a diferença entre eles proporcionará uma melhor gestão em um
projeto, portanto, é essencial saber classi�car os tipos de dados existentes.
 
   Com base no texto acima, qual das opções se refere a Dados Estruturados?
   Marque a opção correta.
A)    Trata dos conjuntos de dados que re�etem corretamente a realidade representada pela fonte de dados, que são consistentes entre si e que, portanto,
são dados válidos, não possui estrutura regular, pouco ou nenhum controle sobre a forma.
B)     Mescla de dados oriundos de várias fontes distintas, como vídeo, texto, áudio, imagens, XML, entre outros. Sem tipo prede�nido (o dado vai sendo
modelado conforme o tempo vai passando, com os campos adaptados).

C)    Dados armazenados em Banco de Dados tradicionais ou relacionais, organizados em tabelas.   São tabelas com informações contidas em linhas e
colunas, na maior parte números, valores numéricos ou caracteres.
D)     Podem seguir diversos padrões, de forma heterogênea, dados embaralhados pela Web em arquivos HTML, XML, ou em Banco de Dados não
Alterar modo de visualização
1
2
3
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
) g p g p q
relacionais, simplicidade para relacionar as informações e di�culdade para alterar o modelo.
 “As Coisas”, que englobam desde sensores (temperatura, umidade, luminosidade, etc.), os objetos do nosso dia a dia (geladeiras, TVs, carros, etc.) estarão
conectados entre si em rede, de modo inteligente e passarão a “sentir” o mundo ao redor e a interagir.” (ASHTON, K., 1999). 
O trecho acima trata de que tecnologia? Marque a opção correta: 
A)   Big Data. 
B)   Data Science.
C)   Machine Learning.
D)   Internet das Coisas. 
“Data Science: é o estudo cientí�co da criação, validação e transformação de dados para criar signi�cados” (JOSH WILLS).
 
As principais características que diferenciam estatística de Data Science são:
 
I. Capacidade de manipular enormes quantidades de dados;
 
II. Usar algoritmos de Inteligência Arti�cial;
 
III. Usar computação em larga escala.
 
Classi�que como (V) verdadeiro ou (F) falso as opções I a III. Marque a alternativa com a sequência correta: 
A)   V; V; V. 
B)  V; F; V. 
C)  F; F; V.
D)   F; F; F. 
O objetivo principal do modelo preditivo é ir além de saber o que aconteceu, ao fornecer uma melhor estimativa do que poderá acontecer no futuro. Usando
dados, algoritmos e métodos oriundos da estatística, aprendizado de máquinas e mineração de dados para se determinar as chances de resultados futuros, ou
desconhecidos, com base em dados passados.
 
O modelo preditivo apresenta três aspectos importantes e que precisam ser compreendidos.
 
Qual das alternativas apresenta os aspectos corretos?  
A)  Ensinar o Modelo; Fazer Análises; Gera Relatórios. 
B)  Fazer predições; Fazer Análise; Avaliar Custos.
C)  Coletar Dados; Gerir Dados; Prever Dados. 
D)  Coletar Dados; Treinar o Modelo; Fazer Predições. 
  O armazenamento de dados, ou retenção de informações usando uma determinada tecnologia para guardar e manter dados acessíveis quando necessário,
exige a atenção de alguns aspectos. 
 
  Que aspectos devem ser considerados para o armazenamento de dados?  Marque a opção que apresenta corretamente os mesmos.
A)    Escalabilidade; Alta Disponibilidade; Flexibilidade.
B)    Facilidade, Escalabilidade, Flexibilidade.
C)    Portabilidade, Alta Disponibilidade; Flexibilidade. 
D)    Usabilidade, Flexibilidade, Segurança.
Uma forma de analisar dados com o objetivo de automatizar o desenvolvimento de modelos analíticos, de maneira que o aprendizado é realizado a partir de
algoritmos que aprendem de maneira interativa, ou seja, com base na análise em tempo real dos dados, os computadores proporcionam informações
i i á d ó i
4
5
6
7
8
importantes para apoiar áreas de negócios.
 
O enunciado acima trata de que conceito? Marque a alternativa correta. 
A)  Machine Data.
B)  Big Data. 
C)  Data Analytics. 
D)  Machine Learning. 
  O vasto uso de dispositivos móveis, de redes sociais e da web, em que vários dados são disponibilizados constantemente, gerou uma considerável elevação
da quantidade de dados armazenados e trafegados no mundo. Há também uma crescente abundância de dados originados por organizações. Essa
exponenciação de dados tornou-se um dos principais desa�os para a Ciência da Computação (MCAFEE; BRYNJOLFSSON, 2012). 
 
  Mas o que são dados? Responda selecionando a alternativa correta:
 
A)  São compostos por fatos coletados, estatísticas ou entradas aleatórias que detêm pouco valor.
B)   São compostos de informações coletadas, informações estatísticas, analisadas e processadas.
C)  Conjunto de dados analisados é derivado de uma coleção de dados processados em que o contexto e o signi�cado foram adicionados aos fatos.
D)  É a informação re�nada por meio da análise, informação interpretada e aplicada a um �m.
   Diversos são os dispositivos IoT, que juntamente com Big Data visam o tempo todo tornar nosso ambiente em todo o nosso entorno mais inteligente, no
sentido de mais sensoriamentos. 
   Neste contexto, dispositivos IoT apresentam três classes, a saber:
A- Objetos puramente passivos com identi�cação de dados �xos, sendo identi�cados na Physical Internface Zone.   
B- Objetos dotados de moderado poder computacional e percepção de contexto, por meio de sensores que podem gerar mensagens e variar a informação
associada a eles.
C- Objetos que possuem conectividade em rede, sem a intervenção humana, possibilitando a emergência da inteligência nos sistemas de rede.
 
Portanto, marque a alternativa correta:
A)   As opções A, B e C estão corretas. 
B)   Somente a opção B está correta.
C)   Apenas a opção A está correta.
D)   As opções A e B estão corretas.
  Compreendemos que as soluções tecnológicas que trabalham com Big Data permitem analisar um volume enorme de dados de forma rápida e ainda oferece
um melhor controle para os gestores das informações. 
 
  As alternativas abaixo representam aplicações de Big Data:
  ( ) Reduzir más contratações, analisar rapidamente todos os dados dos candidatos, inclusive se suas ideologias e metas estão de acordo com os princípios
da empresa, maximizando a probabilidade de contratar o funcionárioideal.
  ( ) Serviços oferecidos por Fast Foods, como Burger King e McDonald’s estão se tornando otimizados, as unidades estão sendo monitoradas e mudando os
recursos de menu, conforme o per�l do cliente.
  ( ) Prever performance, predizer se determinado colaborador será capaz de se destacar perante os demais do setor, se possui ideias inovadoras para o
negócio ou talento para outras atividades na empresa, necessita de uma análise minuciosa e constante.
  ( ) Gerar recomendações, utilizar o histórico de compras e buscas do cliente pelo navegador para gerar uma lista de produtos que também possam ser de
interesse.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta:
A)   F; V; F; F. 
B)   V; F; V; V 
C)   F; F; F; V.
D)  V; V; V; V.
9
10
11
   Tem aviões mandando informações de por onde estão voando e quais as condições climáticas, permitindo voos muito mais seguros e quase independentes
dos pilotos. Até o seu carro pode transmitir quais são as condições da estrada em que você está dirigindo e acompanhar os dados do GPS de motoristas que
ajudam a predizer os horários e locais que estarão mais congestionados, em parte é isso que você faz quando usa aplicativos para cortar caminhos.
 
   Quando estamos falando de Big Data, estamos tratando a capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise
Prescritiva. Assinale qual das opções abaixo descreve corretamente este tipo de análise.
A)    Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram na análise descritiva, na
tentativa de minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração,
correlações, detalhamento e descoberta de dados em busca da descoberta das causas do problema.
B)    Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados,
dados estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Arti�cial. Um exemplo seria a
previsão do faturamento para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha
publicitária.

C)    Utiliza a otimização de forma a identi�car as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto
de análise descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias.
Basicamente é uma forma de de�nir qual a escolha será mais efetiva em determinada situação.
D)    Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e
classi�cando os dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar grá�cos e relatórios sobre orçamentos, vendas, receitas,
processamento analítico on-line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a
queda das vendas de um produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo.
O cientista de dados deve conhecer de tecnologia, de matemática, ter curiosidade e criatividade. Um cientista curioso é aquele que não se conforma com
qualquer coisa, qualquer informação. Agora, conseguir um pro�ssional com conhecimentos técnicos, quantitativos, curioso e colaborativo/comunicativo é bem
difícil. Ao mesmo tempo, este cientista de dados deve saber atuar como um líder, juntamente com pro�ssionais especializados no que fazem.
 
Quais pro�ssionais são aliados ao cientista de dados complementando uma equipe Analytics? Marque a alternativa correta. 
A)  Data Engineer; Advogado; DBA; Programador; Estatístico; Analista de Negócios; Designer. 
B)   Data Engineer; Equipe Testes; DBA; Administrador; Estatístico; Analista de Negócios; Contador. 
C)  Data Engineer; Equipe de Manutenção; Gerente de Projetos; Suporte Técnico; Matemático; Analista de Negócios; Designer.
D)  Data Engineer; Equipe de Extração; DBA; Programador; Estatístico; Analista de Negócios; Designer.
  Big Data é o nome que se dá à enorme quantidade de dados produzidos a cada segundo, por milhares de aparelhos do mundo inteiro, desde o seu celular,
passando por um avião pousando no aeroporto, ou em câmeras de trânsito, até satélites orbitando ao redor da Terra. Ainda, pode ser classi�cado como o
processamento e análise de conjuntos de dados extremamente grandes, que não podem ser processados utilizando-se ferramentas convencionais de
processamento de dados.
 
  Quando estamos falando de Big Data, estamos tratando da capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise
Diagnóstica.
 
  Assinale qual das opções abaixo descreve corretamente este tipo de análise.
 
A)    Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados,
dados estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Arti�cial. Um exemplo seria a
previsão do faturamento para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha
publicitária.
B)    Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e
classi�cando os dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar grá�cos e relatórios sobre orçamentos, vendas, receitas,
processamento analítico on-line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a
queda das vendas de um produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo.

C)    Utiliza a otimização de forma a identi�car as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto
de análise descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias.
Basicamente é uma forma de de�nir qual a escolha será mais efetiva em determinada situação.

D)    Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram, na tentativa de
minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração, correlações,
detalhamento e descoberta de dados. 
Cada vez mais organizações buscam formas sistemáticas para identi�car, gerenciar e integrar dados que se encontram disponíveis em diversos meios. O
12
13
14
15
   Cada vez mais organizações buscam formas sistemáticas para identi�car, gerenciar e integrar dados que se encontram disponíveis em diversos meios. O
que se torna um grande desa�o diante de uma quantidade incalculável de dados.
 
  Neste contexto, pode-se a�rmar que as organizações precisam buscar que tipo de apoio para captar, organizar, analisar e gerenciar dados dos seus
consumidores e suas operações, trazendo de fato impactos decisivos para o mercado e a concorrência?
 
  Marque a alternativa correta:
 
A)   Analista de Negócios e Administradores.
B)   Analista de Sistemas e Testers.
C)   Administrador de Banco de Dados e Desenvolvedores.
D)   Pro�ssionais, como equipes de analytics de forma integrada.
  Aprovado pelo plenário do Senado Federal, o PLC 53/2018 dispõe sobre a proteção de dados pessoais e altera a Lei 12.965/16 do Marco Civil da Internet,
sendo consolidada como a Lei Geral de Proteção de Dados Brasileira (LGPD). 
 
   Recentemente, Josefa Christina fez uma compra on-line em um site e-commerce, no qual forneceu seus principaisdados pessoais, como: nome, CPF, e-mail,
telefone, endereço. Logo em seguida, passou a receber diversas ofertas de outros sites parceiros do e-commerce no qual ela havia realizado a compra, mas
em momento algum concordou em compartilhar os seus dados. Diante deste cenário e de acordo com a Lei Geral de Proteção de Dados Brasileiros, qual
direito não foi atendido pelo site em que Josefa realizou suas compras on-line?  Marque a opção correta:
A)  Direito à Privacidade.
B)  Segurança Jurídica.
C)  Regras para empresas.
D)  Direito do Consumidor.
 Pesquisas apontam que cerca de 80% dos dados das empresas são dados não estruturados e que precisam ser tratados. 
 
Mas como podemos classi�car dados não estruturados?
Selecione a opção correta:
A)  Trata dos conjuntos de dados que re�etem corretamente a realidade representada pela fonte de dados, que são consistentes entre si e que, portanto,
são dados válidos, não possui estrutura regular, pouco ou nenhum controle sobre a forma.
B)  Possui esquema �xo, formato bem de�nido (inteiro, string, data), conhecimento prévio da estrutura de dados, simplicidade para relacionar as
informações (relacionar usuário, com entrega, com pedido), di�culdade para alterar o modelo.
C)  Podem seguir diversos padrões, de forma heterogênea, dados embaralhados pela Web em arquivos HTML, XML, ou em Banco de Dados não relacionais
armazenados em Banco de Dados tradicionais ou relacionais, organizados em tabelas.

D)   Mescla de dados oriundos de várias fontes distintas, como vídeo, texto, áudio, imagens, entre outros. Sem tipo prede�nido (o dado vai sendo modelado
conforme o tempo vai passando, com os campos adaptados). 
O objetivo das técnicas de Aprendizagem de Máquina ou Machine Learning é aprender um modelo (hipótese), usando o conjunto de treinamento para
relacionar atributos da entrada a valores do atributo de saída.
 
Para isso, alguns paradigmas de treinamento são utilizados.
 
Marque a alternativa que apresenta os principais paradigmas de treinamento: 
A)   Supervised Learning; Machine Learning; Unsupervisid Learning; Aprendizagem de Codi�cação.
B)   Aprendizagem Supervisionada; Reforço; Aprendizagem Não Supervisionada, Semissupervisionado.
C)   Naive Bayes; K-Nearest Neighbor; Semissupervisionado; Supervisionada; Reforço. 
D)   Regressão Linear; Aprendizagem Não Supervisionada, Semissupervisionado; Reforço.
A aprendizagem de máquina permite acelerar o processo de análise em Big Data, por exemplo, é possível identi�car um padrão de um consumidor que
comprou um determinado produto e, através deste padrão, prever o comportamento de compra do consumidor para comprar futuramente outros produtos.
 
São exemplos de aplicações de Aprendizagem de Máquina:
16
17
18
19
Uniasselvi © 2021
 
( ) Recomendação de �lmes, séries e vídeos;
 
( ) Tradução automática;
 
( ) Carros autônomos;
 
( ) Detecção de fraudes.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta:
A)  F; F; V; V. 
B)  V; F; V; F.
C)  V; V; V; V. 
D)  V; F; F; V. 
  Ainda há desa�os em inserir novas tecnologias com a IoT e Big Data para trazer melhorias na operação dos negócios, como a segurança e con�ança dos
dados dos clientes/usuários. 
 
  Os principais desa�os podem ser apontados como:
I. A privacidade do consumidor poderá ser comprometida com o grande volume de dados trafegando com informações sobre o usuário desses dispositivos.
 
II. A gestão de armazenamento se preocupa cada vez mais com a capacidade de armazenamento das empresas, se esta será su�ciente para coletar e utilizar
dados da IoT de forma e�caz em relação ao custo.
 
III. A tecnologia dos servidores será focada em um crescente investimento em áreas essenciais e organizações relacionadas a IoT visando rendimento ou
valores signi�cativos.
 
IV. Redes de data centers serão modi�cadas para permitir alto volume de dados de sensores de mensagens pequenas para processo em data center, afetando
assim a largura de banda de entrada, que deverá aumentar no data center.
 
Quanto às alternativas I, II, III e IV, marque a opção correta:
A)  Todas as alternativas estão corretas.
B)  Alternativas I, II e III estão erradas.
C)  Apenas as alternativas I e II estão corretas.
D)  Apenas as alternativas III e IV estão corretas.
20
Voltar

Continue navegando