Buscar

avaliação - Fundamentos de Big Data (17322)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Fundamentos de Big Data (17322) 
Nota: 9.5 
Prova: 39562998
   É difícil falar sobre Big Data sem mencionar o Google, pois muitos dos seus estudos e trabalhos foram motivadores para as ferramentas que utilizamos hoje. 
   Dentre uma das ferramentas, o Map Reduce teve um primeiro artigo publicado pelo Google em 2004. Marque qual das opções a seguir representa MapReduce.
A)   Um sistema de arquivos distribuídos e tolerante a falhas, com escala para diversas máquinas em funcionamento paralelo.
B)   Um banco de dados distribuídos e paralelo em que você pudesse acessar os dados com muitas atividades e um grande volume de dados.
C)    Utiliza índices diversos, mecanismos de varrer uma rede inteira, buscando palavras e indexando essas palavras.
D)  Uma técnica de programação paralela, que de�ne um modelo em que seu programa paralelo tem que ser seguido a partir de duas operações – Map e Reduce.
Uma outra ferramenta importante para o Universo Big Data é o HBase, um grande Banco de Dados distribuídos, que permite acessar grande volume de dados de maneira
rápida.
 
Ainda sobre o HBase, podemos a�rmar:
 
( ) Tolerante a falhas;
 
( ) Realiza pesquisas somente em dados arquivados o�ine;
 
( ) Faz exportações de métricas através de plug-ins de arquivo e ganglia;
 
( ) Modelo de dados acomoda ampla gama de casos de uso.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: 
A)   V; V; V; V. 
B)   V; F; V; V.
C)  F; F; V; F.
D)  F; V; V; F.
  O vasto uso de dispositivos móveis, de redes sociais e da web, em que vários dados são disponibilizados constantemente, gerou uma considerável elevação da
quantidade de dados armazenados e trafegados no mundo. Há também uma crescente abundância de dados originados por organizações. Essa exponenciação de dados
tornou-se um dos principais desa�os para a Ciência da Computação (MCAFEE; BRYNJOLFSSON, 2012). 
 
  Mas o que são dados? Responda selecionando a alternativa correta:
 
A)  Conjunto de dados analisados é derivado de uma coleção de dados processados em que o contexto e o signi�cado foram adicionados aos fatos.
B)  São compostos por fatos coletados, estatísticas ou entradas aleatórias que detêm pouco valor.
C)  É a informação re�nada por meio da análise, informação interpretada e aplicada a um �m.
D)   São compostos de informações coletadas, informações estatísticas, analisadas e processadas.
  Além dos grupos de diversas ferramentas que trabalham com Big Data, ainda há como Tecnologias Big Data as Linguagens de Dados. 
 
  Podemos citar como Linguagens: R; Python e XPath.
 
Interpretadas como:
Alterar modo de visualização
1
2
3
4
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
I – Surgiu com um propósito bem especí�co de facilitar as análises estatísticas e visualização de dados, de forma que fosse mais amigável para os usuários.
II – Possui um foco generalista, serve desde fazer aplicações web, até fazer análises de dados em larga escala.
III - É uma linguagem de consulta que seleciona nós em um documento XML.
 
Relacione cada linguagem à interpretação e marque a opção correta:
A)  R – III; Python – II; XPath – I.
B)  R – I; Python – II; XPath – III. 
C)  R – I; Python – III; XPath – II.
D)  R – II; Python – I; XPath – III.
  Big Data é o nome que se dá à enorme quantidade de dados produzidos a cada segundo, por milhares de aparelhos do mundo inteiro, desde o seu celular, passando por
um avião pousando no aeroporto, ou em câmeras de trânsito, até satélites orbitando ao redor da Terra. Ainda, pode ser classi�cado como o processamento e análise de
conjuntos de dados extremamente grandes, que não podem ser processados utilizando-se ferramentas convencionais de processamento de dados.
 
  Quando estamos falando de Big Data, estamos tratando da capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise Diagnóstica.
 
  Assinale qual das opções abaixo descreve corretamente este tipo de análise.
 

A)    Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram, na tentativa de minimizar eventuais
problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração, correlações, detalhamento e descoberta de
dados. 
B)    Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados, dados
estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Arti�cial. Um exemplo seria a previsão do faturamento
para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha publicitária.
C)    Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e classi�cando os
dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar grá�cos e relatórios sobre orçamentos, vendas, receitas, processamento analítico on-
line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de um produto ou
faturamento da empresa nas últimas semanas ou meses, por exemplo.
D)    Utiliza a otimização de forma a identi�car as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise
descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias. Basicamente é uma forma de
de�nir qual a escolha será mais efetiva em determinada situação.
   Alguns autores a�rmam que a IoT não se resume apenas em aplicações e objetos, sensores e Internet, ou ainda, não apenas em infraestrutura, tecnologia, objetos e
software. Ainda existem os vértices denominados wearables.
 
   As informações a seguir podem ser geradas por Wearables:
   ( ) Exercícios físicos.
   ( ) Informações de saúde.
   ( ) Melhoria da alimentação.
   ( ) Encontrar promoções.
   ( ) Conexão com mídias sociais.
   ( ) Pagamento de contas.
 
   Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta:
A)   F; F; V; F; V; F.
B)   V; V; F; F; V; V.
C)   V; F; F; F; V; V.
D)   V; V; V; V; V; V. 
 “Aprendizado de máquina é a capacidade de melhorar o desempenho na realização de alguma tarefa por meio de experiência.” (Mitchell, 1997).
 
Um computador consegue aprender analisando cinco de�nições, como:
 
I. Ter conhecimento de algo pelo estudo, experiência ou aprendizado.
5
6
7
 
II. Tornar ciente por uma observação ou informação.
 
III. Memorizar.
 
IV. Ser informado ou averiguar algo.
 
V. Receber instrução.
 
Sobre as alternativas, marque a opção correta:  
A)   Apenas as alternativas I e II estão corretas. 
B)   Apenas as alternativas III e IV estão erradas.
C)   Alternativas I, II e III estão erradas. 
D)  Todas as alternativas estão corretas. 
O cientista de dados deve conhecer de tecnologia, de matemática, ter curiosidade e criatividade. Um cientista curioso é aquele que não se conforma com qualquer coisa,
qualquer informação. Agora, conseguir um pro�ssional com conhecimentos técnicos, quantitativos, curioso e colaborativo/comunicativo é bem difícil. Ao mesmo tempo,
este cientista de dados deve saber atuar como um líder, juntamente com pro�ssionais especializados no que fazem.
 
Quais pro�ssionais são aliados ao cientista de dados complementando uma equipe Analytics? Marque a alternativa correta. 
A)  Data Engineer; Equipe de Extração; DBA; Programador; Estatístico; Analista de Negócios; Designer.
B)   Data Engineer; Equipe Testes; DBA; Administrador; Estatístico; Analistade Negócios; Contador. 
C)  Data Engineer; Advogado; DBA; Programador; Estatístico; Analista de Negócios; Designer. 
D)  Data Engineer; Equipe de Manutenção; Gerente de Projetos; Suporte Técnico; Matemático; Analista de Negócios; Designer.
 O processo para obtenção dos dados possui diversas etapas, desde a coleta do dado até o seu descarte. Visando auxiliar estas necessidades para captar e gerar dados e
atribuir valor junto à tomada de decisões, há um processo genérico no qual é estruturado o ciclo de vida dos dados.
Quais etapas compõem esse processo genérico? Marque a alternativa correta.
 
A)   Desenvolvimento, Armazenamento, Transformação, Transição, Descarte. 
B)   Produção, Processamento, Transformação, Teste, Descarte.
C)   Produção, Armazenamento, Transformação, Análise, Descarte.
D)   Desenvolvimento, Processamento, Construção, Análise, Descarte.
A aprendizagem de máquina permite acelerar o processo de análise em Big Data, por exemplo, é possível identi�car um padrão de um consumidor que comprou um
determinado produto e, através deste padrão, prever o comportamento de compra do consumidor para comprar futuramente outros produtos.
 
São exemplos de aplicações de Aprendizagem de Máquina:
 
( ) Recomendação de �lmes, séries e vídeos;
 
( ) Tradução automática;
 
( ) Carros autônomos;
 
( ) Detecção de fraudes.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta:
A)  V; V; V; V. 
 B)  V; F; F; V. 
C)  F; F; V; V. 
D)  V; F; V; F.
8
9
10
O objetivo principal do modelo preditivo é ir além de saber o que aconteceu, ao fornecer uma melhor estimativa do que poderá acontecer no futuro. Usando dados,
algoritmos e métodos oriundos da estatística, aprendizado de máquinas e mineração de dados para se determinar as chances de resultados futuros, ou desconhecidos,
com base em dados passados.
 
O modelo preditivo apresenta três aspectos importantes e que precisam ser compreendidos.
 
Qual das alternativas apresenta os aspectos corretos?  
A)  Ensinar o Modelo; Fazer Análises; Gera Relatórios. 
B)  Coletar Dados; Gerir Dados; Prever Dados. 
C)  Coletar Dados; Treinar o Modelo; Fazer Predições. 
D)  Fazer predições; Fazer Análise; Avaliar Custos.
 Pesquisas apontam que cerca de 80% dos dados das empresas são dados não estruturados e que precisam ser tratados. 
 
Mas como podemos classi�car dados não estruturados?
Selecione a opção correta:

A)   Mescla de dados oriundos de várias fontes distintas, como vídeo, texto, áudio, imagens, entre outros. Sem tipo prede�nido (o dado vai sendo modelado conforme o
tempo vai passando, com os campos adaptados). 
B)  Possui esquema �xo, formato bem de�nido (inteiro, string, data), conhecimento prévio da estrutura de dados, simplicidade para relacionar as informações (relacionar
usuário, com entrega, com pedido), di�culdade para alterar o modelo.
C)  Trata dos conjuntos de dados que re�etem corretamente a realidade representada pela fonte de dados, que são consistentes entre si e que, portanto, são dados
válidos, não possui estrutura regular, pouco ou nenhum controle sobre a forma.
D)  Podem seguir diversos padrões, de forma heterogênea, dados embaralhados pela Web em arquivos HTML, XML, ou em Banco de Dados não relacionais
armazenados em Banco de Dados tradicionais ou relacionais, organizados em tabelas.
 Com certeza você já navegou nos sites da Net�ix ou da Amazon. Essas empresas são experts em realizar boas recomendações aos seus consumidores, seja para
produtos, séries, livros ou �lmes. Pois elas sabem muito bem aplicar Big Data e Machine Learning.
 
Algumas áreas nas quais são aplicadas Machine Learning:
 
( ) Análise de sentimento baseada em texto.
 
( ) Novos modelos de preci�cação.
 
( ) Resultados de pesquisa na web.
 
( ) Prever falhas em equipamentos.
 
( ) Detectar invasões na rede.
 
( ) Reconhecer padrões e imagens.
 
Classi�que as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: 
A)   V; V; F; F; V; V. 
B)  F; F; V; F; V; F. 
C)  V; F; F; F; V; V.
D)   V; V; V; V; V; V. 
 A integração de bases de dados diferentes pode apresentar ruídos, informações ambíguas, con�itantes ou mesmo errôneas. Portanto, a qualidade do processo de análise
dos dados dependerá da qualidade dos dados armazenados nas bases.
 
11
12
13
14
Neste contexto, quais das alternativas abaixo apresentam características importantes para se garantir a qualidade dos dados?
Marque a opção correta: 
A)  Integridade; Granularidade; Tempestividade; Precisão; Consistência; Flexibilidade. 
B)  Integridade; Portabilidade; Tempestividade; Precisão; Usabilidade; Flexibilidade. 
C)  Integridade; E�ciência; E�cácia; Precisão; Consistência; Flexibilidade.
D)  Integridade; Granularidade; Con�abilidade; Funcionabilidade; Consistência; Flexibilidade.
   Tem aviões mandando informações de por onde estão voando e quais as condições climáticas, permitindo voos muito mais seguros e quase independentes dos pilotos.
Até o seu carro pode transmitir quais são as condições da estrada em que você está dirigindo e acompanhar os dados do GPS de motoristas que ajudam a predizer os
horários e locais que estarão mais congestionados, em parte é isso que você faz quando usa aplicativos para cortar caminhos.
 
   Quando estamos falando de Big Data, estamos tratando a capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise Prescritiva.
Assinale qual das opções abaixo descreve corretamente este tipo de análise.
A)    Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram na análise descritiva, na tentativa de
minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração, correlações,
detalhamento e descoberta de dados em busca da descoberta das causas do problema.
B)    Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados, dados
estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Arti�cial. Um exemplo seria a previsão do faturamento
para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha publicitária.

C)    Utiliza a otimização de forma a identi�car as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise
descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias. Basicamente é uma forma de
de�nir qual a escolha será mais efetiva em determinada situação.
D)    Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e classi�cando os
dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar grá�cos e relatórios sobre orçamentos, vendas, receitas, processamento analítico on-
line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de um produto ou
faturamento da empresa nas últimas semanas ou meses, por exemplo.
   Cada vez mais organizações buscam formas sistemáticas para identi�car, gerenciar e integrar dados que se encontram disponíveis em diversos meios. O que se torna
um grande desa�o diante de uma quantidade incalculável de dados.
 
  Neste contexto, pode-se a�rmar que as organizações precisam buscar que tipo de apoio para captar, organizar, analisar e gerenciar dados dos seus consumidores e suas
operações, trazendo de fato impactos decisivos para o mercado e a concorrência?
 
  Marque a alternativa correta:
 
A)   Analista de Negócios e Administradores.
B)   Administrador de Bancode Dados e Desenvolvedores.
C)   Pro�ssionais, como equipes de analytics de forma integrada.
D)   Analista de Sistemas e Testers.
  O armazenamento de dados, ou retenção de informações usando uma determinada tecnologia para guardar e manter dados acessíveis quando necessário, exige a
atenção de alguns aspectos. 
 
  Que aspectos devem ser considerados para o armazenamento de dados?  Marque a opção que apresenta corretamente os mesmos.
A)    Usabilidade, Flexibilidade, Segurança.
B)    Facilidade, Escalabilidade, Flexibilidade.
C)    Escalabilidade; Alta Disponibilidade; Flexibilidade.
D)    Portabilidade, Alta Disponibilidade; Flexibilidade. 
  Aprovado pelo plenário do Senado Federal, o PLC 53/2018 dispõe sobre a proteção de dados pessoais e altera a Lei 12.965/16 do Marco Civil da Internet, sendo
consolidada como a Lei Geral de Proteção de Dados Brasileira (LGPD). 
 
   Recentemente, Josefa Christina fez uma compra on-line em um site e-commerce, no qual forneceu seus principais dados pessoais, como: nome, CPF, e-mail, telefone,
endereço. Logo em seguida, passou a receber diversas ofertas de outros sites parceiros do e-commerce no qual ela havia realizado a compra, mas em momento algum
concordou em compartilhar os seus dados. Diante deste cenário e de acordo com a Lei Geral de Proteção de Dados Brasileiros, qual direito não foi atendido pelo site em
que Josefa realizou suas compras on-line?  Marque a opção correta:
A) Direito do Consumidor
15
16
17
18
A)  Direito do Consumidor.
B)  Direito à Privacidade.
C)  Regras para empresas.
D)  Segurança Jurídica.
   Nas palavras de Eric Siegel, em seu livro Predictive Analytics: “Os dados que coletamos atualmente nos permitem ver coisas que até pouco tempo atrás eram grandes
demais para enxergarmos.” 
 
   Quando estamos falando de Big Data, em uma das suas etapas tratamos a capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a
Análise Preditiva. Assinale qual das opções abaixo descreve corretamente este tipo de análise.
 
A)    Utiliza a otimização de forma a identi�car as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise
descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias. Basicamente é uma forma de
de�nir qual a escolha será mais efetiva em determinada situação.
B)     Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e classi�cando os
dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar grá�cos e relatórios sobre orçamentos, vendas, receitas, processamento analítico on-
line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de um produto ou
faturamento da empresa nas últimas semanas ou meses, por exemplo.

C)    Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados, dados
estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Arti�cial. Um exemplo seria a previsão do faturamento
para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha publicitária. 
D)    Se preocupa exclusivamente com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram, na tentativa de
minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração, correlações,
detalhamento e descoberta de dados em busca da descoberta das causas do problema.
Até mesmo na área de meio ambiente há a utilização de Machine Learning, em que satélites monitoram águas costeiras, gerando imagens diariamente para detecção de
manchas de óleo, permitindo treinar um sistema detector de contaminação.
 
 Mas para fazer adoção e o desenvolvimento de Machine Learning, alguns passos devem ser seguidos, como:
 
I. Data Selection;
 
II. Feature Selection;
 
III. Model Selection;
 
IV. Learning
 
Que podem ser interpretados como:
 
P - escolher as características dos dados empregados é um passo muito importante. Deve-se indicar os dados menos sensíveis a ruídos e que sejam mais fáceis de serem
manipulados. Nesta ocasião é realizada a divisão entre os dados que serão utilizados para treinamento do modelo e os dados para realização dos testes.
 
Q- carece iniciar por modelos mais simples e acrescentar a complexidade se necessário. Este modelo é uma parte de uma realidade ocorrida, em que se deve obter total
controle sobre aquilo que aconteceu. Desta forma será possível realizar as fases seguintes de treinamento e testes identi�cando se o algoritmo será capaz de prever com
o maior nível de assertividade.
 
R- a assimilação dos dados que serão empregados para atingir o objetivo é essencial para o acontecimento do projeto. Este processo compreende a limpeza, seleção e
adequação dos dados que serão empregados. Se você não tem os dados adequados, não há como buscar fazer previsões.
 
S- a etapa de treinamento é bem importante para que o processo seja concluído com êxito. Aproxime os parâmetros adequados que minimizem o erro do algoritmo.
Entenda que o algoritmo precisa destes parâmetros e dos resultados para saber como se comportar nas fases posteriores.
 
Relacione cada passo à interpretação e marque a opção correta: 
A)   I – R; II – P; III – Q; IV – S. 
B)   I – R; II – S; III – Q; IV – P. 
C)  I – P; II – Q; III – R; IV – S. 
D) I – S; II – P; III – Q; IV – R
19
20
Uniasselvi © 2021
D)  I – S; II – P; III – Q; IV – R.
Voltar

Outros materiais