Buscar

Atividade Objetiva 3_ Big Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 1/9
Atividade Objetiva 3
Entrega 20 nov em 23:59 Pontos 1 Perguntas 5
Disponível 8 ago em 0:00 - 20 nov em 23:59 Limite de tempo Nenhum
Tentativas permitidas 2
Instruções
Este teste foi travado 20 nov em 23:59.
Histórico de tentativas
Tentativa Tempo Pontuação
MANTIDO Tentativa 2 10 minutos 0,6 de 1
MAIS RECENTE Tentativa 2 10 minutos 0,6 de 1
Tentativa 1 172 minutos 0,6 de 1
Pontuação desta tentativa: 0,6 de 1
Enviado 19 nov em 8:27
Esta tentativa levou 10 minutos.
Importante:
Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que
você clique em "FAZER O QUESTIONÁRIO", no final da página.
0 / 0,2 ptsPergunta 1
Leia o texto a seguir: 
Map Reduce é um processo programável geralmente em Python muito
importante para Big Data, uma vez que ajuda a entender
comportamentos e tendências de grandes volumes de dados de uma
forma simples e eficaz que colabora imensamente para a tomada de
decisões em tempo real baseada em dados.
Qual alternativa indica a ordem correta do processo de Map/Reduce?
A+
A
A-
https://famonline.instructure.com/courses/24362/quizzes/109271/history?version=2
https://famonline.instructure.com/courses/24362/quizzes/109271/history?version=2
https://famonline.instructure.com/courses/24362/quizzes/109271/history?version=1
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 2/9
 
Planejamento – Identificação de fonte de dados – listagem de termos
desejados – programação – mapeamento – geração de arquivo final
com quantidade de ocorrências – atribuição de chaves únicas -
contagem – contagem de ocorrências.
 
Planejamento – mapeamento – Identificação de fonte de dados –
listagem de termos desejados – programação – atribuição de chaves
únicas – contagem – geração de arquivo final com quantidade de
ocorrências – contagem de ocorrências.
 
Planejamento – Identificação de fonte de dados – listagem de termos
desejados – mapeamento – atribuição de chaves únicas – contagem –
contagem de termos – geração de arquivo final com quantidade de
ocorrências – programação.
ocê respondeuocê respondeu
A alternativa está incorreta. A programação precisa ocorrer antes
do mapeamento, pois antes de mapear a frequência de termos e
frases em uma base de dados volumosa, é preciso planejar junto
com o time de negócios e entender os objetivos da tarefa, então
identificar de onde os dados sem estrutura estão para realizar a
tarefa. Logo após a identificação dos dados originais, é
necessário identificar os termos ou frases que serão mapeados
para aí sim começar a programação do programa Map Reduce,
que ao ser executado mapeará todos os termos e frases
presentes nas fontes de dados identificadas anteriormente e
atribuirá uma chave única para cada um dos termos, que ao se
repetirem ao longo do mapeamento, ganham incremento em seu
valor como uma variável inteira, que após a redução, ou seja,
limpeza dos dados, será exibida em um documento em frente do
termo como no exemplo abaixo, onde a palavra “horrível” e
“cancelar” foram encontradas 150 e 90 vezes, respectivamente:
 
Horrível (150);
Cancelar (90).
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 3/9
 
Planejamento – Identificação de fonte de dados – listagem de termos
desejados – programação – mapeamento – atribuição de chaves
únicas – contagem – contagem de termos – geração de arquivo final
com quantidade de ocorrências.
esposta corretaesposta correta
 
Programação – planejamento – Identificação de fonte de dados –
listagem de termos desejados – contagem de termos – mapeamento –
atribuição de chaves únicas – contagem – geração de arquivo final com
quantidade de ocorrências.
0,2 / 0,2 ptsPergunta 2
Leia o texto a seguir:
Hadoop é um ecossistema com diversas soluções embutidas que
podem ou não funcionar independentemente. Spark, Map/Reduce,
YARN e HDFS são exemplos destas soluções nativas do Hadoop. 
Considerando o texto, avalie as afirmações abaixo:
I. Hadoop pode funcionar sem Spark, pois possui seu próprio
processamento.
II. Map/reduce é uma solução pronta que não exige programação.
III. HDFS é o sistema de arquivos distriuídos do Hadoop.
É correto o que se afirma em:
 I e II, apenas. 
 I e III, apenas. Correto!Correto!
 III, apenas. 
 II e III, apenas. 
 I, apenas. 
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 4/9
A Alternativa está correta.
Apesar de Spark melhorar as funções de processamento e
comunicação de dados através de processamento em memória
e facilidade de conexão através de APIs, Apache Hadoop pode
realizar processamento de dados e aplicações Map/Reduce
sem Spark. Um dos motivos dessa habilidade de funcionamento
sem Spark é seu sistema de arquivos distribuídos (HDFS)
baseado no Google File System.
0,2 / 0,2 ptsPergunta 3
Leia o texto a seguir:
Linguagens de programação podem ser de baixo ou alto nível. Uma
linguagem de baixo nível se aproxima mais da linguagem de máquina,
o que dificulta sua aprendizagem, mas também aumenta as
possibilidades de criação. Linguagens de alto nível, porém, são mais
parecidas com a linguagem humana, o que facilita a aprendizagem e
ao mesmo tempo limita certas funções. Por este motivo, quanto mais
alto o nível de uma linguagem, mais específica para determinados
projetos ela se torna. 
Linguagens de programação acessíveis são o objetivo de todo
desenvolvedor de soluções e fabricante de dispositivos. Isso acontece,
pois quanto mais pessoas dominarem uma linguagem de
programação, mais popular e inovadora esta linguagem se torna. Isso,
por sua vez, faz com que mais fabricantes e empresas usem esta
linguagem em suas soluções, dispositivos e projetos. 
Em Big Data não é diferente. Apache Hive e Apache Pig são exemplos
de diferentes soluções para facilitação de scripts de programação em
ambientes de processamento de dados e Big Data.
Considerando as reflexões apresentadas, assinale a opção correta:
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 5/9
 
É importante levar em consideração o objetivo do projeto antes de
decidir entre Apache Hive e Apache Pig, uma vez que seus propósitos
são diferentes e, por mais fáceis que possam ser, contornar suas
limitações pode ser um atraso para qualquer projeto.
Correto!Correto!
 
Por serem linguagens de alto nível, as linguagens usadas em Apache
Pig e Apache Hive são de fácil aprendizado, o que significa que suas
limitações também são de fácil solução.
 
É muito importante levar em consideração o objetivo de cada empresa
antes de decidir qual linguagem de programação deve ser empregada,
uma vez que o nível de conhecimento dos funcionários, não as
limitações da linguagem, deve ser respeitado.
 
Não é necessário levar em consideração a dificuldade de
aprendizagem e o objetivo de uma linguagem de programação, uma
vez que uma estratégia de contratação eficaz seleciona os melhores
funcionários que, independentemente de seu departamento, terá
conhecimento suficiente para operar as tecnologias.
 
É importante levar em consideração o objetivo do projeto antes de
decidir entre uma linguagem de alto nível e uma de baixo nível, uma
vez que seus propósitos são parecidos e, por mais difíceis que
linguagens de alto nível podem ser, existem milhares de profissionais
prontos para usá-las.
A alternativa está correta. É importante considerar o objetivo do
projeto antes de empregar uma linguagem de programação,
pois funções e propriedades cruciais de algumas linguagens
podem ser limitantes em determinados projetos. Apache Pig,
por exemplo, foi criado para ser voltado para programadores e
pesquisadores, enquanto Apache Hive é mais voltado para
analistas de dados dentro de corporações.
A+
A
A-
23/11/202208:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 6/9
0,2 / 0,2 ptsPergunta 4
Leia o texto a seguir:
Sabe-se que sistemas gerenciadores de bancos de dados são o
coração da revolução dos dados. Por mais rápido que um conjunto de
computadores possa ser, muito se deve ao software em uso para que
se tenha um processamento de dados seguro, rápido e eficaz. 
Considerando o texto, avalie as afirmações abaixo:
I. Operações CRUD em dados podem atrasar todo um sistema que
preza pela segurança e consistência de dados.
II. É recomendável contornar as limitações de software adicionando
mais hardware ao sistema distribuído ao invés de usar NoSQL.
III. Sistemas NoSQL podem abrir mão de aspectos de segurança e até
perder dados para focar na velocidade de processamento distribuído.
IV. Em grandes empresas, não é permitido abrir mão de consistência
de dados ou alguns aspectos de segurança em prol da velocidade.
É correto o que se afirma em:
 I e II, apenas. 
 I e IV, apenas. 
 IV, apenas. 
 II, apenas. 
 I e III, apenas. Correto!Correto!
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 7/9
Alternativa correta.
Operações CRUD, que são as de criar, ler atualizar e excluir
dados, podem travar dados e gerar fila de esperas grandes
demais, que não só atrasam o processamento geral como
também podem parar aplicações e usuários dependentes de
dados que estejam sendo usados com consistência de dados e
segurança.
Por isso é que sistemas NoSQL são usados em sistemas Big
Data e em processamento analítico onde, mesmo que possa
haver alguma perda, a velocidade e disponibilidade são mais
importantes.
0 / 0,2 ptsPergunta 5
Leia o texto a seguir:
Sistemas Gerenciadores de Bancos de Dados são a essência da
evolução em Big Data e em ciências de dados em geral. Graças aos
tradeoffs da segurança limitante de velocidade e flexibilidade dos
sistemas SQL ou relacionais pela flexibilidade e velocidade dos dados
não estruturados de sistemas NoSQL ou não relacionais, é possível
receber dados de diferentes fontes, aplicações e usuários em tempo
real e ter inteligência gerada destes dados para tomada de decisão. 
Sobre estes sistemas interconectados que recebem dados de milhares
de aplicativos, contas de redes sociais, entradas manuais e leitura de
bancos de dados com milhares de formatos diferentes, podemos dizer
que um sistema de fluxo de dados como Apache Kafka permite que
tudo isso aconteça sem a necessidade de softwares middleware para
tradução de dados e estruturação de acordo com o esquema de dados
que um banco tradicional ou relacional teria. 
Refletindo sobre Apache Kafka e sistemas de bancos de dados não
relacionais, avalie as seguintes asserções e a relação proposta entre
elas.
I. Todo sistema que emprega um banco de dados NoSQL ou não
relacional deve necessariamente empregar Apache Kafka.
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 8/9
PORQUE
II. Todo sistema não relacional necessariamente se conecta com
milhares de fontes de dados não estruturados e precisam gerar
inteligência em tempo real para tomada de decisões.
Acerca dessas asserções, assinale a opção correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma
justificativa da I.
 
As asserções I e II são proposições verdadeiras, mas a II não é uma
justificativa da I.
 
A asserção I é uma proposição falsa, e a II é uma proposição
verdadeira.
ocê respondeuocê respondeu
 As asserções I e II são proposições falsas. esposta corretaesposta correta
 
A asserção I é uma proposição verdadeira, e a II é uma proposição
falsa.
A alternativa está incorreta. Nem todo sistema NoSQL precisa
de Kafka, pois é possível usar um sistema não estruturado para
projetos menores que não exijam tamanha conectividade e
poder de processamento. De fato, planejar e estruturar um
sistema com Kafka é uma tarefa difícil que exige muito
conhecimento e poder de processamento que geralmente é
encontrado e necessário em empresas como Netflix e Amazon.
Logo, tanto a asserção I quanto a asserção II são proposições
falsas.
A+
A
A-
23/11/2022 08:01 Atividade Objetiva 3: Big Data
https://famonline.instructure.com/courses/24362/quizzes/109271 9/9
Pontuação do teste: 0,6 de 1
A+
A
A-

Continue navegando

Outros materiais