Buscar

TOPICO DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Simulado AV
Teste seu conhecimento acumulado
 
Disc.: TÓPICOS DE BIG DATA EM PYTHON 
Aluno(a): WILLAMES RIBEIRO DE ASSIS 202003083551
Acertos: 6,0 de 10,0 29/03/2022
 
 
Acerto: 1,0 / 1,0
Em relação aos V's que caracterizam os projetos de Big Data, selecione a opção que trata do processamento
dos dados.
variedade
volume
veracidade
 velocidade
valor
Respondido em 29/03/2022 17:35:29
 
 
Explicação:
A característica velocidade trata da rapidez de geração e processamento dos dados. Variedade diz respeito ao
formato dos dados, valor está relacionado ao resultado útil da análise dos dados, volume significa a quantidade
de dados disponíveis para tratamento e a veracidade diz respeito à confiabilidade da origem dos dados.
 
 
Acerto: 0,0 / 1,0
Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
 É um ecossistema que envolve software e hardware
É um programa
É um protocolo de internet das coisas
 É uma placa de hardware
É o outro nome para Raspberry PI
Respondido em 29/03/2022 17:38:41
 
 
Explicação:
O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto,
não é um programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI
não é o mesmo que Arduino, pois se trata de uma outra tecnologia para internet das coisas.
 
 Questão1
a
 Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
 
Acerto: 1,0 / 1,0
Selecione a opção que indica o processo responsável por executar uma tarefa atribuída a ele pelo Job Tracker.
 Task Tracker
Job Tracker Slave
MapReduce
MapTracker
MapJob
Respondido em 29/03/2022 17:56:54
 
 
Explicação:
O JobTracker envia as informações necessárias para a execução de uma tarefa para o TaskTracker que, por sua
vez, executa a tarefa e envia os resultados de volta para JobTracker, além de fazer o seu rastreamento.
 
 
Acerto: 0,0 / 1,0
Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela
geração de pares intermediários de valor e chave.
Redução
Combinação
 Agrupamento
Gravação da saída
 Embaralhamento
Respondido em 29/03/2022 18:26:16
 
 
Explicação:
Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo
MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução,
o que é realizado em paralelo com outras tarefas da fase de mapeamento.
 
 
Acerto: 1,0 / 1,0
O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do
Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para
utilização do PySpark.
Java e R
Hadoop e Spark
Python e Escala
 Java e Python
Casandra e Spark
Respondido em 29/03/2022 18:24:35
 
 
Explicação:
Gabarito: Java e Python
Justificativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e configuração
do Java, Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai
rodar. No caso do Google Colab, é necessário instalar o FindSpark e o próprio PySpark também.
 Questão3
a
 Questão4
a
 Questão5
a
 
 
Acerto: 0,0 / 1,0
Observe o trecho de código abaixo
query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor) 
registros = spark.sql(query)
Selecione a opção correta a respeito dele.
É possível afirmar que a tabela_teste existe.
 Trata-se de um exemplo de utilização do Spark SQL
É um exemplo de aplicação de GraphX.
A execução do trecho de código vai funcionar corretamente.
 A implementação do trecho de código está errada.
Respondido em 29/03/2022 18:23:47
 
 
Explicação:
Gabarito: Trata-se de um exemplo de utilização do Spark SQL
Justificativa: O trecho de código corresponde a uma aplicação do Spark SQL. Esse componente viabiliza a
utilização de código SQL que facilita bastante a manipulação de dados estruturados. A implementação está
codificada corretamente, apesar de não ser possível afirmar se vai executar sem erros, pois no código não
aparecem informações que permitam fazer afirmações sobre a execução.
 
 
Acerto: 1,0 / 1,0
A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta
laços condicionais e instruções de repetição.
for i in range(10):
 if (i%2==0):
 print(i)
 Qual a saída esperada após a execução do programa?
 Serão impressos no console os números pares entre 0 e 9.
Serão impressos no console os números racionais entre 0 e 9.
Serão impressos no console os números pares entre 1 e 10.
Serão impressos no console os números ímpares entre 0 e 10.
Serão impressos no console os números ímpares entre 0 e 9.
Respondido em 29/03/2022 18:08:08
 
 
Explicação:
O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do
laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um
número é par ou não.
 
 
Acerto: 1,0 / 1,0
A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de
 Questão6
a
 Questão7
a
 Questão8
a
dados mais indicada para dados temporais?
Gráfico de Estrela.
Gráfico de Faces de Chernoff.
 Gráfico de Linha.
Gráfico de Barra.
Gráfico de Matriz de Dispersão.
Respondido em 29/03/2022 18:11:29
 
 
Explicação:
O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando
através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam
tipos de visualização inadequados para dados temporais.
 
 
Acerto: 1,0 / 1,0
Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
KDM.
SIGM.
SIGKDD.
 CRISP-DM.
KDD-DM.
Respondido em 29/03/2022 18:14:01
 
 
Explicação:
O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de
entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do
artefato de aprendizado de máquina.
 
 
Acerto: 0,0 / 1,0
Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a
relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo
principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
IA Pura
IA Quântica
 IA Simbólica
 IA SubSimbólica
IA Biológica
Respondido em 29/03/2022 18:22:26
 
 
Explicação:
As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir
de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos
simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão.
 
 
 
 Questão9
a
 Questão10
a
javascript:abre_colabore('38403','279227573','5169491874');
 
 
 
 
 
 
 
 
javascript:abre_colabore('38403','279227573','5169491874');

Mais conteúdos dessa disciplina