Prévia do material em texto
05/07/22, 13:25 EPS
https://simulado.estacio.br/alunos/ 1/3
JOÃO BATISTA MATTOS BEJARANO
202001039252
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AVS
Aluno: JOÃO BATISTA MATTOS BEJARANO 202001039252
Professor: ROBSON LORBIESKI
Turma: 9001
EEX0174_AVS_202001039252 (AG) 17/06/2022 19:22:56 (F)
Avaliação:
9,0
Av. Parcial.:
2,0
Nota SIA:
10,0 pts
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1. Ref.: 6076913 Pontos: 0,00 / 1,00
A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são
assim definidos devido:
A sua baixa qualidade.
O fato de requererem muito mais pré-processamento.
O fato de virem de uma fonte alternativa não convencional.
O fato de ocuparem menos espaço de memória.
O fato de terem sido obtidos a partir de terceiros.
2. Ref.: 6076764 Pontos: 1,00 / 1,00
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos
afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs,
Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
Apenas I e II.
Apenas I e III.
Apenas I.
Apenas II.
Apenas II e III.
02318 - BIG DATA ANALYTICS
3. Ref.: 6075834 Pontos: 1,00 / 1,00
Educational Performace Solution EPS ® - Alunos
javascript:voltar();
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076913.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076764.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075834.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')
05/07/22, 13:25 EPS
https://simulado.estacio.br/alunos/ 2/3
As redes neurais são implementadas em Python através de uma biblioteca de processamento de cálculos em
paralelo baseada em grafos. Qual o nome desta biblioteca?
Plotly
Tensorflow
Numpy
Pandas
Scipy
4. Ref.: 6075828 Pontos: 1,00 / 1,00
Os modelos simbólicos são aqueles que:
Se baseiam em lógica e regras de inferência para aprender e raciocinar
Se baseiam estritamente em dados e inferências estatísticas em cima deles
São aqueles que lidam apenas com problemas numéricos
Se baseiam em táticas de agrupamento por similaridade
São aqueles que só lidam com problemas categóricos
02508 - HADOOP E ARMAZENAMENTO DE DADOS
5. Ref.: 6076140 Pontos: 1,00 / 1,00
Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela
geração de fragmento para os componentes da fase de redução.
Leitor de registros.
Particionador.
Mapeador.
Combinador.
Redutor.
6. Ref.: 6075861 Pontos: 1,00 / 1,00
Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de
Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o
componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop.
Replicador
Bloco de dados
HServerMap
DataNode
NameNode
02727 - PRINCÍPIOS DE BIG DATA
7. Ref.: 6067294 Pontos: 1,00 / 1,00
Selecione a opção a respeito da computação em nuvem.
trata-se da utilização de aplicações com finalidades específicas
é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet
é a definição para aplicações de Big Data que utilizam os protocolos de internetEducational Performace Solution EPS ® - Alunos
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076140.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075861.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067294.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')
05/07/22, 13:25 EPS
https://simulado.estacio.br/alunos/ 3/3
é uma outra forma de denominar a internet das coisas
é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas
8. Ref.: 6067203 Pontos: 1,00 / 1,00
Selecione a opção correta sobre o uso de Big Data.
Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados.
É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas.
O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado.
Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de
dados.
Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.
02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9. Ref.: 6076005 Pontos: 1,00 / 1,00
As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção
correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em
grafos.
RDDs
MLlib
Spark Core
Spark Streaming
GraphX
10. Ref.: 6076009 Pontos: 1,00 / 1,00
A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para
aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o
Cientista de dados atribuir nome para as colunas.
RDD
numpy.array
SQL
PySpark
DataFrame
Educational Performace Solution EPS ® - Alunos
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067203.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076005.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076009.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')