AV TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

14

0

14

0

1

Tiago Lima

20/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.733 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Disciplina: TÓPICOS DE BIG DATA EM PYTHON
AV
Aluno: TIAGO JOSE DE LIMA
202004083902
Professor: ROBSON LORBIESKI
Turma: 9001
EEX0174_AV_202004083902 (AG)
03/06/2022 10:03:14 (F)
Avaliação:
2,0
Nota Partic.:
Av. Parcial.:
2,0
Nota SIA:
2,0 pts

Estação de trabalho liberada pelo CPF 13936051763 com o token 267030 em 03/06/2022 10:02:28.
O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0.

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1.
Ref.: 6076764
Pontos: 0,00 / 1,00

A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.

Apenas II.

Apenas II e III.
Apenas I e II.

Apenas I.
Apenas I e III.

2.
Ref.: 6076846
Pontos: 0,00 / 1,00

Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como:

Faltantes.

Enviesados.

Nulos.

Embaralhados.
Corrompidos.

02318 - BIG DATA ANALYTICS
3.
Ref.: 6075832
Pontos: 0,00 / 1,00

Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:

Transformação de Dados.
Pré-Processamento .
Avaliação.

Descoberta de Padrões.

Coleta de Dados.

4.
Ref.: 6075830
Pontos: 0,00 / 1,00

O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como:

Informações.

Observações.

Conhecimento.
Big Data.

Dados Faltantes.

02508 - HADOOP E ARMAZENAMENTO DE DADOS
5.
Ref.: 6076138
Pontos: 0,00 / 1,00

Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.

Indivisibilidade.

Consistência.

Isolamento.

Durabilidade.
Atomicidade.

6.
Ref.: 6075861
Pontos: 0,00 / 1,00

Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop.

Replicador
NameNode

HServerMap

Bloco de dados
DataNode

02727 - PRINCÍPIOS DE BIG DATA
7.
Ref.: 6067294
Pontos: 1,00 / 1,00

Selecione a opção a respeito da computação em nuvem.

é uma outra forma de denominar a internet das coisas

é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas
é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet

é a definição para aplicações de Big Data que utilizam os protocolos de internet

trata-se da utilização de aplicações com finalidades específicas

8.
Ref.: 6067388
Pontos: 0,00 / 1,00

Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos.

Aumentar a complexidade do processo de gestão dos dados
Melhorar a interatividade com o usuário
Obter dados que sirvam como base na tomada de decisão

Aumentar a diversidade dos dados

Ampliar o volume de dados da aplicação

02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9.
Ref.: 6076011
Pontos: 0,00 / 1,00

A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark.

R
Python

Java Script

Java
Scala

10.
Ref.: 6082362
Pontos: 1,00 / 1,00

O MapReduce é uma técnica de computação distribuída considerada extremamente eficiente para o processamento de dados, desempenhando papel fundamental no Spark. Em relação ao MapReduce, selecione a opção correta.

A principal característica do MapReduce é a utilização eficiente da memória.

Projetos de big data só podem ser tratados por MapReduce.

As fases de processamento do MapReduce podem variar de acordo com a aplicação.
Pode ser aplicada para projetos que envolvam grandes volumes e variedade de dados.

Só é possível utilizar o MapReduce no Spark através do PySpark.