AVS - TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

5

0

5

0

Rubens Saito

09/12/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.813 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Disciplina: TÓPICOS DE BIG DATA EM PYTHON
AVS
Aluno:

Professor:
Turma:

27/11/2022 20:42:00 (F)
Avaliação:
8,0
Av. Parcial.:
2,0
Nota SIA:
10,0 pts

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1.
Ref.: 6076913
Pontos: 1,00 / 1,00

A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido:

A sua baixa qualidade.

O fato de virem de uma fonte alternativa não convencional.
O fato de terem sido obtidos a partir de terceiros.

O fato de requererem muito mais pré-processamento.

O fato de ocuparem menos espaço de memória.

2.
Ref.: 6076764
Pontos: 0,00 / 1,00

A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.

Apenas II e III.

Apenas II.
Apenas I e II.

Apenas I.
Apenas I e III.

02318 - BIG DATA ANALYTICS
3.
Ref.: 6075829
Pontos: 0,00 / 1,00

Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?

IA SubSimbólica
IA Simbólica

IA Pura

IA Biológica

IA Quântica

4.
Ref.: 6075831
Pontos: 1,00 / 1,00

Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?

KDD-DM.

KDM.

SIGM.
CRISP-DM.

SIGKDD.

02508 - HADOOP E ARMAZENAMENTO DE DADOS
5.
Ref.: 6075862
Pontos: 1,00 / 1,00

Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.

hdfs-site.xml

mapred-site.xml

hadoop-env.cmd

yarn-site.xml

core-site.xml

6.
Ref.: 6076140
Pontos: 1,00 / 1,00

Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução.

Leitor de registros.
Particionador.

Redutor.

Mapeador.

Combinador.

02727 - PRINCÍPIOS DE BIG DATA
7.
Ref.: 6067388
Pontos: 1,00 / 1,00

Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos.

Melhorar a interatividade com o usuário

Ampliar o volume de dados da aplicação
Obter dados que sirvam como base na tomada de decisão

Aumentar a diversidade dos dados

Aumentar a complexidade do processo de gestão dos dados

8.
Ref.: 6067203
Pontos: 1,00 / 1,00

Selecione a opção correta sobre o uso de Big Data.

Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.

É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas.
O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado.

Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados.

Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados.

02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9.
Ref.: 6082368
Pontos: 1,00 / 1,00

O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark.

collect, flatMap e sample.

reduce, map e filter.

take, filter e sample.
first, take e reduce.

count, collect e map.

10.
Ref.: 6076005
Pontos: 1,00 / 1,00

As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos.

RDDs
GraphX

Spark Streaming

Spark Core

MLlib