Logo Passei Direto

A maior rede de estudos do Brasil

Grátis
4 pág.
p1_Preparação e Análise Exploratória de Dados (19364)

Pré-visualização | Página 1 de 2

24/09/2021 11:23
1/4
Avaliação I - Individual FLEX (Cod.:680836) 
Código da prova: 36784331 
Disciplina: Preparação e Análise Exploratória de Dados (19364) 
Período para responder: 18/09/2021 - 03/10/2021 
Peso: 1,50 
1 - Segundo Bi4all (2021, s.p), "sabia que em 2020, a cada minuto, foram publicadas 347 mil novas Stories
no Instagram, 147 mil fotos no Facebook e 41 milhões de mensagens foram trocadas no WhatsApp?". Cabe
destacar "que mais de 4,5 biliões de pessoas usam internet, enquanto os utilizadores das redes sociais
ultrapassaram já os 3,8 biliões com quase 60% da população mundial online. Estes números ilustram bem a
quantidade de dados que circulam no mundo, o que oferece imensas oportunidades e desafios às empresas
que transformam estes dados em valor para o negócio" (BI4ALL, 2021, s.p.). Com base no volume de dados
não significa qualidade de dados, analise as sentenças a seguir:
I- A preparação de dados é essencial para todo e qualquer projeto que envolver a análise exploratória de
dados. 
II- A qualidade do insumo interfere diretamente na qualidade do produto. 
III-Quanto maior a quantidade de dados melhor será o produto final. 
IV-A qualidade do produto final está diretamente relacionada a se ter o maior número possível de
informação. 
Assinale a alternativa CORRETA:
FONTE: BI4ALL. 2021: A Soberania dos dados. 2021. Disponível em:
https://www.bi4all.pt/noticias/blog/2021-a-soberania-dos-dados/. Acesso em: 25 maio 2021.
A ) As sentenças II e IV estão corretas.
B ) As sentenças III e IV estão corretas.
C ) As sentenças I e II estão corretas.
D ) As sentenças I e III estão corretas.
2 - Em tecnologia da informação, temos os mais diferentes profissionais envolvidos em resolver problemas.
Como engenheiro de dados, cientista de dados, analista de negócio, entre outros. As responsabilidades de
cada um podem se intercalar no decorrer do projeto. Nesse sentido, o que se espera que um engenheiro de
dados faça?
A ) Será o responsável por fazer a extração de conhecimento dos dados.
B ) Será o responsável por extrair o conhecimento dos dados e também utilizar o conhecimento obtido para
gerar relatórios de acordo com a necessidade das partes interessadas.
C ) Será o responsável por cuidar de como os dados serão armazenados e processados.
D ) Será o responsável por utilizar o conhecimento obtido para gerar relatórios de acordo com a
necessidade das partes interessadas.
3 - Ao buscar uma solução de um determinado problema, os profissionais envolvidos fazem a identificação
dos dados relacionados com ele. Esses dados podem ser internos e externos. Cabe destacar que essa
identificação inicial será o ponto de partida para fazer a coleta dos dados e a integração em um conjunto de
dados que será utilizado no projeto. Com relação aos tipos de dados identificados e suas fontes, analise as
sentenças a seguir:
I- Os dados estruturados são oriundos de bancos de dados relacionais da organização.
II- Os dados não estruturados e semiestruturados podem ser provenientes das mais diversas fontes, como de
arquivos de texto, imagem, áudio, vídeo, planilhas, além de pesquisas realizadas de mercado.
III- As redes sociais e bases externas abertas não são relevantes no contexto da questão.
Assinale a alternativa CORRETA:
A ) As sentenças II e III estão corretas.
24/09/2021 11:23
2/4
B ) As sentenças I e III estão corretas.
C ) As sentenças I e II estão corretas.
D ) Somente a sentença I está correta.
4 - A organização SGB elencou alguns números para termos uma ideia melhor do volume de dados. "O
volume de dados criado nos últimos anos é maior do que a quantidade produzida em toda a história." (SGB,
2019, s.p.). O estimado para o ano 2020 é que "[...] existirão cerca de 50 bilhões de dispositivos conectados
desenvolvidos para a coleta, análise e compartilhamento de dados. A produção de dados dobra a cada dois
anos e a previsão é de que em 2020 sejam gerados 350 zettabytes de dados ou 35 trilhões de gigabytes; a
rede social Facebook gera mais de 500 terabytes de dados diariamente. O volume de dados no Brasil pode
chegar a 1,6 bilhão de gigabytes em 2020" (SGB, 2019, s.p.). Nesse sentido, qual é o tamanho de um ZB?
FONTE: SGB. O que você precisa entender sobre dados para se tornar uma organização Data Driven. 2019.
Disponível em: http://socialgoodbrasil.org.br/2019/05/15/entenda-tudo-sobre-dados-para-se-tornar-uma-
organizacao-data-driven/. Acesso em: 11 set. 2020.
A ) Equivale a um trilhão de bytes.
B ) Equivale a um trilhão de megabytes.
C ) Equivale a um trilhão de gigabytes.
D ) Equivale a um trilhão de bits.
5 - Em computação, como reconhecimento de padrões, recuperação de informações, aprendizado de
máquina, mineração de dados e inteligência na Web, é necessário preparar dados de qualidade, processando
os dados brutos. Para Mashanovich (2017), pelo menos 70%, às vezes mais de 90% do tempo total do projeto
é dedicado à preparação de dados: coleta de dados, combinar as diversas fontes de dados, agregações,
transformações, limpeza de dados e "fatiar e cortar em cubos". Essa atividade ainda envolve examinar a
amplitude e profundidade dos dados para obter um entendimento claro, além de transformar a quantidade de
dados em qualidade de dados (MASHANOVICH, 2017). Com base na importância da preparação de dados,
analise as sentenças a seguir:
I- Após o problema mapeado é a diferença entre o sucesso e o fracasso obtido. 
II- O problema não precisa estar mapeado para fazer uso da preparação de dados. 
III- A preparação de dados é a chave para resolver o problema em questão mesmo quando não se sabe qual
problema se quer resolver. 
IV-A preparação de dados é um tópico de pesquisa crucial após se mapear o problema em questão. 
Assinale a alternativa CORRETA:
FONTE: MASHANOVICH, N. Credit Scoping: Part 3 - Data Preparation and Exploratory Data Analysis.
2017. Disponível em: https://www.worldprogramming.com/blog/credit_scoring_pt3. Acesso em: 25 maio
2021.
A ) As sentenças III e IV estão corretas.
B ) As sentenças I e IV estão corretas.
C ) As sentenças I e II estão corretas.
D ) As sentenças II e III estão corretas.
6 - Os cientistas de dados avaliam a adequação e a qualidade, identificando se alguma melhoria pode ser feita
no conjunto de dados os resultados necessários. Por exemplo, um cientista de dados pode descobrir que
poucos pontos de dados influenciam o modelo de aprendizado de máquina em direção a um determinado
resultado. Dados de baixa qualidade ou dados ruins custam, a uma organização, média de US$ 13,5 milhões
por ano, o que é um custo alto demais para suportar. Dados ruins ou má qualidade dos dados podem alterar a
precisão dos insights ou podem ocasionar insights incorretos, e é por isso que a preparação é de extrema
importância, mesmo que consuma tempo e seja a tarefa menos agradável do processo de ciência de dados.
Portanto, a preparação de dados é necessária devido à presença de dados não formatados do mundo real.
Com base em como é composto a maioria dos dados do mundo real, analise as sentenças a seguir:
24/09/2021 11:23
3/4
I- A maioria dos dados do mundo real é composta por dados imprecisos (dados ausentes), por dados ruidosos
e dados inconsistentes. 
II- Existem muitos motivos para os dados ausentes não serem coletados continuamente como erro na entrada
de dados, problemas técnicos com biometria e muito mais. 
III- A presença de dados ruidosos (dados errôneos e outliers) se deve aos motivos que ocasionam a existência
de duplicação de dados, entrada de dados humanos, contendo erros de códigos ou nomes, como violação de
restrições de dados e muito mais. 
IV- A presença de inconsistências se deve as razões para a existência de dados ruidosos podem ser um
problema tecnológico de gadget que coleta dados, um erro humano durante a entrada de dados e muito mais. 
Assinale a alternativa CORRETA:
A ) As sentenças II e IV estão corretas.
B ) As sentenças I e II estão corretas.
C ) Somente a sentença IV está correta.
D ) As sentenças II e III estão corretas.
7 - Os atributos contínuos são
Página12