Buscar

Uniasselvi - Preparacao e Análise Exploratória-Flex Individual - Avaliacao I

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Disciplina: Preparação e Análise Exploratória de Dados (19364) 
Avaliação: Avaliação I - Individual ( Cod.:672574) ( peso.:1,50) 
Prova: 31321079 
Nota da Prova: 6,00 
Legenda: Resposta Certa Sua Resposta Errada 
1. A preparação de dados é a base da análise. A melhor maneira de acelerar o processo 
de análise é reduzir o tempo de preparação de dados. Assim, pode-se dizer que, no 
contexto, a preparação de dados significa manipulação de dados em um formato 
adequado para análise e processamento. Nesse processo estão envolvidas etapas 
como de limpeza, integração, transformação, redução e discretização. Referente à 
etapa da limpeza de dados, classifique V para as sentenças verdadeiras e F para as 
falsas: 
 
( ) O foco dessa etapa é resolver os conflitos de integração. 
( ) Essa etapa visa reduzir o conjunto de dados por meio de estratégias, como de 
redução de dimensionalidade de requisitos. 
( ) Essa etapa se trata de corrigir os dados inconsistentes, preencher valores 
ausentes e suavizar dados ruidosos. 
( ) Nessa etapa, pode ocorrer de no conjunto de dados existirem muitas linhas que 
não possuam valor para atributos de interesse, dados inconsistentes, registros 
duplicados ou algum outro erro aleatório. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - F - V - V. 
 b) F - V - F - V. 
 c) F - F - V - F. 
 d) V - F - V - V.
 
2. Os atributos contínuos são aqueles que assumem valores com casas decimais e que 
admitem que entre dois números há uma infinidade de números quebrados. Podemos 
exemplificar com o valor de Pi (3,1415), que fica entre 3,0 e 4,0. Pense em dados 
contínuos como dados que continuam indefinidamente. Esses dados podem ser 
divididos em unidades cada vez menores. Referente aos dados do tipo contínuo, 
classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) Os dados contínuos podem ser categorizados em dois tipos de escalas de 
medição: intervalo e proporção. 
( ) Uma variável, ou atributo, é contínua se puder receber algum valor em um 
determinado intervalo. 
( ) Exemplos de variáveis contínuas são pesos e alturas de pássaros, temperatura de 
um dia etc. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - V - V. 
 b) F - F - V. 
 c) V - V - V.
 d) F - V - F. 
 
3. Volume de dados não significa qualidade de dados. Uma expressão usada é 
"Garbage in, Garbage out", além de ser uma ameaça para o sucesso do projeto. Isso 
acontece pelo fato de a qualidade do insumo ser uma peça fundamental na qualidade 
do produto. Dessa forma, podemos dizer que a preparação de dados é: 
 a) Faz parte do processo da análise exploratória de dados, porém não é algo 
essencial para o projeto como um todo. 
 b) Afeta minimamente a análise exploratória de dados dentro do projeto, devido ser 
uma parte insignificante do projeto. 
 c) Essencial para todo e qualquer projeto que envolve a análise exploratória de 
dados. 
 d) Não afeta a análise exploratória de dados, apesar de fazer parte do projeto. 
 
4. Os atributos contêm informações sobre cada unidade de observação. Dependendo de 
quantos tipos diferentes de informações são coletados de cada unidade, os dados 
podem ser univariados, bivariados ou multivariados. Diante do exposto, classifique 
V para as sentenças verdadeiras e F para as falsas: 
 
( ) Os atributos podem ter formas e estruturas variadas, mas em um critério são 
todos iguais, ou seja, os dados contêm informações e características que separam 
uma unidade ou observação das outras. 
( ) Os valores que um atributo pode assumir são separados em tipo de dados e 
escala de medição. 
( ) Atributo é o recurso, variável ou campo, que é uma propriedade ou 
característica de um objeto. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) V - F - V. 
 b) F - V - F. 
 c) F - F - V. 
 d) V - V - V.
 
5. Os dados são transformados de dados brutos para informação e o conhecimento será 
extraído da informação que foi construída ao longo da preparação de dados. "O 
conhecimento são informações contextualizadas e baseadas em fatos. Por exemplo: 
um conjunto de informações relacionadas evidencia um perfil de cliente" 
(CAETANO, 2018, s.p.). A sabedoria necessária para que as empresas possam tomar 
decisões é adquirida por meio do conhecimento. Nesse contexto de dados, 
informação, conhecimento e sabedoria, analise as sentenças a seguir: 
 
I- Sabedoria são informações contextualizadas e baseadas em fatos. 
II- Conhecimento é o dado já processado. 
III- Dado é a informação bruta, que ainda não passou por processo e/ou organização 
para ser utilizada. 
IV- Informações são dados confiáveis, relevantes e enriquecidos. 
 
Assinale a alternativa CORRETA: 
 
FONTE: CAETANO, J. A. Preparação de dados. 2018. Disponível em: 
https://rapido.igti.com.br/products/pdd-class. Acesso em: 11 set. 2020. 
 a) As sentenças I e II estão corretas. 
 b) As sentenças II e IV estão corretas. 
 c) As sentenças I e III estão corretas. 
 d) As sentenças III e IV estão corretas.
 
6. Ao buscar uma solução de um determinado problema, os profissionais envolvidos 
fazem a identificação dos dados relacionados com ele. Esses dados podem ser 
internos e externos. Cabe destacar que essa identificação inicial será o ponto de 
partida para fazer a coleta dos dados e a integração em um conjunto de dados que 
será utilizado no projeto. Com relação aos tipos de dados identificados e suas fontes, 
analise as sentenças a seguir: 
 
I- Os dados estruturados são oriundos de bancos de dados relacionais da 
organização. 
II- Os dados não estruturados e semiestruturados podem ser provenientes das mais 
diversas fontes, como de arquivos de texto, imagem, áudio, vídeo, planilhas, além de 
pesquisas realizadas de mercado. 
III- As redes sociais e bases externas abertas não são relevantes no contexto da 
questão. 
 
Assinale a alternativa CORRETA: 
 a) As sentenças I e II estão corretas. 
 b) As sentenças II e III estão corretas.
 c) As sentenças I e III estão corretas. 
 d) Somente a sentença I está correta. 
 
7. A organização SGB elencou alguns números para termos uma ideia melhor do 
volume de dados. "O volume de dados criado nos últimos anos é maior do que a 
quantidade produzida em toda a história." (SGB, 2019, s.p.). O estimado para o ano 
2020 é que "[...] existirão cerca de 50 bilhões de dispositivos conectados 
desenvolvidos para a coleta, análise e compartilhamento de dados. A produção de 
dados dobra a cada dois anos e a previsão é de que em 2020 sejam gerados 350 
zettabytes de dados ou 35 trilhões de gigabytes; a rede social Facebook gera mais de 
500 terabytes de dados diariamente. O volume de dados no Brasil pode chegar a 1,6 
bilhão de gigabytes em 2020" (SGB, 2019, s.p.). Nesse sentido, qual é o tamanho de 
um ZB? 
 
FONTE: SGB. O que você precisa entender sobre dados para se tornar uma 
organização Data Driven. 2019. Disponível em: 
http://socialgoodbrasil.org.br/2019/05/15/entenda-tudo-sobre-dados-para-se-tornar-
uma-organizacao-data-driven/. Acesso em: 11 set. 2020. 
 a) Equivale a um trilhão de bits. 
 b) Equivale a um trilhão de megabytes.
 c) Equivale a um trilhão de bytes. 
 d) Equivale a um trilhão de gigabytes. 
 
8. Os dados quantitativos podem ser classificados quando é possível realizar operações 
aritméticas. Vamos exemplificar: quando é possível somar dois pesos ou duas 
temperaturas, peso e temperatura são quantitativos. Dentro dos dados quantitativos, 
também conhecidos como dados numéricos, existe um subnível de tipos de dados: 
dados discretos ou dados contínuos. Referente aos dados discretos, classifique V 
para as sentenças verdadeiras e F para as falsas: 
 
( ) São aqueles dados que assumem valores com casas decimais e que admitem que 
entre dois números há uma infinidade de números quebrados. 
( ) São dados que continuam indefinidamente. 
( ) São dados quantitativos que não têm valores em casas decimais, como inteiros e 
naturais (1, 0, -5). 
( ) São um número inteiro e nãopodem ser subdivididos em partes cada vez 
menores. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - V - F - V. 
 b) F - F - V - V. 
 c) V - F - V - V.
 d) F - F - V - F. 
 
9. Várias atividades precisam ser realizadas para transformar os dados brutos em 
informações relevantes para a tomada de decisão, ou seja, na sabedoria necessária 
para as organizações. Essas atividades dizem respeito à coleta, integração de dados, 
enriquecimento, entendimento do problema, limpeza de dados ausentes, tratamento 
de dados ausentes, análise de outliers, análise estatística, normalização e redução da 
dimensionalidade. Com relação à integração de dados, analise as sentenças a seguir: 
 
I- Envolve combinar dados de diversas fontes e tipos em um único conjunto de 
dados. 
II- É o processo de agregar valor aos dados existentes. 
III- Consiste em eliminar ruídos, inconsistências e resolver problemas estruturais 
IV- Entre 50% e 90% do tempo dos funcionários de Business Intelligence (BI) é 
gasto na preparação de dados para serem analisados. 
 
Assinale a alternativa CORRETA: 
 a) Somente a sentença II está correta. 
 b) Somente a sentença III está correta. 
 c) As sentenças I e IV estão corretas. 
 d) Somente a sentença IV está correta.
 
10.Ter dados de diferentes tipos (variedade) é uma das características do Big Data. 
Esses dados podem ser tanto do tipo estruturado como do tipo não estruturado. 
Lembre-se: dado é tudo o que é observado ou conceituado. Em uma visão um tanto 
restrita, os dados são algo que pode ser medido. Diante do exposto, classifique V 
para as sentenças verdadeiras e F para as falsas: 
 
( ) Os dados representam fatos ou algo que realmente ocorreu, que foi observado e 
medido. 
( ) Os dados podem resultar de observação passiva ou coleta ativa. 
( ) Os dados são observados em cada unidade e armazenados em um dispositivo 
eletrônico. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) V - F - V. 
 b) F - F - V. 
 c) V - V - V.
 d) F - V - F.

Outros materiais