Buscar

Uniasselvi - Preparacao e Análise Exploratória-Flex Individual - Avaliacao II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: Preparação e Análise Exploratória de Dados (19364) 
Avaliação: Avaliação II - Individual ( Cod.:672571) ( peso.:1,50) 
Prova: 31386861 
Nota da Prova: 8,00 
Legenda: Resposta Certa Sua Resposta Errada 
1. Um conjunto de dados é uma coleção de valores, geralmente números quando 
quantitativos ou sequências de caracteres se qualitativas. Os valores são organizados 
de duas maneiras, pertencendo a uma variável e a uma observação. A semântica dos 
dados é fundamental na organização dos dados. Sobre essa observação, assinale a 
alternativa CORRETA: 
 a) A estrutura dos dados se refere aos caracteres apresentados. 
 b) A estrutura dos dados está relacionada com a coleção de seus valores. 
 c) Os dados podem ser estruturados de diferentes formas, ou seja, os dados 
apresentados são os mesmos, contudo o layout é diferente. 
 d) A estrutura dos dados diz respeito aos números que apresentamos. 
 
2. A função de limpeza de informações ausentes compreende a eliminação de valores 
ausentes em conjuntos de dados. Muitas abordagens de dados ausentes simplificam o 
problema jogando fora os dados, ou seja, removendo os valores. Jogar fora os dados 
pode levar a estimativas errôneas devido ao tamanho reduzido da amostra. Referente 
aos métodos existentes para tratar os valores ausentes, classifique V para as 
sentenças verdadeiras e F para as falsas: 
 
( ) Exclusão de Casos. 
( ) Preenchimento (imputar) de manual de valores. 
( ) Preenchimento com valores globais constantes. 
( ) Preenchimento com medidas estatísticas. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) V - V - V - V.
 b) F - F - V - F. 
 c) V - F - V - V. 
 d) F - V - F - V. 
 
3. Para um determinado conjunto de dados, na maioria das vezes, é fácil descobrir o 
que são observações e o que são variáveis, contudo é complicado definir as variáveis 
e as observações de forma precisa. Em um ambiente de detecção de fraude, o uso de 
um número de telefone para várias pessoas pode indicar fraude, dessa forma, 
podemos querer variáveis número de telefone e tipo de número. Analise as opções 
referentes ao exposto e assinale a alternativa INCORRETA: 
 a) Em uma determinada análise pode existir apenas um nível de observação. 
 b) Em uma determinada análise, podem existir vários níveis de observação. 
 c) É mais fácil fazer comparações entre grupos de observações. 
 d) É mais fácil descrever relações funcionais entre colunas do que entre linhas.
 
4. A função de limpeza de inconsistências compreende identificar e eliminar valores 
inconsistentes em conjuntos de dados. Uma inconsistência pode estar relacionada a 
uma única tupla (registro) ou se referir a um conjunto de registros. A inconsistência 
em apenas uma única tupla acontece quando os valores desta tupla são divergentes. 
Referente aos métodos para tratar os valores inconsistentes, classifique V para as 
sentenças verdadeiras e F para as falsas: 
 
( ) Preenchimento com valores globais constantes. 
( ) Preenchimento com medidas estatísticas. 
( ) Exclusão de Casos. 
( ) Correção de erros. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - F - V - V. 
 b) F - V - F - V. 
 c) V - F - V - V.
 d) F - F - V - F. 
 
5. Na regressão clássica, ou regressão linear simples, bem como na maioria dos outros 
modelos, R exclui de maneira automática todos os casos em que alguma das entradas 
estiver ausente. Entretanto isso pode limitar a quantidade de informações disponíveis 
na análise, especialmente se o modelo incluir muitas entradas que estiverem 
propensas a estarem ausentes. As coisas ficam mais complicadas quando os 
preditores tiverem valores ausentes. Referente aos mecanismo de valores ausentes, 
classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) Uma ausência totalmente aleatória depende somente das informações 
disponíveis. 
( ) Uma ausência que depende do valor faltante depende de informações que não 
foram registradas, e essas informações também predizerem os valores ausentes. 
( ) Uma ausência totalmente aleatória ocorre quando os dados estiverem faltando 
completamente ao acaso; a eliminação de casos com dados ausentes não influencia 
suas inferências. 
( ) Uma ausência aleatória depende somente das informações disponíveis. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - F - V - F. 
 b) F - V - F - V. 
 c) F - F - V - V. 
 d) V - F - V - V.
 
6. Os valores do conjunto de dados precisam ser trabalhados para que estejam limpos. 
A boa estruturação dos dados facilita as análises. Frequentemente, os dados não são 
fornecidos em um formato tão organizado. Com relação aos cinco principais 
problemas encontrados em conjunto de dados, de acordo com Wickham (2014), 
analise as sentenças a seguir: 
 
I- Múltiplas variáveis são armazenadas em uma coluna. 
II- Cabeçalhos de coluna são valores, ou seja, são nomes de variáveis. 
III- Múltiplos tipos de observação são armazenados na mesma tabela. 
IV- As variáveis são armazenadas somente em linhas. 
V- Um único tipo de observação é armazenado em várias tabelas. 
 
Assinale a alternativa CORRETA: 
 
FONTE: WICKHAM, H. Tidy data. Journal of Statistical Software, v. 59, n. 10, p. 
1-23, 2014. 
 a) Somente a sentença IV está correta. 
 b) As sentenças I e III estão corretas. 
 c) As sentenças II, IV e V estão corretas.
 d) As sentenças II e III estão corretas. 
 
7. Valores com informações ausentes surgem em quase todas as análises estatísticas 
sérias. Primeiramente, para podermos lidar com valores ausentes, é importante 
sabermos o motivo deles estarem ausentes. Referente a como a linguagem R trata 
essas questões, classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) Os valores ausentes são indicados pelos zeros e Nas. 
( ) Os valores ausentes são indicados pelo Null. 
( ) Os valores ausentes são indicados pelos Nas e Null. 
( ) Os valores ausentes são indicados pelos Nas. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - F - F - V. 
 b) F - V - V - V.
 c) F - F - V - F. 
 d) V - F - V - V.
 
8. A função da atividade de limpeza de informações ausentes compreende a eliminação 
de valores ausentes em conjunto de dados. Muitas abordagens de dados ausentes 
simplificam o problema jogando fora os dados, ou seja, removendo os valores. Jogar 
simplesmente fora os dados pode levar a estimativas errôneas devido ao tamanho 
reduzido da amostra. Existem algumas abordagens que tratam essa questão. 
Referente ao preenchimento (imputar) manual de valores, analise as sentenças a 
seguir: 
 
I- Esse método demanda pouquíssimo consumo de tempo e recursos, sendo um dos 
mais utilizados na prática. 
II- Esse método pode ser implementado por meio de pesquisas junto às fontes de 
dados originais que procurem captar as informações ausentes. 
III- Esse método não é indicado quando a base de dados for muito grande e possuir 
muitos valores ausentes. 
 
Assinale a alternativa CORRETA: 
 a) Somente a sentença III está correta.
 b) As sentenças II e III estão corretas. 
 c) Somente a sentença I está correta. 
 d) As sentenças I e II estão corretas. 
 
9. A função de limpeza de inconsistências compreende identificar e eliminar valores 
inconsistentes em conjuntos de dados. Uma inconsistência pode estar relacionada a 
um único registro (tupla) ou se referir a um conjunto de registros. A inconsistência 
em apenas uma tupla acontece quando os valores dessa tupla forem divergentes. 
Também podem existir inconsistências causadas por integrações de dados, em que 
um atributo pode ter nomes distintos em seus bancos de dados. Consequentemente, 
podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar 
os valores inconsistentes. Referente ao método de correção de erros para tratar os 
valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) Esse método é muito rápido. 
( ) Esse método consome muito tempo. 
( ) Esse método consisteem substituir valores errôneos ou inconsistentes 
identificados no conjunto de dados. 
( ) Esse método pode envolver desde a correção manual até a atualização desses 
valores em um lote predeterminado de registros, usando comandos de atualização de 
dados em ambientes relacionais. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
 a) F - F - F - V. 
 b) V - F - V - V.
 c) F - F - V - F. 
 d) F - V - V - V.
 
10.Dados organizados, ou seja, estruturados, proveem uma forma padronizada de 
vincular a estrutura de dados, isto é, seu layout físico, com sua semântica, ou seja, 
com seu significado. Ao termos um conjunto de dados organizados, conseguimos 
facilmente manipular, modelar e visualizar, possuindo uma estrutura específica. 
Portanto, é essencial compreendermos estrutura e a sua semântica. Analise as 
questões referentes à estrutura de dados e assinale a alternativa CORRETA: 
 a) Os dados podem ser estruturados de diferentes formas, ou seja, os dados 
apresentados são os mesmos, contudo o layout é diferente. 
 b) A estrutura dos dados se refere aos caracteres apresentados. 
 c) A estrutura dos dados diz respeito aos números que apresentamos. 
 d) A estrutura dos dados está relacionada com a coleção de seus valores.

Outros materiais