Buscar

Preparação e Análise Exploratória de Dados - Avaliação II - Individual

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Acadêmico:
Disciplina: Preparação e Análise Exploratória de Dados ()
Avaliação: Avaliação II - Individual ( Cod.:) ( peso.:1,50)
Prova:
Nota da Prova: 10,00
Legenda: Resposta Certa   Sua Resposta Errada  
1. A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode
relacionada a uma única tupla (registro) ou se referir a um conjunto de registros. A inconsistência em apenas uma única tupla acontece quando os 
desta tupla são divergentes. Referente aos métodos para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as f
(    ) Preenchimento com valores globais constantes.
(    ) Preenchimento com medidas estatísticas.
(    ) Exclusão de Casos.
(    ) Correção de erros.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - V - F.
 b) V - F - V - V.
 c) F - F - V - V.
 d) F - V - F - V.
2. Para um determinado conjunto de dados, na maioria das vezes, é fácil descobrir o que são observações e o que são variáveis, contudo é complicad
as variáveis e as observações de forma precisa. Em um ambiente de detecção de fraude, o uso de um número de telefone para várias pessoas pod
fraude, dessa forma, podemos querer variáveis número de telefone e tipo de número. Analise as opções referentes ao exposto e assinale a alternat
INCORRETA:
 a) É mais fácil fazer comparações entre grupos de observações.
 b) Em uma determinada análise pode existir apenas um nível de observação.
 c) É mais fácil descrever relações funcionais entre colunas do que entre linhas.
 d) Em uma determinada análise, podem existir vários níveis de observação.
3. Valores com informações ausentes surgem em quase todas as análises estatísticas sérias. Primeiramente, para podermos lidar com valores ausen
importante sabermos o motivo deles estarem ausentes. Referente a como a linguagem R trata essas questões, classifique V para as sentenças ver
F para as falsas:
(    ) Os valores ausentes são indicados pelos zeros e Nas.
(    ) Os valores ausentes são indicados pelo Null.
(    ) Os valores ausentes são indicados pelos Nas e Null.
(    ) Os valores ausentes são indicados pelos Nas.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - V - F.
 b) F - V - V - V.
 c) F - F - F - V.
 d) V - F - V - V.
4. A função da atividade de limpeza de informações ausentes compreende a eliminação de valores ausentes em conjunto de dados. Muitas abordage
dados ausentes simplificam o problema jogando fora os dados, ou seja, removendo os valores. Jogar simplesmente fora os dados pode levar a est
errôneas devido ao tamanho reduzido da amostra. Existem algumas abordagens que tratam essa questão. Referente ao preenchimento (imputar) m
valores, analise as sentenças a seguir:
I- Esse método demanda pouquíssimo consumo de tempo e recursos, sendo um dos mais utilizados na prática.
II- Esse método pode ser implementado por meio de pesquisas junto às fontes de dados originais que procurem captar as informações ausentes.
III- Esse método não é indicado quando a base de dados for muito grande e possuir muitos valores ausentes.
Assinale a alternativa CORRETA:
 a) Somente a sentença I está correta.
 b) As sentenças I e II estão corretas.
 c) As sentenças II e III estão corretas.
 d) Somente a sentença III está correta.
5. Dados organizados, ou seja, estruturados, proveem uma forma padronizada de vincular a estrutura de dados, isto é, seu layout físico, com sua sem
seja, com seu significado. Ao termos um conjunto de dados organizados, conseguimos facilmente manipular, modelar e visualizar, possuindo uma 
específica. Portanto, é essencial compreendermos estrutura e a sua semântica. Analise as questões referentes à estrutura de dados e assinale a al
CORRETA:
 a) Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente.
 b) A estrutura dos dados está relacionada com a coleção de seus valores.
 c) A estrutura dos dados se refere aos caracteres apresentados.
 d) A estrutura dos dados diz respeito aos números que apresentamos.

6. Na regressão clássica, ou regressão linear simples, bem como na maioria dos outros modelos, R exclui de maneira automática todos os casos em 
alguma das entradas estiver ausente. Entretanto isso pode limitar a quantidade de informações disponíveis na análise, especialmente se o modelo 
muitas entradas que estiverem propensas a estarem ausentes. As coisas ficam mais complicadas quando os preditores tiverem valores ausentes. 
aos mecanismo de valores ausentes, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) Uma ausência totalmente aleatória depende somente das informações disponíveis. 
(    ) Uma ausência que depende do valor faltante depende de informações que não foram registradas, e essas informações também predizerem os
ausentes.
(    ) Uma ausência totalmente aleatória ocorre quando os dados estiverem faltando completamente ao acaso; a eliminação de casos com dados a
não influencia suas inferências.
(    ) Uma ausência aleatória depende somente das informações disponíveis.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - V - F - V.
 b) F - F - V - V.
 c) F - F - V - F.
 d) V - F - V - V.
7. Um conjunto de dados é uma coleção de valores, geralmente números quando quantitativos ou sequências de caracteres se qualitativas. Os valore
organizados de duas maneiras, pertencendo a uma variável e a uma observação. A semântica dos dados é fundamental na organização dos dados
essa observação, assinale a alternativa CORRETA:
 a) A estrutura dos dados está relacionada com a coleção de seus valores.
 b) A estrutura dos dados se refere aos caracteres apresentados.
 c) A estrutura dos dados diz respeito aos números que apresentamos.
 d) Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente.
8. A limpeza de dados diz respeito a todo e qualquer tipo de tratamento que se realize sobre os dados escolhidos de maneira que garanta a qualidade
que se assegure a completude, veracidade e integridade dos fatos que aqueles dados representem. Nesse sentido, analise as sentenças a seguir:
I- Informações ausentes, errôneas ou inconsistentes nas bases de dados devem ser corrigidas de forma a não comprometer a qualidade dos mode
conhecimento a serem extraídos.
II- Valores com informações ausentes dificilmente aparecem em análises estatísticas sérias.
III- Um exemplo simples de limpeza de dados seria a definição de um intervalo de possíveis valores para um determinado atributo.
Assinale a alternativa CORRETA:
 a) Somente a sentença I está correta.
 b) As sentenças II e III estão corretas.
 c) As sentenças I e II estão corretas.
 d) As sentenças I e III estão corretas.
9. A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode
relacionada a um único registro (tupla) ou se referir a um conjunto de registros. A inconsistência em apenas uma tupla acontece quando os valores
tupla forem divergentes. Também podem existir inconsistências causadas por integrações de dados, em que um atributo pode ter nomes distintos 
bancos de dados. Consequentemente, podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar os valores inconsisten
Referente ao método de correção de erros para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) Esse método é muito rápido.
(    ) Esse método consome muito tempo.
(    ) Esse método consiste em substituir valores errôneos ou inconsistentes identificados no conjunto de dados.
(    ) Esse método pode envolver desde a correção manual até a atualização desses valores em um lote predeterminado de registros, usando coman
atualização de dados em ambientes relacionais.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - F - V.
 b) F -V - V - V.
 c) F - F - V - F.
 d) V - F - V - V.
10.Em um conjunto de dados, a organização dos dados deve ser um objetivo geral em função de facilitar nossa análise posterior. As propriedades dos
organizados são as mesmas que a terceira forma normal de Codd, só que voltadas à linguagem estatística, e o foco está em um único conjunto de
Com relação às principais propriedades dos dados organizados, analise as sentenças a seguir:
I- Cada valor pertence a uma variável e a uma observação (instância).
II- Cada variável contém todos os valores de uma determinada propriedade medidos em todas as observações.
III- Cada observação contém todos os valores das variáveis medidas para o respectivo caso.
Assinale a alternativa CORRETA:
 a) Somente a sentença I está correta.
 b) Somente a sentença II está correta.
 c) As sentenças I, II e III estão corretas.
 d) Somente a sentença III está correta.
Prova finalizada com 10 acertos e 0 questões erradas.

Outros materiais