Buscar

UNIASSELVI - Centro Universitário Leonardo Da Vinci - Portal do Aluno - Portal do Aluno - Grupo UNIASSELVI_edit

Prévia do material em texto

01/06/2021 UNIASSELVI - Centro Universitário Leonardo Da Vinci - Portal do Aluno - Portal do Aluno - Grupo UNIASSELVI
https://portaldoalunoead.uniasselvi.com.br/ava/avaliacao/avaliacao_lista.php 1/3
Acadêmico: Andre Candido Lucas Pascoal (2552643)
Disciplina: Preparação e Análise Exploratória de Dados (19364)
Avaliação: Avaliação II - Individual ( Cod.:672571) ( peso.:1,50)
Prova: 31387165
Nota da Prova: 10,00
Legenda: Resposta Certa Sua Resposta Errada Questão Cancelada
1. A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode estar
relacionada a um único registro (tupla) ou se referir a um conjunto de registros. A inconsistência em apenas uma tupla acontece quando os valores dessa t
forem divergentes. Também podem existir inconsistências causadas por integrações de dados, em que um atributo pode ter nomes distintos em seus banc
dados. Consequentemente, podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar os valores inconsistentes. Referente ao
método de correção de erros para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Esse método é muito rápido.
( ) Esse método consome muito tempo.
( ) Esse método consiste em substituir valores errôneos ou inconsistentes identificados no conjunto de dados.
( ) Esse método pode envolver desde a correção manual até a atualização desses valores em um lote predeterminado de registros, usando comandos d
atualização de dados em ambientes relacionais.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - F - V.
 b) V - F - V - V.
 c) F - F - V - F.
 d) F - V - V - V.
2. Valores com informações ausentes surgem em quase todas as análises estatísticas sérias. Primeiramente, para podermos lidar com valores ausentes, é
importante sabermos o motivo deles estarem ausentes. Referente a como a linguagem R trata essas questões, classifique V para as sentenças verdadeira
para as falsas:
( ) Os valores ausentes são indicados pelos zeros e Nas.
( ) Os valores ausentes são indicados pelo Null.
( ) Os valores ausentes são indicados pelos Nas e Null.
( ) Os valores ausentes são indicados pelos Nas.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - V - V - V.
 b) F - F - F - V.
 c) F - F - V - F.
 d) V - F - V - V.
Os valores do conjunto de dados precisam ser trabalhados para que estejam limpos. A boa estruturação dos dados facilita as análises. Frequentemente, o
dados não são fornecidos em um formato tão organizado. Com relação aos cinco principais problemas encontrados em conjunto de dados, de acordo com
Wickham (2014), analise as sentenças a seguir:
I- Múltiplas variáveis são armazenadas em uma coluna.
II- Cabeçalhos de coluna são valores, ou seja, são nomes de variáveis.
III- Múltiplos tipos de observação são armazenados na mesma tabela.
IV- As variáveis são armazenadas somente em linhas.
V- Um único tipo de observação é armazenado em várias tabelas.
Assinale a alternativa CORRETA:
FONTE: WICKHAM, H. Tidy data. Journal of Statistical Software, v. 59, n. 10, p. 1-23, 2014.
 a) As sentenças II e III estão corretas.
 b) Somente a sentença IV está correta.
 c) As sentenças II, IV e V estão corretas.
 d) As sentenças I e III estão corretas.
 * Observação: A questão número 3 foi Cancelada.
4. A limpeza de dados diz respeito a todo e qualquer tipo de tratamento que se realize sobre os dados escolhidos de maneira que garanta a qualidade, ou se
se assegure a completude, veracidade e integridade dos fatos que aqueles dados representem. Nesse sentido, analise as sentenças a seguir:
I- Informações ausentes, errôneas ou inconsistentes nas bases de dados devem ser corrigidas de forma a não comprometer a qualidade dos modelos de
conhecimento a serem extraídos.
II- Valores com informações ausentes dificilmente aparecem em análises estatísticas sérias.
III- Um exemplo simples de limpeza de dados seria a definição de um intervalo de possíveis valores para um determinado atributo.
Assinale a alternativa CORRETA:
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_1%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_2%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_4%20aria-label=
01/06/2021 UNIASSELVI - Centro Universitário Leonardo Da Vinci - Portal do Aluno - Portal do Aluno - Grupo UNIASSELVI
https://portaldoalunoead.uniasselvi.com.br/ava/avaliacao/avaliacao_lista.php 2/3
 a) Somente a sentença I está correta.
 b) As sentenças II e III estão corretas.
 c) As sentenças I e II estão corretas.
 d) As sentenças I e III estão corretas.
5. A função de limpeza de informações ausentes compreende a eliminação de valores ausentes em conjuntos de dados. Muitas abordagens de dados ausen
simplificam o problema jogando fora os dados, ou seja, removendo os valores. Jogar fora os dados pode levar a estimativas errôneas devido ao tamanho
reduzido da amostra. Referente aos métodos existentes para tratar os valores ausentes, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Exclusão de Casos.
( ) Preenchimento (imputar) de manual de valores.
( ) Preenchimento com valores globais constantes.
( ) Preenchimento com medidas estatísticas.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) V - F - V - V.
 b) V - V - V - V.
 c) F - F - V - F.
 d) F - V - F - V.
6. Dados organizados, ou seja, estruturados, proveem uma forma padronizada de vincular a estrutura de dados, isto é, seu layout físico, com sua semântica, o
com seu significado. Ao termos um conjunto de dados organizados, conseguimos facilmente manipular, modelar e visualizar, possuindo uma estrutura espe
Portanto, é essencial compreendermos estrutura e a sua semântica. Analise as questões referentes à estrutura de dados e assinale a alternativa CORRET
 a) A estrutura dos dados diz respeito aos números que apresentamos.
 b) A estrutura dos dados está relacionada com a coleção de seus valores.
 c) Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente.
 d) A estrutura dos dados se refere aos caracteres apresentados.
7. Na regressão clássica, ou regressão linear simples, bem como na maioria dos outros modelos, R exclui de maneira automática todos os casos em que alg
das entradas estiver ausente. Entretanto isso pode limitar a quantidade de informações disponíveis na análise, especialmente se o modelo incluir muitas
entradas que estiverem propensas a estarem ausentes. As coisas ficam mais complicadas quando os preditores tiverem valores ausentes. Referente aos
mecanismo de valores ausentes, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Uma ausência totalmente aleatória depende somente das informações disponíveis. 
( ) Uma ausência que depende do valor faltante depende de informações que não foram registradas, e essas informações também predizerem os valore
ausentes.
( ) Uma ausência totalmente aleatória ocorre quando os dados estiverem faltando completamente ao acaso; a eliminação de casos com dados ausentes
influencia suas inferências.
( ) Uma ausência aleatória depende somente das informações disponíveis.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - V - V.
 b) F - V - F - V.
 c) F - F - V - F.
 d) V - F - V - V.
8. Em um conjunto de dados, a organização dos dados deve ser um objetivo geral em função de facilitar nossa análise posterior. As propriedades dos dados
organizados são as mesmas que a terceira forma normal de Codd, só que voltadasà linguagem estatística, e o foco está em um único conjunto de dados. 
relação às principais propriedades dos dados organizados, analise as sentenças a seguir:
I- Cada valor pertence a uma variável e a uma observação (instância).
II- Cada variável contém todos os valores de uma determinada propriedade medidos em todas as observações.
III- Cada observação contém todos os valores das variáveis medidas para o respectivo caso.
Assinale a alternativa CORRETA:
 a) Somente a sentença II está correta.
 b) Somente a sentença I está correta.
 c) Somente a sentença III está correta.
 d) As sentenças I, II e III estão corretas.
9. Os valores do conjunto de dados precisam ser trabalhados para que estejam limpos, e a estrutura também é fundamental nesse processo, facilitando as a
Frequentemente, os dados não são fornecidos em um formato organizado. Referente aos cinco principais problemas encontrados em conjuntos de dados
classifique V para as sentenças verdadeiras e F para as falsas:
( ) Cabeçalhos de coluna são valores, não nomes de variáveis.
( ) Múltiplas variáveis são armazenadas em uma coluna.
( ) As variáveis são armazenadas tanto em linhas quanto em colunas.
( ) Múltiplos tipos de observação são armazenados na mesma tabela.
( ) Um único tipo de observação é armazenado em várias tabelas.
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - V - F - V.
 b) V - V - V - V - V.
 c) V - F - V - V - F.
 d) F - V - F - V - F.
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_5%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_6%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_7%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_8%20aria-label=
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_9%20aria-label=
01/06/2021 UNIASSELVI - Centro Universitário Leonardo Da Vinci - Portal do Aluno - Portal do Aluno - Grupo UNIASSELVI
https://portaldoalunoead.uniasselvi.com.br/ava/avaliacao/avaliacao_lista.php 3/3
10.Um conjunto de dados é uma coleção de valores, geralmente números quando quantitativos ou sequências de caracteres se qualitativas. Os valores são
organizados de duas maneiras, pertencendo a uma variável e a uma observação. A semântica dos dados é fundamental na organização dos dados. Sobr
observação, assinale a alternativa CORRETA:
 a) Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente.
 b) A estrutura dos dados se refere aos caracteres apresentados.
 c) A estrutura dos dados diz respeito aos números que apresentamos.
 d) A estrutura dos dados está relacionada com a coleção de seus valores.
Prova finalizada com 10 acertos e 0 questões erradas.
https://portaldoalunoead.uniasselvi.com.br/ava/notas/request_gabarito_n2.php?action1=MDk1NUJESQ==&action2=MTkzNjQ=&action3=NjcyNTcx&action4=MjAyMS8x&prova=MzEzODcxNjU=#questao_10%20aria-label=

Continue navegando